株式会社soda × NTTデータ数理システム ディープラーニングを活用した顧客ランク予測モデルの構築事例

  • HOME
  • ディープラーニングを活用した顧客ランク予測モデルの構築事例

AI分析に、驚きのツール

2020年8月 7日 18:28

POSなどのデータ活用が進んでいるマーケティングの分野で、先進的な取り組みを展開している株式会社soda様。すでに導入しているVisual Mining Studio(汎用データマイニングシステム、以下VMS)、 Text Mining Studio(テキストマイニングツール、以下TMS)に加え、新たに深層学習デザインツールDeep Learnerを導入。AIによる分析や予測に期待する顧客企業の声に高精度な結果で応えている。その状況をsodaのメンバーにお聞きした。

Profile:株式会社soda 様
クラウドやAIといった先端テクノロジーやアルゴリズム、ノウハウを活用し、マーケティングプロセス、セールスプロセス、オペレーションプロセス、バックオフィスプロセスなど、ビジネスのあらゆる局面においてデータ収集・利活用を促進。多様なデータの中から有用なものを組合せ、最適なサービスを提供。

株式会社sodaの皆様
株式会社sodaの皆様
左から倉田 陽右 様、後藤 宗介 様、加藤 大輔 様

解析プラットフォームにアドオンするだけで使えるAI

データに基づくマーケティングに注力していると聞きました。

我々は、「顧客購買行動の探求」をテーマに各種の研究開発を行っています。大学やマーケティング関連企業、 AI系ベンチャーとの産学連携や協業により、ベイズ統計による新規顧客獲得のためのモデル創りや、巡回セールスマン問題と遺伝的アルゴリズム(または多目的組合せ問題)による併売を最大化するためのレイアウトの最適化研究、機械学習を活用したマーケティングオートメーション、ディープラーニングによる顧客ランク予測やアンケートのフリーアンサー(自由回答)分析など、多角的なアプローチを行っています。さらに、そうした研究成果をお客様の各種プロモーション施策に反映して、ワンストップでご提供できることが我々の強みとなっています。
最近の研究成果では、大学との共同研究による「購買履歴情報を考慮した階層ベイズモデルによる買取・販売分析」があります。この研究結果は日本マーケティング・サイエンス学会(JIMS)で発表したほか、研究成果を応用したターゲティングやクリエイティブによるDMの制作により、第31回全日本DM大賞(日本郵便株式会社主催)で銀賞を受賞しています。

AIに関しても積極的に取り組んでいらっしゃいますね。

情報化、デジタル化により顧客データが多様・大量に収集できるようになり、そのデータの利活用にお客様のニーズが移っています。こうした流れの中でAIは、これまで難しかった非構造データの分析やそこからの気づきを得るための有効な手段として、お客様からの期待が高まっています。社内のAI関連の人材育成にも力を入れており、日本ディープラーニング協会認定のジェネラリスト(G検定資格保有者)は7名を数えます。

VMSなど数理システムのツールはどのようにお使いですか。

先ほどご紹介した大学との共同研究のほか、各種分析サービスのツールとしてVMSやTMSを導入 し活用しています。そしてDeep Learnerがリリースされたと聞き、大いに興味を持ちました。す でにあるVMS分析プラットフォームにアドオンするだけでディープラーニング環境が実現できるこ とはとても画期的だと感じ、さっそく導入しました。我々がお客様からお預かりするのはアンケー トデータやPOSデータが多いのですが、これらのデータはVMSとDeep Learnerと学習データ があれば、効率的に深層学習による結果が得られます。さらに、大量データの分析にはBig Data Moduleも利用しています。

データ前処理をていねいに行うほど結果の精度が高まる

顧客ランク予測にDeep Learnerをお使いだそうですね。

ある店舗のお客様が今後どのような購買をするか、その行動をランク付けするとどう変動するか。それが予測できれば、例えば「この顧客はランク向上が予測されているから注力すべき」というように、あらかじめ顧客ごとに有効なアプローチや施策を検討したり実施ができます。我々は、そのランク予測を行うモデルをVMSとDeep Learnerで構築しました。
顧客数約6万人、 1,200万トランザクションに及ぶ2年分のデータをもとに、購買したカテゴリの回数などを説明変数としてIDごとに割り当て、学習させました。ここに顧客の半年間の実績を入力し、 1年間のランクを予測します。このモデルで実際のランクと予測ランクとの差を精度として割り出したところ、最初70%という結果が得られました。そこでさらに中間層の数や学習率、次元数などのチューニングやデータセットの再考を繰り返したところ、約80%まで精度を高めることに成功しています。

アンケートの自由記述の可視化にも活用されたそうですね。

フリーアンサーの自然言語を解析した結果とその可視化は、 TMSによるテキストマイニングでも可能ですが、我々はこれまで以上の成果を求めて、 Deep Learnerを組み合わせて解析することを考えました。フリーアンサーは約5,000件あり、これをまずTMSによって形態素解析を行い、単語単位に分け、さらにVMSとDeep Learnerによるオートエンコーダー機能により、入力データを2次元に圧縮して特徴語を抽出しました。加えてクラスタ分析を行い、クラスタごとに特徴的な単語を抽出した結果、精度の高いニーズのキャッチアップが実現できました。これはDeep Learnerがなければできなかったでしょう。

Deep Learnerを使うことのメリットは何でしょうか。

これまでできなかった高精度な予測や分析が、 Deep Learnerによって可能になっています。時代の技術としてAIに期待しているお客様はまだたくさんいます。その期待にお応えするための、 1つのツールを手に入れた。それが我々にとっての一番のメリットではないでしょうか。しかもDeep Learnerは比較的容易に、一定レベルの結果を返してくれます。ご紹介した2つの例でもお客様は得られた新しい結果をもとに、次の施策を企画したり新たなサービスを展開しています。つまり、 Deep Learnerで得た分析結果は、お客様ビジネスの即戦力になっているということです。我々の最終的なゴールはお客様の利益を生み出すことですので、このような実用的なツールはとても重要です。
こうした高精度な結果が、 VMSという解析プラットフォーム上でユーザーフレンドリーに動作するツールで得られることも驚きです。しかも、機械学習で非常に大事なパラメータの探索機能も備えている。もしPython等のオープンソースで開発するなどしていたら、時間とコストが非常にかかっていたでしょう。

Deep Learnerを使う上でのアドバイスをお願いします。

入力するデータをいかに整備するか、その内容や精度によって、Deep Learnerで処理した後の結果が違ってきます。お客様の実データは、研究用データとは違っていろいろなクセがあります。それをふまえた上で、お客様からの要望やデータの状態に応じてクリーニングやグルーピングが必要です。そういった処理を確実に、ていねいに行っておくことが大切です。 VMSやTMSといった数理システムのツールは、そういったときにとても便利に使えます。

おわりに

今回は、データマイニングに必要なデータの前処理から、データの分析・処理まで、高機能なツール群を簡単に利用することのできる汎用ツール「Visual Mining Studio (VMS)」、簡単な操作で本格的なテキストマイニングが行えるツール「Text Mining Studio (TMStudio)」、およびディープラーニング (Deep Learning, 深層学習) のモデルを対話的に設計し、実行するためのモジュール「Deep Learner」を活用された事例についてご紹介しました。 それぞれ、定期的に製品について紹介するオンラインウェビナーを無料開催しておりますので、気になった方はぜひご参加いただけると幸いです。

▼現在開催中のセミナー
https://www.msiism.jp/seminar/

また、弊社NTTデータ数理システムでは、長年培ってきた数理科学の技術を基に、お客様のご要望に合わせた受託開発を承っております。「データはあるから何となく何かをやりたい…」というきっかけでも大丈夫です。お客様が解きたい課題を弊社技術スタッフが一緒に課題整理を行いながら、ご要望に合わせたご利用形態で課題解決をサポートします! ぜひお気軽にお問い合わせ、ご相談いただけると幸いです。