株式会社soda 様 ディープラーニングを活用した顧客ランク予測モデルの構築事例

  • HOME
  • ディープラーニングを活用した顧客ランク予測モデルの構築事例

AI 分析に、驚きのツール

2020年8月 7日 18:28

POS などのデータ活用が進んでいるマーケティングの分野で、先進的な取り組みを展開している株式会社soda様。すでに導入している Visual Mining Studio(汎用データマイニングシステム、以下 VMS)、Text Mining Studio(テキストマイニングツール、以下 TMS)に加え、新たに深層学習デザインツール Deep Learner を導入。AI による分析や予測に期待する顧客企業の声に高精度な結果で応えている。その状況を soda のメンバーにお聞きした。

PDF版はこちら

Profile:株式会社soda 様
クラウドや AI といった先端テクノロジーやアルゴリズム、ノウハウを活用し、マーケティングプロセス、セールスプロセス、オペレーションプロセス、バックオフィスプロセスなど、ビジネスのあらゆる局面においてデータ収集・利活用を促進。多様なデータの中から有用なものを組合せ、最適なサービスを提供。

株式会社sodaの皆様
株式会社sodaの皆様
左から倉田 陽右 様、後藤 宗介 様、加藤 大輔 様

解析プラットフォームにアドオンするだけで使える AI

データに基づくマーケティングに注力していると聞きました。

我々は、「顧客購買行動の探求」をテーマに各種の研究開発を行っています。大学やマーケティング関連企業、 AI系ベンチャーとの産学連携や協業により、ベイズ統計による新規顧客獲得のためのモデル創りや、巡回セールスマン問題と遺伝的アルゴリズム(または多目的組合せ問題)による併売を最大化するためのレイアウトの最適化研究、機械学習を活用したマーケティングオートメーション、ディープラーニングによる顧客ランク予測やアンケートのフリーアンサー(自由回答)分析など、多角的なアプローチを行っています。さらに、そうした研究成果をお客様の各種プロモーション施策に反映して、ワンストップでご提供できることが我々の強みとなっています。
最近の研究成果では、大学との共同研究による「購買履歴情報を考慮した階層ベイズモデルによる買取・販売分析」があります。この研究結果は日本マーケティング・サイエンス学会(JIMS)で発表したほか、研究成果を応用したターゲティングやクリエイティブによる DM の制作により、第31回全日本DM大賞(日本郵便株式会社主催)で銀賞を受賞しています。

AI に関しても積極的に取り組んでいらっしゃいますね。

情報化、デジタル化により顧客データが多様・大量に収集できるようになり、そのデータの利活用にお客様のニーズが移っています。こうした流れの中で AI は、これまで難しかった非構造データの分析やそこからの気づきを得るための有効な手段として、お客様からの期待が高まっています。社内の AI 関連の人材育成にも力を入れており、日本ディープラーニング協会認定のジェネラリスト(G検定資格保有者)は7名を数えます。

VMS など数理システムのツールはどのようにお使いですか。

先ほどご紹介した大学との共同研究のほか、各種分析サービスのツールとして VMS や TMS を導入し活用しています。そして Deep Learner がリリースされたと聞き、大いに興味を持ちました。すでにあるVMS分析プラットフォームにアドオンするだけでディープラーニング環境が実現できることはとても画期的だと感じ、さっそく導入しました。我々がお客様からお預かりするのはアンケートデータやPOSデータが多いのですが、これらのデータは VMS と Deep Learner と学習データがあれば、効率的に深層学習による結果が得られます。さらに、大量データの分析には Big Data Module も利用しています。

データ前処理をていねいに行うほど結果の精度が高まる

顧客ランク予測に Deep Learner をお使いだそうですね。

ある店舗のお客様が今後どのような購買をするか、その行動をランク付けするとどう変動するか。それが予測できれば、例えば「この顧客はランク向上が予測されているから注力すべき」というように、あらかじめ顧客ごとに有効なアプローチや施策を検討したり実施ができます。我々は、そのランク予測を行うモデルを VMS と Deep Learner で構築しました。
顧客数約6万人、1,200万トランザクションに及ぶ2年分のデータをもとに、購買したカテゴリの回数などを説明変数として ID ごとに割り当て、学習させました。ここに顧客の半年間の実績を入力し、1年間のランクを予測します。このモデルで実際のランクと予測ランクとの差を精度として割り出したところ、最初70%という結果が得られました。そこでさらに中間層の数や学習率、次元数などのチューニングやデータセットの再考を繰り返したところ、約80%まで精度を高めることに成功しています。

アンケートの自由記述の可視化にも活用されたそうですね。

フリーアンサーの自然言語を解析した結果とその可視化は、TMS によるテキストマイニングでも可能ですが、我々はこれまで以上の成果を求めて、Deep Learner を組み合わせて解析することを考えました。フリーアンサーは約5,000件あり、これをまず TMS によって形態素解析を行い、単語単位に分け、さらに VMS と Deep Learner によるオートエンコーダー機能により、入力データを2次元に圧縮して特徴語を抽出しました。加えてクラスタ分析を行い、クラスタごとに特徴的な単語を抽出した結果、精度の高いニーズのキャッチアップが実現できました。これは Deep Learner がなければできなかったでしょう。

Deep Learner を使うことのメリットは何でしょうか。

これまでできなかった高精度な予測や分析が、Deep Learner によって可能になっています。時代の技術として AI に期待しているお客様はまだたくさんいます。その期待にお応えするための、1つのツールを手に入れた。それが我々にとっての一番のメリットではないでしょうか。しかも Deep Learner は比較的容易に、一定レベルの結果を返してくれます。ご紹介した2つの例でもお客様は得られた新しい結果をもとに、次の施策を企画したり新たなサービスを展開しています。つまり、Deep Learner で得た分析結果は、お客様ビジネスの即戦力になっているということです。我々の最終的なゴールはお客様の利益を生み出すことですので、このような実用的なツールはとても重要です。
こうした高精度な結果が、VMS という解析プラットフォーム上でユーザーフレンドリーに動作するツールで得られることも驚きです。しかも、機械学習で非常に大事なパラメータの探索機能も備えている。もし Python 等のオープンソースで開発するなどしていたら、時間とコストが非常にかかっていたでしょう。

Deep Learner を使う上でのアドバイスをお願いします。

入力するデータをいかに整備するか、その内容や精度によって、Deep Learner で処理した後の結果が違ってきます。お客様の実データは、研究用データとは違っていろいろなクセがあります。それをふまえた上で、お客様からの要望やデータの状態に応じてクリーニングやグルーピングが必要です。そういった処理を確実に、ていねいに行っておくことが大切です。VMS や TMS といった数理システムのツールは、そういったときにとても便利に使えます。

おわりに

今回は、「Visual Mining Studio」「Deep Learner」の2製品と、簡単な操作で本格的なテキストマイニングが行えるツール「Text Mining Studio(TMStudio)」を活用された事例についてご紹介しました。データマイニングを活用した課題解決について、少しでも興味をお持ちいただけたでしょうか?
2021年10月に「Visual Mining Studio」と「Deep Learner」 の後継製品として、AI・データ分析を内製化できるデータ分析プラットフォーム「Alkano」をリリースしました。それぞれ、定期的に製品について紹介するオンラインウェビナーを無料開催しておりますので、気になった方はぜひご参加いただけると幸いです。

▼現在開催中のセミナー
Alkano の紹介セミナー
Text Mining Studio 紹介セミナー

また、弊社NTTデータ数理システムでは、長年培ってきた数理科学の技術を基に、お客様のご要望に合わせた受託開発を承っております。「データはあるから何となく何かをやりたい…」というきっかけでも大丈夫です。お客様が解きたい課題を弊社技術スタッフが一緒に課題整理を行いながら、ご要望に合わせたご利用形態で課題解決をサポートします!ぜひお気軽にお問い合わせ、ご相談いただけると幸いです。

監修:株式会社NTTデータ数理システム 機械学習、統計解析、数理計画、シミュレーションなどの数理科学を 背景とした技術を活用し、業種・テーマを問わず幅広く仕事をしています。
http://www.msi.co.jp NTTデータ数理システムができること
「数理科学の基礎知識」e-book無料ダウンロードはこちら

関連記事