- HOME
- データ分析の学習・授業にも最適なデータ分析ツール
変更や修正が自由にでき、データマイニングの授業に最適
2022年4月14日 17:00
「情報社会を創造的にデザインする」のキャッチフレーズのもと、ユニークな教育を実践している専修大学ネットワーク情報学部。そこでデータマイニングの授業を担当している江原淳教授は、教材として Visual Mining Studio を導入し、次の社会を担う人材を育てている。
1977年東京大学文学部卒業。財団法人流通経済研究所(現公益財団法人)で主任研究員としてPOSデータ分析やオンライン分析システムを構築。1987年、専修大学教員となる。マーケティング、データマイニング、流通を主な研究分野とし、著書、学術論文多数。日本消費者行動研究学会/日本商業学会/日本マーケティングサイエンス学会/日本オペレーションズリサーチ学会所属。
江原 淳 教授
新しい時代のあり方や仕組みを発想し、組織できる人材を育てる
ネットワーク情報学部の特徴を教えていただけますか。
江原 本学部は2001年、まだないモノを創り出す21世紀型の情報学部としてスタートしました。社会の新しい仕組みやインフラを創り出すために必要な IT やネットワーク、ビジネスに関する幅広い情報や知識、ツールの使い方を教えています。
現在はIoT前夜です。プロセッシングが進化した一方、センシングやアクチュエーティングも進化し、これらによるイノベーションが期待されています。例えば雪の多い地方でクルマのタイヤスリップのデータをリアルタイムで集計すれば、降雪の多い道路区間が特定でき、そこを優先的に除雪すればよくなる。そのように世の中にあるモノがネット接続し、データに基づいてダイナミックにやり方を変えていけば、同じリソースでも何倍もメリットがある社会になるはずです。そうした新しい時代のあり方や仕組みを発想し、ビジネスやサービスとして組織化できる人材を育てることが本学部の目的です。
どのような教育をされているのでしょうか。
江原 情報を扱う力のほか、論理的・創造的に考える力、問題を解決し説明する力、チームで協働する力、多様な視野をもって考える力、継続して自ら学習する力を身につけることを本学部の目標としています。ある分野に特化した技術者ではなく、例えばデザインが分かる技術者や、統計の知識がありデータ解析ができる技術者といったように、幅広い視野や知識、スキルを持った人材を育成することです。そのため、1年生でC言語を必修した上で、メディアプロデュースやコンテンツデザイン、フィジカルコンピューティングなど8つのプログラムの中から自分の興味ある分野を学んでいきます。その中に情報数理や経営情報のプログラムがあり、Visual Mining Studio を使った授業が行われています。
容易なデータインポート、日本語表示・・・ Visual Mining Studioが授業のハードルを下げる
Visual Mining Studio導入の経緯をお聞かせください。
江原 私は以前、調査会社でマーケティングリサーチをしていました。1980年代、POSデータ活用のシステムを構築するなど、マーケティングに数量的手法を持ち込むことを行っていました。そうした経験をもとに、本学部の授業のひとつとしてデータマイニングを担当しています。
この授業は2001年の学部創設時からあり、当初は海外製のソフトウェアを使っていました。しかし、画面表示が英語のため操作に手間取る学生がいて、マイニング中のデバッグ作業が止まってしまうなど授業の進行に影響が出ていました。こうした中で選んだのが Visual Mining Studio です。日本製ソフトウェアですので学生もとっつきやすく、使いやすい。アカデミックライセンスであれば予算面の問題もクリアできます。2015年に導入し、定員100人の授業の演習で利用しています。
授業でどのようにお使いですか。
江原 学生はビジネスのプロセスをよく知りませんから、いきなりデータマイニングで課題を見つけ出すことは困難です。ですから学生が関心を持ちそうなテーマとそれに関連したデータを教材にしています。分析すると思いもよらない発見がある、そんな体験を通してデータマイニングの意義や価値を掴み取ってほしいと思っています。
実際の授業では、大量のメールデータからスパムメールを判別するモデルを Visual Mining Studio により発見する演習を行っています。教室では各学生用PCのほか、2人に1台、私のPC画面をシェアするモニターを置き、私からの指示やマイニングのやり方などをそれで参照しながら演習を進めています。Visual Mining Studio はグラフィカルに分析の流れが分かるので、学生の理解も早いようです。
授業での使い勝手や学生の反応はいかがでしょうか。
江原 一番の評価ポイントは、データインポートの手軽さです。従来のソフトウェアではデータはエクセルファイルを指定して読み込む必要があり、その際に学生がよく失敗し、演習が止まったりしていました。それが Visual Mining Studio ならデータをドラッグ&ドロップするだけでインポートできます。失敗がない。だから演習が止まることなく、スムーズに進められます。授業のハードルを下げるソフトウェアともいえます。
操作に関しても、従来はデータ範囲を指定してからコマンド実行していたのですが、Visual Mining Studio は柔軟で、データインポート後に変数の指定や、その属性の変更もできる。つまり、結果を見ながら自分がやろうとしていることを確かめたり、おかしいと思ったら修正できたりするわけです。しかも日本語表示ですので自分でどんどん試すことができ、操作に関する質問は激減しました。
授業は2つの教室に分かれており、そこを私が行ったり来たりしながら進めていますが、私がいない間でも学生たちは自分で演習を進められます。分からないことがあったら、隣の学生同士で教え合ったりしています。そんなふうに周囲の人と協働して課題を解決していくことが本学部のカルチャーのひとつなので、その点からも Visual Mining Studio はうまくはまっているといえます。
また、ていねいなチュートリアルが添付されていて、初期の授業で操作方法の習得に役立っています。
今後の展望をお聞かせください。
江原 これまでデータ関連の授業では、マーケティングのような経営情報分析がメインでした。今後はデータサイエンスの方向に振り、それに合わせたカリキュラム体系に整えようとしています。同時に、統計とプログラミングの演習をかねて「R」の採用も進めています。数理システムには Visual Mining Studio 同様に使いやすく高機能な Visual R Platform もあり、今後もこれまで同様のサービスやサポートに期待しています。
「データマイニング講義内容」(2018年2月現在)
- ガイダンス
- ビジネスインテリジェンスとデータマイニング
- 関連係数とアソシエーション(ショッピングバスケット分析)
- リンク分析
- エントロピーと決定木1(C5、C4.5、ID3)
- 決定木2(CARTとCHAID)
- クラスター分析(K-meansとward法)
- 自己組織化マップ(SOM:コホネンネットワーク)
- ニューラルネットワークとロジスティック回帰
- 予測力の評価・手法選択・交差検定
- サポートベクターマシン(SVM)
- 記憶ベース推論(MBR、k-NN)
- 比例ハザードモデル(Cox回帰)
- アンサンブル手法(バギングとブースティング)
- データマイニングと個人情報保護
おわりに
今回は、「Visual Mining Studio」を活用していただいた事例についてご紹介しました。データマイニングを活用した課題解決について、少しでも興味をお持ちいただけたでしょうか?
2021年10月に「Visual Mining Studio」の後継製品として、AI・データ分析を内製化できるデータ分析プラットフォーム「Alkano」をリリースしました。Alkano を紹介するオンラインウェビナーを無料開催しておりますので、気になった方はぜひご参加いただけると幸いです。
▼セミナー情報はこちら
Alkano の紹介セミナー
また、弊社NTTデータ数理システムでは、長年培ってきた数理科学の技術を基に、お客様のご要望に合わせた受託開発を承っております。「データはあるから何となく何かをやりたい…」というきっかけでも大丈夫です。お客様が解きたい課題を弊社技術スタッフが一緒に課題整理を行いながら、ご要望に合わせたご利用形態で課題解決をサポートします!ぜひお気軽にお問い合わせ、ご相談いただけると幸いです。
http://www.msi.co.jp NTTデータ数理システムができること