« 日経Big Data、広島での経産省主導、実証実験の記事! | Main | ベインジアンネットワークモデルとiD付POS分析、その2! »

August 09, 2014

ベインジアンネットワークモデルとiD付POS分析、その1!

人工知能学会論文誌 26 巻 6 号 D(2011 年)の論文を読み解く!
・日常購買行動に関する大規模データの融合による顧客行動予測システム
・実サービス支援のためのカテゴリマイニング技術

・https://staff.aist.go.jp/takenaka-t/5075626C69636174696F6E_reD-B61takenaka.pdf
・本研究では,流通量販店の顧客 ID 付きの購買履歴データである 1 年間の ID-POS データと,その会員への 4000 人規模のアンケートデータを用いる.

章立て:
1.はじめに
2.ID-POS 活用に関する現状と関連研究
3.大規模データ融合によるカテゴリ自動生成
4.カテゴリベース顧客行動モデリング
5.考 察
6.むすび
   3.大規模データ融合によるカテゴリ自動生成
    3·1 潜在顧客・潜在商品カテゴリのモデリング
    3·2 日常購買行動に関するデータ
      § 1 大規模 ID-POS データとデータ抽出
      § 2 顧客アンケートデータとその解析
      § 3 ライフスタイルカテゴリの抽出
    3·3 ライフスタイルスコアに基づく制約条件の導入
    3·4 制約条件の導入による計算量の削減
    3·5 カテゴリ生成実験
    3·6 カテゴリ生成の結果
      § 1 パラメータの推定結果
      § 2 価格帯による分類傾向
    3·7 カテゴリ生成の結果検証

   4. カテゴリベース顧客行動モデリング
    4·1 ベイジアンネットワーク
    4·2 確率構造の学習法
    4·3 確率構造モデルの構築
    4·4 カテゴリに対する知識抽出
      §1 潜在商品カテゴリに対する顧客行動理解の一例
      § 2 顧客ライフスタイルカテゴリに対する顧客行動理解の一例

著者:
・石垣 司 Ishigaki Tsukasa:東北大学大学院経済学研究科
・竹中 毅 Takeshi Takenaka:産業技術総合研究所サービス工学研究センター
・本村 陽一 Yoichi Motomura:(同 上)

参考: ID-POS 活用に関する現状と関連研究
・現在では ICT の発達により日常の購買行動の現場で観測されるデータ量は爆発的に増大している.小売業においても,1990 年代よりポイントカードや会員カードを利用した ID-POS データと呼ばれる顧客 ID 付きの購買履歴データも大量に蓄積されている.ID-POS データには「いつ,どこで,誰が,何を,いくつ」購買したのかという履歴が数百万から数億件規模で蓄積されているため,顧客と商品の関係を知るための豊かな情報源となることが期待される.しかしながら小売業の現場の多くでは,そのデータの大規模性からデシル分析や RFM 分析などの基本特徴量の算出のみが主な解析となっており,その解析結果が十分に活用されていない現状がある.
・小売業においてサービス品質の向上と適切な商品管理のためには,どのような顧客がどのような商品を求めているのかを定量的に把握することが望ましい.従来の研究では,顧客アンケートデータ,購買調査データ,スキャンパネルデータ [岡太 01] などを用いて階層的クラスタリング[Saunders 08, Xu 09],潜在クラス分析 [Goodman 78, 佐藤 03],ジョイントセグメンテーション [Ramaswamy 96],自己組織化マップ [Weng 03, 徳高 02] などの手法により顧客や商品のセグメント化が行われている.これらの手法は顧客側,もしくは商品側に注目した単方向のセグメンテーションである.また,コレスポンデンス分析 [Greenacre06, 君山 05] などの顧客と商品の関係を線形的に低次元空間に次元圧縮し,両者の関係性を把握する手法もある.しかしながら,データ収集の方法や適用手法の限界から数百~数万サンプルのデータに対する研究がほとんどである.加えて,ID-POS データの解析として,例えば顧客来店行動の解析 [佐藤 08],消費者の異質性を考慮した消費者モデル [照井 09],新製品の動向解析 [Yada 07],時系列解析手法の応用 [阿部 05],潜在クラスモデルを利用した顧客行動の動的変化の解析 [Iwata 09] などの研究成果があるが,いずれも本論が目的としている顧客と商品のカテゴリをベースとした顧客行動予測システムの構築とは目的が異なる研究である.
・自然言語処理などの分野で使用されている確率的潜在意味解析(PLSI)[Hofmann 99, Hofmann 01] により顧客と商品を同時にクラスタリングする研究もある.[石垣11a] では百貨店の ID-POS データに対して PLSI により作成されたカテゴリに対する顧客行動のモデル化を行っている.また,[石垣 10a] では流通量販店の ID-POS データに対して PLSI を利用した同時分類が行われているが,このモデルでは顧客カテゴリと商品カテゴリを分離せず購買行動データのみに基づき同一の潜在カテゴリへ分類している.PLSI では分類された結果から各カテゴリの意味内容を把握する必要がある.ID-POS データを分類の対象とした場合,商品の分類結果から各カテゴリの意味内容を把握するためには大量の商品の特徴を把握している必要があり,非熟練作業員やデータ分析者にその条件を求めることは現実的ではない.提案モデルでは,カテゴリ生成には顧客ライフスタイルアンケートの分析結果を反映させるため,顧客ライフスタイルを軸として潜在商品カテゴリの意味内容が直感的に理解しやすいという利点もある.

PI研のコメント:
・3年前のiD付POS分析関連の論文ですが、興味深い内容です。この論文は、「人工知能学会論文誌 26 巻 6 号 D(2011 年)」で公開されものです。これを取り上げたのは、著者の一人が以前、本ブログで取りあげた「日経Big Data、広島での経産省主導、実証実験の記事!」の「プロジェクトの委員長、産業技術総合研究所サービス工学研究センターの本村陽一副センター長」であったためです。本論文のテーマは「日常購買行動に関する大規模データの融合による顧客行動予測システム」であり、その骨子は、「本研究では,流通量販店の顧客 ID 付きの購買履歴データである 1 年間の ID-POS データと,その会員への 4000 人規模のアンケートデータを用いる.」と、アンケートとiD付POS分析を組み合わせている点です。しかも、そのアンケートはiD付POS分析の会員へのアンケートである点がユニークです。また、その分析技術としてベイジアンネットワークを用いており、独自の「カテゴリベース顧客行動モデリング」を構築していることです。ちなみに、このiD付POS分析のデータは「生活協同組合コープこうべから提供を受けた.」とのことです。結果、おそらく、広島モデルは、本村氏がプロジェクトリーダーですので、このベインジアンネットワーク手法が全面的に活用されることになると思われます。結果、一企業内ではなく、広島全体のiD付POS分析となり、広島独自のベインジアンネットワークができあがると予想され、これをもとに、様々なサービスが生まれるのではないかと思います。2015年度、来年は、その意味で、iD付POS分析、ビックデータにとって転機となる年となるのではと思います。


お知らせ:
1.2014年度版、食品スーパー・ドラックストア財務3表連環分析、リリース!
  *食品スーパー・ドラックストア、全上場企業約100社のP/L、CF、BSを連環分析!
  *過去5年間を収録(ドラックストア3年)、エクセルで自由自在に分析可能
2.eラーニングでの iD付POS分析を体感しませんか?

  *無料トライアル版、お申し込みはこちら!
  *販売・売場づくりのポイント、無料トライアル版はこちら!
  →Big Data、マーケティング関連のメルマガはじめます、ご登録を!
3.MBQ(マービック)オープン:Big Data、マーケティングポータルサイト!
  →MBQのfacebookはこちら!
4.週間!食品スーパーマーケット最新情報:まぐまぐ! 
5.facebookに「食品スーパーマーケット最新情報」グループ創設374人こちら

« 日経Big Data、広島での経産省主導、実証実験の記事! | Main | ベインジアンネットワークモデルとiD付POS分析、その2! »

Comments

Post a comment

Comments are moderated, and will not appear on this weblog until the author has approved them.

(Not displayed with comment.)

TrackBack

« 日経Big Data、広島での経産省主導、実証実験の記事! | Main | ベインジアンネットワークモデルとiD付POS分析、その2! »