« 併売率=リフト値×購買率で、相互送客の効果を実証! | Main | 食品スーパー、ID付POS分析をMDに活用! »

April 05, 2016

アソシエーション分析って何?

アソシエーション分析:

1.サポート(出現率、支持度):(PI値)
・サポートは、前提 A と結論 B が両方とも登場するレコードの割合を表します。データ全 体に対し、ルールが出現する割合といえます。
・Support (A→B) = (A、B を同時に満たすレコード件数) / (全体件数)

2.信頼度(Confidence):(併買率)
・信頼度は、前提 A を満たすレコードの内、結論 B を満たすレコードの割合を表します。 前提 A が起きたときに結論 B が起きる条件付き確率といえます。
・Confidence(A→B) = Support (A→B) / Support (A) ただし、Support(A) = (A の登場するレコード件数) / (全体件数)

3.Lift(改善度):(リフト値)
・Lift は、前提 A、結論 B に関する信頼度を、前提なしの結論 B についての信頼度で割っ たものです。A とは無関係に B が起こらないという指標になります。大きい値であれば、 A と B は同時に発生する関係にあるといえます。また、A と B が独立である場合、Lift の値は 1 になります。
・Lift (A→B) = Confidence(A→B) / Support(B) = Support (A→B) / (Support (A) ×Support (B))

4.Conviction(確信度) :(逆リフト値の反対)
・Conviction は、前提のサポートと結論以外のサポートの積を、ルール「前提→結論以外」 のサポートで割った値です。前提を A、結論を B とし、結論以外の事象を B’としたと場 合
・Conviction(A→B) = Support(A) × Support(B’) / Support(A→B’) = Support(B’) / Confidence(A→B’) = (1 – Support(B)) / (1 – Confidence(A→B))

5.事例:商品A(前提)と商品B(結論)
・信頼度82.353、サポート1.847、Lift 1.534、 Conviction 2.624
・ルール数42、前提数51、結論数1221、キー数2274

PI研のコメント:
・アソシエーション分析はID付POS分析の専売特許のように思われていますが、その歴史を見ると、実はPOS分析の研究から発した同時購買の分析が原点といえます。IBM Almaden Research Centerが1993年に公表したRakesh Agrawal氏らの論文「Mining Association Rules between Sets of Items in Large Databases」がスタートといわれています。まさに、データマイニングの時代に生まれた分析手法といえます。したがって、ID付POS分析は考慮されておらず、ID付POS分析で活用するには工夫が必要です。さらに、ここ最近のBig Dataの流れ、特に、機械学習への対応も検討が必要であり、これをそのまま単純にアソシエ―ションとして実践活用するにはやや無理がありそうです。参考に、一般的なアソシエーション分析に加え、ID付POS分析でよく使う指標を( )で示しましたが、その視点から見ると、これらの指標の関連が分かりにくいといえます。本来、リフト値は併買率=リフト値×PI値の中でとらえた方が、各指標の関係もグラフ化も容易であり、さらに、ID付POS分析にも活用ができるといえます。特に、サポートに関しては前提A、結論BのPI値を算出した方が信頼度の本質に迫ることができ、図解も容易ですので、わかりやすいのではと思います。また、確信度になると、逆リフト値かつ反対概念を使うため、理解しがたい指標であり、使いづらいといえます。ならば、リフト値が割り算ですので、引き算で算出した方が、参考値としてはわかりやすいのではないかと思います。さらに、2つの事象の関係を見るだけでなく、そこから弁証法的に第3の軸をつくり、止揚してしまった方が、より、2つの関係が理解できるのではないかと思います。これがいわゆる、PLSAですが、どうも、アソシエーション分析は新たな段階に入ったように思います。恐らく、将来は、PLSAからID付POS分析、POS分析のアソシエーションが統一できるのではないかと思います。研究課題ですね。ただ、そのPLSAもLDAへ発展しており、どうも、終わりがなさそうですが、・・

━━━━━━ お知らせ! ━━━━━━━━━━━━
 1.週間!食品スーパーマーケット最新情報:まぐまぐ!
   *http://archives.mag2.com/0000193836/
 2.facebookに「食品スーパーマーケット最新情報」グループ創設645人!
   *https://www.facebook.com/groups/133574913429782/
 3.2015年度版、食品スーパー・ドラックストア財務3表連環分析、リリース!
  *食品スーパー・ドラックストア、全上場企業約100社を対象!
  *過去5年間を(ドラックストア3年)、エクセルで自由自在に分析!
     *お申し込みはこちら:https://pipi.cocolog-nifty.com/consulting/

« 併売率=リフト値×購買率で、相互送客の効果を実証! | Main | 食品スーパー、ID付POS分析をMDに活用! »

Comments

Post a comment

Comments are moderated, and will not appear on this weblog until the author has approved them.

(Not displayed with comment.)

TrackBack


Listed below are links to weblogs that reference アソシエーション分析って何?:

« 併売率=リフト値×購買率で、相互送客の効果を実証! | Main | 食品スーパー、ID付POS分析をMDに活用! »