アソシエーション分析って何?
アソシエーション分析:
1.サポート(出現率、支持度):(PI値)
・サポートは、前提 A と結論 B が両方とも登場するレコードの割合を表します。データ全 体に対し、ルールが出現する割合といえます。
・Support (A→B) = (A、B を同時に満たすレコード件数) / (全体件数)
2.信頼度(Confidence):(併買率)
・信頼度は、前提 A を満たすレコードの内、結論 B を満たすレコードの割合を表します。 前提 A が起きたときに結論 B が起きる条件付き確率といえます。
・Confidence(A→B) = Support (A→B) / Support (A) ただし、Support(A) = (A の登場するレコード件数) / (全体件数)
3.Lift(改善度):(リフト値)
・Lift は、前提 A、結論 B に関する信頼度を、前提なしの結論 B についての信頼度で割っ たものです。A とは無関係に B が起こらないという指標になります。大きい値であれば、 A と B は同時に発生する関係にあるといえます。また、A と B が独立である場合、Lift の値は 1 になります。
・Lift (A→B) = Confidence(A→B) / Support(B) = Support (A→B) / (Support (A) ×Support (B))
4.Conviction(確信度) :(逆リフト値の反対)
・Conviction は、前提のサポートと結論以外のサポートの積を、ルール「前提→結論以外」 のサポートで割った値です。前提を A、結論を B とし、結論以外の事象を B’としたと場 合
・Conviction(A→B) = Support(A) × Support(B’) / Support(A→B’) = Support(B’) / Confidence(A→B’) = (1 – Support(B)) / (1 – Confidence(A→B))
5.事例:商品A(前提)と商品B(結論)
・信頼度82.353、サポート1.847、Lift 1.534、 Conviction 2.624
・ルール数42、前提数51、結論数1221、キー数2274
PI研のコメント:
・アソシエーション分析はID付POS分析の専売特許のように思われていますが、その歴史を見ると、実はPOS分析の研究から発した同時購買の分析が原点といえます。IBM Almaden Research Centerが1993年に公表したRakesh Agrawal氏らの論文「Mining Association Rules between Sets of Items in Large Databases」がスタートといわれています。まさに、データマイニングの時代に生まれた分析手法といえます。したがって、ID付POS分析は考慮されておらず、ID付POS分析で活用するには工夫が必要です。さらに、ここ最近のBig Dataの流れ、特に、機械学習への対応も検討が必要であり、これをそのまま単純にアソシエ―ションとして実践活用するにはやや無理がありそうです。参考に、一般的なアソシエーション分析に加え、ID付POS分析でよく使う指標を( )で示しましたが、その視点から見ると、これらの指標の関連が分かりにくいといえます。本来、リフト値は併買率=リフト値×PI値の中でとらえた方が、各指標の関係もグラフ化も容易であり、さらに、ID付POS分析にも活用ができるといえます。特に、サポートに関しては前提A、結論BのPI値を算出した方が信頼度の本質に迫ることができ、図解も容易ですので、わかりやすいのではと思います。また、確信度になると、逆リフト値かつ反対概念を使うため、理解しがたい指標であり、使いづらいといえます。ならば、リフト値が割り算ですので、引き算で算出した方が、参考値としてはわかりやすいのではないかと思います。さらに、2つの事象の関係を見るだけでなく、そこから弁証法的に第3の軸をつくり、止揚してしまった方が、より、2つの関係が理解できるのではないかと思います。これがいわゆる、PLSAですが、どうも、アソシエーション分析は新たな段階に入ったように思います。恐らく、将来は、PLSAからID付POS分析、POS分析のアソシエーションが統一できるのではないかと思います。研究課題ですね。ただ、そのPLSAもLDAへ発展しており、どうも、終わりがなさそうですが、・・
━━━━━━ お知らせ! ━━━━━━━━━━━━
1.週間!食品スーパーマーケット最新情報:まぐまぐ!
*http://archives.mag2.com/0000193836/
2.facebookに「食品スーパーマーケット最新情報」グループ創設645人!
*https://www.facebook.com/groups/133574913429782/
3.2015年度版、食品スーパー・ドラックストア財務3表連環分析、リリース!
*食品スーパー・ドラックストア、全上場企業約100社を対象!
*過去5年間を(ドラックストア3年)、エクセルで自由自在に分析!
*お申し込みはこちら:https://pipi.cocolog-nifty.com/consulting/
« 併売率=リフト値×購買率で、相互送客の効果を実証! | Main | 食品スーパー、ID付POS分析をMDに活用! »
« 併売率=リフト値×購買率で、相互送客の効果を実証! | Main | 食品スーパー、ID付POS分析をMDに活用! »
Comments