« ハローズ、株価異常な値動き、株価3倍! | Main | クローガー、好調、2016年、第3四半期決算、株価急騰! »

December 09, 2015

ID-POS分析は正規分布ではない?

ID-POSデータと重回帰分析:
・日経ビッグデータ:

第1回:重回帰分析における係数、予測値と残差の解釈
・ID-POSデータで各会員の購入金額を分析・予測する:
・http://business.nikkeibp.co.jp/atclbdt/15/recipe/112900031/
・分析に使うサンプルデータ:ID-POSデータ(カスタマーコミュニケーションズ提供 2014年04月から2014年05月、http://www.truedata.co.jp/)データ
・分析に使うソフト:Excel
・分析方法:重回帰分析
・ポイント:
・残差は回帰式におけるeのことである。これを分析することによって、各顧客への異なるアプローチを考えることができる。
・本稿では、ID-POSデータから重回帰分析を行い、予測値と残差を算出した。回帰分析の係数を解釈することによって、現状の分析と施策の検討をすることができる。また、予測値と残差を分析することは、顧客へのアプローチを考え、売上最適化等を行うためのヒントとなる。係数の解釈とセットで行うようにしたいものである。

第2回:残差による重回帰分析の妥当性の検証
・ID-POSデータで各会員の購入金額を分析・予測する方法:
・http://business.nikkeibp.co.jp/atclbdt/15/recipe/112900032/
・分析方法:重回帰分析の予測値と残差の可視化
・ポイント:
・正規分布していないことがわかる。このように、被説明変数が正規分布に基づかない場合は、変数変換を考えるとよい。例えば、被説明変数を何らかのインデックスにすることを考えてもよいし、乗数変換等もある。被説明変数を変換し、再度回帰分析を行うと、結果が良くなることが期待できる。ただし、その場合は、係数の意味が変わることに注意しなければならない。

第3回:正規確率プロットにより重回帰分析の妥当性を検証
・ID-POSデータで各会員の購入金額を分析・予測する方法:
・http://business.nikkeibp.co.jp/atclbdt/15/recipe/112900033/
・分析方法:正規確率プロット
・ポイント:
・この対策には、分析者の被説明変数が生成される背景への理解、分布への理解、そしてセンスが反映される。分析対象のデータから外す等は時間を短縮するメリットもあるが、分析が恣意的になったり、データの持つ情報量を最大に利用できなかったりいった短所もある。
・重回帰分析は正規分布を前提とした手法であるためチェックは常に必要である。被説明変数が正規分布に基づかない場合、様々な対策があるが、どのような対策を行うかも正規確率プロットから示唆を得ることはできる。

PI研のコメント:
・日経ビッグデータで「おたにの小谷 祐一朗氏」によるID-POS分析の解説が連載されています。前回、おむつとビールについての家計調査データでの分析でしたが、今回はCCLの1000人のID-POSデータを活用しての分析ですので、いよいよ核心に迫っています。内容は「最も簡単な分析手法はRFM分析である。」「RはRecency(最新来店日)、FはFrequency(購入頻度等)、MはMonetary(購入金額)」と、RFM分析をもとに、統計学の視点で深めるという内容です。ここでは3回までの内容ですが、さらに、回数は続くと思われます。ただ、この3回でも興味深い結論が導かれています。ポイントは「正規分布していない」であり、ID-POS分析に真正面から重回帰分析を適用することはできないということです。これまで、実際の事例では分かっていたことですが、統計学的な視点で、生データで実証しています。結果、「対策には、分析者の被説明変数が生成される背景への理解、分布への理解、そしてセンスが反映される。分析対象のデータから外す等は時間を短縮するメリットもあるが、分析が恣意的になったり、データの持つ情報量を最大に利用できなかったりいった短所」ということになります。恐らく、ID-POS分析がいまひとつ分析しにくい要因はこれが大きな壁になっていたと思われ、今後、単純に統計学を適用するのではなく、ひと工夫も、ふた工夫も必要であるといえ、新たなアプローチが必要といえます。

お知らせ:
NEW!
1.2015年度版、食品スーパー・ドラックストア財務3表連環分析、リリース、8/17!

  *食品スーパー・ドラックストア、全上場企業約100社を対象!
  *過去5年間を(ドラックストア3年)、エクセルで自由自在に分析!
2.週間!食品スーパーマーケット最新情報:まぐまぐ! 
3.facebookに「食品スーパーマーケット最新情報」グループ創設616人!
4.eラーンング:
  *ID付POSデータ実践活用セミナーがeラーニングになりました!

December 9, 2015 |

TrackBack


Listed below are links to weblogs that reference ID-POS分析は正規分布ではない?:

Comments

Post a comment