tableauでクラスター分析はじまる!
Tableau でのクラスタリングのしくみ:
・https://onlinehelp.tableau.com/current/pro/desktop/ja-jp/clustering_howitworks.html
・クラスター分析はビュー内のマークをクラスターに区分します。各クラスター内のデータの値は、他のクラスター内のマークよりも互いに似ています。Tableau は色を使用してクラスターを区別します。
・クラスター アルゴリズム:
・Tableau はクラスタリングに k 平均法を使用します。クラスター k の指定された数字に対し、アルゴリズムはデータを k 個のクラスターに区分します。各クラスターには、そのクラスターのすべてのポイントの平均値である中心 (centroid) があります。K 平均法では、クラスター内の個別ポイントとクラスターの中心の間の距離を最小化する手順を繰り返して、中心を配置します。Tableau では、ユーザーは希望するクラスターの数を指定できます。または Tableau がさまざまな k の値をテストし、最適なクラスター数を決定できます 。
・K 平均法では、クラスター中央値の初期仕様が必要です。1 つのクラスターから開始し、メソッドは、平均がデータを 2 つに分割するためのしきい値として使用される変数を選択します。これらの 2 つの部分の重心は、次に k 平均法を初期化し、2 つのクラスターのメンバーシップを最適化するために使用されます。次に、2 つのクラスターから分割対象となるものを 1 つ選択し、そのクラスター内で、平均がデータを 2 つに分割するためのしきい値として使用される変数を選択します。次に、k 平均法を使用してデータを 3 つのクラスター内にパーティション化し、分割クラスターの 2 つの部分の重心と、残りのクラスターの重心で初期化します。このプロセスは、クラスターの設定数に到達するまで繰り返されます。
参考:
・クラスタリング (クラスター分析)
・神嶌 敏弘 氏:
・http://www.kamishima.net/jp/clustering/
・クラスタリング手法は大きく,最短距離法などの階層的手法 (hierarchical method) と,k-means法などの非階層的手法 (non-hierarchical method) に分けられますが,これらの基本的手法を紹介します.
PI研のコメント:
・タブロー、V10からの新機能でいよいよ待望のクラスター分析が可能となりました。これまでのビッグデータのビジュアル化に加え、統計解析機能を組み込む方向に大きな一歩といえます。しかも、非常に慎重に何からスタートするか、特に、ビッグデータの中で何が課題かを検討した上でクラスター分析、しかも、よりビッグデータとの相性の良い、K-means法を採用しています。クラスター分析は解説で取り上げた神嶌敏弘氏のレポートにもあるように、階層型(デンドログラム)、非階層型、さらには、ハード、ソフトがありますが、この中で、ハードクラスタリングの非階層型から入っていますので、満を持しての選択といえるかと思います。実際、ID-POS分析に活用してみましたが、驚くほど簡単で、瞬時に様々なケースをトライでき、いずれも、タブローの真骨頂、ビジュアル化ができますので、これまで欲しかったことが実現でき、快適です。もちろん、結果を読み込み、本当に実践活用できるかは、じっくり分析し、判断する必要がありますが、これまでのビジュアル化に深さが加わったといえ、今後、大いに活用してゆきたいと思います。また、Kは指定しなければタブローが自動に判断してくれる機能もついており、いたれりつくせりといえます。恐らく、これは今後の新展開の第1歩と思われますので、今後、別のクラスター分析、さらには、他の統計解析機能も続々と追加されてくるのではないかと期待されます。個人的にはPLSA、すなわち、ソフトクラスタリング機能を早く入れて欲しいところです。ただ、ここまで来ると、機械学習との連動になりますので、おそらく、ここを当面の目標としているのではないかと思います。今回のK-means法もKを自動解析するところを見ると、一歩、機械学習に踏み込んでいるともいえ、今後の展開が気になるところです。
━━━━━━ お知らせ! ━━━━━━━━━━━━
1.NEW! 隔週、ID-POS分析の連載スタート、DRM オンライン、第8回、3/20!
2.週間!食品スーパーマーケット最新情報:まぐまぐ!
3.facebookに「食品スーパーマーケット最新情報」グループ創設655人!
4.2016年度版、食品スーパー・ドラックストア財務3表連環分析、リリース!
*現在Vol.3、ご要望を取り入れ、すばやく改定:お申し込みはこちら
*食品スーパー・ドラックストア、全上場企業約100社を対象!
*過去5年間を(ドラックストア3年)、エクセルで自由自在に分析!
March 24, 2017 | Permalink
Comments