Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

マトリックス・データ解析法(主成分分析)

マトリックス・データ解析法とは
Matrix data analysis
関連サイト:匠の知恵 https://takuminotie.com/

  • Be the first to comment

  • Be the first to like this

マトリックス・データ解析法(主成分分析)

  1. 1. ク コンサルティング ク コンサルティング クレイン テクノ Crane techno . サイト URL:http://crane-techno.com/ 2020年9月2日 マトリックス・データ解析法
  2. 2. マトリックス・データ解析法 目次 1.マトリックス・データ解析法とは 2.マトリックス・データ解析法の作り方 3.マトリックス・データ解析法 作成事例
  3. 3. 1.マトリックス・データ解析法とは マトリックス・データ解析法とは、マトリックス図の交点に数値データが与えられ た場合に、多くの数値データを相関分析などで処理し、二次元平面図(X-Y平面 図)に表わし、問題とその要因との関係をわかりやすく示す手法です。 英語:matrix data analysis ビッグデータで使用される多変量解析では主成分分析といわれ原石(データ)をダイ ヤ(活きた情報)に変えることができます。 競合分析、自社・他社分析、5択式アンケートなど、市場調査結果から売れ筋を見極 めて新商品開発の方向性を選択するといった場面などに使用することができます。 英語:Principal component analysis
  4. 4. マトリックス・データ解析法の目的 次元削減でデータをシンプルに 3次元までのデータであれば立体図(X,Y,Z)で表現すれば視覚的にも傾向を把握し やすくなりますが3次元以上のデーターの場合は立体図(X,Y,Z)は使用できないの での3次元以上のデーターの次元数を削減する手法として主成分分析が用いられま す。 3次元データー 3次元以上のデーター
  5. 5. マトリックス・データ解析法(主成分分析)とは、多くの変数を持つデータについ てできるだけ情報量を落とさずに、その特性をより少ない次元で明らかにする手法 のことです。例えば、次に3 つの例を示します。 事例1:6次元⇒1次元 事例2:6次元⇒2次元 総合成績 文系 理系 総合成績を抽出し て分析、改善 『文系能力』と『理 系能力』に分けて 分析、改善
  6. 6. 事例3:2次元⇒1次元 肥満度合い BMI BMIを抽出して分析、 改善 身長 体重 BMIとは BMI(Body Mass Index)はボディマス指数と呼ばれ、体重と身長から算出される 肥満度を表す体格指数です。 BMI = 体重kg ÷ (身長m)2
  7. 7. マトリックス・データ解析法で陳列棚を改善 アンケート結果をもとに、缶コーヒーの陳列方法を検討。 各缶コーヒーについて、「コク」「香り」「酸味」の3つの特色で5段階評価のアン ケートをとりました。以下の表は、各缶コーヒーの評価点と平均、標準偏差をまと めています。 目的は缶コーヒーの陳列をお客様の要望に合わせて売り上げを増加させることです。 ①消費者の立場に立って人気商品を評価⇒例:総合的な人気商品で評価 ②特化した個性で訴求する商品で評価⇒例:「香りにこだわる人へ」
  8. 8. アンケート結果を散布図で視覚化 次の散布図は、とりあえず計算結果を省いて、主成分分析の最終出力結果 を視覚化したものです。縦軸は「香り」、横軸は「総合力」を表しています。 この図から、たとえば次のことがわかります。総合的に1番人気なのは、 「サンマルタ」、総合評価では低いが、「香り」に特色があるのが 「UCCB」といった具合です。
  9. 9. 缶コーヒーの陳列棚 改善 お客様が商品を選ぶときの参考にライスカードの横にチラシをつけて販売すること にしました。 「とりあえず迷ったらこれ!」サンタマルタ……総合的な人気商品 「香りにこだわる人にはこれ!」UCCB……香りに特化した個性で訴求 とりあえず迷ったらこれ! 人気No1 商品 UCCB UCCB UCCB UCCB UCCB 「香りにこだわる人にはこれ!」 UCCB
  10. 10. マトリックス・データ解析法の手順、全5ステップ 1.変数の単位を揃えるためにデータを基準化する 2.基準化したデータの相関係数行列を求める
  11. 11. 3.相関係数行列の固有値を固有ベクトルを求める 4.分析結果の精度を確かめる
  12. 12. 5.主成分得点を求め、散布図を描く
  13. 13. 具体的なエクセルを用いたマトリックス・データ解析法 ①平均点が違う国語/化学のテスト80点を評価するには? Excel関数 「STANDARDIZE」でデータを基準化しよう ②コーヒーの「コク」「香り」「酸味」のデータから新たな評価軸を生み 出すには? Excelで相関係数行列、固有値と固有ベクトルを求める ③缶コーヒー総合力1位はどれだ?「コク」「香り」「酸味」の主成分得 点を求め、散布図を描いて解釈する
  14. 14. マトリックス・データ解析の進め方 データ・マトリックス解析は次のような手順で行います。 評価する目的を決める 目的に沿ったデータを収集する データを基準化した後、解析を行う 主成分を2つ抽出して、解析から得られた得点を散布図に表し、評価する 解析は、複雑な計算を伴うことが多いため、パソコン用の統計解析ソフトを利用す ることをお勧めします。 無料で使用できるものも公開されています。 。
  15. 15. 3. 事例によるマトリックス・データ解析法の作り方 ①目的を決定 全社的に実施しているセミナー15コースを、「IT教材の充実」からはじまって、「独特 なスタイル」まで6つの評価尺度で評価し、どういったセミナーがよいのかを探つてみ ることにしました。 評価は、5段階評価で「5」に近いほどよい評価点とします。この評価にあわせてセミ ナーごとの受講希望者の動向も5段階で評価することにしました。 【評価の概要】 評価セミナー数:15コース 評価項目: 「IT教材の充実度」 「テキストの充実度」 「実習の充実度」 「優秀な講師陣」 「事務局のお勧め」 「独特なスタイル」 結果評価: 「受講者数の増加状況」 評価点: 5点:非常によい 4点:よい 3点:普通 2点:悪い 1点:非常に悪い。
  16. 16. ②マトリックス・データ収集 目的に合わせて、データを収集します。収集するデータは、アンケート形式 でも実測値でもかまいません。数値データであれば解析できます。 マトリックス・データ解析に必要なデータは、各サンプルにすべての評価 点が入ってていることが必要条件です。したがって、アンケートなどから データを収集するときは、すべての項目に何らかの評価点が記入されるよう 注意しておきます。 ここでは、15コースのセミナーを評価した結果をマトリックス・データ形 式にまとめています。 行にサンプルナンバーを記入し、列に評価項目をタイトルとして記入します。 記入が終われば、欠落データがないか、誤記入がないかなどをチェックします。 IT教材の充実度 テキストの充実度 実習の充実度 優秀な講師陣 事務局のお勧め 独特なスタイル コースA 4 4 2 3 2 3 コースB 3 2 2 3 5 4 コースC 3 5 5 5 4 3 コースD 4 3 4 2 2 2 コースE 4 3 4 3 2 2 コースF 3 4 1 5 4 5 コースG 2 2 4 2 1 1 コースH 1 3 5 4 3 3 コースI 2 2 3 3 2 2 コースG 2 2 3 2 1 3 コースK 3 1 2 1 2 3 コースL 3 2 3 1 2 3 コースM 3 1 2 1 3 1 コースN 5 2 2 2 3 2 コースO 2 1 1 1 4 5 平均値 2.9 2.5 2.9 2.5 2.7 2.8 標準偏差 1.0 1.2 1.3 1.4 1.2 1.2
  17. 17. ③データーを基準化 ここでのデータは、すべて項目の評価点の大きさと単位が同じですが、評価項目が 身長、体重、年齢など大きさや単位が違う場合、単位の取り方によって、答えが変わ ります。 そのため、各データを平均値0、標準偏差1のデータに変換することで、この問題 を解消することができます。この方法をデータの基準化といいます。 基準化データは、次の式で計算します。 基準化デー夕=(デー夕)ー(平均値)/(標準偏差) 例えば、コースAの「IT教材の充実」の基準化データは 「IT教材の充実」の基準化データ= 4-2.933/1.033=1.033 となります。 グラフ化
  18. 18. 標準化したDATA IT教材の充実度 テキストの充実度 実習の充実度 優秀な講師陣 事務局のお勧め 独特なスタイル コースA 1.03 1.29 (0.67) 0.34 (0.57) 0.17 コースB 0.06 (0.39) (0.67) 0.34 1.99 0.99 コースC 0.06 2.13 1.64 1.82 1.13 0.17 コースD 1.03 0.45 0.87 (0.39) (0.57) (0.66) コースE 1.03 0.45 0.87 0.34 (0.57) (0.66) コースF 0.06 1.29 (1.43) 1.82 1.13 1.82 コースG (0.90) (0.39) 0.87 (0.39) (1.42) (1.49) コースH (1.87) 0.45 1.64 1.08 0.28 0.17 コースI (0.90) (0.39) 0.10 0.34 (0.57) (0.66) コースG (0.90) (0.39) 0.10 (0.39) (1.42) 0.17 コースK 0.06 (1.24) (0.67) (1.13) (0.57) 0.17 コースL 0.06 (0.39) 0.10 (1.13) (0.57) 0.17 コースM 0.06 (1.24) (0.67) (1.13) 0.28 (1.49) コースN 2.00 (0.39) (0.67) (0.39) 0.28 (0.66) コースO (0.90) (1.24) (1.43) (1.13) 1.13 1.82 標準化
  19. 19. ④相関係数を計算 相関係数とは、2つの項目間に関係があるかどうかを評価する係数です。 相関係数は、-1から+1までの値をとり、±1に近いほど相関があるといい、この 相関が強い項目を1つにまとめることがマトリックス・データ解析法の特徴です。 「テキストの充実度」と「優秀な講師陣」の2つの項目の相関係数は0.855であり、+ 1に近いため相関が強いということがわかります。以下、「事務局のお勧め」と「独特 なスタイル」の相関係数が0.604、「テキストの充実度」と「実習の充実度」の相関 係数が0.423と続いています。 この相関係数の一覧表をここで示します。これを相関行列とよびます。相関行列を 計算するには、エクセル分析ツールの「相関」を利用します。 相関行列 IT教材の充実度 テキストの充実度 実習の充実度 優秀な講師陣 事務局のお勧め 独特なスタイル IT教材の充実度 1.000 テキストの充実度 0.202 1.000 実習の充実度 -0.220 0.413 1.000 優秀な講師陣 -0.075 0.855 0.326 1.000 事務局のお勧め 0.039 0.171 -0.311 0.389 1.000 独特なスタイル -0.183 0.169 -0.473 0.288 0.604 1.000
  20. 20. ⑤主成分を選ぶ 固有値とは、新しい評価尺度(主成分)それぞれが、全体の情報量(ばらつきの大きさ)の うち、どれくらいパーセントを占めているかを表しています。 例えば、この表の新しい1番目の主成分Z1は、全体の情報量の37.8%(固有値二主 成分の数、2.265丁6)となります。これを寄与率といい、1つの主成分が元の全項 目が持っている情報の何割を説明できるかを表しています。 第1主成分Z1と第2主成分Z2の寄与率を足した69.1%を累積寄与率といいます。 主成分をいくつ採用するかは、累積寄与率が70~80%以上で、固有値が1以上とい うことが目安になります、ここでは、第1主成分Z1(固有値2.265)と第2主成分Z 2(固有値1.882)を取り上げることにします。 この2つで、累積寄与率が69.1%であり、ほぼ70%をクリアしています。固有ベ クトルの計算は、エクセル2010のソルバー機能を利用して計算することができます。
  21. 21. ⑥主成分のネーミング 各主成分と元の評価尺度(IT教材の充実など6項目)との相関係数を計算したものを 因子負荷量といいます。この値は各主成分が元の評価尺度とどれくらい強く関わっ ているかを示すものです。 新たに取り上げた第1主成分Z1と第2主成分Z2のネーミングを行います。主成分 のネーミングは、「主観的に」行われますが、その際、手がかりとなるのは、主成分 を構成している固有ベクトルや因子負荷量の大きさと符号です。 例えば、第1主成分Z1は、ほば6項目とも「十」の値を示しており、これを「講義の 充実性」とネーミングします。同様に第2主成分Z2は、「テキストの充実度」「実習 の充実度」と「優秀な講師陣」が「-」であり、「IT教材の充実」「事務局のお勧め」と「独 特なスタイル」が「十」であることから、これを「内容の話題性」とネーミングします。
  22. 22. ⑦主成分得点の計算 主成分の式を使って対象的に(例えばコース別に)、主成分の値を算出したものが「主 成分得点」です。主成分得点は対象のグルーブ分けや対象の評価に使います。 グルーブ分けの際に役立つものは主成分同士の散布図です。第2主成分まで採用す るのであれば、第1主成分と第2主成分の散布図を作成し、視覚的にグルーブ分け を行います。 ここでは、第1主成分z1「講義の充実性」と第2主成分z2「内容の話題性」の散布図 を書き、別データから「受講者数が増えてきているコース」をマーキングすると、4 つのコース(B、C、F、H)は、話題性というよりも確実に理解できるセミナーであ ることがわかります、マトリックス・データ解析は、このようにして視覚に訴えら れなかった多次元データを情報の損失をできる限り少なくして、2次元で考祭する ことができます。
  23. 23. 2020 年9月2日 ク コンサルティングクレイン テクノ Crane techno サイト URL:http://crane-techno.com/ 参考文献: 図解入門ビジネス新QC七つ道具の使い方がよくわかる本 ポケット図解 QC七つ道具の基本がわかる本

×