主成分分析 -因子分析との比較-

Similar documents
因子分析

Microsoft Word - M4_9(N.K.).docx

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

スライド 1

観測変数 1~5 因子負荷量 独自因子 a 独自因子 b 共通因子 1 独自因子 c 固有値 ( 因子寄与 ) 独自因子 d 共通因子 2 独自因子 e 共通性 補足説明因子負荷量 : 因子と観測変数の関係性を示す -1.00~+1.00 までの値を取り.60 以上で高く強い関係性があると言える.3

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft Word - SPSS2007s5.doc

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

EBNと疫学

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - e-stat(OLS).pptx

Medical3

Microsoft Word - mstattext02.docx

主成分分析 + 重回帰分析 a.2 変数群に対して, 以下のような手順を実行 ( 多変数群 ) では,2 変数群を組み合わせて実行 ) 説明変数群の主成分分析 2 基準変数群の主成分分析 3 説明変数群における 個の主成分得点に対して, 基準へ数群における主成分得点のすべてを用いて重回帰分析を反復

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

経営統計学

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

1.民営化

ブック 1.indb

13章 回帰分析

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

スライド 1

Medical3

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取


Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - データ解析発表2用パワポ

心理データ解析演習(前半)藤野

Excelによるデータ分析

PowerPoint プレゼンテーション

スライド 1

スライド 1

Taro-13semiamos.jtd

情報工学概論

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

Microsoft Word - Stattext07.doc

資料

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

ANOVA

構造方程式モデリング Structural Equation Modeling (SEM)

SPSSによる実習

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

スライド 1

図 1 調査事項 旅行 趣味に対する意識 旅行に対する意識の選択肢は 選択肢 1>2>3>4の順序で旅行に対する意欲を表す尺度として設定されたものであろう ただし 選択肢 2と3の大小関係はやや微妙である 質問文に 1つだけ をつける とあるから 他の選択肢に当てはまる内容はその選択肢の内容に含まれ

横浜市環境科学研究所

Ⅲ. 結果回答者の属性と回答を求めた内容の概要を図 4 に示す 本事例は 演習のためのトライアルとして行ったもので 筆者の閉鎖的にアップしたSNS を用いた23 名のみの少数サンプルに 色 スポーツ 国 音楽の嗜好について5 件法で回答を求めたものである 図 5~8は それぞれの設問の学生と社会人の

日心TWS

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

第1回

Microsoft PowerPoint - データ解析演習 0520 廣橋

PowerPoint プレゼンテーション

Probit , Mixed logit

件法 (1: 中学卒業 ~5: 大学院卒業 ) で 収入については 父親 母親それぞれについて 12 件法 (0: わからない 収入なし~ 11:1200 万以上 ) でたずねた 本稿では 3 時点目の両親の収入を分析に用いた 表出語彙種類数幼児期の言語的発達の状態を測定するために 3 時点目でマッ

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

相関分析・偏相関分析

数値計算法

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

航空機の運動方程式

地理学論集№83.indd

製造ータの因果分析 | 野中 英和氏(TDK株式会社)

Microsoft PowerPoint - データ解析基礎2.ppt

PowerPoint プレゼンテーション

脳卒中片麻痺者の歩行能力向上のあり方 | 加茂野 有徳氏(農協共済中伊豆リハビリテーションセンター)

Excelを用いた行列演算

lee1

したがって このモデルではの長さをもつ潜在履歴 latent history が存在し 同様に と指標化して扱うことができる 以下では 潜在的に起こりうる履歴を潜在履歴 latent history 実際にデ ータとして記録された履歴を記録履歴 recorded history ということにする M

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

untitled

PowerPoint Presentation

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Microsoft Word - 補論3.2

Microsoft Word - lec_student-chp3_1-representative


平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

MedicalStatisticsForAll.indd

平成23年度全国学力・学習状況調査問題を活用した結果の分析   資料

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

1. 研究の背景 目的 背景 臼杵の町は 城下町であったこともあり 地形を上手に利用した特色のある街並みが形成されている 現在臼杵では 歴史的景観を保存 再生する街並みづくりが行われている そして中央通商店街周辺においても整備計画が持ち上がっている 目的 VR をもちいた景観シミュレーションにより

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

09.pptx

Microsoft Word - Stattext13.doc

相関係数と偏差ベクトル

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習


3章 度数分布とヒストグラム

ToDo: 今回のタイトル

景気指標の新しい動向

三科目合計の算出関数を用いて各教科の平均点と最高点を求めることにする この2つの計算は [ ホーム ] タブのコマンドにも用意されているが 今回は関数として作成する まず 表に 三科目合計 平均 と 最高点 の項目を用意する 項目を入力する際 適宜罫線などを設定し 分かりやすい表作成を心がけること

untitled

Transcription:

主成分分析 - 因子分析との比較 - 2013.7.10. 心理データ解析演習 M1 枡田恵

主成分分析とは 主成分分析は 多変量データに共通な成分を探って 一種の合成変数 ( 主成分 ) を作り出すもの * 主成分はデータを新しい視点でみるための新しい軸 主成分分析の目的 : 情報を縮約すること ( データを合成変数 ( 主成分 ) に総合化 ) 因子分析の目的 : 共通因子を見つけること ( データを潜在因子に分解 ) 2

因子分析と比較! 因子分析 主成分分析 観測変数に共通な潜在因子を探る 因子は変数を説明する独立変数 共通因子の影響を除いたら変数間の偏相関が 0 になるように因子負荷を求める 変数間の相関関係を因子によって説明する http://www.f.waseda.jp/oshio.at/edu/data_b/top.html 観測変数が共有する情報を合成変数として集約する 主成分は変数によってその値が決まる従属変数 主成分の分散が最大になるように変数にかかる重みを求める もとの変数群の分散をできるだけ取り込むような合成変数を求める 3

因子分析と比較! 因子分析 主成分分析 X j = a j1 f 1 + a j2 f 2 +e j x: 観測変数 a: 因子負荷 f: 共通因子 e: 独自因子 * 共通因子に誤差は含まない ( 独自因子に含まれる ) Z j = a j1 X 1 +a j2 X 2 z: 主成分 a: 主成分負荷量 x: 観測変数独自因子を考慮しない! * 主成分は誤差を含む変数をそのまま合成しているので 誤差を含む *a j12 +a j22 = 1 4

主成分の決め方 分散が最大になるように第 1 主成分を決めたら 次は第 1 主成分とは相関しないという条件下で分散が最大になるように 第 2 主成分を決める 第 3 主成分以降も同様 http://www.macromill.com/landing/words/b007.html 5

主成分得点 主成分得点 - データが新しく得られた主成分の軸上で取る値 - 主成分の軸にあるデータの点 (#1) から下ろした垂線の先の軸上での目盛 ( 座標値 ) * データの数だけ主成分得点はある * 主成分負荷量 : 主成分得点ともとの変数との相関係数 ( 主成分負荷量を見ると もとの変数が各主成分にどの程度反映されているか分かる ) 第一主成分第二主成分 y 軸 -1.2-0.8 78 # 1 35 X 軸 6

ここまでを簡単にまとめると 因子分析では 因子 項目 というパスが引けるが 主成分分析では 項目 合成得点 というパスになる 主成分分析はデータの記述であり 因子分析のような潜在変数を想定したモデルではない * 主成分分析はデータをまとめる ( 合成の分析 ) 主成分分析では 主成分をできる限り少なくすることが目的 - 結果において 第一主成分でどの項目も高くなっていることは 主成分分析では喜ばしい結果 - 究極的には 第一主成分だけ出ればよい * 第一主成分は総合指標になることが多い * 上位の主成分ほど個体の散らばりをよく表す 7

主成分分析の特徴 (1) 主成分分析は 計算に繰り返しのない主因子法を用い 共通性の初期値を 1 として計算 ( 独自性を考慮しない ) - 主成分分析では 必ず共通性の初期の値はすべて 1 と出力される! - ここで用いる主因子法は因子分析の因子抽出法の 1 つ 因子分析と違うのは 因子分析の計算では共通性を 1 とは推定しないということだけ 8

主成分分析の特徴 (2) 主成分分析では ( 基本的に ) 軸の回転を行わない - 主成分分析で用いる主因子法は 第一因子にできるだけ因子寄与を高くしようとするもの - 因子分析で回転させるのは 因子寄与を分散させて単純構造にするためであり 因子数を少なくするのではなく むしろ増えることになる 少ない次元で説明することができなくなる * 単純構造 特定の因子だけに因子負荷が高い値を示した因子パターンを示す場合 9

主成分分析の特徴 (3) 主成分分析では 取り上げなかった下位の主成分を誤差と見なす ( 上位の主成分を結果として取り上げ 解釈の対象にする ) - 下位の主成分の重みつき合計が各変数の誤差 各変数の誤差は取り上げなかった下位の主成分をその源として共有し 互いに独立なものでない 主成分分析の誤差は各変数に独自のものでない! 10

主成分分析の解釈 主成分分析においては 異なる主成分どうしは無相関 ( 軸が直交 ) 異なる主成分は互いに無関係な意味をもつ 主成分はどちらの方向が正か負かを決められないので 主成分の正負と意味づけにおける正負が逆転してもよい - 例 ) ある主成分が 対人関係能力の高さ と解釈した場合 主成分正 対人関係能力が高い 負 対人関係能力が低い 正 対人関係能力が低い 負 対人関係能力が高い という解釈が妥当なこともあれば という逆転の解釈が妥当なこともある 11

どんな時に使うのか 多変量データ ( 例えば多数の質問項目 ) の総合評価をしたい時 - 各変数の類似性を明確にし 総合的に把握する - いわゆる ( たったひとつの ) 総合評価だけでなく いろいろな観点からの総合評価を抽出する 例 ) 授業評価のアンケート - 授業全体の総合評価に加え 内容の総合評価や教員の努力の総合評価を抽出することができる 12

どんな時に使うのか 変数に重みづけをして 合成得点を算出したい時 - 変数に重みづけをすれば 個体の相違がいっそう明瞭になる総得点が得られる * 分散をできるだけ大きくする 個体差をできるだけ大きくする 13

どんな時に使うか 例 ) テストの合計得点の算出 国語の平均が 30 点 (SD 10), 数学の平均点が 70 点 (SD 20) である時 - 国語が得意な A 君は国語が 40 点, 数学が 50 点で,2 教科の合計は 90 点 - 数学が得意な B 君は国語が 20 点, 数学が 90 点で,2 教科の合計は 110 点 単に足しあわせた合計得点には, 数学の得点の影響がより大きく反映してしまうのではないか 数学が得意な学生が上位を占め, 国語が得意な学生の順位が低くなってしまうことになり, あまりフェアなやり方とはいえない 主成分分析を用いると, 各教科の点数に 重みづけをして, 合成得点を算出することができる 14

どんな時に使うのか 主成分分析は企業経営 マーケティング等でも用いられる - 顧客満足度を調査したアンケート結果をまとめるとき ( 多くの顧客の欲求をまとめ 明らかにする ) - 消費者のさまざまな商品の購買数量の類似性を明らかにしたいときなど http://www.macromill.com/landing/wo rds/b001.html 15

主成分分析の利点 数学的な原理や主成分を求める方法が単純明快 変数間の相関行列さえあれば計算できる 因子分析のように複数の推定法があって それぞれで結果が違うということはない データ数より変数の数が多いデータにも適用できる ( 得られる主成分の数は データ数 -1 ) 因子分析では データ数が少ないと不適解が生じやすいが 不適解が生じないため 常に結果が求められる 1 回で計算が終わる 16

注意! みなさんはそんなことしないと思いますが SPSS では 因子分析のデフォルトが 主成分分析 になっているために 因子分析をするつもりが 誤って主成分分析を行ってしまうケースがある - 計算上の違いは共通性の初期値の違いだけであるので 大きな違いは生じない場合もあるが ふつうの因子分析よりいい結果に見えてしまうことがあるので注意! - 因子分析と主成分分析では得点の算出法が大きく異なるので注意! * 因子得点 各因子と各個体 ( 各データ ) の相関の程度 17

デモ 因子抽出 - 方法 で 主成分分析 ( デフォルト ) を選択 - 抽出の基準 の 最小の固有値 は 1 でよい - 回転のない因子解 にチェックをいれておく 続行 * 主成分分析では軸を回転させない 18

デモ 主成分得点を算出したい時には 得点 をクリック - 変数として保存 にチェックを入れる - 回帰法 を選択 続行 OK 19

デモ 共通性 因子分析の時と同様に, 共通性が出力される ただし, 初期の固有値はすべて 1 になる 20

デモ 説明された分散の合計 一番左上の部分が, 主成分分析では 成分 となっている 回転を行っていないので, 回転後の負荷量平方和 は出力されない 全分散のうち 2 つの 主成分で説明される 部分は 70.21% となって いる 21

成分行列 デモ 因子分析では 因子行列 であったが, 主成分分析では 成分行列 となる ここで表示される数値は 重み ( 負荷量 ) と呼ばれる 第 1 主成分には 6 つの変数いずれも正の 重みを示している 第 1 主成分 : 総合評価 第 2 主成分は 外向性 社交性 積極性 が正の重み, 知性 信頼性 素直さ が 負の重みを示している 第 2 主成分 : 対人関係能力と知的能力のいずれが優位か 22

因子分析と比較 因子分析 ( 主因子法 バリマックス回転 ) 主成分分析 23

デモ 主成分得点 を算出するよう指定したので, 2つの主成分に相当する得点が各ケースについて算出される 主成分得点は平均が 0, 分散が 1 になる 24

デモ 主成分得点間の相関を 調べる 分析 相関 2 変量 新たに算出された変数 2 つを右図のように選択 25

デモ 出力されたデータを見ると主成分得点間の相関係数は r = 0, 無相関になっている 主成分同士が無相関 26

参考文献 足立浩平 (2006) 多変量データ解析法 - 心理 教育 社会系のための入門 - ナカニシヤ出版 加藤剛 (2013) 本当に使えるようになる多変量解析超入門技術評論社 小塩真司 HP: 心理データ解析 Basic (http://www.f.waseda.jp/oshio.at/edu/data_b/top.html) 南風原朝和 平井洋子 杉澤武俊 (2009) 心理統計学ワークブック - 理解の確認と深化のために有斐閣 市場調査 アンケート調査のマクロミル HP - 主成分分析 (http://www.macromill.com/landing/words/b007.html) - 因子分析 (http://www.macromill.com/landing/words/b001.html) 松尾太加志 中村知靖 (2002) 誰も教えてくれなかった因子分析 - 数式が絶対に出てこない因子分析入門 - 北大路書房 村山航さん (Department of Psychology, University of California, Los Angeles)HP (http://www4.ocn.ne.jp/~murakou/factor.htm) 27