Microsoft Word - M4_9(N.K.).docx

Similar documents
観測変数 1~5 因子負荷量 独自因子 a 独自因子 b 共通因子 1 独自因子 c 固有値 ( 因子寄与 ) 独自因子 d 共通因子 2 独自因子 e 共通性 補足説明因子負荷量 : 因子と観測変数の関係性を示す -1.00~+1.00 までの値を取り.60 以上で高く強い関係性があると言える.3

因子分析

主成分分析 -因子分析との比較-

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - 資料04 重回帰分析.ppt

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Medical3

スライド 1

スライド 1

スライド 1

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1.民営化

Microsoft PowerPoint - e-stat(OLS).pptx

統計的データ解析

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

EBNと疫学

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

様々なミクロ計量モデル†

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - データ解析発表2用パワポ

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

Microsoft PowerPoint - stat-2014-[9] pptx

PowerPoint プレゼンテーション

ブック 1.indb

Microsoft Word - SPSS2007s5.doc

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

1 はじめに

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft Word - lec_student-chp3_1-representative

講義「○○○○」

Microsoft Word - manuscript_kiire_summary.docx

Medical3

横浜市環境科学研究所

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft PowerPoint - Statistics[B]

ANOVA

経済統計分析1 イントロダクション

Microsoft Word - å“Ÿåłžå¸°173.docx

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

基礎統計

日心TWS

13章 回帰分析

PowerPoint Presentation

ビジネス統計 統計基礎とエクセル分析 正誤表

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

数値計算法

Microsoft Word - 補論3.2

Microsoft Word - thesis.doc

Microsoft PowerPoint - statistics pptx

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Probit , Mixed logit

カイ二乗フィット検定、パラメータの誤差

画像類似度測定の初歩的な手法の検証

JUSE-StatWorks/V5 活用ガイドブック

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - statistics pptx

12日目

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

SPSSによる実習

事例から振り返る    調査プロセスの検証

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft PowerPoint - データ解析基礎2.ppt

博士論文 考え続ける義務感と反復思考の役割に注目した 診断横断的なメタ認知モデルの構築 ( 要約 ) 平成 30 年 3 月 広島大学大学院総合科学研究科 向井秀文

Microsoft Word - 教育経済学:課題1.docx

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Microsoft PowerPoint - sc7.ppt [互換モード]

Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students A Dissertation Submitted t

J-SOX 自己点検評価プロセスの構築

測量試補 重要事項

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

ISO9001:2015内部監査チェックリスト

論文題目 大学生のお金に対する信念が家計管理と社会参加に果たす役割 氏名 渡辺伸子 論文概要本論文では, お金に対する態度の中でも認知的な面での個人差を お金に対する信念 と呼び, お金に対する信念が家計管理および社会参加の領域でどのような役割を果たしているか明らかにすることを目指した つまり, お

_KyoukaNaiyou_No.4

青焼 1章[15-52].indd

線形システム応答 Linear System response

Microsoft PowerPoint ppt

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

             論文の内容の要旨

学習指導要領

生命情報学

日本言語科学会(JSLS)チュートリアル講演会 平成13年12月16日(日)午前10時30分から午後4時30分 慶應義塾大学三田キャンパス東館6階G-SEC Lab   言語研究のための統計解析 「論理」学としての思考法,「美」学としての提示法

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint saitama2.ppt [互換モード]

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

どのような便益があり得るか? より重要な ( ハイリスクの ) プロセス及びそれらのアウトプットに焦点が当たる 相互に依存するプロセスについての理解 定義及び統合が改善される プロセス及びマネジメントシステム全体の計画策定 実施 確認及び改善の体系的なマネジメント 資源の有効利用及び説明責任の強化

Microsoft PowerPoint - 測量学.ppt [互換モード]

Transcription:

第 9 章因子分析 9-1 因子分析とは 因子分析 (factor analysis) 実験や観測によって得られた 観測変数 の背後に存在する 因子 を推定する統計的分析手段 観測変数 (observed variable) 実験や観測を通して得られたデータ ( 観測値 ) 因子 (factor) 得られた観測変数に対し影響を及ぼしている 一見すると表には出て来ていない潜在的な要因のこと 潜在変数 (latent variable) とも言われる 共通因子 (common factor) 複数の観測変数の背後にあり 影響を与える因子のこと 共通因子によって説明される観測変数の分散のことを 共通分散 (common variance) といい その値を共通性 (communality) という 独自因子 (unique factor) 1つの観測変数にのみ影響を与えている因子のこと 独自因子によって説明される観測変数の分散のことを 独自分散 (unique variance) という 個別に各変数に影響を及ぼす要因としては この独自因子の他に測定の誤差も存在している 因子負荷量 (factor loading) 因子と観測変数の間の関係性の強弱のこと 推定された因子の解釈に使用される 因子分析では 複数の観測変数に共通した要因である共通因子を推定したい しかし 実際に実験や観測によって得られた観測変数は 共通因子の他にも その変数独自の因子や測定誤差を含んでいる また 各観測変数に対し どの因子が強く影響を及ぼして どの因子があまり影響を与えていないのかという 関係性の強弱を知ることも必要であり 因子負荷量の値が大事になる つまり 観測変数 y は因子負荷量 a と共通因子 x によって 以下の式のように分解することが出来る y=a! x! + a! x! + a! x! + + 誤差 因子分析には大きく分けて 2 つの手法が存在する (1) 探索的因子分析 (exploratory factor analysis: EFA) 因子と観測変数の間の関係に付いて 先行する仮説や制約を分析時には考えず

に あくまで観測によって自分が得られた観測変数 ( データ ) のみから相関係数を計算し 観測変数間に相関関係をもたらす因子は何かを推定する手法のこと しかし 全く仮説をおかずに実験や観測を行う訳ではない 観測変数の間にどのような関係性があるか想定して関連がありそうな観測変数をそろえなければ因子を推定できなくなってしまうからである どんな関係性があるかは分からないが 何かしら関係はしていそう な観測変数を選ぶということである この探索的因子分析では とりあえず分析内の全ての環境変数と因子が関連するというモデルを想定して分析する そして得られた推定値を考えて 本当に関連している因子は何かを解釈する (2) 検証的因子分析 (confirmatory factor analysis: CFA) 確率的因子分析とも呼ばれる 先行する理論を元に 因子の数や意味 因子と環境変数の関係をあらかじめ 規定しておいた仮説を作っておき その仮説が本当に正しいか検証する為に 得られた観測変数を分析する手法のこと 観測変数間の相関関係は仮定した因子構造と一致するか否か という問いに答える為に分析を行い データと仮説の当てはまり具合を検証する 探索的因子分析とは異なり 想定される因子は全ての観測変数に関連するとは見なさずに因子と関連が強い観測変数にのみ焦点を当てている 探索的因子分析は以下の目的で使われる 1 2 3 構成概念を探る観測変数間の相関関係をまとめ そのパターンを統計的にまとめることで 背後にある因子構造や概念を理解 定義したりする場合に用いられる 検証的因子分析では あくまで元からある仮説が正しいか検証するだけなので 予期していなかった因子構造や概念は見つかりにくい しかし 探索的因子分析では 必要最低限の仮定しかおかない為 考えていなかった関係性が現れることもあるかもしれない 妥当性の高い質問用紙を作成する測定が難しいと思われるような概念や要因を引き出す為に とりあえず考えられる質問項目を大量に用意しておき 試作の質問用紙を作る そして その回答結果を分析し 因子に分ける その際に どの因子にも属さない ( 妥当でない ) 質問項目を削除し選別を行う これを何回か繰り返すことで より妥当性の高い質問用紙を作成することができる 変数をまとめる

質問項目のように大量に観測変数がある場合 出来るだけ数少ない変数にまとめることで一般化を行い 因子間の関係性を検証しやすくしたり 他の目的に利用しやすくすることが可能となる ただし ただ単に多くの観測変数をまとめて単純に数値化することのみが目的であるのならば 主成分分析 (principal component analysis) を用いる方が適切である より一般化され多くの観測変数に共通して影響を及ぼす因子を見つける為に変数をまとめるのである 以上 3 つのような用途を挙げたが 行った探索的因子分析の結果が妥当かどうかを確認 する為に確認としてさらに 異なるサンプルを用いて検証的因子分析を行うこともある 9-2 因子分析の基本事項 (1) サンプルサイズサンプルサイズに絶対的な基準はなく データの質や環境変数や因子の数 相関関係の強さや共通性等によっても 適切なサイズは変わる 一般的には 信頼できる相関係数の算出の為に 全体として 300 1 変数辺り 10 15 は必要である どのくらいが妥当であるかの理論的根拠としては KMO の標本妥当性の測度 (Kaiser-Meyer-Olkin measure of sampling adequacy) で検証すると良い また 十分なサンプルサイズが確保できないような場合でも 測定する観測変数の数を絞り込み 少なくとも観測変数の10 倍程度は確保する必要がある (2) データの種類観測変数として 間隔尺度 比率尺度の連続データを扱う (3) 観測変数の数 3 4 つの観測変数が1つの因子に対して高い因子負荷量を示すことが 1 つの目安である 観測変数を増やせば 多面的に因子を分析することが可能になり信頼性は増すが そのぶん分析は大変になる (4) 観測変数間の相関因子の分析に用いられる相関係数が.30 以上を示す観測変数が見られない場合 共通因子を十分に抽出することが出来ず 分析の意味がない 反対に.90 以上の場合多重共線性や単一性の恐れがある 因子負荷 因子寄与 共通性

(1) 因子負荷量 因子と観測変数がどのくらい関連しているかを -1.00~1.00 の間の値で表す この値 が大きいほど強い関連性があり 一般に.60 以上で高く.30 未満で低いとされる (2) 因子寄与 因子寄与率 累積因子寄与率 1 因子寄与各因子が観測変数の変動をどの程度説明しているのかを表す数値 各因子に置ける観測変数の因子負荷量の 2 乗の和 各因子が観測変数に対して全体的にどの程度貢献しているのかを示す 2 因子寄与率各因子の因子寄与を最大値で割った数値 各因子が全観測変数に対してどの程度の割合で貢献しているのかを示す 観測寄与の最大値は因子の理論的最大数で観測変数の総数に相当する 3 累積因子寄与率因子寄与率を第 1 因子から順に足して行った数値 (3) 共通性観測変数を説明している各因子負荷量の 2 乗和で算出され 抽出された因子全体が 個々の観測変数をどの程度説明しているかを表す 全因子との共通分散の合計が観測変数の共通性となり 0~1 の値をとる よって 1 からそれぞれの観測変数の共通性の値を引くと独自性が分かる 因子の推定方法複数の観測変数から因子を推定し妥当な解釈を行うためにはまず最初に因子の推定方法を選択する必要がある 仮説検証の行う為の前提として 母集団まで一般化しないのであれば 主成分分析 主因子法 イメージ因子法が適しており 母集団にまで結果を拡張して一般化したいのであれば 最尤法 ( さいゆうほう ) もしくはアルファ因子法が適している 因子分析では 因子抽出の段階で 共通性が 1 以上の値を示す不適解という問題が起こることがある その原因としては 以下の2 点がある 1 推定する因子負荷量の数に対してサンプルサイズが十分でない場合 2 データに適合する因子のモデルが定まらない場合主因子法は 因子モデルとデータの適合度を計算できる最小 2 乗法や最尤法と比べて不

適解が出にくい しかしこれは同時に不適解というかたちで現れるダータの問題を見落 としてしまう可能性もある よって現在では最尤法が良く使用される 因子の回転方法因子をより解釈可能なものとする為に 因子を回転させる必要がある 通常 因子分析を行うと因子が抽出されるが その段階では因子と観測変数はうまく合致していない そこで因子軸を引き それを回転させた上で 傾向の似たいくつかの観測変数の固まりを解釈できるようにグルーピングするプロセスが必要となる つまり 因子軸をそれぞれ観測変数群に重なるように動かす ことが因子の回転である 回転には 直行回転と斜交回転の2 通りがあり そのそれぞれにいくつかの回転方法がある 直行回転は 因子間には相互作用がなく互いに独立している という制約を置いた回転方法であり 代表的な方法としてはバリマックス回転が挙げられる 一方 斜交回転は 因子は互いに相関がある と想定した方法で プロマックス回転が使われる 回転させる前の時点では 観測変数がどちらの因子と関係があるのか判断しにくいため 2 本の軸を直行回転 あるいは斜交回転させて 更に観測回数を重ねて行くことで 因子の解釈を容易にするのである この2 種類の回転方法には以下のような相違点がある 1 回転軸の動かし方直交回転では 2 本の因子軸を直角に固定したまま動かす 角度を保って回転させるため 軸と観測変数の重なりに制約が生まれる 斜交回転では 2 本の因子軸を個別に動かす そのため 観測変数の散らばり具合に対して柔軟に軸と観測変数を重ねることができ 因子の解釈が行いやすい 2 因子負荷量と相関係数直交回転では観測変数同士の相関を想定せず 因子負荷量と相関係数は同じものとして扱われる 斜交回転では因子負荷量と相関係数の 2 つは異なるため 別々の票に出力される 3 因子寄与 因子寄与率 累積因子寄与率の算出直交回転では 回転させても一方の因子への因子負荷量が高まれば 他方への因子負荷量が低下するという関係性が維持されるので 因子寄与の最大値が観測変数の数になり 因子寄与の計算が可能となる そのため 初期 因子抽出後 回転後の 3 か所においてこれら 3 つの値が表示される

一方 斜方回転ではどの因子に対しても高い因子負荷量を示すことが可能であるため最大値が定まらず因子寄与の計算を行うことができない そのため 回転後の因子寄与の値が出力されず 全体的にどの程度の貢献度なのかについては相対比較に留まる このように 直交回転 斜交回転ともに メリットデメリットがある 因子を回転させることの最大の目的は 単純構造を達成し 因子の解釈を容易にすることである 単純構造とは 観測変数が強い関係性を持つ因子に対してはより強い因子負荷量を 関係性の低い因子にはより低い因子負荷量を示し 各因子がより明確に構成されている状態のことである この 単純構造を達成するという点においては 回転軸の角度を自由に動かせる斜交回転の方が優れている さらに 因子間の相関を推定しないのは不自然であることが多く これらの理由から斜交回転の方が広く使われている 因子分析では データに分析をかけると推定地の算出 因子の回転が客観的に行われている その後の最終的な因子数の決定や因子の解釈は 分析者自らの判断で行う それはすなわち 観測変数に対して最も解釈が妥当である因子を探ることが探索因子分析において 大きな作業となる そのため 因子の推定方法や回転方法の選択は 非常に重要なプロセスである 9-4 主成分分析相関関係にある観測変数を限りなく少ない成分へと分解し データを要約することで新たな合成変数を作ることを目的とする統計的分析手段である ここでは 主成分分析と因子分析では多くの類似点が見られるが 以下のような違いがある 1 因子分析では 観測変数の分散が 共通分散と独自分散に分けられ 共通分散のみを因子の推定に利用した それに対し 主成分分析では 全ての分散がグルーピングに用いられる そのため 主成分分析では 共通性が 1 に固定される 誤差は各変数に分離されずに含まれたままで 最後に誤差が足されるということがない また 不適解などの共通性に関する問題も見られない 2 因子分析では 観測変数間の相関係数の原因となる潜在的な因子を推定し その因子から観測変数への影響を推定する 一方 主成分分析は観測変数を要約するという主要観点から 観測変数から合成変数への影響関係を想定する 各観測変数がどの程度合成変数に影響を与えるのかを示す量が主成分負荷量である 因子分析では各観測変数を探る式を立てるが 主成分分析では 共通概念である主成

分を求める式を立てることになる 3 4 因子分析では 複数の因子を仮定することにより 観測変数全体を説明しようと試みる 一方 主成分分析では第 1 主成分が最も分散を最大限に説明するように計算が行われる そのため 最も大事なのは第 1 主成分である データの要約に主眼を置く主成分分析では 相関が高いほど 情報の集約性が高まることから 多重共線性や単一性が問題にならない これを利用して重回帰分析において 多重共線性や単一性が問題になる場合に 主成分分析で得られた主成分得点を独立変数として重回帰分析を行う 主成分回帰という手法が存在する 以上の説明から明らかなように 主成分分析は複数の観測変数を集約し 主成分得点により 変数化や数値化をすることが主な目的となる 因子分析でも因子の変数化や数値化は可能ではあるが 因子分析の本来の目的は観測変数の背後に共通して存在する因子の推定である このように 主成分分析と因子分析は目的や特徴が異なるので 適切に使い分ける必要がある