公 益 社 団 法 人 日 本 心 理 学 会 第 4 回 心 理 医 学 系 研 究 者 のためのRによる 統 計 学 の 研 究 会 初 心 者 による 初 心 者 のための 探 索 的 因 子 分 析 東 京 医 科 歯 科 大 学 医 歯 学 総 合 研 究 科 博 士 課 程 1 年 市 倉 加 奈 子 (ichikura.lppm@tmd.ac.jp) ac
本 日 のMENU 1. 探 索 的 因 子 分 析 とは 2. 探 索 的 因 子 分 析 の 原 理 3. 探 索 的 因 子 分 析 の 手 順 4. データ 解 析 環 境 R による 探 索 的 因 子 分 析 の 手 順
本 日 のMENU 1. 探 索 的 因 子 分 析 とは 2. 探 索 的 因 子 分 析 の 原 理 3. 探 索 的 因 子 分 析 の 手 順 4. データ 解 析 環 境 R による 探 索 的 因 子 分 析 の 手 順
探 索 的 因 子 分 析 とは 観 測 される 一 連 の 変 数 から 直 接 観 察 すること のできない 因 子 ( 潜 在 変 数 )を 見 出 す 方 法 探 索 的 因 子 分 析 Exploratory Factor Analysis 直 交 解 では 因 子 パターン ン 独 自 性 斜 交 解 では 因 子 パターン 独 自 性 因 子 間 相 関 を 自 由 母 数 として 行 う 因 子 分 析 確 認 的 因 子 分 析 Confirmatory Factor Analysis 実 質 科 学 的 知 見 をもとに 因 子 パターン 独 自 性 因 子 間 相 関 を 固 定 母 数 または 制 約 母 数 として 行 う 分 析
探 索 的 因 子 分 析 とは 観 自 測 由 される に 値 を 取 一 りうる 連 の 未 変 知 数 な から 母 数 直 ( 母 接 集 観 団 察 に すること 固 有 のできない 因 子 ( 潜 在 変 数 )を 見 出 す 方 法 の 定 数 )のことで 自 分 の 仮 定 したモデルにお いて どのような 値 をとるか 全 く 分 からない 場 合 に 用 いる 探 索 的 因 子 分 析 Exploratory Factor Analysis 直 交 解 では 因 子 パターン ン 独 自 性 斜 交 解 では 因 子 パターン 独 自 性 因 子 間 相 関 を 自 由 母 数 として 行 う 因 子 分 析 確 認 的 因 子 分 析 Confirmatory Factor Analysis 実 質 科 学 的 知 見 をもとに 因 子 パターン 独 自 性 因 子 間 相 関 を 固 定 母 数 または 制 約 母 数 として 行 う 分 析
探 索 的 因 子 分 析 とは 探 索 的 因 子 分 析 では 説 明 変 数 1 説 明 変 数 2 説 明 変 数 1 1 2 3 1 2 3 独 自 因 子 独 自 因 子 独 自 因 子 独 自 因 子 独 自 因 子 独 自 因 子 1 1 1 1 1 1 何 個 の 共 通 因 子 を 持 った モデルが 適 切 かを 検 討
探 索 的 因 子 分 析 とは 確 認 的 因 子 分 析 では 説 明 変 数 1 説 明 変 数 2 説 明 変 数 1 説 明 変 数 2 1 2 3 1 2 3 独 自 因 子 独 自 因 子 独 自 因 子 独 自 因 子 独 自 因 子 独 自 因 子 1 1 1 1 1 1 どのような 共 通 因 子 の 影 響 性 を 持 った モデルが 適 切 かを 検 討
本 日 のMENU 1. 探 索 的 因 子 分 析 とは 2. 探 索 的 因 子 分 析 の 原 理 3. 探 索 的 因 子 分 析 の 手 順 4. データ 解 析 環 境 R による 探 索 的 因 子 分 析 の 手 順
探 索 的 因 子 分 析 の 原 理 目 的 : 共 通 因 子 を 見 つけだすこと 説 明 変 数 1 説 明 変 数 2 1 2 3 4 5 独 自 因 子 1 独 自 因 子 2 独 自 因 子 3 独 自 因 子 4 独 自 因 子 5
探 索 的 因 子 分 析 の 原 理 共 通 因 子 説 明 変 数 1 説 明 変 数 2 因 子 負 荷 量 a11 a21 a31 a12 a22 a32 a42 a52 a41 a51 観 測 値 1 2 3 4 5 独 自 因 子 1 独 自 因 子 2 独 自 因 子 3 独 自 因 子 4 独 自 因 子 5 独 自 因 子
探 索 的 因 子 分 析 の 原 理 例 ) 因 子 負 荷 量 : f1 文 系 能 力 共 通 因 子 の 目 f2 的 理 変 系 数 能 への 力 影 響 性 例 ) 理 科 と 数 学 にも 多 少 は 文 系 能 力 が 影 響 a a31 a42 a a11 a21 a31 a52 a12 a22 a32 a41 a51 u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 e1 e2 e3 e4 e5 独 自 性 : 個 別 の 独 自 因 子 の への 影 響 性 例 ) 国 語 英 語 社 会 の 違 いを 規 定
探 索 的 因 子 分 析 の 原 理 f1 文 系 能 力 f2 理 系 能 力 a21 a31 a11 a42 a52 a12 a22 a32 a41 a51 u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 e e e e e e1 e2 e3 e4 e5 u = a f + a f + e u1 = a11 f1 + a12 f2 + e1 1 共 通 因 子 1の 影 響 性 共 通 因 子 2の 影 響 性 独 自 因 子 1
探 索 的 因 子 分 析 の 原 理 u = a f + a f + e u1 a11 f1 a12 f2 e1 1 共 通 因 子 1の 影 響 性 共 通 因 子 2の 影 響 性 独 自 因 子 1 u2 = + + a21 f1 a22 f2 e2 u3 = + + a31 f1 a32 f2 e3 u4 = + + a41 f1 a42 f2 e4 u5 = + + a51 f1 a52 f2 e5
探 索 的 因 子 分 析 の 原 理 注 意 1 主 成 分 分 析 との 違 い 説 明 変 数 1 説 明 変 数 2 説 明 変 数 説 明 変 数 説 明 変 数 1 2 3 1 2 3 因 子 分 析 : 観 測 値 が 従 属 変 数 u 1 = a 11 f 1 + a 12 f 2 + e 1 主 成 分 分 析 : 観 測 値 が 独 立 変 数 f = u 1 a 1 + u 2 a 2 + u 3 a 3 u 2 = a 21 f 1 + a 22 f 2 + e 2 u 3 = a 31 f 1 + a 32 f 2 + e 3
探 索 的 因 子 分 析 の 原 理 注 意 2 納 得 いくモデルが2つ 得 られたら 説 明 変 数 1 説 明 変 数 2 1 2 3 4 5 研 究 者 の 主 観 ( 仮 説 )を 重 要 視 して 選 択 する 説 明 変 数 1 説 明 変 数 2 説 明 変 数 3 1 2 3 4 5
本 日 のMENU 1. 探 索 的 因 子 分 析 とは 2. 探 索 的 因 子 分 析 の 原 理 3. 探 索 的 因 子 分 析 の 手 続 き 4. データ 解 析 環 境 R による 探 索 的 因 子 分 析 の 手 順
探 索 的 因 子 分 析 の 手 続 き 1 因 子 の 抽 出 2 共 通 因 子 数 の 選 定 3 因 子 の 回 転 4 各 共 通 因 子 の 意 味 の 解 釈 5 分 析 結 果 の 精 度 の 確 認
1 因 子 の 抽 出 因 子 の 抽 出 とは: 因 子 負 荷 量 と 独 自 因 子 の 分 散 を 推 定 反 復 収 束 推 定 誤 差 計 算 の 速 さ の 大 きさ の 容 易 さ 主 因 子 法 大 易 反 復 主 因 子 法 遅 大 易 最 小 2 乗 法 速 大 難 最 尤 法 速 小 難 推 定 誤 差 の 大 きさは 正 規 分 布 仮 定 時 手 計 算 反 復 主 因 子 法 ソフト 最 尤 法 が 好 まれる
1 因 子 の 抽 出 これらの 抽 出 方 法 はどのようなことをしているのか? (1) の 標 準 化 f1 文 系 能 力 f2 理 系 能 力 標 準 化 : 平 均 = 0 標 準 偏 差 = 1 になるように 置 換 a21 a31 a11 a42 a52 a12 a22 a32 a41 a51 u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 e e e e e e1 e2 e3 e4 e5
1 因 子 の 抽 出 国 語 英 語 社 会 理 科 数 学 あ 10 10 20 80 90 い 20 40 10 100 80 う 30 20 10 90 100 え 90 80 70 20 30 お 70 90 90 10 30 か 100 100 80 20 20 さ 20 10 10 30 20 し 30 20 10 10 30 す 90 90 80 90 90 せ 80 90 100 70 90 標 準 化 : = M) / SD u1 (x1
1 因 子 の 抽 出 国 語 英 語 社 会 理 科 数 学 あ -1.26 126-1.18 118-0.72 072 074 0.74 093 0.93 い -0.97-0.39-0.98 1.26 0.64 う -0.69 069-0.92 092-0.98 098 100 1.00 123 1.23 え 1.03 0.66 0.57-0.84-0.82 お 0.46 0.92 1.08-1.10-0.82 か 1.31 1.18 0.82-0.84-1.11 さ -0.97-1.18-0.98-0.58-1.11 し -0.69-0.92-0.98-1.10-0.82 す 1.03 0.92 0.82 1.00 0.93 せ 0.74 0.92 1.34 0.47 0.93
1 因 子 の 抽 出 u1 国 語 u5 数 学 あ -1.26 0.93 せ 0.74 = 0.93 u1 国 語 u5 数 学 あ a 11 f あ1 + a 12 f あ2 + e 1 a 51 f あ1 + a 52 f あ2 + e 1 せ a 11 f せ1 + a 12 f せ2 + e 1 a 51 f せ1 + a 52 f せ2 + e 1 この 等 式 が 成 り 立 つはず!!
1 因 子 の 抽 出 (2) 各 変 数 の 平 均 と 標 準 偏 差 を 仮 定 f1 文 系 能 力 f2 理 系 能 力 a11 a21 a31 a12 a22 a32 a42 a52 平 均 = 0 標 準 偏 差 = 1 であると 仮 定 u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 平 均 = 0 標 準 偏 差 = d 2 であると 仮 定 a41 a51 e1 e2 e3 e4 e5
1 因 子 の 抽 出 (2) 各 変 数 の 平 均 と 標 準 偏 差 を 仮 定 つまり f1 文 系 能 力 f2 理 系 能 力 因 子 の 抽 出 とは a21 a31 a11 a12 a22 a32 a42 a52 平 均 = 0 標 準 偏 差 = 1 であると 仮 定 1 因 子 負 荷 量 a n u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 平 均 = 0 標 準 偏 差 = d 2 であると 仮 定 2 独 自 因 子 の 分 散 a41 d n a51 を 求 めること e1 e2 e3 e4 e5
(3) 変 数 間 の 相 関 を 仮 定 1 因 子 の 抽 出 共 通 因 子 f1 文 と 独 自 因 子 系 能 力 は 相 関 なしと 仮 定 f2 理 系 能 力 a11 a21 a31 a12 a22 a32 a41 a42 a52 a51 u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 独 自 因 子 同 士 は 相 関 なしと 仮 定 e1 e2 e3 e4 e5
(3) 変 数 間 の 相 関 を 仮 定 1 因 子 の 抽 出 f1 文 系 能 力 f2 理 系 能 力 a11 a21 a31 a12 a22 a32 a42 a52 共 通 因 子 同 士 が 相 関 なしと 仮 定 : 直 交 回 転 モデル 共 通 因 子 同 士 が 相 関 ありと 仮 定 : 斜 交 回 転 モデル u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学 研 究 者 の 主 観 ( 仮 説 ) が 重 要! a41 一 般 的 には 共 通 因 子 同 士 が 全 く 相 関 なしとは 考 えにくい a51 e1 e2 e3 e4 e5
1 因 子 の 抽 出 (4) 因 子 負 荷 量 独 自 因 子 の 分 散 の 算 出 1 r 12 r 13 r 14 r 15 r 21 1 r 23 r 24 r 25 R = AA + D r 31 r 32 1 r 34 r 35 r 41 r 42 r 43 1 r 45 R: 相 関 行 列 r 51 r 52 r 53 r 54 1 A: 因 子 負 荷 行 列 D: 分 散 の 対 角 行 列 a 11 a 12 d 2 1 0 0 0 0 a 21 a 22 0 d 2 2 a a a a a 0 0 0 = 11 21 31 41 51 a 31 a 32 + 0 0 d 2 3 0 0 a a 0 0 0 d 2 41 a 12 a 22 a 32 a 42 a 52 42 4 0 a 0 0 0 0 d 2 51 a 52 5
1 因 子 の 抽 出 (4) 因 子 負 荷 量 独 自 因 子 の 分 散 の 算 出 国 語 英 語 社 会 理 科 数 学 国 語 1.95.91 -.30 -.22 英 語.95 1.95 -.21 -.15 社 会.91.95 1 -.23 -.10 理 科 -.30 -.21 -.23 1.93 数 学 -.22 -.15 -.10.93 1 間 の 相 関 を 求 める
1 因 子 の 抽 出 (4) 因 子 負 荷 量 独 自 因 子 の 分 散 の 算 出 1 0.95 0.91-0.3-0.2 095 0.95 1 095 0.95-0.2 02-0.2 02 0.91 0.95 1-0.2-0.1-0.3-0.2-0.2 1 0.93-0.2-0.2-0.1 0.93 1 a 11 a 12 d 2 1 0 0 0 0 a 21 a 22 0 d 2 2 a a a a a 0 0 0 = 11 21 31 41 51 a 31 a 32 + 0 0 d 2 3 0 0 a a 0 0 0 d 2 41 a 12 a 22 a 32 a 42 a 52 42 4 0 a 0 0 0 0 d 2 51 a 52 5 計 算 していくと
1 因 子 の 抽 出 (4) 因 子 負 荷 量 独 自 因 子 の 分 散 の 算 出 a 11 a 12.932.222 a 21 a 22.938.328 a 31 a 32 =.898.321 a 41 a 42 -.520.813 a 51 a 52 -.440.864 異 なる 抽 出 方 法 で 再 分 析 共 通 因 子 数 の 変 更 観 測 変 数 の 減 少 異 常 値 の 削 除 などの 方 法 でエラーが 出 なくなるまでモデルを 模 索
2 共 通 因 子 数 の 推 定 ガッドマン ルール(カイザーガットマン 基 準 ) 固 有 値 相 関 行 列 の 固 有 値 が 1より 大 きなものの 個 数 を 因 子 数 とする 因 子 の 番 号
2 共 通 因 子 数 の 推 定 スクリー 法 (スクリープロット 基 準 ) 固 有 値 相 関 行 列 の 固 有 値 の 大 きさの 変 化 がなだらか になる 直 前 の 固 有 値 番 号 を 因 子 数 とする 因 子 の 番 号
3 因 子 の 回 転 回 転 の 種 類 直 交 回 転 バリマックス 法 コーティマックス 法 バイティコーティマックス 法 斜 交 回 転 プロマックス 法 コーティミン 法 バイコーティミン 法 コバリミン 法
3 因 子 の 回 転 1.000.900.800.700.600.500 国 語 英 語 社 会 理 科 数 学.400.300.200.100.000.600.400.200.000.200.400.600.800 1.000 1.200
3 因 子 の 回 転 1.000 共 通 因 子 の 意 味 を 解 釈 しやすく.900 するために.800 軸 を 回 転 させる.700.600.500 国 語 英 語 社 会 理 科 数 学.400.300.200.100.000.600.400.200.000.200.400.600.800 1.000 1.200
3 因 子 の 回 転 バリマックス 回 転 で 見 てみると 1.200 1.000.800.600 国 語 英 語 社 会 理 科 数 学.400.200.000.400.200.000.200.400.600.800 1.000 1.200.200.400
3 因 子 の 回 転 第 1 共 通 因 子 第 2 共 通 因 子 国 語.932.222 英 語.938.328 回 転 社 会.898.321 理 科 -.520.813 数 学 -.440.864 第 1 共 通 因 子 第 2 共 通 因 子 国 語.943 -.170 英 語.991 -.076 社 会.952 -.066 理 科 -.150.954 数 学 -.056.968
4 各 共 通 因 子 の 意 味 の 解 釈 第 1 共 通 因 子 第 2 共 通 因 子 国 語.943 -.170 英 語.991 -.076 社 会.952 -.066 理 科 -.150.954 数 学 -.056.968 f1 文 系 能 力 f2 理 系 能 力.943.991.952.954.968 -.170 -.076 -.066 -.150 -.056 u1 国 語 u2 英 語 u3 社 会 u4 理 科 u5 数 学
5 分 析 結 果 の 精 度 の 確 認 第 1 共 通 因 子 第 2 共 通 因 子 国 語.943 -.170 英 語.991 -.076 社 会.952 -.066 理 科 -.150.954 数 学 -.056.968 第 1 共 通 因 子 の 寄 与 率 = (b 2 11+ b 2 21 + b 2 31 + b 2 41 + b 2 51) 100 / 5 = 56.065 第 2 共 通 因 子 の 寄 与 率 = (b 2 12+ b 2 22 + b 2 32 + b 2 42 + b 2 52) 100 / 5 = 37.723 累 積 寄 与 率 = 56.056 + 37.723 = 93.779 (%)
本 日 のMENU 1. 探 索 的 因 子 分 析 とは 2. 探 索 的 因 子 分 析 の 原 理 3. 探 索 的 因 子 分 析 の 手 続 き 4. データ 解 析 環 境 R による 探 索 的 因 子 分 析 の 手 順
R による 探 索 的 因 子 分 析 の 手 順 国 語 英 語 社 会 理 科 数 学 あ 10 10 20 80 90 い 20 40 10 100 80 う 30 20 10 90 100 え 90 80 70 20 30 お 70 90 90 10 30 か 100 100 80 20 20 さ 20 10 10 30 20 し 30 20 10 10 30 す 90 90 80 90 90 せ 80 90 100 70 90
R による 探 索 的 因 子 分 析 の 手 順 データの 読 み 込 み setwd("g:/r_toukei") dat <- read.table( table("exercise_r_toukei.csv r csv", sep=",, " header=t T, na=".") library(psych) 1ハードディスク G の 中 にある フォルダ r_toukei にアクセス 2csvファイル exercise_r_tou kei のデータを 行 列 datと 置 く 3パッケージ psych を 呼 び 出 す
R による 探 索 的 因 子 分 析 の 手 順 因 子 分 析 の 実 行 (2 因 子 と 仮 定 ) factanal(x=dat,factors=2) 何 も 指 定 しなければ 最 尤 法 バリマックス 回 転 独 自 性 4 各 の 独 自 性
R による 探 索 的 因 子 分 析 の 手 順 因 子 分 析 の 実 行 (2 因 子 と 仮 定 ) factanal(x=dat,factors=2) 5 共 通 因 子 1と 共 通 因 子 2 のそれぞれの 因 子 負 荷 量 を 算 出 因 子 負 荷 量 因 子 負 荷 量 が0に 近 すぎる と 表 示 されない!
R による 探 索 的 因 子 分 析 の 手 順 因 子 分 析 の 実 行 (2 因 子 と 仮 定 ) factanal(x=dat,factors=2) 因 子 寄 与 率 累 積 因 子 寄 与 率 適 合 度 検 定 のp 値 6 因 子 寄 与 率 累 積 因 子 寄 与 率 を 算 出 7 適 合 度 の 検 定
R による 探 索 的 因 子 分 析 の 手 順 因 子 負 荷 量 をすべて 表 示 print(factanal(x=dat,factors=2),cutoff=0) 因 子 負 荷 量 が0 以 上 の 値 は すべて 表 示 因 子 負 荷 量
R による 探 索 的 因 子 分 析 の 手 順 共 通 性 の 算 出 communality <- 1-factanal(x=dat,factors=2)$uniquenesses 共 通 性 8 共 通 性 を 算 出 ( 共 通 性 が 高 い= 共 通 因 子 で 説 明 できる 部 分 が 大 きい)
R による 探 索 的 因 子 分 析 の 手 順 共 通 因 子 数 の 推 定 evres <- eigen(cor(dat)) evres$value plot(evres$value, type="b") 固 有 値 の 算 出 スクリープロット 9 固 有 値 を 算 出 10スクリープロットを 作 図
R による 探 索 的 因 子 分 析 の 手 順 ちなみに factanal(x=dat,factors=2, rotation="promax") プロマックス 回 転 で 分 析
私 の 参 考 文 献 1マンガでわかる 統 計 学 因 子 分 析 編 (オーム 社 ) 統 計 や 因 子 分 析 に 対 する 抵 抗 感 を 下 げる 行 列 の 計 算 方 法 や 専 門 用 語 を 勉 強 2 共 分 散 構 造 分 析 疑 問 編 ( 朝 倉 書 店 ) 探 索 的 因 子 分 析 と 確 認 的 因 子 分 析 の 違 いを 勉 強 因 子 分 析 に 関 連 した 専 門 用 語 を 勉 強 3SPSSで 学 ぶ 医 療 系 多 変 量 データ 解 析 ( 東 京 図 書 ) 因 子 分 析 の 根 本 的 な 原 理 と 基 本 方 程 式 の 理 解 4 心 理 統 計 学 の 基 礎 ( 有 斐 閣 アルマ) 因 子 分 析 の 手 順 と 数 式 の 理 解 5SASによる 統 計 解 析 基 礎 統 計 編 ( 科 学 技 術 出 版 ) 因 子 抽 出 法 と 因 子 数 の 決 定 に 関 する 原 理 の 理 解 http://www.sigmath.es.osaka-u.ac.jp/~kano/old/lecture/u_graduate/multivariate/factor.pdf
私 の 参 考 文 献 6Using Multivariate Statistics(Pearson International Edition) 良 く 分 からない 作 った 資 料 と 相 違 がないか 確 認 7データ 解 析 環 境 R ( 工 学 者 ) R のデータ ハンドリングを タ 勉 強 8The R Tips -データ 解 析 環 境 Rの 基 本 技 グラフィックス 活 用 集 -(オーム 社 ) R のデータ ハンドリングを デ タ ド 勉 強 9 R によるやさしい 統 計 学 (オーム 社 ) R による 因 子 分 析 のプログラムを 確 認