システムインタフェース 設 計 論 ~データ 解 析 手 法 ~ サイバーメディアセンター 清 川 清 1
尺 度 水 準 尺 度 : 比 べる 基 準 名 義 尺 度 順 序 尺 度 間 隔 尺 度 比 率 尺 度 名 義 尺 度 単 なる 記 号 (ラベル) ノンパラメトリック 同 一 性 は 議 論 できるが 大 小 比 較 はできない 電 話 番 号 背 番 号 銘 柄 品 詞 など 順 序 尺 度 大 小 比 較 はできるがその 間 隔 は 問 えない 震 度 鉱 物 硬 度 成 績 の 順 位 など 2005 年 7 月 11 日 2 2
尺 度 水 準 間 隔 尺 度 等 間 隔 に 目 盛 りづけされ 差 異 が 議 論 できる 摂 氏 華 氏 知 能 指 数 年 代 など 比 率 尺 度 ( 比 例 尺 度 ) 原 点 (ゼロ 点 )が 定 義 できる 測 定 値 間 の 比 率 が 議 論 できる 絶 対 温 度 長 さ 重 さ 時 間 など 名 義 < 順 序 < 間 隔 < 比 率 の 順 に 情 報 量 が 大 きい 高 水 準 の 尺 度 から 低 水 準 の 尺 度 への 変 換 は 可 能 2005 年 7 月 11 日 3 3
定 性 データと 定 量 データ 定 性 データ 対 象 とする 属 性 の 性 質 や 内 容 を 示 す 言 葉 や 文 字 で 表 す 名 義 尺 度 順 位 尺 度 から 得 られる 定 量 データ 対 象 とする 属 性 を 数 量 によって 示 す 数 字 や 数 値 で 表 す 間 隔 尺 度 比 率 尺 度 から 得 られる 2005 年 7 月 11 日 4 4
様 々な 代 表 値 最 頻 値 最 も 度 数 の 多 いクラスに 対 応 する 値 中 央 値 測 定 値 をソートして 真 中 にくる 値 算 術 平 均 値 (ΣX)/n 調 和 平 均 値 各 値 の 逆 数 の 平 均 値 の 逆 数 幾 何 平 均 値 (ΠX)^(1/n) 2005 年 7 月 11 日 5 5
最 頻 値 名 義 尺 度 にも 用 いることができる 間 隔 尺 度 以 上 の 場 合 は 区 間 に 分 ける 例 )あるタスクの 完 遂 時 間 の 度 数 分 布 0~10 秒 : 5 人, 10~20 秒 : 8 人, 20~30 秒 : 11 人, 30~40 秒 : 4 人 最 頻 値 は 20~30 秒 は 乱 暴 普 通 は25 秒 とする より 厳 密 な 求 め 方 : 最 頻 値 = ( 下 限 値 )+ 上 側 度 数 /( 下 側 度 数 + 上 側 度 数 ) 階 級 幅 = 20 + 4 / (4 + 8) x 10 = 23.33 秒 2005 年 7 月 11 日 6 6
中 央 値 Me = X (n + 1) / 2 (n が 奇 数 の 場 合 ) Me = (X n/2 +X n/2 + 1 )/2 (n が 偶 数 の 場 合 ) バラツキに 対 して 変 動 しにくい 例 :スポーツ 選 手 の 年 棒 の 代 表 値 例 :ある 測 定 値 1, 2, 2, 2, 2, 3, 3, 4, 5 中 央 値 :9 個 中 5 番 目 の 2 しかし 2より 小 さい 値 は1つ 大 きい 値 は4つある 新 中 央 値 = ( 下 限 値 )+(n/2 - 下 側 総 度 数 ) / 中 央 値 度 数 階 級 幅 = 2 + (4.5-1) / 4 1 = 2.875 2005 年 7 月 11 日 7 7
算 術 平 均 値 (ΣX)/n データの 重 心 となっている 統 計 的 処 理 に 向 いている 例 )あるタスクの 完 遂 時 間 の 度 数 分 布 0~10 秒 : 5 人, 10~20 秒 : 8 人, 20~30 秒 : 11 人, 30~40 秒 : 4 人 (5.0 x 5 + 15.0 x 8 + 25.0 x 11 + 35.0 x 4) / 28 = 20.0 秒 2005 年 7 月 11 日 8 8
調 和 平 均 値 n/(σ1/x) データの 逆 数 が 間 隔 尺 度 とみなされるとき に 用 いる 例 )30km の 道 のりを 行 きは30km/h 帰 り は60km/hで 走 った 際 の 全 体 の 平 均 時 速 算 術 平 均 値 : 45km/h 調 和 平 均 値 : 2/((1/30) + (1/60)) = 40km 1.5 時 間 で60km 走 ったので 正 解 2005 年 7 月 11 日 9 9
幾 何 平 均 値 (ΠX)^(1/n) Y=logX / n とすると 幾 何 平 均 値 は e Y 指 数 や 対 数 の 関 係 にある 事 柄 に 用 いる 例 ) 感 覚 量 が 刺 激 の 対 数 に 比 例 する 場 合 与 えた 刺 激 の 平 均 は 幾 何 平 均 とすべき 2005 年 7 月 11 日 10 10
データの 尺 度 水 準 と 統 計 量 名 義 尺 度 : 最 頻 値 度 数 分 布 順 序 尺 度 : ( 上 記 +) 最 大 値 最 小 値 中 央 値 間 隔 尺 度 ( 上 記 +) 平 均 値 分 散 標 準 偏 差 比 率 尺 度 ( 上 記 +) 幾 何 平 均 調 和 平 均 2005 年 7 月 11 日 11 11
統 計 的 検 定 の 必 要 性 仮 説 : ボタン 早 押 しの 速 度 は 女 性 より 男 性 のほうが 早 い ( 秒 ) 0.32 0.28 0.24 0.20 0.16 0.12 0.08 0.04 0.00 男 性 女 性 2005 年 7 月 11 日 12 12
統 計 的 検 定 の 必 要 性 仮 説 : ボタン 早 押 しの 速 度 は 女 性 より 男 性 のほうが 早 い ( 秒 ) 0.32 0.28 0.24 0.20 0.16 0.12 0.08 0.04 0.00 男 性 女 性 個 人 差 が 大 きいので 少 人 数 では 結 論 できない 2005 年 7 月 11 日 13 13
統 計 的 検 定 の 必 要 性 仮 説 : ボタン 早 押 しの 速 度 は 女 性 より 男 性 のほうが 早 い ( 秒 ) 0.32 0.28 0.24 0.20 0.16 0.12 0.08 0.04 0.00 男 性 女 性 大 勢 の 平 均 値 で 結 論 できるか? 2005 年 7 月 11 日 14 14
統 計 的 検 定 の 必 要 性 仮 説 : ボタン 早 押 しの 速 度 は 女 性 より 男 性 のほうが 早 い ( 秒 ) 0.32 0.28 0.24 0.20 0.16 0.12 0.08 0.04 0.00 男 性 女 性 平 均 値 では 結 論 できない ばらつき 具 合 と 併 せて 比 較 する 必 要 がある 2005 年 7 月 11 日 15 15
統 計 的 検 定 の 必 要 性 仮 説 : ボタン 早 押 しの 速 度 は 女 性 より 男 性 のほうが 早 い 女 性 男 性 2005 年 7 月 11 日 16 16
統 計 的 検 定 実 験 仮 説 は 想 定 する 母 集 団 全 体 が 対 象 世 界 中 の 男 性 vs. 世 界 中 の 女 性 実 験 データを 母 集 団 全 体 から 取 るのは 困 難 本 当 の 答 えは 誰 にも 分 からないことに 注 意 統 計 的 検 定 標 本 (サンプル) から 得 たデータの 特 徴 が 母 集 団 全 体 についても 当 てはまるかどうかを 確 率 的 に 調 べる 有 意 水 準 を 設 定 し 検 定 の 結 果 から 帰 無 仮 説 を 棄 却 または 採 択 する 2005 年 7 月 11 日 17 17
帰 無 仮 説 と 対 立 仮 説 帰 無 仮 説 差 があるように 見 えたのは 偶 然 だったのだ と 考 える 仮 説 H 0 で 表 す 早 押 しに 男 女 の 差 があるとは 言 えない ( 差 がない とは 言 わないことに 注 意 ) 帰 無 仮 説 を 棄 却 有 意 差 がある 帰 無 仮 説 を 採 択 有 意 差 がない 対 立 仮 説 やはり 偶 然 ではない とする 仮 説 H 1 で 表 す 2005 年 7 月 11 日 18 18
有 意 水 準 偶 然 性 を 判 定 する 基 準 0.05(5% 水 準 ), 0.01(1% 水 準 )がよく 使 われる どの 水 準 で 検 定 するかは 実 験 者 自 身 が 決 定 する αで 表 す 危 険 率 ともいう 5% 水 準 で 有 意 差 がある 場 合 結 論 が 誤 りである 確 率 が 5%はある という 意 味 で 危 険 第 一 種 誤 り 確 率 α: 帰 無 仮 説 が 正 しいのに 棄 却 する 確 率 有 意 差 がないのにあると 結 論 してしまう 第 二 種 誤 り 確 率 β: 帰 無 仮 説 が 誤 りなのに 採 択 する 確 率 有 意 差 があるのにないと 結 論 してしまう 2005 年 7 月 11 日 19 19
片 側 検 定 と 両 側 検 定 H 0 :Θ=Θ 0 のときに 片 側 検 定 (1-way): H 1 :Θ>Θ 0 (または Θ<Θ 0 ) と 考 える 方 向 性 を 問 う セリーグはパリーグより 人 気 がある 両 側 検 定 (2-way): H 1 :Θ Θ 0 と 考 える 方 向 性 を 問 わない セリーグとパリーグは 人 気 に 差 がある 2005 年 7 月 11 日 20 20
一 様 分 布 取 りえる 値 の 生 起 確 率 が 等 しい 分 布 平 均 E(x) = 1/2, 分 散 V(x) = 1/12 2005 年 7 月 11 日 21 21
三 角 分 布 一 様 分 布 に 従 う 確 率 変 数 v1, v2 の 差 は 三 角 分 布 に 従 う 平 均 E(x) = 0, 分 散 V(x) = 1/6 2005 年 7 月 11 日 22 22
正 規 分 布 n 個 の 一 様 乱 数 の 和 を 考 え nを 大 きくする N(μ, σ 2 ): 母 平 均 E(x)=μ, 母 分 散 V(x)=σ 2 N(0, 1 2 ) を 標 準 正 規 分 布 という 2005 年 7 月 11 日 23 23
χ 2 分 布 N(0, 1 2 ) に 従 う n 個 の 確 率 変 数 x i の2 乗 和 χ 2 = x 1 2 + + x n 2 の 分 布 自 由 度 φ=n, 平 均 E(χ 2 ) = φ, 分 散 V(χ 2 ) = 2φ 2005 年 7 月 11 日 24 24
χ 2 検 定 ノンパラメトリック 検 定 が 可 能 カテゴリ 間 の 度 数 分 布 について 独 立 性 や 一 様 性 を 検 定 できる 男 性 女 性 右 利 き 男 性 で 右 利 きの 人 数 女 性 で 右 利 きの 人 数 左 利 き 男 性 で 左 利 きの 人 数 女 性 で 左 利 きの 人 数 H 0 : カテゴリ 間 は 独 立 している X 2 = Σ(( 観 察 度 数 - 期 待 度 数 ) 2 / 期 待 度 数 ) は 帰 無 仮 説 が 正 しい 場 合 χ 2 分 布 に 従 う 度 数 は 最 少 のセルでも5つ 以 上 必 要 とされる 2005 年 7 月 11 日 25 25
χ 2 検 定 の 例 例 : 世 代 によって 普 段 使 うOSは 異 なるか 観 測 度 数 のクロス 表 ~30 31~50 51~ 計 OS1 35 7 8 50 (0.50) OS2 10 6 6 22 (0.22) OS3 8 5 15 28 (0.28) 計 53 18 29 100 (1.00) 期 待 度 数 のクロス 表 ~30 31~50 51~ 計 OS1 26.5 9 14.5 50 (0.50) OS2 11.66 3.96 6.38 22 (0.22) OS3 14.84 5.04 8.12 28 (0.28) 計 53 18 29 100 (1.00) この 場 合 の 自 由 度 は ( 列 -1) x ( 行 - 1) = 4 2005 年 7 月 11 日 26 26
χ 2 検 定 の 例 ( 観 察 度 数 - 期 待 度 数 ) 2 / 期 待 度 数 ~30 31~50 51~ OS1 2.73 0.44 2.91 OS2 0.24 1.05 0.02 OS3 3.15 0.00 5.83 総 和 X 2 = 16.4 有 意 水 準 1% 自 由 度 4のχ 2 値 = 13.28 16.4 > 13.28 であるから H 0 は 棄 却 される 世 代 によって 普 段 使 うOSに 有 意 差 がある (これはあくまで 説 明 用 のデータです) Excel では 関 数 CHITEST( 観 察 度 数 範 囲, 期 待 度 数 範 囲 ) で 棄 却 率 p を 計 算 できる この 例 では p=0.0025 < 0.01 2005 年 7 月 11 日 27 27
t 分 布 一 般 に 標 本 平 均 X は 母 平 均 μと 異 なるが 標 準 化 した 際 のその 差 異 t が 従 う 分 布 (U は 標 本 の 不 偏 分 散 ) 自 由 度 φ= n - 1 2005 年 7 月 11 日 28 28
t 検 定 2 群 の 平 均 値 に 差 があるかどうかを 検 定 群 間 の 対 応 の 有 無 で 式 が 異 なる 1 標 本 に (x 1, y 1 ),, (x n, y n ) という 対 応 がある 場 合 等 分 散 性 は 問 わないが XとYのデータの 個 数 は 等 しくないとダメ 例 ) 多 くのグループ 内 実 験 Excel: TTEST (X 範 囲, Y 範 囲, 片 側 検 定 (1)か 両 側 検 定 (2)か, 1) 2 対 応 がないが 分 散 が 等 しいと 仮 定 できる 場 合 例 ) 多 くのグループ 間 実 験 Excel: TTEST (X 範 囲, Y 範 囲, 片 側 検 定 (1)か 両 側 検 定 (2)か, 2) 3 対 応 がなく 分 散 も 等 しいと 仮 定 できない 場 合 Excel: TTEST (X 範 囲, Y 範 囲, 片 側 検 定 (1)か 両 側 検 定 (2)か, 3) いずれも 帰 無 仮 説 は 2 群 の 母 平 均 値 に 差 はない 2005 年 7 月 11 日 29 29
F 分 布 χ 2 分 布 に 従 う 独 立 な 確 率 変 数 χ 1 2, χ 2 2 について 以 下 のFが 従 う 分 布 2005 年 7 月 11 日 30 30
分 散 分 析 Analysis of Variance (ANOVA) 独 立 変 数 と 従 属 変 数 の 独 立 性 を 検 定 2つ 以 上 の 変 数 間 の 相 違 を 一 度 に 検 定 できる 分 散 に 差 があるかを 検 定 するF 検 定 を 利 用 平 均 値 に 差 があるかも 検 定 できる (1) 全 体 のバラツキ を (2) 独 立 変 数 の 違 いによるバラツキ と (3)それ 以 外 の 要 因 によるバラツキ に 分 解 (1)=(2)+(3) (2)が(3)よりも ある 比 率 で 大 きければ 独 立 変 数 から 従 属 変 数 への 影 響 があったといえる 2005 年 7 月 11 日 31 31
分 散 分 析 の 例 インタフェースの 使 いやすさを 比 較 独 立 変 数 :インタフェースの 種 類 A, B, C, D 1 要 因 4 水 準 要 因 : 独 立 変 数 の 種 類 水 準 :1つの 独 立 変 数 中 のカテゴリー 数 従 属 変 数 : 5 段 階 評 価 の 主 観 評 価 値 1: 使 いにくい 2:やや 使 いにくい 3:どちらともいえない 4:やや 使 いやすい 5: 使 いやすい 2005 年 7 月 11 日 32 32
分 散 分 析 の 例 UIの 種 類 被 験 者 の 評 価 値 合 計 平 均 件 数 A 4 5 3 4 5 21 4.2 5 B 4 3 4 2 3 16 3.2 5 C 4 2 1 5 4 16 3.2 5 D 3 2 3 1 2 11 2.2 5 全 体 64 3.2 20 全 体 平 方 和 : S1 = (4 3.2)^2 + + (2 3.2)^2 = 29.2 因 子 平 方 和 : S2 = 5x(4.2 3.2)^2 + 5x(2.2 3.2)^2 = 10.0 グループ 間 変 動 ともいう 誤 差 平 方 和 : S3 = (4 4.2)^2 + + (2 2.2)^2 = 19.2 グループ 内 変 動 ともいう 2005 年 7 月 11 日 33 33
分 散 分 析 の 例 全 体 平 方 和 : S1 = 29.2 因 子 平 方 和 : S2 = 10.0 誤 差 平 方 和 : S3 = 19.2 全 体 の 自 由 度 : F1 = (データ 件 数 1) = (20 1) = 19 因 子 の 自 由 度 : F2 = ( 水 準 数 1) = (4 1) = 3 誤 差 の 自 由 度 : F3 = (F1 F2) = (19 3) = 16 因 子 による 分 散 : V2 = (S2 / F2) = (10.0 / 3) = 3.33 誤 差 による 分 散 : V3 = (S3 / F3) = (19.2 / 16) = 1.2 F 値 : V2 / V3 = 3.33 / 1.2 = 2.78 2005 年 7 月 11 日 34 34
分 散 分 析 の 例 F 値 = 2.78 これを F 分 布 表 の 値 と 比 較 自 由 度 (3, 16) のF 分 布 における 有 意 水 準 5%での 棄 却 域 は 3.24 2.78 < 3.24 帰 無 仮 説 は 棄 却 できない 使 いやすさに 有 意 差 はみられない P 値 : F 値 に 対 応 した 棄 却 確 率 この 場 合 は p = 0.07 棄 却 できる 場 合 は p < αとなる 2005 年 7 月 11 日 35 35
Excel での 計 算 例 [ツール] [ 分 析 ツール] [ 分 散 分 析 : 一 元 配 置 ] 一 元 配 置 = 説 明 変 数 が 一 要 因 分 散 分 析 : 一 元 配 置 概 要 グループ 標 本 数 合 計 平 均 分 散 A 5 21 4.2 0.7 B 5 16 3.2 0.7 C 5 16 3.2 2.7 D 5 11 2.2 0.7 分 散 分 析 表 変 動 要 因 変 動 自 由 度 分 散 観 測 された 分 散 比 P- 値 F 境 界 値 グループ 間 10 3 3.333333333 2.777777778 0.074982 3.238867 グループ 内 19.2 16 1.2 合 計 29.2 19 2005 年 7 月 11 日 36 36
分 散 分 析 のいろいろ 1 要 因 の 分 散 分 析 ( 一 元 配 置 分 散 分 析 ) 対 応 なし( 被 験 者 間 要 因, ex. 2 群 x1 条 件 ) 対 応 あり( 被 験 者 内 要 因, ex. 1 群 x2 条 件 ) 2 要 因 の 分 散 分 析 (ニ 元 配 置 分 散 分 析 ) 対 応 なし& 対 応 なし(ex. 4 群 x1 条 件 ) 対 応 なし& 対 応 あり(ex. 2 群 x2 条 件 ) 対 応 あり& 対 応 あり(ex. 1 群 x4 条 件 ) 3 要 因 の 分 散 分 析 ( 三 元 配 置 分 散 分 析 ) 全 て 対 応 なし ~ 全 て 対 応 あり の4 種 類 2005 年 7 月 11 日 37 37
交 互 作 用 各 要 因 の 主 効 果 と 異 なり 複 数 の 要 因 の 組 合 せにより 発 現 する 複 合 効 果 のこと 例 ) 学 生 の 性 格 と 効 果 的 学 習 法 内 向 的 なら 家 庭 教 師 外 向 的 なら 塾 が 良 い? 2 要 因 の 分 散 分 析 の 手 順 交 互 作 用 を 検 証 交 互 作 用 があれば 単 純 主 効 果 を 検 定 要 因 Aのある 水 準 での 要 因 Bの 主 効 果 などのこと 交 互 作 用 がなければ 主 効 果 を 検 定 2005 年 7 月 11 日 38 38
t 検 定 と 分 散 分 析 t 検 定 2 群 に 対 してのみ 用 いられる データ 数 が 少 なくても 用 いられる 分 散 分 析 何 群 に 対 してでも 用 いられる データ 数 は30 以 上 が 望 ましい (t 分 布 はn=30 以 上 で 正 規 分 布 とほぼ 区 別 できなくなる) ただし 個 々の 群 の 順 位 づけはできない この 場 合 分 散 分 析 やt 検 定 を 繰 り 返 すとH 0 が 棄 却 されやすくなる 多 重 比 較 を 行 なう 必 要 がある 2005 年 7 月 11 日 39 39
多 重 比 較 H 0 : 各 平 均 μ 1 = = μ n 1 Scheffe の 手 法 有 意 性 をより 慎 重 に 判 断 する 2 Tukey の 手 法 有 意 性 をより 緩 く 判 断 する データ 数 が 等 しい 必 要 がある 3 Bonferroni の 手 法 t 検 定 の 有 意 水 準 を 予 め 厳 しく 設 定 する 手 法 有 意 性 判 定 の 程 度 は1と2の 間 2005 年 7 月 11 日 40 40
検 定 手 法 のいろいろ カテゴリーの 差 比 率 や 独 立 性 一 様 性 の 検 定 :χ 2 検 定 分 散 1 群 の 分 散 と 期 待 分 散 の 比 較 :χ 2 検 定 2 群 の 分 散 の 比 較 :F 検 定 3 群 以 上 の 分 散 の 比 較 : 分 散 分 析 平 均 1 群 2 群 の 比 較 :t 検 定 3 群 以 上 の 比 較 : 分 散 分 析 多 重 比 較 : TukeyのHSD 法 など 2005 年 7 月 11 日 41 41
グラフのいろいろ 棒 グラフ 例 ) 名 義 尺 度 のカテゴリー 別 の 度 数 分 布 を 確 認 折 れ 線 グラフ 例 ) 量 的 データを 時 系 列 で 確 認 円 グラフ 例 ) 名 義 尺 度 のカテゴリー 別 の 頻 度 分 布 を 確 認 帯 グラフ 例 ) 順 序 尺 度 のカテゴリー 別 に 頻 度 分 布 を 確 認 3Dグラフ 情 報 の 損 失 は 少 ないが かえって 見 づらいこともある 2005 年 7 月 11 日 42 42
箱 髭 図 (box plot) 各 四 分 位 点 ±1.5 IQR* 中 央 値 *IQR= 第 3 四 分 位 値 - 第 1 四 分 位 値 飛 び 外 れ 値 第 1, 第 3の 四 分 位 点 箱 の 基 準 が 平 均 と 標 準 偏 差 という 場 合 もある 2005 年 7 月 11 日 43 43
散 布 図 2005 年 7 月 11 日 44 44
散 布 図 行 列 (MA チャート) 2005 年 7 月 11 日 45 45