URL: http://tsigeto.info/statg/ 作 成 : 田 中 重 人 ( 准 教 授 ) 現 代 日 本 論 / 比 較 現 代 日 本 論 研 究 演 習 I 統 計 分 析 の 基 礎 東 北 大 学 文 学 部 / 文 学 研 究 科 :2014 年 度 前 期 < 木 2>コンピュータ 実 習 室 ( 文 学 部 本 館 7F711-2) 講 義 概 要 記 載 内 容 +α 講 義 題 目 : 統 計 分 析 入 門 到 達 目 標 : (1) 統 計 分 析 の 基 礎 を 理 解 する; (2) 実 際 にデータ 分 析 をできるようになる 授 業 内 容 : 意 識 調 査 テスト 実 験 などのデータはどのように 分 析 すればいいでしょうか こ の 授 業 では 小 規 模 の 標 本 調 査 を 念 頭 において 統 計 分 析 の 基 礎 的 な 手 法 を 学 びます これまで 統 計 的 な 分 析 をおこなったことのない 人 を 対 象 に 初 歩 から 講 義 します 同 時 に コンピュータ を 実 際 に 使 って データ 分 析 の 実 習 をおこないます テキスト: 吉 田 寿 夫 1998 本 当 にわかりやすいすごく 大 切 なことが 書 いてあるごく 初 歩 の 統 計 の 本 北 大 路 書 房 成 績 評 価 の 方 法 : 各 回 の 授 業 中 の 課 題 (50%) 中 間 試 験 (20%) 期 末 レポート (30%) を 合 計 して 評 価 する その 他 : 実 習 室 のコンピュータ 台 数 が 限 られているため 受 講 人 数 を 制 限 することがある 卒 業 論 文 等 で 質 問 紙 調 査 を 予 定 している 者 は 現 代 日 本 論 質 問 紙 調 査 の 基 礎 ( 前 期 水 2) およ び 実 践 的 統 計 分 析 法 ( 後 期 木 2) も 受 講 することがのぞましい 授 業 の 概 要 1. イントロダクション (4/10) 2. SPSS 入 門 (4/17) 3. 統 計 分 析 の 基 礎 (4/24, 5/8) 4. 度 数 分 布 とクロス 表 (5/15~29) 5. 中 間 試 験 (6/5) 6. 平 均 値 の 比 較 (6/12~26) 7. 推 測 統 計 (7/3~17) 8. 期 末 レポート (8/15 提 出 ) 8/22 以 降 に 返 却 () 内 の 日 付 は 学 期 前 のおおよその 計 画 をあらわしているが 実 際 の 授 業 の 進 行 状 況 によ って 前 後 にずれることがある 受 講 者 との 連 絡 とフィードバック 毎 回 の 課 題 宿 題 は コメントをつけて 返 却 します ( 再 提 出 を 求 めることもあります) 中 間 試 験 期 末 レポートは 採 点 後 に 返 却 します 課 題 宿 題 は 特 に 指 示 のあるものをのぞき ISTU ( 東 北 大 学 インターネットスクール: http://www.istu.jp) のレポート 機 能 による 提 出 とします 提 出 期 限 は 原 則 として 授 業 前 日 ( 水 曜 ) 正 午 (12:00) です ISTU には この 授 業 の 受 講 申 請 をしておいてください ( 受 講 者 情 報 の 自 動 的 登 録 は 履 修 登 録 完 了 以 降 )
内 容 の 詳 細 1. イントロダクション 授 業 の 概 要 スケジュール 評 価 方 法 部 屋 とコンピュータの 使 いかた SPSS の 起 動 模 擬 データ 入 力 実 習 2. SPSS 入 門 データの 配 布 と 説 明 データ 行 列 (データセット) とは メニューによるシンタックス 作 成 変 数 値 の 再 割 り 当 て その 他 のソフトウエアについて 3. 統 計 分 析 の 基 礎 [ 序 章 ] 記 述 統 計 と 推 測 統 計 標 本 調 査 とは データの 種 類 ( 尺 度 水 準 ) 4. 度 数 分 布 とクロス 表 4.1. 度 数 分 布 表 [1 章 ] frequencies コマンド 相 対 度 数 (パーセンテージ) 棒 グラフ ヒストグラム 度 数 ポリゴン Excel によるグラフ 作 成 4.2. クロス 表 [4 章 ] 度 数 分 布 表 のグループ 化 クロス 表 表 記 行 と 列 の% 周 辺 度 数 (marginal distribution) crosstabs コマンドとそのオプション 4.3. 無 関 連 状 態 と 期 待 度 数 [4 章 ] φ 係 数 期 待 度 数 残 差 と Cramer の 連 関 係 数 V 表 とグラフの 書 きかた 5. 中 間 試 験 6. 平 均 値 の 比 較 6.1. 平 均 と 分 散 [2 章 ] データの 種 類 : 復 習 平 均 値 分 散 と 標 準 偏 差 分 布 と 外 れ 値 ノンパラメトリックな 代 表 値 ( 中 央 値 と 四 分 位 偏 差 ) 6.2. 平 均 値 の 層 別 比 較 [5 章 ] 平 均 の 差 と 差 の 平 均 層 別 平 均 エフェクト サイズ 相 関 比 から 分 散 分 析 へ 公 表 に 際 してなにを 書 くべきか 7. 推 測 統 計 7.1. 誤 差 の 評 価 [6 章 ] データの 記 述 と 誤 差 の 評 価 標 本 抽 出 の 4 段 階 モデル 無 作 為 抽 出 非 標 本 誤 差 標 本 誤 差 の 統 計 的 推 測 7.2. 平 均 値 の 推 定 [8 章 ] 平 均 値 の 点 推 定 区 間 推 定 と t 分 布 平 均 値 の 差 の 区 間 推 定 エフェクトサイズ 相 関 比 と 区 間 推 定 7.3. 統 計 的 検 定 [8 章 ] 区 間 推 定 の 簡 易 表 記 としての 有 意 水 準 平 均 値 の 差 の t 検 定 連 関 係 数 のχ2 検 定 分 散 分 析 と F 検 定 検 定 結 果 の 表 記 [ ] 内 は 教 科 書 の 参 照 箇 所 連 絡 先 田 中 重 人 ( 東 北 大 学 文 学 部 日 本 語 教 育 学 研 究 室 ) : 980-8576 仙 台 市 青 葉 区 川 内 27-1 文 学 部 法 学 部 合 同 研 究 棟 2F E-mail: tanakas2013 @tsigeto.info 授 業 後 に 訂 正
2014.4.10 現 代 日 本 論 / 比 較 現 代 日 本 論 研 究 演 習 I ( 田 中 重 人 ) 受 講 登 録 フォーム 氏 名 (よみがな): 学 年 : 学 籍 番 号 : 所 属 ( 文 学 部 日 本 語 教 育 学 専 修 以 外 の 場 合 ): 研 究 内 容 : 自 宅 でパソコンを 使 えますか? ある / ない SPSS を 使 った 経 験 がありますか? ある / ない コンピュータ プログラムを 作 成 したり プログラミングの 授 業 を 受 けたりしたことが ありますか? ある / ない ある 場 合 言 語 名 ( ) つぎのうち 利 用 したことがあるものは? ISTU / DCW / SRP 以 下 は 採 点 用 4/17 4/24 5/8 5/15 5/22 5/29 6/5 6/12 6/19 6/26 7/3 7/10 7/17 宿 題 課 題 参 加 中 間 期 末
URL: http://www.sal.tohoku.ac.jp/~tsigeto/statu/ 作 成 : 田 中 重 人 ( 准 教 授 ) [ 現 代 日 本 論 演 習 統 計 分 析 の 基 礎 ] 第 1 回 (2014-04-10) 受 講 者 の 興 味 と 数 学 的 知 識 の 調 査 別 紙 コンピュータ 実 習 室 について 入 室 退 室 学 生 証 が 必 要 ( 正 規 の 学 生 以 外 は 登 録 申 し 込 みが 必 要 ない 人 は 教 務 係 で 臨 時 カードを 借 りること) 文 学 部 正 規 学 生 以 外 ( 研 究 生 や 他 学 部 の 学 生 など) は 登 録 が 必 要 土 足 飲 食 喫 煙 厳 禁 退 出 時 には 必 要 事 項 を 紙 に 記 入 コンピュータの 起 動 と 終 了 使 いはじめるときは コンピュータ 本 体 の 電 源 を 入 れる 表 示 されるお 知 らせをひととおりよむこと キーボード 右 上 の NumLock ランプがついているか 確 認 使 い 終 えるときは マイドキュメント などに 保 存 してある 自 分 のファイルを 削 除 画 面 左 下 の スタートメニュー から シャットダウン を 選 択 コンピュータ 本 体 の 電 源 が 切 れたことを 確 認 USB スティック メモリなどをわすれないこと ファイルの 保 存 場 所 について 教 室 のコンピュータの 内 蔵 ディスクには 個 人 のファイルを 置 いてはならない 授 業 中 に 必 要 なファイルは マイドキュメント フォルダに 一 時 的 に 保 存 してよいが 授 業 が 終 わったら 自 分 のスティック メモリ 等 にコピーして 内 蔵 ディスクのほうのファイルは 削 除 すること
模 擬 データ 入 力 実 習 SPSS の 起 動 スタートメニューから プログラム IBM SPSS Statistics IBM SPSS Statistics 19 で 起 動 する ( ここで 何 かエラーメッセージが 出 るかもしれないが 気 にせず 続 行 または OK する ) どのような 作 業 を 行 いますか? ときかれたら データに 入 力 をチェックして OK データ 入 力 配 布 した 架 空 の 回 答 票 をもとに データを 入 力 してみよう まず 変 数 を 定 義 データエディタ ウインドウのいちばん 下 の 変 数 ビュー タブに 切 り 替 える 変 数 名 を 必 要 なだけつくる 今 回 は a, b,..., e とでもしておこう 変 数 名 は 自 分 がわかればどんなものでもよい 日 本 語 も 使 える なお 変 数 名 以 外 のフィールドは 入 力 しなくてよい 書 き 終 わったら データ ビュー タブに 切 り 替 えて いちばん 上 の 行 に 変 数 名 がなら んでいることを 確 認 する つづいてデータを 入 力 していく 今 回 は 3 人 分 のデータを 用 意 してあって 変 数 は 5 個 なので 3 5 の 行 列 型 のデータができるはずである 適 当 な 名 前 で マイドキュメント 内 に 保 存 してみる (ほかのフォルダに 保 存 してはならな い ) マイドキュメント を 開 いて SPSS データファイル (なんとか.sav) ができていることをた しかめる このデータファイルは 授 業 終 了 時 に 削 除 すること ( 次 回 以 降 の 授 業 ではつかわないので コ ピーしておく 必 要 はない ) この 方 式 は SPSS でデータを 入 力 するときのいちばん 簡 便 な 方 法 であるが 大 きなデータは あつかいにくいので テキストファイルでデータを 用 意 しておくのがふつうである
URL: http://tsigeto.info/statg/ 2014-04-17 I 2 SPSS ( ) [ ] SPSS 1 Word ISTU SPSS <http://www2.kokugakuin.ac.jp/~ogiso/spss/> SPSS 2 <http://www.koka.ac.jp/morigiwa/sjs/les10201.htm> <http://www.koka.ac.jp/morigiwa/sjs/les10401.htm> SPSS <http://www.ic.nanzan-u.ac.jp/~urakami/u-spss/ SPSS f.html> SPSS <http://yuriyuri321.blog.fc2.com/ blog-entry-45.html> SPSS PC 2 1995 SSM B (2000 6 ) 70 2 ( ) <http://srdq.hus.osaka-u.ac.jp/pdf/ssm95bj.pdf>
( ) 250 ( ) ( ) 3 SPSS 3.1 SPSS ( ) ( 8 )? 3.2 ( ) ( ) ( ) 3.3 (1) (2) (3) (4) OK ( ) Ver. 19 SPSS ( ) 2
(2, 4,...) 3.4 PC Microsoft Office (Word Excel ) SPSS Excel Word 4 ( ) ( ) OK ( ) 3
URL: http://tsigeto.info/statg/ 2014-04-24 I 3 ( ) [ ] 1 40 70 ( ) 2 ( p. 27 31) 3 ( ) p. 43 <http://www.stat.go.jp/koukou/howto/process/ proc4 3 1.htm> <http://www.wwq.jp/stacal.htm> (percentile) 4 ( ) Yahoo! <http://detail.chiebukuro.yahoo.co.jp/qa/question detail/q1214126522> M e <http://aoki2.si.gunma-u.ac.jp/lecture/univariate/median.html> One more step! (1990, p.15)
5 (1) ( ) (2) (3) (4) (5) (6) ( ) ( p. 1 6) 6 4 (universe) = (population) = (designed sample) = (valid sample / case) = (random sampling) (probability sample) 2 ( 1 ) ( ) ( 2 ) 7 (1) pp. 7 16 (2) SSM (3) (4) ISTU 5/7 ( ) (1990). 2
URL: http://tsigeto.info/statg/ 2014-05-08 I 4 ( ) [ ] 1 (= ) (1) SSM (2) (3) ( ) 1 6 2 8 3, 4, 5 11 6 14 7 17 12 9 13 12 14 14 15 16 16 18
2 3 SPSS Excel Word (ISTU 12:00 ) (1) (2) (3) 32 37 3 (table): (graph/chart): 4 ( ) ( ) ( ) ( ) ( p. 34) ( p. 106) 2
URL: http://tsigeto.info/statg/ 2014-05-15 I 5 ( ) [ ] 1 2 (1) : (2) : ( 100% ) (1) Excel ( ) ( ) 3 (3D) Excel 2 SPSS OK
3 (cross table) (1) (2) (3) ( ) ( 4 ) (Excel ) ISTU 2
URL: http://tsigeto.info/statg/ 2014-05-22 I 6 ( ) [ ] 1 % % : % % ( ) 100% ( ) Excel ( ) % 2 2 Phi Cramer V (pp. 108, 116 117) Cramer V Pearson 2 [ 4-19] [4-17] Pearson 2 V ISTU
3 ( = independent): % ( % ) (marginal frequency): ( = expected frequency): ( ) ( ) (frequency): (residual): (standard residual): 2(chi-square): V : 2 4 6/5 ( ) ISTU 2
N 36.0 50.5 13.5 100.0 111 27.3 56.8 15.9 100.0 132 31.3 53.9 14.8 100.0 243 0% 20% 40% 60% 80% 100%
URL: http://tsigeto.info/statg/ 2014-05-29 I 7 ( ) [ ] 1 2 3 m=2 m 1=1 V = χ 2 /N SPSS [4-17] χ 2 /N(m 1) = Pearson 2 = = = = = ( ) ( n 11 n 1. n.1 ) V ( ) 0 1? p. 115 2 ( ) ( ) ( ) 0 ( )
V 0.1 ( ) 0.2 0.3 3 SPSS χ 2 /N Phi ( = ) m=2 V = ( p. 110) 2 2 pp. 112 114 2 2 4 HAWCAS (2014) with Excel <http://bdastyle.net/tools/ correlation-coefficient/page1-cramer.html> (n.d.) : ( : & ) <http://rikanet2.jst.go.jp/contents/cp0530/contents/06-01-10.html> (2004) (1): 2 ( ) <http://www.k3.dion.ne.jp/~mabuchi/lectures/stat cross chisq 01.htm> 2
I / ( ) 1 36.0 50.5 13.5 100.0 (111) 27.3 56.8 15.9 100.0 (132) 31.3 53.9 14.8 100.0 (243) Cramer's V=0.094 =7 2 46.0 (113) 27.6 (134) 36.0 (247) =0.191 =3 ( ) ( ) 100.0% ( ) Cramer V ( ) 100.0 1000 1 V 3 2 1
URL: http://tsigeto.info/statg/ 2014-06-12 I 8 ( ) [ ] 1 1 2 4 3 4 6 ( 20 ) 1(2) SPSS recode (lowest thru 30 = 1)(30 thru highest = 2) (lowest thru 30 = 1)(31 thru highest = 2) (30 thru highest = 2)(lowest thru 30 = 1) 2 pp. 42 52 3 (mean): (variance): 2 (standard deviation): (SD ) 2-1 (p. 48) 4 p. 52 2-3 ISTU 5 SPSS ( p. 48 6) ( 200 ) ( 10 )
6 4 ( p. 53 59) ( ) ( ) SPSS 2 ( p.142 144) 2 7 (outlier) ( p. 46) ( ) 2
URL: http://tsigeto.info/statg/ 2014-06-19 I 9 ( ) [ ] 1 ( ) effect size (ES) ( ) 1.1 Effect size (ES) Cohen d ES = SD (1) SD p. 137 SD ES 2 ES 2 3 1.2 (correlation ratio) SD SD SD (eta) 1.3 SPSS 1 ( ) 0 1 ES SPSS
2 (1) (2) (1) (3) ES ( ) (4) ( ) (5) ISTU 3 : 8/15 ( ) 17:00 : ISTU : : 2
URL: http://tsigeto.info/statg/ 2014-06-26 I 10 ( ) [ ] (ANOVA) 1 (ANOVA ANalysis Of VAriance) (dependent variable) (independent variable) ( ) : : Cramer V? 2 (11 ) : 1, 2, 3, 3, 4, 4 : 2, 3, 4, 4, 5 SPSS 3 ES (n 1, n 2 N = n 1 +n 2 ) ES 2 = η 2 1 η 2 N 2 n 1 n 2 (1) 2 (n 1 = n 2 )
ES 2 = 4η 2 1 η 2 (2) ( ES ) ( <0.4 ) ES = 2 4?? 5 ( 2 ) ( 3 ) 6 SD (error bar; ) SD Excel SPSS SD ( ) ( ) 2
表 1 保 守 的 意 識 の 男 女 差 平 均 標 準 偏 差 ( 人 ) 男 性 4.15 1.01 (109) 女 性 3.57 1.26 (130) 合 計 3.83 1.18 (239) 以 前 からなされていたやり 方 を 守 ることが 最 上 の 結 果 を 生 む に 対 する 回 答 : 1. そう 思 う ~ 5. そう 思 わない 相 関 比 η=0.244. 無 回 答 =11. 5 4 3 2 1 男 性 女 性 以 前 からなされていたやり 方 を 守 ることが 最 上 の 結 果 を 生 む に 対 する 回 答 : 1. そう 思 う ~ 5. そう 思 わない 相 関 比 η=0.244. N=239. 無 回 答 =11. 図 1 保 守 的 意 識 の 男 女 差 ( 平 均 ± 標 準 偏 差 )
度 数 分 布 表 性 別 度 数 パーセント 有 効 パーセント 累 積 パーセント 1.00 6 54.5 54.5 54.5 有 効 2.00 5 45.5 45.5 100.0 合 計 11 100.0 100.0 従 属 変 数 度 数 パーセント 有 効 パーセント 累 積 パーセント 1.00 1 9.1 9.1 9.1 2.00 2 18.2 18.2 27.3 有 効 3.00 3 27.3 27.3 54.5 4.00 4 36.4 36.4 90.9 5.00 1 9.1 9.1 100.0 合 計 11 100.0 100.0 仮 想 の 値 度 数 パーセント 有 効 パーセント 累 積 パーセント 2.83 6 54.5 54.5 54.5 有 効 3.60 5 45.5 45.5 100.0 合 計 11 100.0 100.0 統 計 量 性 別 従 属 変 数 仮 想 の 値 度 数 有 効 11 11 11 欠 損 値 0 0 0 平 均 値 1.4545 3.1818 3.1816 標 準 偏 差.52223 1.16775.40055 平 均 値 の 比 較 従 属 変 数 報 告 書 性 別 平 均 値 度 数 標 準 偏 差 1.00 2.8333 6 1.16905 2.00 3.6000 5 1.14018 合 計 3.1818 11 1.16775 連 関 の 測 定 方 法 イータ イータの2 乗 従 属 変 数 x 性 別.343.118 分 散 分 析 表 平 方 和 自 由 度 平 均 平 方 F 値 有 意 確 率 ク ルーフ 間 ( 結 合 ) 1.603 1 1.603 1.199.302 従 属 変 数 x 性 別 ク ルーフ 内 12.033 9 1.337 合 計 13.636 10
URL: http://tsigeto.info/statg/ 2014-07-03 I 11 ( ) [ ] 1 : 1, 2, 3, 3, 4, 4 2.833 : 2, 3, 4, 4, 5 3.600 : 3.182 = 6(2.833 3.182) 2 +5(3.6 3.182) 2 =1.603 (1) n (=11) SD = η = 1.603 =0.382 11 (2) SD SD = 0.382 =0.343 1.113 (3) SPSS n 1 (=10) ( n>200 ) 2 ( pp. 3 5) ( 3 )
3 8 8 2010 FIFA 8 <http://ja.wikipedia.org/wiki/ ( )> (= ) (= ) : : (null hypothesis) 0.5? 4 4.1 (1) ( 95%) (2) (1 ) ( 2.5% ) (3) 95% 4.2 n (n>30) m (0.1<m<0.9) 95% m(1 m) m ± 1.96 n 4.3 400 240 ( ) 95% ( ) (4) 2
URL: http://tsigeto.info/statg/ 2014-07-10 I 12 ( ) [ ] 1 m SD M 95% m ± SD (1) n t ( ) (df = n 1) ( 1 ) 200 95% 1.96 2 2 d 95 1 d ± SD + 1 (2) n 1 n 2 n 1,n 2 (n 1 + n 2 2) t 3 SPSS 3.1 3.2 T ( 2 SD )
4 (statistical test) (0 ) 4.1 ( pp. 156 158, 165 166) (null hypothesis): (significant): 4.2 5% 95% 0 95 5% 95% 0 4.3 ( 1 ) p ( 5 ) 0.007 5% 0.023 5% 0.088 5% 5 ( ) 6 (1) pp. 156 162 (2) 2
URL: http://tsigeto.info/statg/ 2014-07-17 I 13 ( ) [ ] 1 2 F : =0 SPSS 2 t t ( SD ) 3 : V =0 SPSS 2 Pearson ( 5 ) 2 2 V = 0 2 (= ) 4 ( ) p < 0.05 (*) p > 0.05 ns (= not significant)
/ ( ) 1 36.0 50.5 13.5 100.0 (111) 27.3 56.8 15.9 100.0 (132) 31.3 53.9 14.8 100.0 (243) Cramer's V=0.094 p < 0.05 =7 2 46.0 (113) 27.6 (134) 36.0 (247) =0.191* =3 3 (1) ( ) 2.62 1.02 (114) 2.24 0.91 (136) 2.41 0.98 (250) 0.198. p < 0.05. 4 (2) ( ) 2.62 1.02 (114) 2.24 0.91 (136) 2.41 0.98 (250) 0.198*. *: 5%. 5 (1) ( ) 1.77 0.67 (111) 1.89 0.65 (132) 1.84 0.66 (243) 0.086. p > 0.05.. 6 (2) ( ) 1.77 0.67 (111) 1.89 0.65 (132) 1.84 0.66 (243) 0.086 ns. ns: 5%..