講義資料 P1 第 1 回ガイダンス 1 受講にあたって (1) 担当者宮本友弘 ( 東北大学高度教養教育 学生支援機構准教授 ) E-mail: tomohiro@tohoku.ac.jp 専門 : 心理学 / 教育情報学 (2) 授業の概要 ( シラバス参照 ) (3) 教材 1 授業用の Web サイトを開設しています http://www16.plala.or.jp/tm-home/rm2016/ ( すべて半角 ) 2 使用するソフトウェア ソフトウェア 主な用途 Excel データ入力 図表作成 基礎的な統計法 ( 平均値 SD t 検定など ) js-star 直接確率計算 χ2 検定と残差分析 3 要因までの分散分析 http://www.kisnet.or.jp/nappa/software/star/ SPSS ほとんどの統計法とくに多変量解析 ( 因子分析 重回帰分析など ) 3 参考書 田中敏 山際勇一郎 (1992). ユーザーのための教育 心理統計と実験計画法 方法の理解から論文の書き方まで教育出版平均値 標準偏差 (SD) t 検定 分散分析 相関係数 χ 2 検定といった基礎的な統計法をわかりやすく解説しています 結果をどのように書くかもわかります 松尾太加志 中村知靖 (2002). 誰も教えてくれなかった因子分析北大路書房探索的因子分析をわかりやすく解説した本の決定版 斜交回転のことをここまでわかりやすく解説した本はないでしょう SPSS によるやり方の記述も十分 小塩真司 (2005). 研究事例で学ぶ SPSS と Amos による心理 調査データ解析東京図書 SPSS を使って 因子分析 重回帰分析といった多変量解析をどう行うかについて 具体的な事例 ( データ ) を用いて解説しています 論文でどう書くかもわかります 村瀬洋一 高田洋 廣瀬毅士 ( 編 )(2007). SPSS による多変量解析オーム社 SPSS を使って 多変量解析をどう行なうかを詳しく説明しています 上記の補充として有用です 2 研究法について (1) 児童学研究科 ( 修士論文研究 ) 教職研究科 ( 課題研究 ) の主な種類 呼称 研究の対象となるもの 研究のまとめ方と意義 文献研究 文献 思想比較 資料発掘 今後の展望 事例研究 個別記録 個別事例の追跡と概念的記述 ( 用語や図式 ) 実証研究 調査 実験等によるデータ 実態把握 探索 ( 仮説の生成 ) 仮説の検証 実践研究 現場 実践の評価 改善
講義資料 P2 文献の種類 著書論文 学会誌紀要報告書市販雑誌 その他学会発表 種類具体例注意すること出版社 保育学研究 ( 日本保育学会 ) 児童学研究 ( 聖徳大学 ) 児童心理 日本学術会議協力学術研究団体 / 査読付大学のレベル / 査読付 (2) 論文の書式 * 各研究科 指導教官によって若干異なるので注意 例 ) 前付け 本文 後付け 表紙 ( タイトル ) 要約はじめに目次 第 1 章序論第 1 節研究史第 2 節本研究の目的第 2 章研究 1 第 1 節目的第 2 節方法第 3 節結果第 4 節考察 第 3 章研究 2 第 1 節目的第 2 節方法第 3 節結果第 4 節考察第 4 章全体的考察第 5 章結論引用文献 謝辞 ( 後書き ) 資料 (3) 実証研究の進め方 1) テーマの設定問題意識 日常的な関心など 研究可能な形で述べること ( ) ポイント 1 22 つの関係 A B 2) 仮説のタイプ 1 探索型研究 : 理論はなく ある事象の性質 状態を探る 2 検証型研究 : 理論から導いた仮説が正しいかどうかを確かめる 3) 研究の企画 A 操作 設定測定 B 測定測定 データ収集の方法 1 見る 2 聞く 3 何かさせる ( パフォーマンスを見る )
講義資料 P3 第 2 回データの種類と統計的検定の考え方 1 測定とは構成概念 ( 人格特性や行動傾向 ) 現象 ( 行動や反応 ) 測定 ( 数値やカテゴリーを割当てる ) データ 2 尺度の種類尺度順序性等間隔性原点 0 例平均賛成 反対 女子 男子など 名義尺度 分類名 ( カテゴリー ) L>M>S 優 > 了 > 可順序尺度 間隔尺度 比率尺度 温度など (0 度の 2 倍は 0 でない ) 時間 体重など (0 秒の 2 倍は 0 秒 ) < 考えてみよう > 評定尺度法によって得られたデータをどう判断するか? 3 統計的推測通常 母集団全体を調べること ( 悉皆調査 ) は無理! 母集団 ( 研究対象全体 ) 抽出 標本 ( サンプル ) 標本 ( 実際の被験者 ) から 一定の目安 ( 確率 ) に基づく判断をする 例題 1 ある質問を 20 名に対して行った 賛成と反対の意見はどちらが多いといえるか 表 1 回答の集計結果 ( 人 ) 賛成反対 5 15 データの表示 : 集計表の作成 < 統計的検定の考え方 > 1 仮説を立てる帰無仮説 : 良い の人数と 悪い の人数は差がない ( 等しい 偶然のユレ ) 対立仮説 : 賛成 の人数と 反対 の人数には差がある ( 賛成 の人数が 反対 の人数よりも少ない ) 2 帰無仮説のもとでデータが起きる偶然で起こる確率 ( 偶然確率 ) を計算する 確率を表す記号は p(probability)
講義資料 P4 3 偶然確率の大きさを評価する 0.05 を基準にする 0.05 以上 よく起こることが起きている 偶然にすぎない 帰無仮説を棄却できない 0.05 未満 まれなことが起きている 偶然でない 意味がある 帰無仮説を棄却 <js-star での分析 > 1 左側メニューの 1 2 表 ( 正確二項検定 ) をクリック 2 表示された枠に 集計表の数値を入力 計算ボタンをクリック 3 出力結果 [ 直接確率計算 1 2] 観測値 1 観測値 2 ----------------------------------------- 5 15 両側検定 : p=0.0414 * (p<.05) 片側検定 : p=0.0207 * (p<.05) ----------------------------------------- < 結果の書き方 > 表 1 は回答別の人数を示したものである 正確二項検定の結果 賛成 の人数は 反対 の人数よりも有意に少なかった ( 両側検定 :p=.04) 第 1 文データの表示 第 2 文分析結果 1 使用した分析法 ( 正確 2 項検定 ) 2 検定方法 ( 両側検定 ) 3 偶然確率 (p= ) を記載して 有意であった / なかった 有意差があった / なかった を書く 分析結果に基づく 推論 ( 通常は 考察 で書く ) < 補足 > 同じ比率でも検定結果は異なる 良い 悪い 良い 悪い 6(75%) 2(25%) 18(75%) 6(25%) パーセントしか表示していない結果には注意する! 度数の表示を優先する
講義資料 P5 4 統計的方法の種類 A 独立変数 B 従属変数 方法 カテゴリー カテゴリー ノンパラメトリック法 :χ 2 検定 カテゴリー 数量 実験計画法 :t 検定 分散分析 数量 数量 多変量解析 : 相関係数 因子分析 重回帰分析
講義資料 P6 第 3 回ノンパラメトリック検定 1 1 カテゴリー データの処理の進め方 (0) データ処理の準備 1 質問紙調査の場合質問紙に通し番号を振る 対象者の ID とする 2 データの入力 Excel を使用する 対象者をタテ 変数をヨコに 一人一行の原則 1 行目には変数名を入力する 性別などのカテゴリー データも コード化して数字にしておく ( 例男子 :1 女子 :0) 多肢選択法 ( 複数回答 ) の場合の入力に注意 例 ) 次の中から 関心があるものすべてに を付けてください 1. 経済の構造改革 2. 景気対策 3. 政治 行政の在り方 4. 外向 安全保障 5. 社会保障制度改革 6. 環境問題 7. 教育改革 8. 憲法問題 9. その他 ( ) 10. 特にない (1) データの表示 : 集計表の作成 対象者 条件 成績 各カテゴリーの人数 個数を条件ごとにカウントして 集計表を作成カウントした数を度数 各マスをセルという ア A できた イ A できた できた できない 計 ウ A できない 条件 A 4 1 5 周辺度数 エ A できた 条件 B 2 3 5 周辺度数 オ A できた 計 6 4 10 カ B できない 周辺度数 周辺度数 総度数 キ B できた ク B できない ケ B できた コ B できない (2) データの分析 : 度数 ( 比率 ) の差の検定
講義資料 P7 2 1 j 表の分析 例題 1 SPSS の練習 [0] データの読み込み 1SPSS を起動する 2 キャンセルをクリック 3 データファイルを SPSS 画面へドラッグする 4 使用するワークシートを選択 OK をクリック
講義資料 P8 [1] 正確二項検定の実行 ( 復習 ) 1 分析 ノンパラメトリック検定 過去のダイアログ 2 項 2 検定変数リストに 回答 2 を移動 検定比率は 0.50 OK 3 出力結果 値にラベルをつける 1 変数ビューで 値の欄をクリックする 2 値 ラベルを入力 追加をクリックする
講義資料 P9 [2]χ 2 検定の実行 ( 新しい内容 ) 1 分析 ノンパラメトリック検定 過去のダイアログ カイ 2 乗 2 検定変数リストに 回答 2 を移動 3 出力結果 回答 2 期待度 観測度数 N 数 N 残差 賛成 5 10.0-5.0 反対 15 10.0 5.0 合計 20 検定統計量 回答 2 カイ 2 乗 5.000 a 自由度 1 漸近有意確率.025 a. 0 セル (0.0%) の期待度数は 5 以下です 必要なセルの度数の最小値は 10.0 です 1 期待度数を求める観測度数 実際に得られた度数期待度数 偶然確率 ( 母比率 ) のもとで予測される度数 2 観測度数と期待度数のズレを数量化する 3 自由度 (df) を計算する ある統計量において自由に変わりうる要素の数 4 当該のχ2 値の出現する確率を χ 2 分布から求める 4 結果の書き方表 は各回答の人数を示したものである χ 2 検定の結果 賛成の人数が反対の人数よりも有意に少なかった (χ 2 (1)=5.00,p<.05) まとめ 1 カテゴリーデータの処理 (1) データの表示 : 集計表の作成 (2) データの分析 : 度数 ( 比率 ) の差の検定 1 真の確率を計算する 直接確率計算 (2 項検定など ) 2 近似の確率を計算する データを χ 2 という統計量にして その確率を求める χ2 検定の制約 集計表の中に度数 0 のセルがある 集計表の中に期待度数 5 以下のセルが 全セルの数の 20% 以上ある
講義資料 P10 例題 2 小学生 69 名を対象に 先生にほめられるとしたら どんなほめられ方を好むかを調べた 収集されたデータ ( 仮想 ) から どんなことがいえるか (1) データの表示 : 集計表の作成 1Excel ファイルを SPSS に読み込む Excel ファイルを SPSS の画面にドラッグすればよい 2 分析 記述統計 度数分布表 3 ほめられた方 を選択 中央の矢印をクリック OK をクリック 4 度数分布表の出力 ここから 表 タイトル 名前発表 能力賞賛 努力賞賛 賞状授与 (2) データの分析 1 分析 ノンパラメトリック検定 過去のダイアログ カイ 2 乗 注意! データはすべて数字の方がよい 変換 変数ビューで 値にラベルをつけるといよい 2 ほめられ方 2 を選択 中央の矢印をクリック OK をクリック 3 出力読み取るべき情報は? (3) 結果をまとめる表 は
講義資料 P11 第 4 回ノンパラメトリック検定 2 1 クロス集計表 i j 表の分析 例題 3 肺がんの患者 60 名と 健常者 90 名を無作為に選び 喫煙について調べた 収集されたデータ ( 仮想データ ) からどんなことがいえるか 例題 32 データをダウンロード ( 肺がん患者 :1 健常者 :2 / 喫煙 :1 非喫煙 :2) (1) データの表示と分析 0)Excel ファイルを SPSS に読み込む 読み込んだら 変数ビューで 各変数の値にカテゴリー名を付けること 1) クロス集計表の作成と χ2 検定の実行 1 分析 記述統計 クロス集計表を選択 2 肺がん を 行 喫煙 を 列 に移動する 3 統計量 をクリック カイ 2 乗 にチェックを入れたら 続行をクリック ここをクリック して移動 4 セル をクリック 期待度数にもチェックを入れる チェックを入れる 続行をクリック 2 の画面で OK をクリック
講義資料 P12 5 クロス集計表の出力 肺がんと喫煙のクロス表 喫煙 喫煙 非喫煙 合計 肺がん 肺がん患者 度数 52 8 60 期待度数 40.0 20.0 60.0 調整済み残差 4.2-4.2 健常者 度数 48 42 90 期待度数 60.0 30.0 90.0 調整済み残差 -4.2 4.2 合計 度数 100 50 150 期待度数 100.0 50.0 150.0 6χ 2 検定の結果 カイ 2 乗検定 漸近有意確率 正確有意確率 正確有意確率 値 自由度 ( 両側 ) ( 両側 ) ( 片側 ) Pearson のカイ 2 乗 18.000 a 1.000 b 連続修正 16.531 1.000 尤度比 19.467 1.000 Fisher の直接法.000.000 線型と線型による連関 17.880 1.000 有効なケースの数 150 a. 0 セル (.0%) は期待度数が 5 未満です 最小期待度数は 20.00 です b. 2x2 表に対してのみ計算 7χ 2 検定が有意の場合の下位検定 残差分析 どのセルが χ 2 値の有意性に貢献したかを判定する方法各セルの観測度数と期待度数の差 ( 残差 ) を調整した値 ( 調整済み残差 ) をみる 有意かどうか 有意な残差は定数として決っている 残差の絶対値 >1.96 p<.05 残差の絶対値 >2.58 p<.01 符号 : ズレの方向 プラスか マイナスか (2) 結果をまとめる 1 集計表と 残差分析の結果の表を作成する 表 1 表 2 残差分析の結果 ( 調整済み残差 ) 喫煙非喫煙喫煙非喫煙 肺がん患者 健常者 肺がん患者 健常者
講義資料 P13 2 文章を記述する表 1 は肺がん患者と健常者における喫煙と非喫煙の人数を集計したものである χ 2 の結果 人数の偏りは有意であった (χ 2 (1) =18.00, p<.01) 残差分析を行った結果 表 2 にみられるように 肺がん患者では喫煙者が多く 健常者では喫煙者が多かった 1 データの表示 2χ 2 検定の結果の記述 ( 主分析 ) 3 残差分析の結果の記述 ( 下位分析 ) χ 2 検定の制約 集計表の中に度数 0 のセルがある 集計表の中に期待度数 5 以下のセルが 全セルの数の 20% 以上ある 例題 4 不安障害のある 21 名に対して 心理療法 A あるいは 心理療法 B を実施し 改善の有無について調べた 収集されたデータ ( 仮想データ ) からどんなことがいえるか ( 心理療法 A:1 心理療法 B:2 / 改善あり :1 改善なし :2) (1) 集計表の作成 心理療法 A 改善あり 改善なし 心理療法 B (2) 結果をまとめる 例題 5 ある小学校の保護者に道徳教育の必要性 ( 必要を 1 不要を 2) について 2 回調査した 1 回目と 2 回目の間に 担当教員による道徳教育の目的や実際についての説明があった 得られたデータからどんなことがいえるか このまま χ 2 検定を実行すると 表 1 道徳教育に対する意見の変化 ( 人 ) 説明前 \ 説明後 必要 不要 必要不要 対象者のデータが 対応している ことに注意する
講義資料 P14 マクネマーの法 ( マクニマーの検定 ) を行う 分析 ノンパラメトリック検定 過去のダイアログ 2 個の対応サンプルの検定を選択 変数 1 に事前変数 2 に事後を投入する McNemar にチェックを入れる p<.01 なので 有意である どういう意味か? 対応があるデータどうしの変化に注目して 分析している 変化のないセルには注目しない 表 2 態度が変化した者の人数 ( 人 ) 必要 不要不要 必要 5 20 この 5 人と 20 人の差を検定している マクネマーの法は 1 つの考え方であり 新しい方法ではない 結果のまとめ ( 例 ) 態度が変化した者を集計し ( 表 2) 正確二項検定を行なった結果 不要 から 必要 へ変化した者の人数が その逆の人数より有意に多かった ( 両側検定 :p=.004) 担当教員の説明は 道徳教育を不要と考える保護者の意識を変容させる効果があるといえる
講義資料 P15 第 5 回数量データの要約 : 記述統計量 1 数量データの処理の流れ (1) データ表示手順 1 ヒストグラムの作成手順 2 記述統計量 (M SD など ) の計算 記述統計手順 3 作表 作図 注意 : 統計概念の記号として用いる文字は イタリックとする (2) データ分析 : t 検定 分散分析など 推測統計 2 データ表示 例題 6 大学生 15 名に単語を 12 個提示した後 すぐに再生テストを行った 手順 1 2 ヒストグラムの作成と記述統計量の計算 (1)SPSS の操作 1 分析 記述統計 度数分布 2 変数を投入する 3 統計量を指定する 4 ヒストグラムを選択する (2) ヒストグラムのチェック 1 極端値 ( データ全体の分布から大きくはずれている値 ) のチェック不良値であることが多い 研究者側の要因手続きの失敗 ( 教示の不徹底 材料の不備など ) 場面統制の失敗 ( 他者の介入 騒音 停電など ) 被験者側の要因知的原因 ( 既有知識 専門技能 誤解 理解不足など ) 情意的原因 ( 興奮 反発 無関心 心理的防衛など ) 身体的原因 ( 疲労 睡眠不足 近視 難聴など )
講義資料 P16 2 分布形のチェック ( 正規分布かどうか?): 数量データとして処理をするための前提条件 正規分布 数量データの処理は適用できない 平均が代表値にならない カテゴリー データとして処理 統計的にチェックする方法もある 1 分析 記述統計 探索的 2 従属変数を投入する 3 正規性の検定とプロットにチェックを入れる 4 出力結果 コルモゴロフ スミルノフの検定 (K-S 検定 ) とシャピロ ウィルク検定 (S-W 検定 ) データの分布と 正規分布とのズレが 有意かどうかを検定する 適合度の検定ともいう 人数が少ない場合は S-W 検定を使用する この場合の確率は K-S 検定が p=.200 S-W 検定が p=.119 なので 有意でない つまり データの分布は 正規分布とズレていない 正規分布とみなせるということ 統計的な結果と ヒストグラムなどの視覚的な結果を総合して判断する
講義資料 P17 (3) 記述統計量 再生数 1) 代表値 ( 分布の中心的位置を示す ) 度数 有効 15 欠損値 0 平均値 (M) 7.33 中央値 ( メディアン Me) 7.00 最頻値 ( モード Mo) 7 標準偏差 1.799 分散 3.238 歪度 ( わいど ) 1.119 歪度の標準誤差.580 尖度 ( せんど ) 2.090 尖度の標準誤差 1.121 最小値 5 最大値 12 1 平均値 2 中央値 ( メディアン ) データを順番に並べてちょうど真ん中になるケースの値 累積 % が 50% に該当する値 極端値の影響が少ない 3 最頻値 ( モード ) もっとも度数の多い値 2) 散布度 ( データの散らばりの程度を表す ) 1 標準偏差 2 分散 3 最大値 最小値 3) 歪度と尖度歪度 : 分布の左右対称性を表す 1 歪度 =0: 左右対称 2 歪度 <0: 右に偏った分布 3 歪度 >0: 左に偏った分布 尖度 : 分布のとんがり具合を表す 1 尖度 =0: 正規分布と同程度 (3 もある ) 2 尖度 <0: 正規分布よりもへん平 3 尖度 >0: 正規分布よりも尖っている ( 参考 ) 4) 平均を用いてはならない場合 1 データが数量でない場合 : 順序尺度の場合に注意 2 データの中に極端値が存在する場合 3 データの分布が正規分布とみなせない場合
講義資料 P18 5) 標準偏差 (SD:Standard Deviation) とは何か? 各データが 平均からどの程度ズレているかを表す 標準偏差の求め方 標準偏差 ( 分散 ) の求め方は 2 通りあるので注意! 実際値 標本の標準偏差推定値 母集団の標準偏差 ( 不偏推定値 ) 母集団 ( 研究対象全体 ) 抽出 標本 (sample) 母数 推定 統計量 ( 実際値 ) データの実際値 ( 分母が N) と 母集団の推定値 ( 分母が N-1) のどちらを採用? どちらか一方を一貫して用いるなら支障はない ( 参考 1) 標準偏差と平均をみれば分布の見当がつく ( あくまでも簡便法 ) 例 )1~5 までの 5 段階評定データ 平均 SD 平均 -SD 平均 +SD 正規分布 3.25 1.16 2.09 4.41 L 型分布 2.17 1.28 0.89 3.45 J 型分布 3.83 1.28 2.55 5.11 ( 参考 2)SPSS での記述統計量の別の求め方 分析 記述統計 記述統計
講義資料 P19 例題 7 大学生 40 名 ( 男子 20 名 女子 20 名 ) に単語を 12 個提示した後 すぐに再生テストを行った 手順 1 ヒストグラムのチェックどうやって男女別にヒストグラムを描くか? 1 データ ファイルの分割 2 グループごとの分析 をチェックし グループ化変数 に性別を投入する グループの比較 でもよい 出力結果が異なる 以後の分析は すべて男女別に行なわれる 手順 2 平均と SD を計算する 手順 1 の指定を解除しておく ( 全てのケースを分析 に戻す ) 1 分析 平均の比較 グループの平均 2 独立変数 に性別 従属変数 に再生数を投入 3 必要に応じて 統計量を選択する 3 出力 このまま Excel にコピーすると便利
講義資料 P20 手順 3 作表 作図 1 作表平均と標準偏差を表にまとめる ( 作表による統計量の掲載 ) 人数 平均 SD 表 各テストの平均と標準偏差 ( 点 ) 男女 N M SD 2 作図 図 男女別の平均再生数
講義資料 P21 どうやってアンテナを出すか? 1 グラフを作成する 2 次にグラフツールのレイアウト 誤差範囲で 3 折れ線グラフの場合 棒グラフの場合 4 ユーザー設定で値を指定