第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では 47 都道府県に入力されていたとする 富山 石川 そして 福井 の県ごとの人数は少ない 北陸 とこれらの県出身者をまとめると 次の統計処理もそして本来の研究の目的も さらに追求できそうと判断した場合に 適用できる処理である 間隔尺度水準の変数では 連続得点上に位置する被験者を たとえば GP 分析のように上位群と下位群とに集団を分ける際にも適用できる SPSS の 変換 (T) の 値の再割り当て(R) でこの操作をおこなうことができる 注意が必要なことは 再割り当てを 同一変数 でおこなうと元の値と入れ替わりが起きることである 他の変数 への割り当ての場合には 出力変数として新たに定義した変数が SPSS データに追加されることになる ここでは 間隔尺度の変数で新しい変数を生成する方法を紹介する 分布の確認処理この操作の前に 変数の分布の状態を確認する方法を紹介する 対象とするデータファイルは 例題データ1の rosen96.sav とする 変数は自尊感情尺度の尺度得点で この変数 (ssa: 例題データのファイルの変数名 ) について まず 棒グラフを正規分布曲線を付けて表示してみることにする SPSS のメニュー画面で 分析 (A) の 記述統計量(E) で 度数分布表 (F) で単純度数の計算ができる( 第 2 部 (p.12) も参照 ) 総点から3つの群に分けてみることを検討してみるために さらに 度数分布表 内で 統計(S) を選び 図 44 のように 等サイズ で 3 グループに分割として 平均と標準偏差 歪度と尖度の出力も指定してみる 図表 (C) では 図 45 のように ヒストグラム (H) と 正規曲線付き(W) とを指定する 図 44 度数分布の統計での指定画面図 45 同じく図表の指定 38
次が SPSS ビューアの画面を切り貼りしたものである この統計量の出力中で パーセンタイルは 33.3 の横の点 (26) よりも低い得点に約 33% が位置しているという意味であり 同じく 66.6 の横の 30 点より上位に約 33 が位置しており この間に残りの被験者が分布していることになる ssa ssa 度数 平均値標準偏差歪度歪度の標準誤差尖度尖度の標準誤差ハ ーセンタイル 統計量 有効欠損値 33.33333333 66.66666667 145 0 27.5517 5.27432 -.170.201.085.400 26.0000 30.0000 有効 12.00 15.00 16.00 17.00 18.00 19.00 20.00 21.00 22.00 23.00 24.00 25.00 26.00 27.00 28.00 29.00 30.00 31.00 32.00 33.00 34.00 35.00 36.00 37.00 38.00 40.00 合計 ssa 度数 ハ ーセント 有効ハ ーセント 累積ハ ーセント 1.7.7.7 1.7.7 1.4 1.7.7 2.1 1.7.7 2.8 4 2.8 2.8 5.5 3 2.1 2.1 7.6 3 2.1 2.1 9.7 5 3.4 3.4 13.1 7 4.8 4.8 17.9 8 5.5 5.5 23.4 3 2.1 2.1 25.5 10 6.9 6.9 32.4 9 6.2 6.2 38.6 8 5.5 5.5 44.1 17 11.7 11.7 55.9 13 9.0 9.0 64.8 14 9.7 9.7 74.5 3 2.1 2.1 76.6 9 6.2 6.2 82.8 9 6.2 6.2 89.0 4 2.8 2.8 91.7 5 3.4 3.4 95.2 1.7.7 95.9 1.7.7 96.6 2 1.4 1.4 97.9 3 2.1 2.1 100.0 145 100.0 100.0 ここでは 3 群とし ている 分布の形態か らみて適切な分類か どうかは さらに再検 討の余地がありそう である 間隔尺度水準 の変数について その 分布を統計量とグラ フとあわせて検討し てみることができる という 1 つの例と考 えてほしい 39
値の再割り当て : 値の変換自尊感情尺度得点で 上の結果から 3つの群に分割してみることにする 26 点以下とすると下位群は 38.6% となる 25 点では 32.4% となるので ここでは 25 点以下を下位群とし 記号として L を与える 上位群は 31 点で切ってみることにして ここでは H を与え 中間群には M を与えてみることにする 変換(T) の 値の再割り当て(R) の 他の変数 への画面で まず対象の変数 ssa を選ぶ 変換先変数名 としてここでは ssag と新しい変数名を与えた この変数名は既存の変数名と重複しないようにしなければならない 図 46 他の変数への値の再割り当て ( 新しい変数名の作成 ) 画面 次に 図 45 の画面中央下の 今までの値と新しい値 (O) を選ぶ 今までの値を新しい値に変換する処理として多様なオプションが用意されている 欠損値を何らかの値に置き換えることもできるわけである ここでは 最小点から 25 点で (25 点以下 ) に L という文字を与えてみることにする この指定を確定するには 追加 (A) を押す なお 新しい変数を数値として扱う場合は 文字型変数への出力 の指定をしてはいけない 図 47 新しい変数の生成と変換 ( 文字型 ) 指定の画面 40
引き続いて 中間の M 群を 範囲 (N) で 26 から 30 と数値を入れ 追加し さらに上位 群を 31 点から最大値として 追加する 図 48 変換の範囲指定の画面 範囲指定に誤りがないかを確認後に 続行 を押と 画面は 図 45 に戻る 次に 変更 をクリックすると 数値型変数 -> 出力変数の下に ssa->ssag が表示され 変換作業の準備が終わる OK を押すとここで定義した新しい変数 ssag が生成されることなる なお この操作の結果は 度数表やクロス表で確認することができる 16. 重回帰分析ある 1 つの変数 (y) を他の複数の変数 (x1~xn) から予測できる程度とその予測での各変数の貢献の程度を分析する手法として心理学では重回帰分析が使用されてきた ここでは big five の検査尺度である FFI から E 尺度 (Extraversion) をyとし これを YG 性格検査の 12 尺度から予測してみることにする 使用するファイルは 2005 年度前期最後の心理テストからのデータで YGFFI2005.sav( 社会学部内サーバーにて配布 ) として配布したものである このデータのファイルは 実習授業で 授業での使用と研究とを目的として収集したものの 1 部である 配布や使用は 受講生に制限し ここ (HP) では相関行列についても公開しない 解説は 間隔尺度水準の変数に重回帰分析を適用した最も基礎的な内容だけとして 手順と統計量の説明を載せる ロジステック回帰分析のように 2 値データの分析も SPSS では可能である データの変数の尺度水準にあわせた適切な解析方法や変数選択法などの詳細については ここでは 触れない 参考文献などを参照してほしい 重回帰分析は y への予測を最大化するような n 個の変数への重み付けを求める方法である 最少 2 乗法によるこの方法では 予測に使われる変数群が一次独立な関係にあることが求められている 変数間が独立していない場合や相関が高すぎる場合には 多重共線性の現象に遭遇することもある 41
図 49 重回帰分析を指定する画面 ここで説明する重回帰分析は 回帰 (R) の 線形(L) である SPSS では y は従属変数に相当する (FFI の E 尺度 ) 独立変数は これを予測するための変数群のことであり ここでは YG12 尺度を独立変数として投入してみた 他のオプションは ここでは指定していない 図 50 重回帰分析での分析する変数の指定画面 42
ここでは 結果を説明する際に参照する出力のみを提示する モテ ル集計 モテ ル R R2 乗 調整済み R2 乗 推定値の標準誤差 1.777 a.603.581 4.942 a. 予測値 : ( 定数 ) S, C, T, Ag, Co, G, O, R, A, N, D, I 係数 a モテ ル 1 ( 定数 ) D C I N O Co Ag G R T A S a. 従属変数 : effi 標準化係 非標準化係数 数 B 標準誤差 ヘ ータ t 有意確率 13.869 2.167 6.400.000 -.279.088 -.222-3.165.002.187.105.120 1.783.076.286.107.203 2.670.008 -.117.109 -.078-1.077.283 -.036.113 -.020 -.321.748 -.246.096 -.137-2.556.011.053.101.032.523.602.440.087.295 5.052.000.475.102.281 4.678.000 -.009.094 -.006 -.096.924.064.097.045.661.509.355.090.256 3.950.000 モデル集計の R の値は y と予測に使用された変数 (x1~xn) を下の出力の非標準化係数で重みを付けて合成した変数との相関係数であり 重相関係数と呼ばれる 予測の成功の程度は この値を2 乗した決定係数 (0.603) で評価されることが多い この結果では 決定係数が 0.6 を越えているので big five の外向性尺度を YG12 尺度から予測することができるといえる YG 尺度の中でこの予測に貢献している尺度は 高いものから順に G R S であり これらは 0.1% 以下の有意水準にある 逆の重みがかかっているのが D 尺度であり Co も同じ負の重みである N は正で C も同じとなっている 重回帰分析では 非標準化係数 と 標準化係数 の2つの係数が出力される この違いは 得点の標準化にある Z 得点に変換して重回帰分析をおこなった場合の結果が 標準化係数 であり 素点のままでの分析結果が 非標準化係数である なお この係数とは 一般的には 偏回帰係数 と呼ばれる 43
17. 多重比較 2 要因の分散分析 ( 山内 (2000) より統計のテキストの例題を SPSS で検討してみる方法を簡単に紹介する 使用するのは山内 (2000) の多重比較 (pp.151-156) と 2 要因の分散分析 (pp.164-173) である 一般的な統計のテキストではスペースを省略することを目的として独立した被験者の得点を要因 水準で整理して表にしている すべての被験者を行として 列に要因 水準 得点を配置した表を作成すれば SPSS で統計テキストの例を解析することができる 出力される結果の意味や内容をテキストを参照しながら 一般的な表示形式で提示することを学習してほしい 図 51 山内 (2000,p.152)4 つの治療法の例より図 52 山内 (2000,p.166) 表 11.1 より この 2 つのファイルも YGFFI2005.sav と同じように社会学内で配布した 44