Microsoft Word - SPSS2007s5.doc

第 5 部 SPSS によるデータ解析 : 追加編ここでは卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがあるたとえば調査データの出身県という変数があったとして初期の処理の段階では 47 都道府県に入力されていたとする富山石川そして福井の県ごとの人数は少ない北陸とこれらの県出身者をまとめると次の統計処理もそして本来の研究の目的もさらに追求できそうと判断した場合に適用できる処理である間隔尺度水準の変数では連続得点上に位置する被験者をたとえば GP 分析のように上位群と下位群とに集団を分ける際にも適用できる SPSS の変換 (T) の値の再割り当て(R) でこの操作をおこなうことができる注意が必要なことは再割り当てを同一変数でおこなうと元の値と入れ替わりが起きることである他の変数への割り当ての場合には出力変数として新たに定義した変数が SPSS データに追加されることになるここでは間隔尺度の変数で新しい変数を生成する方法を紹介する分布の確認処理この操作の前に変数の分布の状態を確認する方法を紹介する対象とするデータファイルは例題データ1の rosen96.sav とする変数は自尊感情尺度の尺度得点でこの変数 (ssa: 例題データのファイルの変数名 ) についてまず棒グラフを正規分布曲線を付けて表示してみることにする SPSS のメニュー画面で分析 (A) の記述統計量(E) で度数分布表 (F) で単純度数の計算ができる( 第 2 部 (p.12) も参照 ) 総点から3つの群に分けてみることを検討してみるためにさらに度数分布表内で統計(S) を選び図 44 のように等サイズで 3 グループに分割として平均と標準偏差歪度と尖度の出力も指定してみる図表 (C) では図 45 のようにヒストグラム (H) と正規曲線付き(W) とを指定する図 44 度数分布の統計での指定画面図 45 同じく図表の指定 38

次が SPSS ビューアの画面を切り貼りしたものであるこの統計量の出力中でパーセンタイルは 33.3 の横の点 (26) よりも低い得点に約 33% が位置しているという意味であり同じく 66.6 の横の 30 点より上位に約 33 が位置しておりこの間に残りの被験者が分布していることになる ssa ssa 度数平均値標準偏差歪度歪度の標準誤差尖度尖度の標準誤差ハーセンタイル統計量有効欠損値 33.33333333 66.66666667 145 0 27.5517 5.27432 -.170.201.085.400 26.0000 30.0000 有効 12.00 15.00 16.00 17.00 18.00 19.00 20.00 21.00 22.00 23.00 24.00 25.00 26.00 27.00 28.00 29.00 30.00 31.00 32.00 33.00 34.00 35.00 36.00 37.00 38.00 40.00 合計 ssa 度数ハーセント有効ハーセント累積ハーセント 1.7.7.7 1.7.7 1.4 1.7.7 2.1 1.7.7 2.8 4 2.8 2.8 5.5 3 2.1 2.1 7.6 3 2.1 2.1 9.7 5 3.4 3.4 13.1 7 4.8 4.8 17.9 8 5.5 5.5 23.4 3 2.1 2.1 25.5 10 6.9 6.9 32.4 9 6.2 6.2 38.6 8 5.5 5.5 44.1 17 11.7 11.7 55.9 13 9.0 9.0 64.8 14 9.7 9.7 74.5 3 2.1 2.1 76.6 9 6.2 6.2 82.8 9 6.2 6.2 89.0 4 2.8 2.8 91.7 5 3.4 3.4 95.2 1.7.7 95.9 1.7.7 96.6 2 1.4 1.4 97.9 3 2.1 2.1 100.0 145 100.0 100.0 ここでは 3 群としている分布の形態からみて適切な分類かどうかはさらに再検討の余地がありそうである間隔尺度水準の変数についてその分布を統計量とグラフとあわせて検討してみることができるという 1 つの例と考えてほしい 39

値の再割り当て : 値の変換自尊感情尺度得点で上の結果から 3つの群に分割してみることにする 26 点以下とすると下位群は 38.6% となる 25 点では 32.4% となるのでここでは 25 点以下を下位群とし記号として L を与える上位群は 31 点で切ってみることにしてここでは H を与え中間群には M を与えてみることにする変換(T) の値の再割り当て(R) の他の変数への画面でまず対象の変数 ssa を選ぶ変換先変数名としてここでは ssag と新しい変数名を与えたこの変数名は既存の変数名と重複しないようにしなければならない図 46 他の変数への値の再割り当て ( 新しい変数名の作成 ) 画面次に図 45 の画面中央下の今までの値と新しい値 (O) を選ぶ今までの値を新しい値に変換する処理として多様なオプションが用意されている欠損値を何らかの値に置き換えることもできるわけであるここでは最小点から 25 点で (25 点以下 ) に L という文字を与えてみることにするこの指定を確定するには追加 (A) を押すなお新しい変数を数値として扱う場合は文字型変数への出力の指定をしてはいけない図 47 新しい変数の生成と変換 ( 文字型 ) 指定の画面 40

引き続いて中間の M 群を範囲 (N) で 26 から 30 と数値を入れ追加しさらに上位群を 31 点から最大値として追加する図 48 変換の範囲指定の画面範囲指定に誤りがないかを確認後に続行を押と画面は図 45 に戻る次に変更をクリックすると数値型変数 -> 出力変数の下に ssa->ssag が表示され変換作業の準備が終わる OK を押すとここで定義した新しい変数 ssag が生成されることなるなおこの操作の結果は度数表やクロス表で確認することができる 16. 重回帰分析ある 1 つの変数 (y) を他の複数の変数 (x1~xn) から予測できる程度とその予測での各変数の貢献の程度を分析する手法として心理学では重回帰分析が使用されてきたここでは big five の検査尺度である FFI から E 尺度 (Extraversion) をyとしこれを YG 性格検査の 12 尺度から予測してみることにする使用するファイルは 2005 年度前期最後の心理テストからのデータで YGFFI2005.sav( 社会学部内サーバーにて配布 ) として配布したものであるこのデータのファイルは実習授業で授業での使用と研究とを目的として収集したものの 1 部である配布や使用は受講生に制限しここ (HP) では相関行列についても公開しない解説は間隔尺度水準の変数に重回帰分析を適用した最も基礎的な内容だけとして手順と統計量の説明を載せるロジステック回帰分析のように 2 値データの分析も SPSS では可能であるデータの変数の尺度水準にあわせた適切な解析方法や変数選択法などの詳細についてはここでは触れない参考文献などを参照してほしい重回帰分析は y への予測を最大化するような n 個の変数への重み付けを求める方法である最少 2 乗法によるこの方法では予測に使われる変数群が一次独立な関係にあることが求められている変数間が独立していない場合や相関が高すぎる場合には多重共線性の現象に遭遇することもある 41

図 49 重回帰分析を指定する画面ここで説明する重回帰分析は回帰 (R) の線形(L) である SPSS では y は従属変数に相当する (FFI の E 尺度 ) 独立変数はこれを予測するための変数群のことでありここでは YG12 尺度を独立変数として投入してみた他のオプションはここでは指定していない図 50 重回帰分析での分析する変数の指定画面 42

ここでは結果を説明する際に参照する出力のみを提示するモテル集計モテル R R2 乗調整済み R2 乗推定値の標準誤差 1.777 a.603.581 4.942 a. 予測値 : ( 定数 ) S, C, T, Ag, Co, G, O, R, A, N, D, I 係数 a モテル 1 ( 定数 ) D C I N O Co Ag G R T A S a. 従属変数 : effi 標準化係非標準化係数数 B 標準誤差ヘータ t 有意確率 13.869 2.167 6.400.000 -.279.088 -.222-3.165.002.187.105.120 1.783.076.286.107.203 2.670.008 -.117.109 -.078-1.077.283 -.036.113 -.020 -.321.748 -.246.096 -.137-2.556.011.053.101.032.523.602.440.087.295 5.052.000.475.102.281 4.678.000 -.009.094 -.006 -.096.924.064.097.045.661.509.355.090.256 3.950.000 モデル集計の R の値は y と予測に使用された変数 (x1~xn) を下の出力の非標準化係数で重みを付けて合成した変数との相関係数であり重相関係数と呼ばれる予測の成功の程度はこの値を2 乗した決定係数 (0.603) で評価されることが多いこの結果では決定係数が 0.6 を越えているので big five の外向性尺度を YG12 尺度から予測することができるといえる YG 尺度の中でこの予測に貢献している尺度は高いものから順に G R S でありこれらは 0.1% 以下の有意水準にある逆の重みがかかっているのが D 尺度であり Co も同じ負の重みである N は正で C も同じとなっている重回帰分析では非標準化係数と標準化係数の2つの係数が出力されるこの違いは得点の標準化にある Z 得点に変換して重回帰分析をおこなった場合の結果が標準化係数であり素点のままでの分析結果が非標準化係数であるなおこの係数とは一般的には偏回帰係数と呼ばれる 43

17. 多重比較 2 要因の分散分析 ( 山内 (2000) より統計のテキストの例題を SPSS で検討してみる方法を簡単に紹介する使用するのは山内 (2000) の多重比較 (pp.151-156) と 2 要因の分散分析 (pp.164-173) である一般的な統計のテキストではスペースを省略することを目的として独立した被験者の得点を要因水準で整理して表にしているすべての被験者を行として列に要因水準得点を配置した表を作成すれば SPSS で統計テキストの例を解析することができる出力される結果の意味や内容をテキストを参照しながら一般的な表示形式で提示することを学習してほしい図 51 山内 (2000,p.152)4 つの治療法の例より図 52 山内 (2000,p.166) 表 11.1 よりこの 2 つのファイルも YGFFI2005.sav と同じように社会学内で配布した 44