相関分析・偏相関分析 - PDF 無料ダウンロード

相関分析偏相関分析教育学研究科修士課程 1 回生田中友香理

MENU 相関とは相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数偏相関係数 SPSSによる偏相関係数順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す曲線回帰分析を行う

相関とは 2 変数間の直線関係の強さを見ることを相関という Ex. 教師が経験を積むにつれ教育熱心になるテレビを見る時間が長いほど宿題をする時間が短くなる変数 'x( の値が大きいほど他方の変数 'y( の値も大きい傾向にある時正の相関関係がある変数 'x( の値が大きいほど他方の変数 'y( の値が小さい傾向にある時負の相関関係がある

相関分析とは ' パラメトリックな手法 ( Pearson の相関係数について一般にパラメトリックな手法では Pearson の積率相関係数 (Pearson s product-moment correlation coefficient: r) を用いる計算式 'x.y の共分散を x と y の各分散幾何平均値で割った値 (

相関分析とは ' パラメトリックな手法 ( 相関係数の値の範囲相関係数の値の範囲は -1 r 1 であり相関係数の大きさの評価について以下が基準となる.0 r.2 ほとんど相関なし.2 < r.4 弱い相関あり.4 < r.7 比較的強い相関あり.7 < r 1.0 強い相関あり

相関分析とは ' パラメトリックな手法 ( 相関分析のポイント複数の変数間の関係を探る最初の手段として有効相関関係と因果関係は異なる相関係数が強くても本質的な因果関係が成立しているとは限らない Cf. 回帰分析 ' 一方の変数から他方の変数を予測する ( 結果だけではなく散布図も必ず確認する直線以外の関係性が見えることもある

相関分析とは ' パラメトリックな手法 ( SPSS で相関分析 excel データをダウンロードして保存する SPSS を立ち上げファイルから excel データを読み込む分析 'A) 相関 'C) 2 変量 'B) を選ぶダイヤルボックスで対象とする変数を選ぶここでは出生体重と在胎週数を選びをクリックして右のボックスへ移す相関係数の Pearson(N) にチェックする有意な相関係数に星印をつける 'F) をチェックする OK をクリックする 2 変数間の相関を複数見たいときには 3 つ以上の変数を選ぶと一気にそれぞれの相関を出してくれる

相関分析とは ' パラメトリックな手法 ( 結果.585 が胎盤重量と出生体重の相関係数である出生体重と胎盤重量は 1% 未満で有意な正の相関があった同じ変数同士の相関は 1 と表記され対角線として右上と左下部分に同じ値が出力されるのでいずれか一方を見ればよい検定の結果 p<0.01 で有意となり相関係数 r=0.585 で比較的強い相関があった出生体重胎盤重量相関係数 Pearson の相関係数有意確率 ( 両側 ) N Pearson の相関係数有意確率 ( 両側 ) N **. 相関係数は 1% 水準で有意 ( 両側 ) です出生体重胎盤重量 1.585**.000 1423 1423.585** 1.000 1423 1423

相関分析とは ' パラメトリックな手法 ( 散布図を描いてみるグラフ'G) レガシーダイアログ'L( を選ぶサブメニューから散布図 / ドット 'S) を選択する単純をクリックし定義をクリックする X 軸に出生体重 Y 軸に胎盤重量をドラック & ドロップ OK をクリックする

相関分析とは ' パラメトリックな手法 ( 相関分析をするときの注意疑似相関の危険性 2 変数間に相関関係が認められた場合には必ず他の変数の影響をうたがう Ex. 知能指数と身長が高い相関関係にある年齢の影響が背後に存在する年齢を制御変数とした偏相関係数を算出する通常は 3 変数以上の相関係数を求め相関の強い組合せが多いときに偏相関係数を求めて疑似相関を発見する作業を行う

相関分析とは ' パラメトリックな手法 ( 相関分析をするときの注意混合標本に注意する Ex. 全体としてみれば正の相関だが学年ごとで区切ってみると負の相関になる外れ値の扱い散布図中に飛び離れた値があると外れ値 ' 観察上他とは明らかに大きな小さな値を取るデータ ( の可能性がある相関係数と順位相関係数を求めて比較する明らかに外れ値とわかる場合にはその値を除外する

相関分析とは ' パラメトリックな手法 ( 相関分析をするときの注意曲線的な相関が存在しないか? 散布図を出し点の並びが直線的な関係を示さない場合順位相関係数の適用を考える回帰分析であれば曲線回帰分析を適用するおまけ時系列データには使用できない同じ被験者で時系列的にとったデータをまとめ時間がたつごとに増える減るという関係を出すのはよくない ' 相関係数は出るが個人内の変化を見ているわけではない ( こういう場合回帰分析や分散分析を用いる

相関分析とは ' パラメトリックな手法 ( 偏相関係数 'partial correlation coefficient( 見かけ上の相関 ' 疑似相関 squrious correlation( を危惧してひとつの変数の影響を除いた他の二つの変数の相関係数を求める手法 x,y,z の変数があり x,y, の相関係数を rxy,x と z の相関係数を rxz y と z の相関係数を ryz としたとき z を制御変数とした偏相関係数 rxy.z は以下の式になる偏相関係数も -1 r 1 の範囲をとり絶対値が 1 に近いほど関係は強いことを示す

相関分析とは ' パラメトリックな手法 ( SPSS による偏相関係数先ほどと同じデータを使用する分析 'A) 相関 'C) 偏相関 'R( をクリックするダイヤルボックス中の出生体重と胎盤重量を変数 'V) に移動する影響を取り除きたい変数母親の年齢を制御変数 'C) に移動する OK をクリックするついでに出生体重胎盤重量母親の年齢の相関係数を求めてみる ' 手順は先ほどと同じ (

相関分析とは ' パラメトリックな手法 (.585 が偏相関係数である有意確率は.001 未満相関係数制御変数母親の年齢出生体重胎盤重量相関有意確率 ( 両側 ) df 相関有意確率 ( 両側 ) df 出生体重胎盤重量 1.000.585..000 0 1419.585 1.000.000. 1419 0 相関係数の表 : 年齢と出生体重胎盤重量の間の相関が低かったため年齢を制御変数としても結果はあまり変わらなかった相関係数胎盤重量出生体重母親の年齢 Pearson の相関係数有意確率 ( 両側 ) N Pearson の相関係数有意確率 ( 両側 ) N Pearson の相関係数有意確率 ( 両側 ) N **. 相関係数は 1% 水準で有意 ( 両側 ) です胎盤重量出生体重母親の年齢 1.585**.017.000.531 1423 1423 1422.585** 1 -.004.000.871 1423 1423 1422.017 -.004 1.531.871 1422 1422 1422

順位相関係数とは ' ノンパラメトリックな手法 ( データの分布が正規分布以外となるときには順位相関係数を用いる Spearman の順位相関係数 'spearman s rank correlation coefficient( ρ' ロー ( Kendall の順位相関係数 'Kendall s rank correlation coefficient( τ-b' タウ ( ともに -1 から 1 の値を取り 1 だと同順 -1 だと逆順になる計算式 Spearman の順位相関係数 Kendall の順位相関係数

順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数先ほどと同じデータを使う分析 'A) 相関 'C) 2 変量 'B) を選ぶダイヤルボックスで出生体重と在胎週数をクリックするで変数を右のボックスに移す相関係数の Kendall のタウ b'k) Spearman(S) にチェック有意な相関係数に星印をつける 'F) をチェック OK をクリック

順位相関係数とは ' ノンパラメトリックな手法 ( 結果表の見方は相関係数と同じ上段が Kendall のタウ b の結果であり下段が Spearman の ρ の結果 Kendall のタウ b Spearman のロー出生体重在胎週数出生体重在胎週数相関係数相関係数有意確率 ( 両側 ) N 相関係数有意確率 ( 両側 ) N 相関係数有意確率 ( 両側 ) N 相関係数有意確率 ( 両側 ) N **. 相関は 1 % 水準でで有意となります ( 両側 ) 出生体重在胎週数 1.000.275**..000 1423 1423.275** 1.000.000. 1423 1423 1.000.362**..000 1423 1423.362** 1.000.000. 1423 1423

おまけ ' 時間があれば ( 2 変数の関係を回帰分析を用いて調べてみる単回帰分析の詳細は省略 ' 復習 ( 先ほどと同じデータを使用分析 'A( 回帰 'R( 線形 'L) を選択する従属変数 'D) に胎盤重量を入れる独立変数 'I) に出生体重を入れる統計量 'S( をクリックし推定値 'E) 信頼区間 'N) モデルの適合度 'M) をチェックする続行をクリックし OK をクリック

おまけ ' 時間があれば ( 結果分散分析の表の有意確率を確認 'p<.05 でないと回帰式は役に立たない ( 係数の表の有意確率と非標準化係数を見る胎盤重量 =131.783+0.147 出生体重

おまけ ' 時間があれば ( モデル集計の R R 2 を見る '1 に近いほど予測精度が高い ( R 2 =.342 なので予測精度はあまりよくないこの回帰式は分散分析表より p<0.01 で有意であり回帰係数も p<0.01 で有意であったしかし決定係数は R 2 =.342 と小さく予測精度は高くないことがわかった

おまけ ' 時間があれば ( 散布図を見るもしかして曲線の関係で捉えたほうがいい?

おまけ ' 時間があれば ( 曲線回帰分析をやってみる 2 変数の散布図を書き曲線的な関係であると考えられる場合には曲線回帰を行う分析 'A) 回帰 'R) 曲線推定 'C) 出生体重を独立変数の変数 'V) へ胎盤重量を従属変数 'D) へ移動する当てはめたい曲線式にチェックする ' 散布図をみてどの回帰式がふさわしいか考える ( 今回は線形 'L) 二次 'Q) にチェックする OK をクリックする

おまけ ' 時間があれば ( 結果モデル集計とパラメータ測定値の表を見るモデル集計の R2 乗の値が各回帰式の精度である 2 次が R 2 =.353 で線型よりも適合度がいいようだが極端に違わない場合は線形の方が無難? パラメータ測定値の定数が回帰式の値 2 次 :447.475-0.066x+0.00003532x 2

おまけ ' 時間があれば ( 散布図には実際の曲線が描かれている

まとめ相関分析 2 つの変数の比例関係を数値的に表す例体重が重くなるほど身長が高くなる 2 変数間の関係を調べるのには便利な方法擬似相関混合標本などに注意偏相関分析や群ごとに分けて相関分析をするとったデータに偏りがある場合や曲線関係になるときには順位相関分析をする回帰分析一つの変数が他方の変数を予測する例体重 kg の人が平均的にどれくらいの身長となるか説明力 ' 決定係数 ( が出せる曲線回帰分析ができる

参考文献森敏昭吉田寿夫 (1990). 心理学のためのデータ解析テクニカルブック北大路書房対馬栄輝 '2007(. SPSS で学ぶ医療系データ解析東京図書青木繁伸 '2009(. R による統計解析オーム社石村貞夫石村光資郎 '2007(. SPSS でやさしく学ぶ統計解析第 3 版東京図書小田利勝 '2007(. SPSS による統計解析入門プレアデス出版