相関分析・偏相関分析

Similar documents
Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

PowerPoint プレゼンテーション

スライド 1

Medical3

統計的データ解析

Microsoft Word - mstattext02.docx

13章 回帰分析

Microsoft Word - Stattext12.doc

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

ANOVA

EBNと疫学

ビジネス統計 統計基礎とエクセル分析 正誤表

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

1.民営化

スライド 1

Microsoft Word - SPSS2007s5.doc

経営統計学

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Medical3

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

横浜市環境科学研究所

モジュール1のまとめ

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Chapter 1 Epidemiological Terminology

Microsoft Word - 保健医療統計学112817完成版.docx

基礎統計

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

因子分析

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft Word - å“Ÿåłžå¸°173.docx

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

日本言語科学会(JSLS)チュートリアル講演会 平成13年12月16日(日)午前10時30分から午後4時30分 慶應義塾大学三田キャンパス東館6階G-SEC Lab   言語研究のための統計解析 「論理」学としての思考法,「美」学としての提示法

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

不偏推定量

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

カイ二乗フィット検定、パラメータの誤差

目次 はじめに P.02 マクロの種類 ---

Microsoft Word - lec_student-chp3_1-representative

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

第1回

スライド 1

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

Microsoft Word - StataNews doc

PowerPoint プレゼンテーション

EBNと疫学

Microsoft PowerPoint - stat-2014-[9] pptx

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

相関係数と偏差ベクトル

Microsoft PowerPoint ppt

講義「○○○○」

Microsoft PowerPoint - データ解析演習 0520 廣橋

Microsoft PowerPoint - 測量学.ppt [互換モード]

画像類似度測定の初歩的な手法の検証

Microsoft PowerPoint - GLMMexample_ver pptx

8 A B B B B B B B B B 175

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft Word - apstattext04.docx

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

スライド 1

ベイズ統計入門

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

MedicalStatisticsForAll.indd

Microsoft Word - 補論3.2

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - Econometrics pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Transcription:

相関分析 偏相関分析 教育学研究科修士課程 1 回生 田中友香理

MENU 相関とは 相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数 偏相関係数 SPSSによる偏相関係数 順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す 曲線回帰分析を行う

相関とは 2 変数間の直線関係の強さを見ることを相関という Ex. 教師が経験を積むにつれ 教育熱心になる テレビを見る時間が長いほど 宿題をする時間が短くなる 変数 'x( の値が大きいほど他方の変数 'y( の値も大きい傾向にある時 正の相関関係がある 変数 'x( の値が大きいほど他方の変数 'y( の値が小さい傾向にある時 負の相関関係がある

相関分析とは ' パラメトリックな手法 ( Pearson の相関係数について 一般に パラメトリックな手法では Pearson の積率相関係数 (Pearson s product-moment correlation coefficient: r) を用いる 計算式 'x.y の共分散を x と y の各分散幾何平均値で割った値 (

相関分析とは ' パラメトリックな手法 ( 相関係数の値の範囲 相関係数の値の範囲は -1 r 1 であり 相関係数の大きさの評価について 以下が基準となる.0 r.2 ほとんど相関なし.2 < r.4 弱い相関あり.4 < r.7 比較的強い相関あり.7 < r 1.0 強い相関あり

相関分析とは ' パラメトリックな手法 ( 相関分析のポイント 複数の変数間の関係を探る最初の手段として有効 相関関係と因果関係は異なる 相関係数が強くても 本質的な因果関係が成立しているとは限らない Cf. 回帰分析 ' 一方の変数から他方の変数を予測する ( 結果だけではなく 散布図も必ず確認する 直線以外の関係性が見えることもある

相関分析とは ' パラメトリックな手法 ( SPSS で相関分析 excel データをダウンロードして 保存する SPSS を立ち上げ ファイルから excel データを読み込む 分析 'A) 相関 'C) 2 変量 'B) を選ぶ ダイヤルボックスで 対象とする変数を選ぶ ここでは 出生体重 と 在胎週数 を選び をクリックして右のボックスへ移す 相関係数 の Pearson(N) にチェックする 有意な相関係数に星印をつける 'F) をチェックする OK をクリックする 2 変数間の相関を複数見たいときには 3 つ以上の変数を選ぶと 一気にそれぞれの相関を出してくれる

相関分析とは ' パラメトリックな手法 ( 結果.585 が胎盤重量と出生体重の相関係数である 出生体重と胎盤重量は 1% 未満で有意な正の相関があった 同じ変数同士の相関は 1 と表記され 対角線として右上と左下部分に同じ値が出力されるので いずれか一方を見ればよい 検定の結果 p<0.01 で有意となり 相関係数 r=0.585 で比較的強い相関があった 出生体重 胎盤重量 相関係数 Pearson の相関係数有意確率 ( 両側 ) N Pearson の相関係数有意確率 ( 両側 ) N **. 相関係数は 1% 水準で有意 ( 両側 ) です 出生体重胎盤重量 1.585**.000 1423 1423.585** 1.000 1423 1423

相関分析とは ' パラメトリックな手法 ( 散布図を描いてみる グラフ'G) レガシーダイアログ'L( を選ぶ サブメニューから 散布図 / ドット 'S) を選択する 単純 をクリックし 定義 をクリックする X 軸に 出生体重 Y 軸に 胎盤重量 をドラック & ドロップ OK をクリックする

相関分析とは ' パラメトリックな手法 ( 相関分析をするときの注意 疑似相関の危険性 2 変数間に相関関係が認められた場合には 必ず他の変数の影響をうたがう Ex. 知能指数と身長が高い相関関係にある 年齢の影響が背後に存在する 年齢を制御変数とした偏相関係数を算出する 通常は 3 変数以上の相関係数を求め 相関の強い組合せが多いときに 偏相関係数を求めて疑似相関を発見する作業を行う

相関分析とは ' パラメトリックな手法 ( 相関分析をするときの注意 混合標本に注意する Ex. 全体としてみれば 正の相関だが 学年ごとで区切ってみると 負の相関になる 外れ値の扱い 散布図中に飛び離れた値があると 外れ値 ' 観察上 他とは明らかに大きな 小さな値を取るデータ ( の可能性がある 相関係数と順位相関係数を求めて比較する 明らかに外れ値とわかる場合には その値を除外する

相関分析とは ' パラメトリックな手法 ( 相関分析をするときの注意 曲線的な相関が存在しないか? 散布図を出し 点の並びが直線的な関係を示さない場合 順位相関係数の適用を考える 回帰分析であれば 曲線回帰分析を適用する おまけ 時系列データには使用できない 同じ被験者で時系列的にとったデータをまとめ 時間がたつごとに増える 減るという関係を出すのはよくない ' 相関係数は出るが 個人内の変化を見ているわけではない ( こういう場合 回帰分析や 分散分析を用いる

相関分析とは ' パラメトリックな手法 ( 偏相関係数 'partial correlation coefficient( 見かけ上の相関 ' 疑似相関 squrious correlation( を危惧してひとつの変数の影響を除いた他の二つの変数の相関係数を求める手法 x,y,z の変数があり x,y, の相関係数を rxy,x と z の相関係数を rxz y と z の相関係数を ryz としたとき z を制御変数とした偏相関係数 rxy.z は以下の式になる 偏相関係数も -1 r 1 の範囲をとり 絶対値が 1 に近いほど関係は強いことを示す

相関分析とは ' パラメトリックな手法 ( SPSS による偏相関係数 先ほどと同じデータを使用する 分析 'A) 相関 'C) 偏相関 'R( をクリックする ダイヤルボックス中の 出生体重 と 胎盤重量 を 変数 'V) に移動する 影響を取り除きたい変数 母親の年齢 を 制御変数 'C) に移動する OK をクリックする ついでに 出生体重 胎盤重量 母親の年齢の相関係数を求めてみる ' 手順は先ほどと同じ (

相関分析とは ' パラメトリックな手法 (.585 が偏相関係数である 有意確率は.001 未満 相関係数 制御変数母親の年齢 出生体重 胎盤重量 相関有意確率 ( 両側 ) df 相関有意確率 ( 両側 ) df 出生体重 胎盤重量 1.000.585..000 0 1419.585 1.000.000. 1419 0 相関係数の表 : 年齢と出生体重 胎盤重量の間の相関が低かったため 年齢を制御変数としても結果はあまり変わらなかった 相関係数 胎盤重量 出生体重 母親の年齢 Pearson の相関係数有意確率 ( 両側 ) N Pearson の相関係数有意確率 ( 両側 ) N Pearson の相関係数有意確率 ( 両側 ) N **. 相関係数は 1% 水準で有意 ( 両側 ) です 胎盤重量 出生体重 母親の年齢 1.585**.017.000.531 1423 1423 1422.585** 1 -.004.000.871 1423 1423 1422.017 -.004 1.531.871 1422 1422 1422

順位相関係数とは ' ノンパラメトリックな手法 ( データの分布が 正規分布以外となるときには 順位相関係数を用いる Spearman の順位相関係数 'spearman s rank correlation coefficient( ρ' ロー ( Kendall の順位相関係数 'Kendall s rank correlation coefficient( τ-b' タウ ( ともに -1 から 1 の値を取り 1 だと同順 -1 だと逆順になる 計算式 Spearman の順位相関係数 Kendall の順位相関係数

順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 先ほどと同じデータを使う 分析 'A) 相関 'C) 2 変量 'B) を選ぶ ダイヤルボックスで 出生体重と 在胎週数をクリックする で変数を右のボックスに移す 相関係数 の Kendall のタウ b'k) Spearman(S) にチェック 有意な相関係数に星印をつける 'F) をチェック OK をクリック

順位相関係数とは ' ノンパラメトリックな手法 ( 結果 表の見方は 相関係数と同じ 上段が Kendall のタウ b の結果であり 下段が Spearman の ρ の結果 Kendall のタウ b Spearman のロー 出生体重 在胎週数 出生体重 在胎週数 相関係数 相関係数有意確率 ( 両側 ) N 相関係数有意確率 ( 両側 ) N 相関係数有意確率 ( 両側 ) N 相関係数有意確率 ( 両側 ) N **. 相関は 1 % 水準でで有意となります ( 両側 ) 出生体重 在胎週数 1.000.275**..000 1423 1423.275** 1.000.000. 1423 1423 1.000.362**..000 1423 1423.362** 1.000.000. 1423 1423

おまけ ' 時間があれば ( 2 変数の関係を 回帰分析を用いて調べてみる 単回帰分析の詳細は省略 ' 復習 ( 先ほどと同じデータを使用 分析 'A( 回帰 'R( 線形 'L) を選択する 従属変数 'D) に 胎盤重量 を入れる 独立変数 'I) に 出生体重 を入れる 統計量 'S( をクリックし 推定値 'E) 信頼区間 'N) モデルの適合度 'M) をチェックする 続行 をクリックし OK をクリック

おまけ ' 時間があれば ( 結果 分散分析の表の有意確率を確認 'p<.05 でないと回帰式は役に立たない ( 係数の表の有意確率と非標準化係数を見る 胎盤重量 =131.783+0.147 出生体重

おまけ ' 時間があれば ( モデル集計の R R 2 を見る '1 に近いほど予測精度が高い ( R 2 =.342 なので 予測精度はあまりよくない この回帰式は分散分析表より p<0.01 で有意であり 回帰係数も p<0.01 で有意であった しかし 決定係数は R 2 =.342 と小さく 予測精度は高くないことがわかった

おまけ ' 時間があれば ( 散布図を見る もしかして 曲線の関係で捉えたほうがいい?

おまけ ' 時間があれば ( 曲線回帰分析をやってみる 2 変数の散布図を書き 曲線的な関係であると考えられる場合には 曲線回帰を行う 分析 'A) 回帰 'R) 曲線推定 'C) 出生体重 を 独立変数 の 変数 'V) へ 胎盤重量 を 従属変数 'D) へ移動する 当てはめたい曲線式にチェックする ' 散布図をみて どの回帰式がふさわしいか考える ( 今回は 線形 'L) 二次 'Q) にチェックする OK をクリックする

おまけ ' 時間があれば ( 結果 モデル集計とパラメータ測定値の表を見る モデル集計の R2 乗の値が各回帰式の精度である 2 次が R 2 =.353 で線型よりも適合度がいいようだが 極端に違わない場合は 線形の方が無難? パラメータ測定値の定数が回帰式の値 2 次 :447.475-0.066x+0.00003532x 2

おまけ ' 時間があれば ( 散布図には 実際の曲線が描かれている

まとめ 相関分析 2 つの変数の比例関係を数値的に表す 例 体重が重くなるほど身長が高くなる 2 変数間の関係を調べるのには 便利な方法 擬似相関 混合標本などに注意 偏相関分析や 群ごとに分けて相関分析をする とったデータに偏りがある場合や 曲線関係になるときには 順位相関分析をする 回帰分析 一つの変数が他方の変数を予測する 例 体重 kg の人が平均的にどれくらいの身長となるか 説明力 ' 決定係数 ( が出せる 曲線回帰分析ができる

参考文献 森敏昭 吉田寿夫 (1990). 心理学のためのデータ解析テクニカルブック北大路書房 対馬栄輝 '2007(. SPSS で学ぶ医療系データ解析東京図書 青木繁伸 '2009(. R による統計解析 オーム社 石村貞夫 石村光資郎 '2007(. SPSS でやさしく学ぶ統計解析第 3 版東京図書 小田利勝 '2007(. SPSS による統計解析入門プレアデス出版