PowerPoint プレゼンテーション

Similar documents
EBNと疫学

統計的データ解析

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

ビジネス統計 統計基礎とエクセル分析 正誤表

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - sc7.ppt [互換モード]

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

日心TWS

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft Word - Stattext13.doc

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Medical3

スライド 1

情報工学概論

経営統計学

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

スライド 1

基礎統計

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - 資料04 重回帰分析.ppt

モジュール1のまとめ

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

カイ二乗フィット検定、パラメータの誤差

講義「○○○○」

Microsoft Word - å“Ÿåłžå¸°173.docx

青焼 1章[15-52].indd

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft PowerPoint - stat-2014-[9] pptx

Probit , Mixed logit

Microsoft PowerPoint - statistics pptx

Microsoft Word - appendix_b

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - statistics pptx

不偏推定量

Microsoft PowerPoint - ch04j

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - Statistics[B]

Microsoft Word - 補論3.2

経済統計分析1 イントロダクション

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

1.民営化

Microsoft PowerPoint - statistics pptx

Microsoft Word - mstattext03.docx

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Medical3

相関分析・偏相関分析

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

解析センターを知っていただく キャンペーン

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

様々なミクロ計量モデル†

Microsoft Word - 保健医療統計学112817完成版.docx

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

第7章

ベイズ統計入門

Microsoft Word - Stattext07.doc

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

数値計算法

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

横浜市環境科学研究所

Microsoft PowerPoint - A1.ppt [互換モード]

13章 回帰分析

PowerPoint プレゼンテーション

ヘルメスの翼に

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft PowerPoint - 測量学.ppt [互換モード]

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

Microsoft Word - apstattext04.docx

スライド タイトルなし

ANOVA

Excelにおける回帰分析(最小二乗法)の手順と出力

数値計算法

Microsoft PowerPoint - 基礎・経済統計6.ppt

スライド 1

Microsoft PowerPoint - 三次元座標測定 ppt

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft PowerPoint - ICS修士論文発表会資料.ppt

untitled

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順


自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

本冊子の利用にあたって 本冊子は 能力強化研修で扱う内容を理解する上で助けとなるであろう統計学の基礎事 項を選択肢形式の問題として提示したものです 統計学に不安のある受講生は事前の学 習として活用ください 試験ではないので正答数自体は重要ではありません より効果的な学習 復習となるよ う 次のような

Transcription:

1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley.

概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

相関係数とは何か 3/X 二つの変数それぞれの 集団内での相対的位置 を求めたときの, 二つの変数間の直線的関係を表す指標 二変数をそれぞれzスコア化すると, 両変数のzスコアがどれだけ対応するか, と簡単に定義できる 完全な正の相関のとき, 集団内の個人は2つの変数で同じzスコアを取る 完全な相関 = 一方の変数でもう一方を完全に予測

相関係数の数式 4/X 相関係数の式として, 様々な変形式が用いられてきた 手計算を簡単にするための式 式の表すものを捉えやすい式

相関係数の数式 5/X 本文には書かれていないが, 一般的には以下 1/(N-1) は 1/N でも OK どうせ分母と分子で打ち消される http://www.weblio.jp/content/%e3%83%94%e3%82%a2%e3%82 %BD%E3%83%B3%E3%81%AE%E7%A9%8D%E7%8E%87%E7%9 B%B8%E9%96%A2%E4%BF%82%E6%95%B0

相関係数の数式 6/X 共分散を見ることで, どのようなときにrの値が正 ( 負 ) になることに貢献するのかわかる Ai = (Xi - Xの平均 )(Yi - Yの平均 ) 共分散 = 1/N * Σ Ai Ai < 0 Ai > 0 Ai > 0 Ai < 0 X の平均値 平均値を基準に 4 区画 ( 象限 ) に分けたとき, 右上 左下は 正 に, 右下 左上は 負 の相関係数に貢献 Y の平均値

相関係数の検定 7/X

相関係数の検定 8/X 母相関係数 ρ=0とした場合のrの分布はどのようなものか (= 帰無分布 ) をまず考える 統計学的に,ρ=0でサンプルサイズが十分に大きい時, 分布は平均 0, 標準誤差が1/ Nとなることが分かっている サンプルサイズが十分に大きくないときには, 標準誤差は以下の式となる (p170)

相関係数の検定 9/X そして相関係数の有意性は以下の t 値から求め ることができる (p271) ρ0は0なので, 式変形後, 式 9.6が一般的に知られるt 値の式である

相関係数の検定 10/X rの臨界値を求める 自由度 ( とα) の関数 t 値を求めて検定はするものの,t 値はrとNの関数なので, 臨界値をrの値から求めることができる Table A.5

相関係数の検定 11/X 相関係数の自由度は N-2 r = 1 なぜなのか N=2で相関を計算すると何が起きるか 直線は必ず2 点を通れるので,rの絶対値が1(= 一方の変数でもう一方の変数が完全に予測可能 ) に つまり, このときの相関係数は母相関係数について何の情報も与えない 仮に自由度を母相関係数についての情報量だとすると,N-2が自由度というのは直観的に理解可能

相関係数の注意点 1 12/X 相関係数の解釈には注意が必要 線形の関係しか捉えられない 二次関数的関係は捉えられない Fig.9.3, 9.4

相関係数の注意点 2 13/X 限定された母集団 母相関係数 :ρ( ロー ) 母集団全体からランダムサンプリングすれば,rは ρをバイアスなく測定するが, 大抵は, サンプルの範囲が限定されているなどによって, バイアスを受ける 切断効果

相関係数の注意点 2 14/X 切断効果 Fig.9.5 変数の分散が限定されることで, 母集団には存在する相関関係が歪められること 多くの場合は, 相関が小さくなる 母集団の分布が曲線の場合には, 強くなる場合がある

15/X 本来はもっとサンプルに分散があって, 上記のように分布していたかもしれない

相関係数の注意点 3 16/X 外れ値の影響を強く受ける 相関係数は外れ値の影響を強く受ける 特に, 両方の変数が外れ値になる値 (bivariate outliers) の影響が大きい 図 9.6では, 元々強い負の相関だった者が, 若干正の相関になってしまう

相関係数の注意点 4 17/X 相関は因果を意味しない 因果が逆であったりする 運動するから元気なのか, 元気な人が運動しているのか 第三変数 楽天的だから運動もして元気 この場合にも, 運動と元気の間には相関が生じる このことは,2 群の実験でも同じことである 運動群と非運動群を分けても, そこに第三変数である楽天的な傾向の介在は防げていない ( 群分けではなくて, 運動量を 操作 すれば別 )

相関係数の注意点 5 18/X 相関係数のインフレ? 先ほど述べたように,N=2のとき,rが必ず1になるという相関係数のインフレが起こる しかしこれは,N=3, N = 11のときでも, 本来は r=0となるはずの期待値が,rの期待値は (1/(N- 1)) で与えられるので, それぞれ0.707, 0.316となるという形で残る なにぃっ!? っと思ってシミュレーションしてみた

シミュレーション 19/X 相関係数が大体 0 になる分布を生成 N = 10000 r = -0.006538254 これを母集団と見なす ここから n ずつサンプリングして, 相関係数を計算 それを 100 回くり返した平均相関係数をプロット y -4-2 0 2 4-2 0 2 x

平均相関係数frame2 0.0 0.2 0.4 0.6 0.8 1.0 ρ = 0 あれ? ばらつきは大きいけど別にバイアスはないような どうも,r を絶対値にしたときの話らしい (p272) 0 20 40 60 80 100 vec n = サンプルサイズ 20/X

平均相関係数シミュレーション 21/X ここから,nの数ずつサンプリングして, 相関係数を計算 それを100 回くり返した平均相関係数の絶対値をプロットする ρ = 0 frame2 0.0 0.2 0.4 0.6 0.8 1.0 0 20 40 60 80 100 vec n = サンプルサイズ

シミュレーション 22/X つまり, 自分に都合の良い相関係数のときだけ論文中に取り上げて議論してしまった場合には, 上記のバイアスをモロに受ける サンプルサイズが少ないと, 母相関係数とはかなりズレた相関係数が得られる

相関係数の注意点 6 23/X 相関係数の前提 独立無作為サンプリング どちらの変数も正規分布 二変量正規分布 (bivariate normal distribution) ただしサンプルサイズが大きい時には,2 変数の正規分布の仮定はそれほど重要ではなくなる

相関係数の検定力分析 24/X 相関係数の検定についても検定力を求めることができる 基本は独立な二群の平均値差の検定と同じ ただし,t 値とr 値を混同しないこと 前者は効果量とサンプルサイズに依拠し, 後者は効果量そのもの

相関係数の検定力分析 25/X 検定力分析をするためには,t 検定のときのように,δ( 前はtの期待値であった ) が必要である これは, 母相関係数 ρに (N-1) をかけたものである 式 9.7

相関係数の検定力分析 26/X 必要な参加者数を求める場合 ( 式 9.8) Table A.3 を用いる 検定力が 85% 欲しいならば,δ は 3.00 必要で, そのためには N は 74.5 必要だとわかる (p279)

フィッシャーの Z 変換 27/X ρ = 0のとき, 分布はほぼ正規分布に近似することができる しかし例えばρ =.8のとき, 1 以上の値が取れないため, 分布が歪む これを修正するのがフィッシャーのZ 変換 Table A.6を用いる Zに変換すれば,zスコアと同様の扱いができ, 検定や信頼区間を出すのに便利

相関係数の信頼区間 28/X 1. rをzに変換して正規分布するようにする 2. 信頼水準を決める 95% 3. zの95% 信頼水準の臨界値は絶対値 1.96 4. Zの標準誤差をこの式で計算する 5. 臨界値と標準誤差の積に Z を足す ( 引く ) 6. それぞれの値が信頼区間の上限と下限になる

相関係数の信頼区間 29/X さらに, ここで計算された値はあくまでもZ の値なので, これをrに再変換する これにも表 A.6 を使えば良い

相関係数の検定 30/X 特定の相関係数よりも大きいか小さいかの検定は,ρ = 0 以外の帰無分布を考えるので, 本来は分布の歪みを考えなくてはならない しかしフィッシャーのZ 変換を用いたz 検定を行うことで対応することができる 以下の式でzを計算し, 検定にかける

相関係数の検定 31/X 相関係数の差の検定 さきほどの検定を応用できる この式で z を出す 式 9.11 ただしこれは独立の 2 群間の r の差を検定する場合 独立でない場合には,Howell (2007) の方法を用いる