<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

Similar documents
2 散布図を書く意義 1) 視覚的にどんな関係かを考えることができる 2つの変数間の関係をどう表現するか 1 直線的関係 2 2 次関数 3 指数 対数 双曲線など 4 その他今回の授業では直線的関係についてしか学ばないが,2つの変数間の関係を曲線で表す方がよい場合も多い. 2) 異常値などを発見で

<4D F736F F D2090B695A8939D8C768A E F1918A8AD695AA90CD>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

EBNと疫学

スライド 1

統計的データ解析

PowerPoint プレゼンテーション

Microsoft PowerPoint - sc7.ppt [互換モード]

情報工学概論

基礎統計

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - e-stat(OLS).pptx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

ビジネス統計 統計基礎とエクセル分析 正誤表

1.民営化

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - Stattext13.doc

Microsoft Word - appendix_b

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

第7章

相関分析・偏相関分析

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

不偏推定量

Medical3

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx

横浜市環境科学研究所

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - ch04j

Microsoft Word - apstattext04.docx

Microsoft Word - mstattext02.docx

13章 回帰分析

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Medical3

参考1中酪(H23.11)

青焼 1章[15-52].indd

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

講義「○○○○」

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Excelにおける回帰分析(最小二乗法)の手順と出力

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft PowerPoint - stat-2014-[9] pptx

数値計算法

カイ二乗フィット検定、パラメータの誤差

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

経済統計分析1 イントロダクション

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft Word - 補論3.2

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - 基礎・経済統計6.ppt

0415

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

スライド タイトルなし

経営統計学

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - Econometrics pptx

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

スライド 1

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

スライド 1

Microsoft Word - Stattext11.doc

Microsoft PowerPoint - 資料04 重回帰分析.ppt

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

統計学の基礎から学ぶ実験計画法ー1

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

【補足資料】確率・統計の基礎知識

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

データ解析

PowerPoint プレゼンテーション

Microsoft PowerPoint - 医学統計のつぼ.ppt

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - 測量学.ppt [互換モード]

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

13章 回帰分析

Microsoft Word - econome4.docx

モジュール1のまとめ

8 A B B B B B B B B B 175

基礎統計

サーバに関するヘドニック回帰式(再推計結果)

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

1

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

Transcription:

第 回相関分析 9 年 月 日 A.つの変数間の関係を調べる. 散布図を書く例 水稲の収量に関連のある生育指標を知りたい. 例えば草丈と収量には関連があるだろうか? 例 トマトの糖度は施肥量によってどのように変化するかを知りたい. 例えば, 窒素施肥量を増加させると糖度はどうなるか? 散布図の書き方 )x 軸 ( 横軸 ) には原因となる変量を, y 軸 ( 縦軸 ) には結果となる変量をとる. サツマイモの収量 (g/m) 7 月の平均気温 ( ) 窒素施肥量 (g/m) 3 窒素施肥量 (g/m) 月の平均気温 ( ) サツマイモの収量 (g/m) - - - - - - 3 月の平均気温 ( ) 7 月の平均気温 ( ) ) できるだけ点が図全体にばらつくように軸の上下限を決める. 7 月の平均気温 ( ) 3 7 月の平均気温 ( ) - - - - - - - - 月の平均気温 ( ) 月の平均気温 ( )

7 散布図を書く意義 ) 視覚的にどんな関係かを考えることができる 7 9 年 月 日 つの変数間の関係をどう表現するか 直線的関係 次関数 3 指数 対数 双曲線など その他今回の授業では直線的関係についてしか学ばないが,つの変数間の関係を曲線で表す方がよい場合も多い. ) 異常値などを発見できる 異常値を除去すると,つの変数間に相関関係が変わることがある. 7 - - 3) 異なるグループに分けられることがある 7 8 - - - - - - - コンピューターを使えば, 与えられたデータにいかような関係でも簡単に当てはめられること ができる. しかし, その当てはめがいつでも正しいとは限らない. 必ず図に書いてから解析を始 めるように心がけなければならない.

9 年 月 日 B. 相関と回帰. 相関と回帰の違い つの変量 ( x, y ) の関係について, x, y ともに正規分布にしたがってばらつく量であるときには両者の直線的な関係を相関という. 一方, x については指定できる変数 ( 独立変数という ) であり, y が指定された x に対して, あるばらつきを含んで決まる場合, 回帰という. 相関では両変数間の関連の度合いを相関係数で評価することを主な目的とする. 回帰では相関係数で評価することもできるが, 主たる目的は両変数間の数的関係を回帰直線で表し, ある x が指定されたときに y がいくつになるかを求めることである.. 相関と回帰の例兄弟の身長について考える. 兄の身長と弟の身長それぞればらつきのある変数であり, 兄の身長を指定しても, そのことで弟の身長が決まるとは考えられない. したがって, 兄弟の身長は相関である. しかし, 父と子の身長を考えると, 遺伝的な要因から父の身長は子の身長に影響を及ぼしているであろう. 父の身長を指定するとあるばらつきを持って, 子の身長が決まると考えられる. 父と子の身長は回帰分析できる. 父と子の身長はともに正規分布するので相関分析もできる. 次に食事で得た蛋白質の量と身長の関係を考えよう. 蛋白質の量を決めればあるばらつきを持って身長が決まるから, 回帰分析できる. この場合は蛋白質の量は指定でき, 正規分布しないので, 相関分析は不適当である. 次の例は相関か回帰か? 最高気温と最低気温身長と体重飼料中の脂肪含量と牛の乳脂肪率テレビを見る時間と血圧テレビを見る時間とエンゲル係数塩分摂取量と血圧 3. 相関と回帰のモデル相関は 変量がそれぞれ正規分布する右上の図のようなデータをモデルとしている. それに対して回帰では右の図のように x は指定できる変量なので, 誤差は持たない. 一方, y は指定された x について正規分布し, ある一定の誤差を持つ.y の誤差は x の値によって変化しない. 3

9 年 月 日 C. 相関. 相関係数 つの変数間の直線的な関係 ( 相関関係 ) は相関係数 によって定量的に示すことができる. 相関係数には以下の性質がある である. が に近いほど正の相関が強く,- に近いほど負の相関が強い. 3 が に近いときは, 両変数間には相関がない ( 無相関 ). =. 8 =.9 3 - - -3 - - 3 - - - -3 - - 3 - = - - -3 - - 3 - - -3 - - - - -8 8 =. - - -8 8 =.9 - - -3 - - 3 - - - - -3 - - 3 - 相関係数 S n xy = ここで積和 S xy = S xxs yy i= - - -8 - ( xi x)( yi y),x の平方和 S xx = ( xi x), n i= y の平方和 S yy = n i= ( y i y) 相関係数は 変数の間に直線的な関係があるかだけを評価する. したがって, 次曲線のような関係があっても相関係数 はほとんど かもしれない.

相関係数の計算方法 ( 右のデータについて ) 関数を使う方法 9 年 月 日 分析ツールを使う方法 練習 : 右のデータ ( 授業用データ ) について相関係数を計算せよ.

. 相関係数に関する推定と検定 推定相関係数 は集めてきたデータ ( 標本 ) から求めたものであるから, 統計量である. 母集団の相関係数である母相関係 数 ρ を から区間推定することができる. その前に母相関係数 ρ が与えられたときに, 標本の相関 9 年 月 日 係数 はどのように分布するかをみてみよう. 図相関係数の分布右上の図のように母相関係数 ρ が であるときには, その母集団から無作為に抽出した標本の 相関係数は左右対称に分布する. しかし, 母相関係数が ± に近づくと著しくゆがんだ分布をする. 標本の相関係数 の分布は ρ = のとき n t = は自由度 n のt 分布に従う. + + ρ ρ のとき Z = ln は近似的に正規分布 N( ln, ) に従う. ρ n 3 この関係を利用して, 標本の相関係数 が得られたときに母相関係数を区間推定できる. ここで ln は自然対数 ( 底を e とする対数 ) である. e は自然対数の底であり, e.788... エクセルの関数を利用して計算する以下の方法では自然対数についての知識は必要ない. 母相関係数 ρの推定の手順 () 点推定 : ρˆ = () 区間推定 : 信頼率 p% のρの信頼区間はエクセルでは以下のように計算できる. FISHERINV (( FISHER( ) NORMSINV (( + p) / ) / SQRT ( n 3))) ρ FISHERINV (( FISHER ( ) NORMSINV (( p) / ) / SQRT ( n 3))) 例 : 相関係数 =.99( 標本数 n=) すなわち 9% 信頼区間をつけた母相関係数の推定値は. ρ. 99 となる.

9 年 月 日 練習 個のデータセットから標本相関係数 =.7 を得た. 母相関係数を 9% の信頼区間をつけて, 区間推定せよ. 検定母相関係数 ρに関する検定は, たいていの場合, 帰無仮説 H :ρ=, 対立仮説 H :ρ とする無相関の検定である (つの変数間に相関がないという帰無仮説を検定する). 帰無仮説 : 両変数間には相関がない. 母相関係数 ρ= 対立仮説 : 両変数間には相関がある. 母相関係数 ρ 帰無仮説が棄却されたときは両変数間には相関があると結論できる. 帰無仮説が棄却できなかったときは両変数間には相関があるとはいえないと結論できる. 母集団の母相関係数 ρ= のときでも, そこから無作為に取り出した標本の相関係数が. 程度のかなり大きな値となることもよくある. 標本の相関係数 の分布は ρ = のとき n t = は自由度 n のt 分布に従う. このことを利用して,t 検定する. エクセルでは ABS( ) n ABS( ) SQRT ( n ) p- 値 = TDIST (, n,) = TDIST (, n,) SQRT ( ^) 例 : 相関係数 =.99( 標本数 n=) を得た. 相関の有無を検定せよ. 帰無仮説 : 両変数間には相関がない. 母相関係数 ρ=. 母集団に相関がない. 対立仮説 : 両変数間には相関がある. 母相関係数 ρ. 母集団に相関がある. p- 値は.87 となるので,% の有意水準で帰無仮説を棄却でき, 相関があると認められる. 7

練習 : 以下の相関係数について, 相関の有無を検定せよ. =. 7, n = 9 年 月 日 =. 3, n = 相関係数 の検定の結果, 相関が有意であることがわかったら, 相関自体の強さは相関係数の絶対値で判断する. おおむね次のように考える. -.~-. 高い負の相関 -.99~-. 中位の負の相関 -.399~-. 低い負の相関 -.99~+.99 無相関 +.~+.399 低い正の相関 +.~+.99 中位の正の相関 +.~+. 高い正の相関 したがって, 相関係数が % あるいはそれより小さい有意水準で有意であったとしても, 相関係数自体の値が に近ければ,つの変数間の相関はあまり大きいとはいえない. 標本数が多くなると, 相関係数がかなり に近くても有意にはなるので, この点に注意すること. 論文などで相関係数に * や ** が付いていることをよく見るが, 母相関係数が でないことを検定しており, ふつう * は % の有意水準で相関があるとき,** は % の有意水準で相関があることを示している. 3. みかけの ( 偽の ) 相関関係相関係数が高いからといって, 両者の間に因果関係などが必ずあるとは限らない. 例えば, 年齢を問わずに調査したら, 血圧と垂直飛びに負の相関関係があるかもしれない. しかし, 加齢とともに血圧は上がり, 運動能力は落ちるから, この関係は見かけのものでしかない. あるいはテレビの普及率と米の消費量を 9 年代について調べたら, 負の相関があるだろう. 一般に時間の絡むデータでは見かけの相関関係の出てくることがよくある. 8

時系列データ 9 年から 97 年におけるテレビの販売数と自動車事故の数 9 年から 97 年におけるタバコの消費本数と平均寿命 9 年 月 日 以上のことを調べるとどういう結果が得られるか? その結果から, どういう誤った結論が引き出せるか? 年齢などに関わるデータ血圧と原宿あるいは巣鴨で遊ぶ時間 3 その他小学 ~ 年生までの身長と体重の相関関係は同年代だけの相関係数よりもかなり大きくなる.. 相関分析の手順 つの変量間の相関係数 を計算する ρ= という帰無仮説を検定し, 相関関係が有意であるかを調べる 3 有意であれば, 相関の強さを相関係数の大きさから評価する. 相関があっても, それはつの変量間に必ずしも何らかの関係があることを証明するわけではない. 注意点 :つの変量間に実際にどんな結びつきがあるのかを相関分析の後, 考える. D. 宿題. 自分の調べたつの変量の間の関係について, 両方のデータともに以下の~3までを行え. 散布図を書く上での注意にしたがって, 散布図を書き直せ. 9% 信頼区間をつけて母相関係数を区間推定せよ. 3 相関の有無 ( 帰無仮説 ρ=) を検定せよ.. 自分の調べた相関についてのデータに相関があるときはどういう関係があるのかを考えよ. すなわちみかけの相関ではないのか, 直接的な因果関係があるのか, あるいは何か別の要因が間に入っていないか? 相関がないときは ( 始めに相関があると予想したにもかかわらず ) なぜ相関がなかったのかを考えよ. 9