Microsoft PowerPoint - A1.ppt [互換モード]

Similar documents
. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

基礎統計

PowerPoint プレゼンテーション

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

EBNと疫学

情報工学概論

Microsoft Word - Stattext12.doc

Medical3

Microsoft Word - 保健医療統計学112817完成版.docx

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext11.doc

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

統計的データ解析

Microsoft PowerPoint - e-stat(OLS).pptx

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

第7章

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Medical3

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

統計学の基礎から学ぶ実験計画法ー1

Microsoft Word - appendix_b

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

青焼 1章[15-52].indd

EBNと疫学

Microsoft Word - apstattext05.docx

Microsoft PowerPoint - Statistics[B]

講義「○○○○」

0415

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - 医学統計のつぼ.ppt

スライド 1

PowerPoint プレゼンテーション

MedicalStatisticsForAll.indd

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

<4D F736F F F696E74202D BD95CF97CA89F090CD F6489F18B4195AA90CD816A>

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft PowerPoint - statistics pptx

経済統計分析1 イントロダクション

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

Microsoft Word - mstattext01.docx

スライド 1

仮説検定の手順

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft PowerPoint - 資料04 重回帰分析.ppt

JUSE-StatWorks/V5 ユーザーズマニュアル

モジュール1のまとめ

基礎統計

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - stat-2014-[9] pptx

<4D F736F F F696E74202D208EC0926E89758A7782CC82BD82DF82CC939D8C765F939693FA2E >

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード]

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

Microsoft PowerPoint - 基礎・経済統計6.ppt

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Microsoft Word - reg2.doc

stat-base_ppt [互換モード]

数値計算法

MT2-Slides-13.pptx

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

stat-base [互換モード]

Microsoft PowerPoint - Quality11.ppt

Microsoft PowerPoint - statistics pptx

際 正規分布に従わない観測値に対して通常の t 検定を適用した場合 どのような不都合が生じるかを考える 一般に通常の t 検定や Wilcoxon 検定などの仮説検定を行う場合 2つの処理の間に差がないことが真実であるにもかかわらず差があると主張する過誤確率 ( 第 1 種の過誤確率 ) 2つの処理

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

第1回

8 A B B B B B B B B B 175

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

[12]SPSS_01.indd

構造方程式モデリング Structural Equation Modeling (SEM)

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

相関分析・偏相関分析

数値計算法

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313591E63189F18AEE967B939D8C7697CA2E >

不偏推定量

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

コーチング心理学におけるメソッド開発の試み 東北大学大学院 徳吉陽河

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft Word - SPSS2007s5.doc

Transcription:

011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html) R による統計処理 (http://aok.s.guma-u.ac.jp/r/) ANOVA 君 基本統計量 ( 要約統計量 ) 5 基本統計量 ( 要約統計量 ) 6 分布の中心をあらわす 平均 中央値 最頻値 分布のちらばりをあらわす レンジ 四分位数 パーセンタイル 標本分散 不偏分散 標準偏差 (SD) 分布の形をあらわす 歪度 尖度 1

011/4/13 7 母集団と標本 8 確率変数確率分布期待値 (E): 確率変数の分布の平均例 )1 回 40 円で サイコロの目の10 倍のお金がもらえる 得? 6 1 E (10 ) 35 6 1 母集団 N 個 母数 ( パラメタ ) 母平均 μ 母分散 σ 個を無作為抽出 標本 1,, 標本誤差 推定する 標本平均 不偏分散 u, v, ˆ 標本統計量 標本平均 標本分散 s 不偏 : 標本統計量によって推定した値 ( 推定値 ) が母数に一致 標本分布 9 標本分布 10 標本 1,, X 1 母集団に関係なく X の標本分布の平均 X 母集団 母数 ( パラメタ ) 母平均 μ 母分散 σ 標本 1,, 標本 1,, X 標本統計量の分布 標本分布 Xの標本分布の標準偏差 標準誤差 SE 平均値の推定精度 X : サンプルサイズ ( 標本の大きさ ) X 3 母数の推定にはサンプルサイズを大きくする SD SE 11 帰無仮説 (H 0 ) 仮説検定 a = b 1SD 1SE 対立仮説 (H 1 ) 有意水準 (α) a = b a> b 5% 1% Mea±SD 生データのちらばり Mea±SE =10 平均値の推定精度 標準化 検定統計量 臨界値 棄却域に入る H 0 を棄却する X% 水準で有意 ( 例 )p<.05 入らない H 0 を棄却しない 有意差なし.s.

011/4/13 大数の法則 標準正規分布 N(0,1) N(μ, σ ) 14 dorm () 0.0 0.1 0. 0.3 0.4 標準化 z f ( z) 0.341 0.136 0.0 1 1 ep[ z ] -4-0 4 両側検定と片側検定 16 0.0 0.1 0. 0.3 0.4 両側検定 0.0 0.1 0. 0.3 0.4 片側検定 plot(dorm, -4, 4) vals <- seq(, 4, legth=10) dvals <- dorm(vals) polygo(c(vals,rev(vals)),c(rep(0,10),rev(dvals)), col= gray ) -4-0 4 下側確率 上側確率 -4-0 4 棄却域 検出力 / 検定力 母集団に存在する差や相関を正しく検出できる能力 H 0 が真 18 α H 0 を棄却する H 0 を採択する H 0 が真第一種の誤り α( 危険率 ) 1-α H 1 が真 1-β( 検定力 ) 第二種の誤り β 1-β β 3

011/4/13 必要なサンプル数 19 平均 10 分散 4 の正規分布からの乱数 0 α β SD : 検出したい差 必要なNはSD に比例する 必要なNは に反比例する αを厳しくすると多くのnが必要となる Mea 0 5 10 15 β を小さくすると多くの N が必要となる 0 0 40 60 80 100 Sample Sze 平均 10 分散 4 の正規分布からの乱数 Varace 0 5 10 15 0 0 40 60 80 100 Sample Sze plot (c(0,10),c(0,15), type="", lab="sample Sze", ylab= Mea") for (df seq(3,101,)){ for ( 1:30) { <- rorm(df, mea=10, sd=) pots(df,mea()) } } plot (c(0,10),c(0,15), type="", lab="sample Sze", ylab="varace") for (df seq(3,101,)){ for ( 1:30) { <- rorm(df, mea=10, sd=) pots(df,var()) } } 多重検定の問題 3 4 有意水準 α で k 回の検定をおこなうと 1 (1 ) α=0.05 k k 全体の有意水準 1 0.050 0.097 3 0.143 15 0.537 パラメトリックな手法 ノンパラメトリックな手法 尺度水準 間隔尺度 比例尺度 不問 母集団の分布型の仮定 正規分布等分散性 不問 標本サイズ 小さすぎてはいけない 0~30 程度以上 10 程度以上 対象とする統計量中央値平均値最頻値 分散 散布度 ( 積率 ) 相関係数 連関計数順位相関係数 度数 検定力 高い 低い 4

011/4/13 ノンパラメトリック 5 検定目的 パラメトリック 順序尺度 名義尺度 母比率 二項検定 対応のない比率の χ 検定 差 対応のある比率の差 McNemar 検定 ( ) CochraQ 検定 (3 条件以上 ) 適合度 1 標本 Kolmogorov Smrov 検定 χ 検定 独立性 相関係数の検定 順位相関係数の検定 χ 検定連関係数の検定 対応のない 標本の代表値の差対応のある 標本の代表値の差 対応のない 3 標本以上の代表値の差 対応のある 3 標本以上の代表値の差 t 検定 (Welch の方法 ) Wlcoo の順位和検定 (Ma Whtey の U 検定 ) χ 検定 対応のある t 検定 Wlcoo の符号付順位和検定 McNemar 検定 1 要因分散分析 ( 完全無作為化法 ) 1 要因分散分析 ( 乱塊法 ) Kruskal Walls 検定 Fredma 検定 χ 検定 CochraQ 検定 検定目的 多重比較 パラメトリック Bofero 法 Tukey 法 Duet 法 ノンパラメトリック順序尺度 Steel Dwass 法 Steel 法 名義尺度 6. カイ二乗検定 カイ二乗分布 互いに独立な確率変数 X が標準正規分布にしたがうとき 以下で与えられる確率変数 χ は χ 分布にしたがう X 1 ~ ( 1) 分布 観測度数 (O 1 O O ) が期待度数 (E 1 E E ) とどの程度食い違っているか ( O E ) E 1 ~ ( 1) 分布 自由度 (-p) 標本数 p 推定された母数の数 Ch-squared dstrbutos 9 30 0.0 0. 0.4 0.6 0.8 1.0 df= 1 df= df= 3 df= 4 df= 5 df= 6 df= 7 df= 8 df= 9 どれかの E が10 以下の時 分割表の時 イェーツの連続性の修正 ( O E 0.5) E 1 0 4 6 8 5

011/4/13 χ 検定 ( 適合度の検定 ) 31 3 カテゴリの度数が理論値と合っているかどうか chsq.test(c(40, 15, 1, 5), p=c(9, 3, 3, 1)/16) 例 ) メンデルの遺伝法則 表現形質 AA Ab ab ab 理論値 9 3 3 1 観測度数 40 15 1 5 χ 検定 ( 独立性の検定 ) 33 34 質的変数が独立であるかどうか ( 連関があるかどうか ) 例 ) 男女間で差があるか? はい いいえ 男子 3 6 女子 1 19 dat <- matr(c(3,6,1,19),col=, byrow=t) chsq.test(dat,correct=f) chsq.test(dat) 3. 分散分析 (ANOVA) 35 群間に差があり 36 Aalyss of Varace a 1 a パラメトリック検定 帰無仮説 : 各群の平均値はすべて等しい群間の平均値の違いを群内のデータのばらつき具合 (= 分散 ) と比較し 十分に大きいかどうかを判断する 群間に差がない a 1 a 6

011/4/13 群間の平均値の違い 37 ばらつきの指標 : 不偏分散 38 母分散の ( 不偏 ) 推定量 a 1 a 不偏分散 u 偏差平方和 1 自由度 1 1 ( ) 群間の不偏分散と群内の不偏分散の比を F 分布を使って比較 a 1 群のばらつき a 群のばらつき 39 データ = 群平均 ( 群本来の値の推定値 )+ 群内のばらつき 生データ 群平均 群内のばらつき 40 0 a 1 a a 1 a 7 8 7 10 6 10 = a 1 a 7 9 7 9 7 9 7 9 + a 1 a 0-1 0 1 1-1 データ = 全体平均 + 群による違い + 群内のばらつき 生データ 全体平均 群による違い = 群間のばらつき 群内のばらつき 0 a 1 a a 1 a 7 8 7 10 6 10 = a 1 a + a 1 a + a 1 a 0-1 0 1 1-1 群間のばらつき ( 群平均と全体平均の偏差平方和 : 群間平方和 S b ) (-1) + (-1) + (-1) + (-1) +1 + 1 + 1 + 1 = 8 群内のばらつき ( 生データと群平均の偏差平方和 : 群内平方和 S w ) 0 + 0 + 1 +(-1) +(-1) + 1 + (-1) + 1 = 6 41 群間のばらつきの不偏分散 ( 群間平均平方 V b ) 群間平方和 / 自由度 = 8 / 1 = 8 群内のばらつきの不偏分散 ( 群内平均平方 V w ) 群内平方和 / 自由度 = 6 / 6 = 1 4 群間のばらつき ( 群間平方和 ) の自由度 (df b ) 群数 ()- 全体平均の数 (1) = 1 群内のばらつき ( 群内平方和 ) の自由度 (df w ) データ数 (8)- 群数 () = 6 F 比 群間平均平方 F 群内平均平方 F ~ F (df b, df w ) 分布 7

011/4/13 F dstrbutos ( df= 15 ) F dstrbutos ( df= 50 ) F dstrbutos ( df= 50 ) 44 probablty 0.0 0. 0.4 0.6 0.8 1.0 1. df1= 1 df1= df1= 3 df1= 4 df1= 6 df1= 10 probablty 0.0 0. 0.4 0.6 0.8 1.0 1. df1= 1 df1= df1= 3 df1= 4 df1= 6 df1= 10 probablty 0.0 0. 0.4 0.6 0.8 1.0 1. df1= 1 df1= df1= 3 df1= 4 df1= 6 df1= 10 0.0 0.5 1.0 1.5.0.5 3.0 3.5 0.0 0.5 1.0 1.5.0.5 3.0 3.5 0.0 0.5 1.0 1.5.0.5 3.0 3.5 F F F 分散分析表 45 4. 相関係数 46 要因 平方和 自由度 平均平方 F 値 p 群間 S b df b V b =S b /df b F=V b /V w ( )( y y) 群内 S w df w V w =S w /df w 全体 S T df T Source SS df MS F p Factor 8 1 0.03 * Error 6 6 1 Total 14 7 + p <.10, * p <.05, ** p <.01, *** p<.005, **** p<.001 平均を原点として 右上と左下は正右下と左上は負共分散 s y 1 N N 1 ( )( y y) (Pearso の積率 ) 相関係数 r 47 48 完全な正の相関があるような場合 s s s y y 完全な負の相関があるような場合 s s s y 共分散の取りうる範囲 ss y s s y y s y で割ると sy 1 1 s s y s s y. 7 r 1. 強い相関あり. 4 r.7. r.4 弱い相関あり 0 r. 比較的強い相関あり ほとんど相関なし 8

011/4/13 相関係数の留意点 外れ値の影響 切断効果 分割相関 ( 層別相関 ) 曲線相関 疑似相関 49 外れ値の影響 r = -.3 r =.844 50 51 5 切断効果 全体で r =.765 分割相関 ( 送別相関 ) 横軸で 6 以上で切ると r =.39 53 54 曲線相関 疑似相関 9

011/4/13 5. 多変量解析 55 目的変数 量的 説明変数 質的 あり量的 重回帰分析 数量化 Ⅰ 類 質的 判別分析 数量化 Ⅱ 類 なし 主成分分析因子分析多次元尺度構成法 数量化 Ⅲ 類数量化 Ⅳ 類 その他 クラスタ分析共分散構造分析 10