(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Similar documents
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

EBNと疫学

Medical3

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft Word - Stattext12.doc

情報工学概論

基礎統計

青焼 1章[15-52].indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - A1.ppt [互換モード]

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Medical3

統計的データ解析

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft Word - Stattext13.doc

PowerPoint プレゼンテーション

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

経済統計分析1 イントロダクション

仮説検定の手順

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

Microsoft Word - 保健医療統計学112817完成版.docx

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - Statistics[B]

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

PowerPoint プレゼンテーション

Microsoft PowerPoint - statistics pptx

第7章

Microsoft Word - Stattext11.doc

現代日本論演習/比較現代日本論研究演習I「統計分析の基礎」

現代日本論演習/比較現代日本論研究演習I「統計分析の基礎」

ANOVA

スライド 1

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Microsoft Word - apstattext05.docx

不偏推定量

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

Microsoft Word - appendix_b

Microsoft PowerPoint - stat-2014-[9] pptx

スライド 1

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - statistics pptx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

MT2-Slides-13.pptx

講義「○○○○」

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - Econometrics pptx

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

k3 ( :07 ) 2 (A) k = 1 (B) k = 7 y x x 1 (k2)?? x y (A) GLM (k

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

データ科学2.pptx

Microsoft Word - Power_Analysis_Jp_ docx

Microsoft PowerPoint - statistics pptx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

EBNと疫学

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

解析センターを知っていただく キャンペーン

Microsoft Word - å“Ÿåłžå¸°173.docx

様々なミクロ計量モデル†

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

モジュール1のまとめ

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word - mstattext01.docx

MedicalStatisticsForAll.indd

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

1

日心TWS

数値計算法

Microsoft Word - reg2.doc

Microsoft PowerPoint - 基礎・経済統計6.ppt

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Excelにおける回帰分析(最小二乗法)の手順と出力

Microsoft Word - 計量研修テキスト_第5版).doc

_KyoukaNaiyou_No.4

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F F696E74202D208EC0926E89758A7782CC82BD82DF82CC939D8C765F939693FA2E >

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft Word - mstattext03.docx

MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです ゲージ R&R 分析 ( 交差 ) 概要 測定システ

講義のーと : データ解析のための統計モデリング. 第5回

カイ二乗フィット検定、パラメータの誤差

Transcription:

第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない 名義尺度 順序尺度に使用可能 表 1. 2 群 あるいは 3 群以上の標本の差を検定する方法 三浦他, (2004) 英語教師のための教育データ分析入門 p.61, 大修館書店より引用 3-1-1 統計的検定の手順 (1) 仮説の設定例. 対立仮説 (alternative hypothesis, H 1 ) 異なった教授法で指導を受けたグループ A とグループ B の英語力に差がある 帰無仮説 (null hypothesis, H 0 ) グループ A とグループ B の英語力に差がない 平均の差がない (A-B=0) であることを仮定している (2) 有意水準の決定帰無仮説を棄却して対立仮説を採択するかどうかを判断する基準の設定を行う この基準が有意水準 (significance level: α) = 危険率 (critical value) であり 通常 5%(α=.05) に設定される 100 回のサンプリング中 5 回おこることの確率のこと ( 場合によっては 1% 有意水準を設定する場合もある )

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説を採択する 有意確率が 5% より高くなった場合には 2 群の平均差は偶然に起こる確率の範囲内の差であるとし 帰無仮説を採択し 有意差がなかった と報告する 偶然起きたものではない= 比較する過程で与えられた刺激が何らかの影響を与えたと考える 3-1-2 統計的検定における過誤と問題点 (1) 統計的検定における過誤 有意水準を 5% に設定するということは 本当は差がないのに誤って差があると判断してしまう (= 第一種の過誤 : Type I error) 可能性を 5% 含んでいることを意味する Type I error は有意水準を低く設定 (1% 有意水準など ) で回避できるが その場合第二種の過誤 (= Type II error: β) が起きることがある Type II error= 本当は有意差があるのに 有意さがないと判断してしまうこと 有意確率が p=.06 である場合 帰無仮説を採択するが サンプルサイズが原因となった可能性がある ( こういった.05<p<.10 の範囲の場合 有意傾向とみなす場合がある ) 本当に有意差があり 有意だと判断する のであれば問題ないが その判断を行う場合には検定力 (power: 1-β) を検出する サンプルサイズが小さい場合は 検定力が低く 有意になりにくいため 検定力分析 (power analysis) によって十分な検定力を確保するのに必要なサンプルサイズを求めておくことお必要である 検定力分析は R などで可能 > power.t.test(n=xx, delta=xx, sd=2.5) で計算できるが 対応するサンプルの数等によって 検定力があるかどうか 基準値が変わってくる 検定力分析のツールとして iphone/ ipad アプリとして Power Analysis がある (2) 有意性検定の問題点統計的検定は確率的に有意かどうかを判断するため 有意性検定 (significance testing) を行う 必ずしも有意確率だけに結果の解釈を頼るのはよくない 1 標本が母集団を代表するように無作為抽出ができているかというと ほとんどの場合 純粋な意味の

無作為抽出は行われていない サンプリングによって結果が変わってくるという誤差を含む 2 有意性検定の結果はサンプルサイズに大きく左右され サンプルサイズが小さいと検定力右側で第二種の過誤を犯す可能性が高くなる 逆に サンプルサイズがかなりに大きいと 少しの差でも有意になってしまう サンプルサイズに左右されにくい 効果の大きさを表す統計量である効果量 (effect size: 3-5 参照 ) も併せて求めることが推奨される 3-1-3 標本分布母集団の分布は正規分布を仮定している 正規分布する性質から導きだされた標本分布 (sampling distribution) と呼ばれる確率分布がある 母集団から理論的に無限回ランダム サンプリングをした場合に求めた統計量が どのような確率でどのような値をとるのか 1 回にサンプリングするサンプルサイズ ( 正確には自由度, df) 別に分布したものである χ 2 値 :χ 2 分布 (chi-square distribution) F 値 :F 分布 ( F distribution) t 値 :t 分布 (t distribution) などがある

サンプルサイズが大きくなるほど標準誤差が小さくなり 母集団の真の値 ( 母数 ) に集中した分布にな る χ 2 分布は標準正規分布から抽出した標本の 2 乗値の分布で ノンパラ 因子分析 構造方程式モデリングにおけるモデルの適合度の検定などで利用される 自由度 1のとき χ 2 分布の形状は F 分布に類似し ほかの標本分布同様 自由度が高くなるにつれて 徐々に正規分布の形状に近づく F 分布は 分散分析などの分散比の検定に用いられる分布で 2 つの異なる正規分布からの標本の 2 乗値の分布をχ 2 2 α とχ β 分布とすると その比 χ 2 α /χ 2 β に従う そのため この分布は自由度を 2 つ持つことになる 3-1-4 両側検定と片側検定有意であるかどうかを決定する棄却域 ( 有意水準 ) は 分布の上側と下側の両方に設定して行う両側検定 (two-tailed test) が一般的である 5% 有意水準で棄却域を設定すると 両側 2.5% ずつ設定されることになる 有意差が片側一方にしか起こらないと予測がつく場合に 分布の片側だけに基準を設定する片側検定 (one-tailed test) がある これは 5% 有意水準をそのまま片側に設定する 方向性が明らかな場合以外は 通常両側検定を行う 3-2 t 検定とは t 分布に照らし合わせて 2 群の平均の差を検証する場合に用いるパラメトリック検定 例. 中学生と高校生のテレビを見る時間の長さに違いがあるのか男子生徒のほうが女子生徒より理系科目が強いのかなど 2 群間を比較する際に使用 平均値の大小だけを比較するのではなく それぞれの群の得点分散を考慮する必要がある 3-2-1 t 検定の実験計画と前提 (1) t 検定では 対応あり (repeated-measures) と対応なし (independent-measures) の 2 種類の実験計画を立てることができる 対応ありの検定では 同じ被験者に異なる 2 つの条件を与え その条件間の差を検討する

対応なしの検定では 異なる性質をもった被験者に同じ条件を与えて グループ間を比較する場合と 同じ性質をもった 2 群に異なる条件を振り分ける方法の 2 種類がある 後者のデザインでは それぞれの群を統制群 (control group) と実験群 (experimental group) と呼ぶ 実験群と統制群や男女など 被験者を分ける条件や変数を独立変数 (independent variable) と呼ぶ ま た 得点や時間など 独立変数の条件をもとに集めたデータを扱った変数を従属変数 (dependent variable) と呼ぶ (2)t 検定を使用する際には 以下の前提のもとで分析が行われる 1データの種類 : 連続性のある間隔尺度 または比率尺度の量的データであること 2ランダム サンプリング : サンプル母集団からランダム サンプリングされ 母集団を十分代表していること 3 正規性 : 標本平均の分布が正規分布に従うこと * 正規分布から少々外れている場合でも t 検定は正規性に対して頑健 (robust) で結果が影響を受けにくいため そのまま t 検定を利用する 対応なしt 検定で加わる前提 4 等分散性 (homogeneity of variance) 比較する 2 群のデータ分散が等しいこと SPSS で t 検定を行う場合 2 つの母集団が等しいことを帰無仮説としたルビーン (Levene) の検定が行われ この検定で有意でなければ前提を満たしているといえる 有意だった場合 等分散性を仮定しない と表示されるウェルチの方法による結果を参照する そのほかにコクラン コックスの方法もある 5 観測値の独立性 : 異なった被験者からのデータが独立していること データがお互いに影響しあい相関が高い場合 第 1 種の過誤が起きやすくなる 3-2-2 t 検定の設定と t 値の算出 t 検定では t = 観測された標本分散の差 ( x 1 x 2) 標本平均の差の標準誤差 という式が使用され これは何らかのある効果あるいは原因に よる標本平均の差がその標準誤差のいくつ分ゼロから離れているかを計算することにより 偶然おこる誤差よりどの程度大きいか調べる t 値は A の標本数 +B の標本数 -2 で求めた自由度の t 分布に従うので そこから t 値の偶然に起こる 確率を求める (1) 対応なし t 検定 (2 群のサンプルサイズが同じ場合 ) 条件によって被験者が異なる対応なし t 検定の場合 2 群は 集団として受けた条件による違いに加えて 個人の性質の違いも誤差として含める

t = x 1 x 2 S 1 2 + S 2 2 n 1 n 2 (2) 対応なし t 検定 (2 群のサンプルサイズが異なる場合 ) 異なる人数の 2 群間を比較する場合には 各群のサンプルサイズの違い = を考慮するために サンプルサ イズから 1 を引いた自由度をそれぞれの分散にかけることで サンプルサイズの大きいほうの値がより 大きくなるように重みづけした式を求め 別式に代入し t 値を求める 1 S p 2 = (n 1 1)s 1 2 + (n 1 1)s 2 2 n 1 + n 1 2 2 t = x 1 x 2 S p 2 + S 2 p n 1 n 2 (3) 対応あり t 検定の場合 同じ被験者に 2 条件が割り当てられるので 分子には 1 つの集団の 2 条件の差を置き 分母の差の標準 誤差は 1 集団内の 2 条件の分散から求める t = x 1 x 2 S D n (df = n 1) 補足検定力分析をフリーで行うことのできる HP Russ Lenth s and sample-size page (http://www.math.uiowa.edu/~rlenth/power/) (t 検定だけでなく ANOVA などの検定力分析も可能 ) Power Analysis for ANOVA Designs (http://www.math.yorku.ca/scs/online/power/) ( ただし多元配置分散分析用に設計されているため 処理には注意が必要 )