第7章

Similar documents
基礎統計

情報工学概論

EBNと疫学

講義「○○○○」

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - stat-2014-[9] pptx

ビジネス統計 統計基礎とエクセル分析 正誤表

統計的データ解析

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

不偏推定量

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Medical3

Probit , Mixed logit

スライド 1

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

Microsoft Word - Stattext13.doc

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft PowerPoint - Statistics[B]

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - ch04j

Medical3

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

経済統計分析1 イントロダクション

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - A1.ppt [互換モード]

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft PowerPoint - 測量学.ppt [互換モード]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

カイ二乗フィット検定、パラメータの誤差

数値計算法

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Microsoft Word - appendix_b

PowerPoint プレゼンテーション

数値計算法

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Microsoft Word - Stattext07.doc

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

スライド 1

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

PowerPoint プレゼンテーション

モジュール1のまとめ

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

青焼 1章[15-52].indd

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 )

Microsoft PowerPoint - Econometrics pptx

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft Word - Stattext11.doc

様々なミクロ計量モデル†

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

ベイズ統計入門

13章 回帰分析

基礎数理 ()Aさんは確定拠出年金の加入者となった 投資商品は収益率がそれぞれ独立な正規分布 N(7, σ ), N(, σ y ) に従う,Y から選択することとした の過去 8 年間の収益率の実績は {8,,,5,,-,6,}(%) Y の過去 6 年間の収益率の実績は {,,,4,,}(%)

Microsoft PowerPoint - 基礎・経済統計6.ppt

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

データ解析

untitled

解析センターを知っていただく キャンペーン

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

_KyoukaNaiyou_No.4

Microsoft Word - mstattext02.docx

Excelにおける回帰分析(最小二乗法)の手順と出力

統計Ⅰ 第1回 序説~確率

日心TWS

経営統計学

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

Microsoft Word - 補論3.2

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

 

Microsoft PowerPoint - 03ModelBased.ppt

Microsoft Word - apstattext04.docx

1.民営化

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft Word - Time Series Basic - Modeling.doc

Transcription:

5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定 (point estimation) という 母数の推定値は次のように定義される 定義 5.1. 標本 X 1, X 2,,X n に対して 統計量 t(x 1, X 2,,X n) で母数 θを推定するとき t(x 1, X 2,,X n) を母数 θの推定量 (estimator) といい その値を推定値 (estimate) と呼ぶ 推定量は抽出する標本毎に偶然に変動する確率変数であり その推定精度を考える必要がある t(x 1, X 2,,X n) を母数 θの推定量とするとき 確率 1で t(x 1, X 2,,X n) θ である 標本平均と標本分散はそれぞれ母集団 ( 分布 ) の平均と分散の推定値である 正規分布 N(100,25) から 標本数 10 と 100 の無作為抽出実験を 10 回行い 標本平均と分散を求めた結果を下の表にまとめた 表 5.1. 標本数 10 の標本からの標本平均と分散実験 1 2 3 4 5 6 7 8 9 10 平均 99.69 99.24 103.00 98.85 100.77 99.10 99.90 99.74 100.30 100.36 分散 37.54 40.20 29.18 19.03 30.30 36.82 41.60 14.41 36.15 15.23 表 5.2. 標本数 100 の標本からの標本平均と分散 実験 1 2 3 4 5 6 7 8 9 10 平均 99.49 100.34 100.27 100.03 99.98 99.42 100.11 99.99 100.48 99.83 分散 29.47 28.67 28.29 25.02 28.91 25.84 24.86 21.13 23.83 28.96 標本平均や標本分散は標本を抽出するごとに偶然変動するが 変動の大きさは標本が増える に従って小さくなる この性質は前章で述べた大数の法則である 推定量の良さの基準とし て次の 2 つの性質は基本的である (i) 一致性 (consistency) t(x 1, X 2,,X n) を母数 θの推定量とするとき n に対して 1

t(x 1, X 2,,X n) θ ( 確率収束 ) であるとき 推定量は一致性をもつという また その推定量はθの一致推定量 (consistent estimator) という (ii) 不偏性 (unbiasedness) 推定量 t(x 1, X 2,,X n) が E{t(X 1, X 2,,X n)} = θ のとき この性質を推定量の不偏性という また その推定量は不偏推定量 (unbiased estimator) である 標本平均 X _ は母平均 μの推定量であり 大数の法則から一致性を持つことが分かる また E(X _ ) =μであるから 標本平均は不偏推定量でもある 次に偏差平方和 N 2 N 2 X X X i 1 i i 1 i nx 2 を考える ここで E(X i2 ) = σ 2 +μ 2, E( X 2 ) = σ 2 /n +μ 2 であるから この期待値は (n-1)σ 2 である 従って E(S 2 ) =(n-1)σ 2 /n, E( 2 ) =σ 2 を得る このことから S 2 はσ 2 の不偏推定量では無いが 2 は不偏推定量である 両者が一致推定量であることは大数の法則を用いれば分かる 標本数が大きいとき S 2 は不偏推定量に近づき このような性質を漸近不偏性という このように 我々が通常用いている統計量は解釈が容易で かつ数学的にも良好な性質をもっている 例 5.1. 確率変数 X と Y の標本分散をそれぞれ XX, YY で また共分散を XY とすれば 標本 相関係数は r XX XY YY で示される この統計量は不偏性を持たないが XX, YY, XY が一致推定量であるので 相関係数の一致推定量である 標本数が大きいときは 標本相関係数は XY r で近似されるので 漸近的に不偏推定量である X Y 5.2. 推定量の標準誤差 母数 θ の不偏推定量を t(x 1, X 2,,X n) とするとき t(x 1, X 2,,X n) の標準偏差を標準誤差 (standard error, SE) という すなわち 2

SE = Var t X, X,..., X ) ( 1 2 n である 例えば 標本平均 X の標準誤差は SE=σ/ n で また不偏分散 2 の分散が Var( 2 ) = 2 4 1 n であるから標準誤差は SE = 2 2 n 1 である 実際の解析では標準誤差はその推定値で 求めることになる すなわち 前者は SE = n 後者はSE = 2 2 n1 である 例 5.2. 次のデータは男子学生の身長のデータである 母集団が正規分布するものとして データから平均と分散を推定する データ :168.0, 168.5, 172.5, 182.5, 164.0, 160.5, 167.5, 174.5, 162.5, 173.0, 168.5, 173.5 このタータから を得る 164.5, 177.5, 160.0, 172.0, 168.0, 170.5, 166.5, 168.5, 175.0, 157.0, 171.0, 176.5 (cm) 標本平均 x =169.3 (cm) (SE =1.2), 標本分散 2 =36.3 (cm 2 ) (SE =10.7) 円周率 の推定実験を行う 一辺が 2 の正方形内から無作為に点を n 個抽出し そのうち 4n 内接する半径 1 の円に入る点の個数 n0 の相対度数の 4 倍 すなわち 0 n で円周率を推定する ( モンテカルロ法 ) 図 5.1 の実験で推定値 3.15 (SE=0.0818) を得る 図 5.2 はこの実験を 10 回反復した結果である 推定値は標本抽出を行う度に変動する様子が示されている 図 5.1 n=400 の場合の実験 3

3.3 推定値 3.25 3.2 3.15 3.1 推定値 3.05 3 2.95 0 2 4 6 8 10 図 5.2 n=400 の実験を 10 回反復した結果 標準誤差は推定量の推定精度を表すので 推定精度を予め決定して その精度に合わせた標本数を決定することが可能である 例 5.3. 男子学生の身長の標準偏差を高々 σ=6.5cm とするとき 平均の推定で標準誤差を 0.5cm 以下にするための標本数を求める 標本数を n とするとき SE=σ/ n =6.5/ n 0.5 を解いて n 169 を得る 例 5.4. 成功確率 p のベルヌイ試行で p の推定を考える ただし 0.2 < p < 0.8 とする 実験回数 n としたときの標本平均の標準誤差は SE= p ( 1 p) / n 1/(2 n ) である 標準誤差を 0.05 以下にするための標本数は 1/(2 n ) 0.05 を解いて n 100 を得る 一般に標準誤差は漸近的な方法によって算出する場合が多い その理論は次節で説明する推定量の漸近正規性に基づく 問 5.1. 次のデータは男子学生 20 名に対する胸囲のデータ ( 単位 cm) である 平均とその標 準誤差を求めよ 81.0, 93.6, 85.0, 86.1, 95.3, 91.1, 79.4, 84.4, 84.0, 87.7, 4

85.6, 90.5, 82.0, 85.3, 91.9, 87.7, 85.5, 81.1, 87.1, 978 5.3. 信頼区間母数の点推定に対して 母数が区間に入ることを推定する この推定法を区間推定 (interval estimation) という 定義 5.2. 母数 θをもつ分布 ( 母集団 ) からの無作為標本を x 1, x 2,,x n とするとき 統計量 T L(x 1, x 2,,x n), T (x 1, x 2,,x n) が T L(x 1, x 2,,x n) < T (x 1, x 2,,x n), P(T L(x 1, x 2,,x n) < θ< T (x 1, x 2,,x n) θ) = 1 α を満たすとき 区間 (T L(x 1, x 2,,x n),t (x 1, x 2,,x n)) を信頼係数 1-α の信頼区間 (confidence interval) または 100(1-α)% 信頼区間という 注意定義上で信頼区間の信頼係数は自由に決めることができるが 通常は α=0.05, 0.01 すなわち 95% と 99% の信頼区間が用いられる 信頼区間の意味を考えるために 正規分布 N(10,25) から標本の大きさ 10 の標本抽出を 20 回反復し 各標本で平均の 95% 信頼区間を作ったものを表 5.8 にしている この実験では 20 回中 19 回の信頼区間は平均値を含むことが分かる 第 11 回目の標本で信頼区間は平均値を含まない 平均の 95% 信頼区間は繰り返し実験すると 確率 0.95 で母平均を含むことを意味する 表 5.3. 95% 信頼区間の 20 回の反復実験標本 1 2 3 4 5 6 7 8 9 10 下限 9.274 6.102 6.257 6.571 4.661 4.279 7.856 9.28 10.126 6.767 上限 15.47 12.3 12.45 12.77 10.86 10.48 14.05 15.48 16.324 12.97 標本 11 12 13 14 15 16 17 18 19 20 下限 3.623 8.427 6.95 7.696 7.519 6.543 6.672 6.933 7.2665 7.627 上限 9.821 14.62 13.15 13.89 13.72 12.74 12.87 13.13 13.465 13.82 (i) 平均値の信頼区間正規母集団 N(μ,σ 2 ) からの無作為標本を X 1, X 2,,x n とするとき t 統計量 t = n (X μ)/ は自由度 n-1 の t 分布に従う いま t(n-1,α/2) をこの t 分布の上側 100α/2% 点とすれば P n X t n, t 1, 1 1 2 n 2 5

である この確率内の事象から 100(1-α)% 信頼区間は n 1, X tn 1, 2 n n X t (5.1) 2 で与えられる 信頼区間は次のように表現する場合もある X tn 1, 2 n 例 5.4. 男子学生 15 人を無作為抽出し 収縮期の血圧を測定し x = 123.47 (mmhg), 2 =153.124 を得た このときの 95% 信頼区間を求める 血圧の分布が正規分布とすると t(14,0.05)=2.145 であるから信頼区間は (116.62,130.32) で与えられる 問 5.2. 例 5.2 の身長のデータから平均の 95% 信頼区間を作れ (ii) 成功 ( 二項 ) 確率の信頼区間成功確率 p のベルヌイ試行結果として 標本 X 1,X 2,,X n を得るとき p の最尤推定量 p は標本平均であり その漸近分布は N(p,p(1-p)/n) である このとき P( p - p < q(α/2) p ˆ(1 pˆ) / n ) = 1 -α である ここで 分散 p(1-p)/n をp (1- p )/n で近似して 次の 100(1 -α)% 信頼区間を得る p - q(α/2) p ˆ(1 pˆ) / n < p < p + q(α/2) p ˆ(1 pˆ) / n (5.2) ここに q(α/2) は標準正規分布の上側確率が α/2 である限界値 すなわち P(Z> q(α/2))= α/2 を満たす値である 例 5.5. 182 回の実験を行い 55 回成功した このとき 成功確率の 95% 信頼区間を求める p = 55/182 = 0.302 であるから 次の信頼区間を得る 0.151 < p < 0.453 次に n 回のベルヌイ試行を行って 1 回も成功しなかった場合の信頼区間を求める いま (1 p) n > 1 α を考えて これを p について解いて 次の信頼区間を得る 0 p < 1 (1 α) 1/n 問 5.5. 100 人をある母集団から任意に 100 人抽出し 55 人がある項目に はい と答えた はい と答える確率の 95% 信頼区間を求めよ 6

5.4. 検定の考え方仮説検定は 仮説 ( 帰無仮説 )H 0 と対立仮説 H 1 の二者択一を標本を用いて行う統計的方法である その概要を掴むために次の例を考える [ 例 5.6] あるサイコロが正確かどうかを調べることを考える 表 6.1 はサイコロを 100 回投げた実験結果である この場合 反復して実験を行い もし特定の目が他より多く観察され または少なく観察されれば そのサイコロの正確さについて疑いをもつ この検定の帰無仮説と対立仮説は次のようにするのが自然である H 0: サイコロは正確である すなわち P(i の目が出る ) = 1/6 (i =1,2,3,4,5,6). H 1: サイコロは不正確である すなわち 少なくとも1つの目に対して P(i の目が出る ) 1/6. この例で サイコロを n 回反復し i の目が出る回数を n i とするとき 観測結果に偏りがあると確率的に判断されれば 帰無仮説を棄却し (reject) そのような偏りの傾向が見られなければ 帰無仮説を採択する (accept) ことになる この例はカイ自乗検定の節で再度取り扱う 表 5.4. サイコロ投げ実験サイコロの目 1 2 3 4 5 6 計出現回数 10 15 20 24 21 10 100 また 次の例は通常見られる典型的な例である [ 例 5.7] 過去数年間 同じ内容の統計学試験を行った結果 その平均は 70 点で 標準偏差は 6.5 点であった 今年は 20 人の学生が 統計学の試験を受け その標本平均は 75 点であった このクラスの学生は 過去の学生に対して成績が良いか否かを考える この場合の仮説は H 0: 平均 μ=70, H 1: μ 70 (5.3) である また 今年は試験前に 成績向上を狙って特別補習を行っているとすれば 対立仮説は H 1: μ>70 (5.4) とするのが妥当である 上の例から分かるように 統計的検定では仮説と対立仮説を事前に立てることが重要で そのためには対象とする現象を十分吟味する必要がある 検定で二者択一の判断基準として データ情報を縮約する統計量を用いる 例 5.6 では後に述べるカイ自乗統計量 (chi square statistic) 例 5.7 では標本平均 あるいは t 統計量 (t-statistic) を用いて検定を行う 検定に用いる統計量を検定統計量 (test statistic) という 仮説検定の理解を助けるために 例 5.7 を考える 7

学生が均一で 試験成績が正規母集団 N(μ,σ 2 ) に従うとする 標本平均を X _ とするとき Z = n X (5.5) の分布は標準正規分布である この場合 仮説 H 0: μ= 70 の下で σ= 6.5, n =20, 観測値 X _ = 75 である ただし 過去の受験学生が多数のために σ を未知母数とせずに既知母数 σ= 6.5 と して考える この場合の統計量 (5.5) の値は であり z 0 = 20 (75-70)/6.5 =3.440 P(Z > z 0) = P(Z > 3.440) = 0.0003 を得る これは仮説 H 0 の下で極めてまれな観測結果であると考えられ 仮説は棄却すること が妥当である 上の確率を有意確率または p 値という 仮説検定の定式化については次の節 で述べる 問 5.3. 例 5.6 で 1 の目は 10 回出現している 帰無仮説 H 0 の下で 1 の目が 10 以下になる確 率を中心極限定理により近似計算し この結果が稀なものであるかどうか検討せよ 問 5.7. 例 5.7 で分散が未知とする 標本平均 x 75 不偏分散がu 2 51であった t 統計 量を用いて仮説 H 0: μ= 70 を検討せよ 5.5. 正規分布に関する基本的検定法 (i) 正規分布 N(μ,σ 2 ), 分散 σ 2 が既知の場合の H 0:μ=μ 0 の検定標本 X 1,X 2,,X n が得られたとき 統計量 Z(5.4) は H 0 の下で標準正規分布に従う 対立仮説 H 1:μ μ 0 のとき 有意水準 αに対して棄却域は W: Z > z(α/2) (5.6) で与えられる ここに 棄却限界点 (critical point) z(α/2) は P( Z > z(α/2)) = αを満たす上側 50α% 点である 従って 有意水準 α=0.05 に対して棄却域は Z >1.96 である また 有意水準 α=0.01 に対しては Z >2.58 が棄却域である 対立仮説 H 1:μ>μ 0 のときは W: Z > z(α) (5.7) が棄却域である 同様に対立仮説 H 1:μ <μ 0 のときは W: Z < -z(α) (5.8) が棄却域になる 問 5.8. 例 5.7 を有意水準 0.05 で検定せよ 大標本のときの近似的な検定は この方法が基本である 標本 X 1,X 2,,X n が平均 μ 分散 σ 2 の分布 ( 母集団 ) から得られたとき 標本数が十分大きいとき 標本平均 X は平均 μ 分散 σ 2 /n の正規分布に漸近的に従う ( 中心極限定理 ) 従って 8

nx Z = の分布は漸近的に標準正規分布である また 分散 σ 2 が未知のときは 不偏分散を 2 に対 し nx t = (5.9) (5.10) は近似的に標準正規分布に従い このことを用いれば 平均に関する検定が行える 上の不偏分散を標本分散 S 2 で置き換えても近似的には同様である (ii) 正規分布 N(μ,σ 2 ), 分散 σ 2 が未知の場合の H 0:μ=μ 0 の検定 このときの検定統計量は nx t = (5.11) であり 自由度 n-1 の t 分布に従う 有意水準 αのとき 対立仮説 H 1:μ μ 0 に対する棄却域は W: t > t(n-1,α/2) (5.12) である ここで t(n-1,α/2) は自由度 n-1 の t 分布の上側 100α/2% 点である 対立仮説 H 1:μ > μ 0 のときは 棄却域は W: t > t(n-1,α) であり また対立仮説 H 1:μ<μ 0 のときは W: t < - t(n-1,α) となる [ 例 5.8] マウス 10 匹に特殊な栄養剤を混ぜた飼料を与えて飼育したところ 生後 1ヶ月の体重増加が次のデータのようになった 19, 18, 21, 22, 24, 15, 23, 20, 18, 28 (g) マウスを通常の飼料のみで飼育した場合の発育は 1ヶ月で 20g とされている このとき 栄養剤の効果があったかどうかを検定する 体重増加量は正規分布とすると仮定し 仮説 H 0: μ=20 と対立仮説 H 1:μ>20 に対して検定を行う 検定統計量は t 統計量であり t 0 = 10 (20.8-20)/3.676 = 0.688 を得る t 統計量の上側 5% 点は t(19,0.05) =1.729 で 帰無仮説は棄却されない 栄養剤の効果は無いと判断される 問 5.4. 例 5.7 のデータが次のように与えられている H 0: 平均 μ=70, H 1: μ 70 を有意水準 0.05 で検定せよ ただし データは正規分布すると仮定する 9

95 63 90 35 88 60 73 55 81 100 93 88 67 90 75 72 70 50 43 75 10