統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Similar documents
基礎統計

EBNと疫学

Microsoft PowerPoint - statistics pptx

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - stat-2014-[9] pptx

講義「○○○○」

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - Statistics[B]

ビジネス統計 統計基礎とエクセル分析 正誤表

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - sc7.ppt [互換モード]

統計的データ解析

第7章

Microsoft PowerPoint - e-stat(OLS).pptx

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

情報工学概論

スライド 1

スライド 1

Microsoft Word - Stattext12.doc

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft PowerPoint - ch04j

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - å“Ÿåłžå¸°173.docx

不偏推定量

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Medical3

Microsoft Word - Stattext13.doc

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

カイ二乗フィット検定、パラメータの誤差

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

モジュール1のまとめ

数値計算法

統計学の基礎から学ぶ実験計画法ー1

Medical3

Probit , Mixed logit

Microsoft PowerPoint - 基礎・経済統計6.ppt

untitled

Microsoft Word - Stattext11.doc

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

データ解析

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

スライド 1

数値計算法

Microsoft PowerPoint - 測量学.ppt [互換モード]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

経済統計分析1 イントロダクション

様々なミクロ計量モデル†

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft Word - appendix_b

Microsoft PowerPoint - A1.ppt [互換モード]

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

PowerPoint プレゼンテーション

Microsoft Word - Stattext07.doc

Microsoft PowerPoint - Econometrics pptx

解析センターを知っていただく キャンペーン

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 )

MT2-Slides-13.pptx

0415

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

3章 度数分布とヒストグラム

青焼 1章[15-52].indd

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft Word - reg2.doc

_KyoukaNaiyou_No.4

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

学習指導要領

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

PowerPoint プレゼンテーション

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

13章 回帰分析

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

基礎統計

統計Ⅰ 第1回 序説~確率

Microsoft PowerPoint - Inoue-statistics [互換モード]

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

3章 度数分布とヒストグラム

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

測量士補 重要事項「標準偏差」

Microsoft Word - reg.doc

Microsoft Word - 補論3.2

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft Word - apstattext05.docx

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

Transcription:

統計学 Ⅱ(16 11-1 章 11 章母集団パラメータの推定 1. 信頼区間 (1 点推定と区間推定 ( 区間推定のシミュレーション (3 母平均 μの信頼区間 (4 母比率 pの信頼区間 (5 母比率 pのより厳密な信頼区間. 点推定量の特性 (1 標本平均 X の持つ望ましい性質 ( 不偏性 (3 推定量の分散と有効性 (4 平均 乗誤差 MEと最小分散性 (5 一致性 (6 チェビシェフの不等式 3. 標本の大きさの決定 (1 標準誤差 ( 比率の推定と標本の大きさ (3 平均値の推定と標本の大きさ 4. 母分散 σ の推定 (1 標本分散の性質 ( 標本分散 の標本分布と χ 分布 (3 母分散 σ の信頼区間 5. 最尤法 (1 最尤法の考え方 ( 尤度と最尤推定値 (3 最尤推定値の例 1 信頼区間 (1 点推定と区間推定 統計学の基本的な考え方 (1 章参照 データ = 母集団から抽出された標本 知りたいことは母集団の情報 ( パラメータ 母 ( 集団 平均 μ 母 ( 集団 比率 p など しかし, それらは未知 教科書 66-77 ページ 知ることができるのは, 標本のデータとそこから計算された統計量の実現値 標本平均 x 標本比率 など 既知の標本 ( データ の情報から, 未知の母集団に関する情報をいかに推定するかが問題 母集団 : 名古屋地区全体................... p=? 視聴率調査 標本抽出 推定 標本 : 調査世帯 (6 世帯..... % の視聴率 点推定と区間推定 X の標本分布 母比率の推定 : 標本比率の標本分布の性質を利用 p 標本比率 X の標本分布の平均 = 母集団比率 p 標本比率で母比率を推定する ( 点推定 しかし, 個々の p p ˆ : Xの実現値 1つの推定値で正確な推定は不可能 母集団の値は, 実際にはわからない 一定の区間に母集団の値 ( 母比率 が入るような推定値をつくる= 区間推定 推定値の精度を反映させる X 区間で推定することの意義 : 推定値の精度を反映 例 =5に対する視聴率調査の結果の. p =5 に対する視聴率調査の結果の. 結果 ( 点推定値 は同じだが, もっている意味は異なる 結果の精度は,=5の方が高い( なぜか? 精度 をどのように測るか 標本平均の標本分布の分散 ( 小さいほど精度が高い 区間で推定を行う ( 区間推定 ex. =5では,.19~.1に真の視聴率が含まれる =5 では,.16~.4に真の視聴率が含まれる pq X 母平均の推定 ex. 日本の平均貯蓄残高 母集団 N.................. 母平均 μ=? 推定 標本 x 1, x, : x x 16 X の標本分布 x 母平均の推定 : 標本平均の標本分布の性質を利用 標本平均 X の標本分布の平均 = 母集団平均 μ 標本平均で母平均を推定する ( 点推定 しかし, 個々の x 1つの推定値で正確な推定は不可能 一定の区間に母平均が入るような推定値をつくる= 区間推定 X 1

統計学 Ⅱ(16 11-1 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t. 95.975.975 この式に T を代入する t.975 母集団.............. μ=? N(, 母集団分布 標本 標本 標本 標本 X の標本分布 x x x x N(, 基準化変量 Z T 統計量 x σをで z 置換え x t 1 x z x t 1 x x z t 1 x x z t 1 Z~N (,1 T ~ 自由度 -1のt 分布 母平均の区間推定 P t μについて解くと P X t.975 X t 1 区間 X t.975 X t 1.975.975, X t 1.975 1.95 のなかに母平均が含まれる確率が95% cf. 標本分布 ( 標本ごとに X やはいろいろな値をとる 1 μ: 未知.975.95 表 11-1 (69 ページ 参照 ( 参考 区間の導出方法 P t X t 1.975.975.95 を μ について解く ( 未知なのは μ だけ X P( t.975 t.975.95 / 1 P( t.975 X t.975.95 1 1 P( X t.975 X t.975.95 1 1 P( X t.975 X t.975.95 1 1 (3 母平均 μ の信頼区間 P X t.975 X t.975 実際の状況 1 1 ある1つの標本のみが抽出される X, は確率変数 その標本のデータをもとに標本平均, 標本標準偏差が計算さ れる 1 1 x x, ( x x, 1 1 区間の式に x と を代入 P x t x t 1 実現値なので, 確率変数ではない 確率表現ができない 1.975.975.95.95 信頼係数と信頼区間 * P x t.975 x t 1.975 P * ( は確率ではないことを表わす.95 1 ある実現値をもとに計算した区間には, 母平均 μ が入っているか, 入っていないか確定している.95: 確率ではなく, 信頼の程度 ( 信頼度 を表わす = 信頼係数.95 など 1 に近い (= 確からしい 値を用いる 通常は.95 で十分 (.99 を用いることもある 実現値に基づいた母平均 μ の区間推定値 = 信頼区間

統計学 Ⅱ(16 11-1 章 信頼係数 (7 ページ 信頼係数と確率 信頼係数は確率とは異なった概念 ある信頼区間に母平均は入っているか, 入っていないか しかし, 信頼区間を何度も作成すると, 信頼区間のうちの 95% が母平均を含むことから, 確率と似たような解釈が可能 cf. 標本分布, 表 11-1 1- 信頼係数 = 危険度 : 結論が間違える可能性 ex..5 信頼係数には,95% や 99% が用いられる 95% の場合は,t 分布表の.975 に対する数値 t 分布の両側を.5% ずつとるので,.95 ではなく,.975 を用いる 99% の場合は,t 分布表の.995 に対する数値.5%.5% 95% 97.5% 母平均 μ の信頼区間の公式 信頼係数 95% の場合 x t.975, x t 1 (. 975 ただし,t.975 は自由度 -1のt 分布の97.5% 点 1 1 x x, ( x x, 1 1 一般的に, 信頼係数 γ-1の場合 x t, x t 1 1 1 信頼係数は, 通常は 95% か 99% が用いられる ex. 信頼係数 99%.995 ( t t. 995 1.9951.99 母平均 μ の信頼区間の計算例 : 例題 11.1 x x x ( x x 1 -.9-3.8 14.63 3.1..3 3 -.6-3.5 1.43 4-5.7-8.6 74.39 5.4 -.5.8 6.7 -..5 7.7 -..5 8 4.3 1.4 1.89 9 9.3 6.4 4.64 1. -.7 7.43 11 9.3 6.4 4.64 1 8.3 5.4 8.89 合計 35.1 1.34 平均.9 分散 18.4 標準偏差 4.3 信頼係数 95% の信頼区間の公式 ( x t.975 x.9, t.975, x t 1.1.975 1 18.4, 4.3 4.3 4.3.9.1,.9.1 1 1 1 1.1, 5.8 母平均 μ( 真の平均 は,95% の信頼度で,.1 から 5.8 の区間に含まれている (4 母比率 p の信頼区間 平均と比率は, 基本的に同じ 信頼区間についても, 同様の式で計算可能 の信頼区間 ( x t.975, x t. 975 1 pの信頼区間 : 1.96 pq ˆ ˆ, 1.96 pq ˆ ˆ 標本の比率の標準偏差 (1, データの標準偏差 = 比率はデータ数 が大きい場合が多い 1 qˆ t 分布ではなく, 正規分布を用いても構わない ( 自由度が大きいと, t 分布は標準正規分布で近似できる -1 のかわりに, を用いてもよい ( が大きければ -1 母比率 p の信頼区間の導出 中心極限定理 Z X p ~N(,1 Z p(1 p 比率の場合, は十分大きいことが多い 標準偏差 ( 分母 を推定量で置き換える P1.96 X p ~N (,1 X (1 X X p 1.96.95 X (1 X 1.96 Z 1.96.95 1.96は標準正規分布の97.5 点 P % pについて解き, 確率変数 X を実現値 で置き換える (1 (1 X X X X P X 1.96 p X 1.96.95 * (1 (1 P ˆ 1.96 ˆ 1.96 p p p.95 母比率 pの信頼係数 95% の信頼区間の公式 pq ˆ ˆ pq ˆ ˆ ( 1.96, 1.96 は標本比率,qˆ 1, z. 975 信頼係数 γ-1 の場合 z pq ˆ ˆ, z pq ˆ ˆ 1.96 ex. 信頼係数 99%.995 ( z z. 995.58 3

統計学 Ⅱ(16 11-1 章 母比率 p の信頼区間の計算例 : 例題 11.(75 ページ 母比率 pの信頼係数 95% の信頼区間の公式 pq ˆ ˆ pq ˆ ˆ ( 1.96, 1.96.53, qˆ 1.47, 98 を代入.53(1.53.53 1.96,.53 1.96 98 (.53.3,.53.3 (.498,.56.53(1.53 98 母比率 p( 真の内閣支持率 は,95% の信頼度で, 49.8% から 56.% の区間に含まれる. (5 母比率 p のより厳密な信頼区間 中心極限定理 X p (,1 X p Z ~N P 1.96 1.96.95 p(1 p (1 p p これをpについて解き, 確率変数 X を実現値 で置き換えれば信頼区間を作成できる 1.96 (1 1.96 1.96 (1 1.96 X X X X P X 1.96 1.96 p X 1.96 4 1.96 4 近似の度合いは高い ただし, が大きければ, それほど大きな差はない ( 教科書の練習問題 1.95 点推定量の特性 (1 点推定量のもつ望ましい特性 区間推定 教科書 77-84 ページ 未知の母平均 ( あるいは, 一般にパラメータ について区間を設定し, そこに含まれる確からしさ ( 信頼係数 を付与することによって推定 点推定 ある一つの推定値によって, 母集団の情報 ( パラメータ を推定する しかし, 推定値 ( 標本平均 は, 一般にパラメータ ( 母平均 に一致しない ( 一致する確率は 母平均と母比率の点推定量 母平均 μの点推定量 : X ( 点推定値 x 標本平均 例 : 日本全体の平均貯蓄残高の推定値として, 約 9 世帯を調査した貯蓄残高の平均約 16 万円を用いる. 母比率 pの点推定量 : X( 点推定値 標本比率 名古屋地区のある番組の視聴率は, 抽出された6 世帯の視聴率が% だったので,% であると推定した. 一般に推定値は母平均や母比率とは一致していない x, p なぜ, それなのに推定量として用いるか いくつかの望ましい特性をもっている ( 不偏性 ある推定量の標本分布の平均が, 推定しようとするパラメータと一致する = 不偏性 標本平均は不偏性をもつ 標本平均 X の標本分布の平均 = 母平均 μ Xの標本分布 ~ N (, 不偏性をもたない推定量 不偏性 ( 続 不偏性は, 推定量のもつ望ましい特性の1つ 1つ1つの推定値は, パラメータをあててはいない しかし, 全体としてみれば ( 平均すると, パラメータをうまくあてている 真の値を過大に推定する場合と, 過小に推定する場合のバランスがとれている 標本比率も母比率の不偏推定量 メディアンやモードは不偏推定量ではない 平均がメディアンなどより代表値として, よく用いられる理由 4

統計学 Ⅱ(16 11-1 章 (3 推定量の分散と有効性 不偏推定量 一般に, 推定量とパラメータは一致しない どの程度一致していないか (= 誤差 を考える 標本分布の散らばりが大きい 推定量がパラメータから離れたところに落ちる可能性が高い 標本分布の散らばりが小さい 推定量がパラメータの近くに落ちる可能性が高い X x であっても, 標本分布の散らばりが小さければ, 標本平均の精度は高い ( x はμに近い 最小分散性 不偏推定量の標本分布の分散は, 小さいほど望ましい ( 誤差が小さい 標本平均の標本分布の分散 一定の条件のもとで, 最小の分散をもつ不偏推定量であることがわかっている 母集団が正規分布の場合 母集団が正規分布でなくても, 線形不偏推定量のなかで最小の分散をもつ いずれにせよ, 標本平均は標本分布の分散 (= 誤差 が小さい推定量であることがわかっている cf. メディアン (5 一致性 不偏推定量の標本分布の分散 小さいほど望ましい データ数 が大きくなると, 分散がに近づく場合, 一致性をもつという が大 推定量がパラメータに近づく が大 標本平均の標本分布の分散 = が大きくなるとに近づく a a が大きいと, 標本平均は母平均に近い値をとる可能性が高い ˆ 不偏推定量の誤差 誤差 ( 精度 = 推定量の標本分布の散らばり ( 標準偏差で測ることが多い 標本分布の標準偏差のことを, 標準誤差という 標準誤差が大きい 推定量の誤差が大きい ( 精度が低い 標準誤差が小さい 推定量の誤差が小さい ( 精度が高い 3 標本の大きさの決定 誤差の大きさは何によって決まるか教科書 84-89ページ (1 標準誤差 推定値の誤差 = 標本分布の散らばり = 標本分布の標準偏差で測定される ( 単位が平均と同じなので, 分散より利用しやすい 標本平均の場合 標本比率の場合 pq 95% の信頼区間 pq ˆ ˆ pq ˆ ˆ ( x t.975, xt. 975 ( 1.96, 1.96 1 1 1. σ( 母集団の標準偏差 コントロールできない ( 一定. データ数 コントロール可能 が大きいほど, 誤差は小さい データ数を 倍にする 1 誤差は1/にならず,.77 精度は倍 推定値の精度を 倍 ( 誤差を半分 にするためには, データ数を 4 倍にする必要がある 5

このイメージは 現在表示できません 統計学 Ⅱ(16 11-1 章 推定値の精度とデータの個数 誤差 = 標準誤差で測る 精度 = 誤差と反比例 精度を 倍 (= 誤差を 分の1 データ数を4 倍にする必要がある を4 倍 1 4 精度を 3 倍 (= 誤差を 3 分の 1 データ数を 9 倍にする必要がある 精度を k 倍 (= 誤差を k 分の 1 データ数を k 倍にする必要がある 比率の場合も同様 具体的な誤差の大きさ ( 信頼係数 95% 平均の場合 X ~ N(, 1.96 が誤差になる より 比率の場合 pq X ~ N( p, より 1.96 が誤差になる pq 真の平均より上下に 1.96 真の比率より上下に の誤差を考えるの誤差を考える ( 比率の推定と標本の大きさ 標本の大きさ (= データ数 をいくつすればよいか 誤差をどの程度に抑えるかによって決定される 誤差を ± a 以下にする場合 p に適当な数値を与えて 1.96 pq a を について解く 標本の大きさの決定の例 (85-86 ページ 信頼係数 95% の場合の誤差 1.96 誤差を 1% 以内に収める a=.1 p=. とすると pq a.(1. 1.96.1 について解く..8 1.96.1 1.96..8.1 1.96..8.1 6146.56 よって,6147 人以上 (3 平均値の推定と標本の大きさ 平均の誤差 :1.96 誤差を ±c 以下にする σに適当な数値を与えて 1.96 を について解く c ただし, σ や c に数値を与えることは困難な場合が多い 4 母分散 σ の推定 教科書 89-94 ページ 母分散についても, 平均と同様に考えることができる 推定量として, 標本分散を用いる 標本分散の標本分布を考え, 標本分布の平均 標本分布の分散によって, 推定量を判断する 推定量としては, 偏差 乗和を ではなく,-1 でわった分散を用いることが多い ( 不偏性 区間推定を行う 6

統計学 Ⅱ(16 11-1 章 1 章仮説検定 1 仮説検定の考え方 (1 簡単な例 ( 帰無仮説と対立仮説 (3 仮説の判定方法 (4 棄却域, 受容域, 有意水準 (5 検定統計量 (6 種類の過誤 (7 仮説検定の手順のまとめ 母平均 μ の片側検定 (1 母平均 μ の片側検定の例 ( 母平均 μ の片側検定の手順 (3 母比率 p の片側検定 3 母平均 μ の両側検定 (1 母平均 μ の両側検定 ( 母比率 p の両側検定 4 平均値の差の検定 (1 母分散が等しい場合の平均値の差の検定 ( 母分散が等しくない場合の平均値の差の検定 5 適合度検定と分割表の検定 (1 適合度検定 ( 独立性の検定 6 その他の検定 1 仮説検定の考え方 (1 簡単な例例題 1.1: 1 円玉を投げて表が出る確率が.5かどうか調べる 知りたいのは母集団の比率 ( 真の比率 p pが.5かどうかを検証したい 信頼区間によって, 検証する.61, 1 pの信頼係数 95% の信頼区間 (.514,.76 pは.5であるとはいえない.58, 1 (.483,.677 p pは.5であることは否定できない 表が出たら 1, 裏が出たら 1 の割合 =1, データの平均 = 表の比率 母集団. 1 1 1..1 1.. 1 1 1 1.......5? 標本. 1. 1.. 1......61 ( 帰無仮説と対立仮説 p=.5 かどうか判定したい p の信頼区間に.5 が含まれているかどうかで判定できる p=.5 という仮説 (hypothe を検定する (tet という ( 統計的 仮説検定の問題通常は, 信頼区間を作成せずに, より直接的な検定を行う 特に, 検定したい p=.5 を帰無仮説といい,H で表す H : p =.5 p.5: 対立仮説 ( H 1 : p.5 ex. サイコロで 3 の目が出る確率を判定したければ, H : p=1/6 (3 仮説の判定方法 p=.5 がデータと矛盾するかどうかで判定する データと矛盾する データから計算された比率が.5からかなり離れる データと矛盾しない データから計算された比率が.5に近い 判定結果 1 p=.5 がデータと矛盾したら, p.5と判定する 帰無仮説は否定 ( 棄却 される 対立仮説が正しい p=.5 がデータと矛盾していなかったら, p=.5と判定する 帰無仮説は否定 ( 棄却 されない 受容される 仮説の棄却 採択 H : p.5 v H : p.5 帰無仮説と標本比率の標本分布 1 帰無仮説 H が否定される 帰無仮説 H が棄却される (reject という 対立仮説 H 1 が正しい 対立仮説 H 1 が採択される (accept という 帰無仮説 H が否定されない 帰無仮説 H が棄却されない 帰無仮説 H が受容される H が正しいという言い方は正確ではない 通常は, 否定したいことを帰無仮説に設定する 要は, 帰無仮説 H が棄却されるか, 棄却されないかをデータによって判定することが, 仮説検定 どの値を基準に判定を決めるかが問題 H : p=.5 のもとでの, 標本比率 X の標本分布 pq pq.5.5.5 N( p, N(.5,.5 1 H : p=.5が正しければ, データから計算された標本比率の値 は.5 付近の値をとりやすい そこで, を計算して N(.5,.5 判定する.5 X 7

統計学 Ⅱ(16 11-1 章 標本比率の実現値による判定 H : p=.5が正しければ, 標本比率 Xは平均.5の正 規分布に従う データから計算された が.5 付近の値をとりやすい を計算した結果, 1 が.5 付近の値をとった 帰無仮説は受容される ( 当然のこと が.5から離れた値をとった N(.5,.5 通りの解釈が可能 (1 たまたまめずらしいことが起こった ( 帰無仮説が間違っている ( 棄却 ( の立場をとる.5 (4 棄却域, 受容域, 有意水準 がどのくらい.5から離れていれば, 帰無仮説を棄却するか? たまたま起こったとは言えない位離れた値を ( 起こりうる確率が十分に小さくなるように, その境界とする その境界を臨界値, 棄却点という 基準となる確率が5% 以下になるようにする < 臨界値 1, または > 臨界値 棄却域 N(.5,.5 帰無仮説を棄却する 5% 対立仮説を採択する 臨界値 1 臨界値 受容域 帰無仮説を棄却しない ( 受容する.5 棄却域 臨界値 1 受容域 臨界値 棄却域 有意水準 仮説検定で用いる 5%( ないしは 1% の値を有意水準という 有意水準 = 帰無仮説 H が正しいにもかかわらず, それを棄却してしまう確率 = 帰無仮説を棄却した場合, それが誤り (error を犯している確率 有意水準には,5% や 1% がよく用いられる 臨界値 ( 棄却域 の決め方 H : p=.5 のもとで有意水準を5% とすると, P( a X b.95 N(.5,.5 となるように a,bを求める 5% pq 中心極限定理よりX ~ N( p, X p P 1.96 1.96.95 pq a pq pq P 1.96 1.96 p X p.95 p.5, q 1.5.5, 1 を代入して.5 b P(.4 X.598.95.4または.598ならば H : p.5を棄却する (5 検定統計量 標本比率 X の実現値 によって, 帰無仮説を棄却するかどうか判断 いちいち上の不等式を解くのは面倒なので, より一般的な検定を考える 棄却域を固定し, 検定統計量 Z により検定を行う pq X p X ~ N ( p, Z pq H : p pのもとで H : p.5なら, p.5 X p Z ~ N(,1 先の例では, pq p z P( 1.96 Z 1.96.95 pq.61.5 よって棄却域は, z 1.96または z 1.96.5.5 1. (7 仮説検定の手順のまとめ 1. 検定の対象である母集団パラメータについて, 帰無仮説 H と対立仮説 H 1 を設定する.. 検定統計量 W を選択し,H のもとでの W の標本分布を求める ( W に H で指定した値を代入したのが W. 3. 有意水準を与えて,W に対する棄却域を決める. 4. W の実現値 w をデータから計算 5. 判定 w が棄却域に入った 帰無仮説 H を棄却する (H 1 を採択する w が棄却域に入っていない 帰無仮説 H を棄却しない ( H を受容する 8

統計学 Ⅱ(16 11-1 章 3 母平均 μ の両側検定 仮説の設定 帰無仮説 H :μ=a ( 対立仮説 H 1 :μ a.5 検定統計量 X T ~ 自由度 1の t分布 1 X a H のもとで, T ~ 自由度 1 -c c 棄却域棄却域 1の t 分布 自由度 -1 の t 分布 棄却域 有意水準を5% とする P(T<c=.975となるcをt 分布表より求める P(-c<T<c=.95 T <-c またはT >cが棄却域 データから, x, を求め,aととともにT の式に代入してt を計算 棄却域に入るかどうかで判定 x a t 1 例題 1.4 (318 ページ 仮説の設定 H :μ=8 ( 対立仮説 H 1 :μ 8 検定統計量 =5なので, X 8 H のもとで, T ~ 自由度 4の t分布 1 -.776.776 棄却域 t 分布表より, 自由度 4では, P(T<.776=.975 棄却域は, T <-.776 またはT >.776 =5, x 8.4,.8 より x 8.4 8 t 1.8 5 1 t は棄却域に含まれないので, 帰無仮説は棄却されない 8 グラムである ( ことは否定されない 1 自由度 4 の t 分布 x x x ( x x 1 79-1.4 1.96 8 -.4.16 3 81.6.36 4 81.6.36 5 81.6.36 合計 4 3. 平均 8.4.64.8.5 棄却域 母比率 p の両側検定 仮説の設定 検定統計量 X p Z ~ N (,1 pq / X p にHを代入 Z p q / H : p p p p v H1 : 有意水準を.5とするとP(-1.96<Z<1.96=.95より, 棄却域は,Z <-1.96, Z >1.96 p データより z を算出し,z を計算 pq / 判定 z >c 帰無仮説を棄却し, 対立仮説を採択する. z c 帰無仮説は棄却されない. N(,1.5-1.96 1.96 棄却域棄却域 母平均 μ の片側検定 (1 母平均 μ の片側検定の例 例題 11.1 帰無仮説 H :μ= 対立仮説 H 1 :μ> 自由度 -1 の t 分布 検定統計量 T X T ~ 自由度 1の t分布 1 X X H のもとで, T ~ 自由度 1 1 棄却域 有意水準を与えて, 片側に設定する P(T<c=.95としたとき,T >cが棄却域 c.5 棄却域 1の t分布 ( 母平均 μ の片側検定の手順 仮説の設定 H : v H1 : 検定統計量 X T 1 自由度 -1 の t 分布 c 有意水準 αを与えて, 棄却域を決める P(T<c=1-αとすれば, 棄却域はT >c データより x とを算出し,t を計算 x t 判定 / 1 t >c 帰無仮説を棄却し, 対立仮説を採択する. t c 帰無仮説は棄却されない..5 棄却域 (3 母比率 p の片側検定 仮説の設定 検定統計量 Z X p p q / H p p v H1 : X p Z ~ N(,1 より pq / : p p 有意水準 αを与えて, 棄却域を決める P(Z<c=Φ(c=1-αとすれば, 棄却域はT >c α=.5 のとき,c=1.645 p z pq / データよりを算出し,z を計算 判定 z >c 帰無仮説を棄却し, 対立仮説を採択する. z c 帰無仮説は棄却されない. N(,1.5 1.645 棄却域 9

統計学 Ⅱ(16 11-1 章 11 章母集団のパラメータの推定練習問題 1. ある株の変化率の過去 5か月分のデータは,.5,.5, 1.5, 1.5,.( 単位 :% であっ た. 以下の問いに答えよ. (1 データの平均, 分散, 標準偏差を求めよ. x x x ( x x ただし, 計算は % のまま行うこと ((3 も同様. 1.5.5 3 1.5 ( 自由度 4 のt 分布の 97.5% 点, すなわち 4 1.5 P ( T < a =.975 となる a を求めよ. 5. (3 母平均 µ の信頼係数 95% の信頼区間を求めよ. 答えは信頼区間を求めた段階で, 小数第 3 位で四捨五入し, 小数第 位まで求めよ. 合計平均 (4 この株を買うべきかどうか ( 買ったらもうかるかどうか について, (3 の結果と あわせて簡単に理由をつけて答えよ.. 過去 5 回の模擬テストの偏差値は,47,47,51,53,55 であった. (1 データの平均, 分散, 標準偏差を求めよ. x x x ( x x ( 自由度 4 のt 分布の 97.5% 点, すなわ 1 47 ち P ( T < a =. 975 となる a を求めよ. 47 (3 母平均 µ の信頼係数 95% の信頼区間を 3 51 求めよ. 答えは信頼区間を求めた段階 4 53 5 55 で, 小数第 位で四捨五入し, 小数第 1 合計 位まで求めよ. (4 偏差値 46 の大学への合格可能性について, (3 の結果とあわせて簡単に理由を 平均 つけて答えよ. また, 偏差値が 48,56 の大学についても合格可能性を考えよ. 3. 過去 4 回の模擬テストの偏差値は,5,5,51,53 であった.と同様に, 偏差値の平均の 95% 信頼区間をつくり, 偏差値が 45,5,55 の大学への合格可能性を判断せよ. 4. ある株の 4 か月の変化率は,,1,1( 単位 :% であった.1 と同様に母平均 µ の信頼 係数 95% の信頼区間を求め, この株を買ったら利益が出るかどうかについて判断せよ. 5.98 ページの練習問題 1 6.98 ページの練習問題 1

統計学 Ⅱ(16 11-1 章 7. ある番組の視聴率を調べるために,4 世帯に調査をしたところそのうち 144 世帯がその番組を見ていたという. (1 視聴率の点推定値を求めよ. ただし, 単位は % で答えよ. ( 真の視聴率の信頼係数 95% の信頼区間を求めよ. 答えは,% の単位で, 小数第 1 位まで答えること ( はじめに視聴率を小数で計算し, 小数第 4 位で四捨五入し, 小数第 3 位まで求め, 信頼区間は % 表示で小数第 1 位まで答えよ. (3 この番組の視聴率が 3% を越えたかどうかを, ( の結果とあわせて簡単に理由をつけて答えよ. 8. ある地域の現在の失業率を調べるために, 労働力人口 64 人に調査をしたところそのうち 64 人が失業していたという. このとき次の問いに答えよ. (1 失業率の点推定値を求めよ. ただし, 単位は % で答えよ. ( その地域の真の失業率の信頼係数 95% の信頼区間を求めよ. 答えは,% の単位で, 小数第 1 位まで答えること ( はじめに失業率を小数で計算し, 小数第 4 位で四捨五入し, 小数第 3 位まで求め, 信頼区間は % 表示で小数第 1 位まで答えよ. (3 この失業率の過去最高値は 9.6% であることがわかっている. 現在の失業率が過去の最高値を越えたかどうかを, ( の結果とあわせて簡単に理由をつけて答えよ. 9.98 ページの練習問題 4 1.99 ページの練習問題 5 11.99 ページの練習問題 6 1. 16 年 11 月 1 日 ( 月 ~ 11 月 7 日 ( 日 の週の関東地区のアニメ番組の視聴率で, 第 1 位は サザエさん で 14.%, 第 位は ちびまるこちゃん で 1.% であった ( ビデオリサーチによる視聴率調査. (1 それぞれの番組の視聴率の 95% 信頼区間を作成せよ. ただし, 標本の大きさは 6 とする ( はじめに小数で計算し, 小数第 4 位で四捨五入し, 小数第 3 位まで求め, 信頼区間は % 表示で小数第 1 位まで答えよ. ( サザエさん が第 1 位といってよいかどうか,(1 の結果をもとに判断せよ. 13. 16 年 1 月の完全失業率は,3.% である. 標本の大きさを 6 として, 信頼係数 95% の信頼区間をつくり, その誤差の範囲について考えよ. 14. 16 年 1 月の男の完全失業率は 3.%, 女の完全失業率は.7% であった. 男女別に失業率の 95% 信頼区間をつくり, 男女の失業率に差があるかどうかを答えよ. ただし, 男の標本を 35, 女の標本を 5 とする. 11

統計学 Ⅱ(16 11-1 章 15. 日本経済新聞社とテレビ東京が第二次安倍内閣発足直後の 1 年 1 月 6~7 日に実施した世論調査において, 内閣支持率は 6%, 不支持率は 9% であった. (1 有効回答数 ( 標本の大きさ を 87 として, 内閣支持率の信頼係数 95% の信頼区間を求めよ. ( 6 年 9 月の第一次安倍内閣発足時の内閣支持率は 71% であった. 第一次安倍内閣発足時の支持率を所与として, 第二次安倍内閣の発足時の支持率が第一次のそれを下回っているかどうかを判断せよ. (3 不支持率の信頼係数 95% 信頼区間をつくり, 支持率の信頼区間と比較せよ. 16. 朝日新聞が 16 年 1 月 15~16 日に実施した世論調査で, トランプさんがアメリカの大統領になることで, 日米関係はよい方向に向かうと思いますか. 悪い方向に向かうと思いますか. それとも変わらないと思いますか という質問を行ったところ,49% が 変わらないと思う と答えた. 変わらない と回答した割合の信頼係数 95% の信頼区間を作成し, その割合が 5% を下回っているかどうか判断せよ. ただし, 有効回答数を 1973 とする. また, よい方向に向かうと思う と 悪い方向に向かうと思う を合わせた回答の割合, つまり変わると思うと回答した割合は 31% であった. 変わると回答した割合の信頼係数 95% の信頼区間を作成し, 変わらない と回答した方が上回っているかどうかを判断せよ. 17. 1 人についてある調査を行ったところ誤差が大きかった. そこで誤差を 1/( 精度を 倍 にするためには, 標本の大きさを何人にすればよいか. また, 誤差を 1/3 にしたい場合はどうか. 18. 視聴率調査で真の視聴率が p=.1 のときの誤差を求めよ. ただし, 信頼係数は 95%, =6 とする. また,p=.,p=.3 についても, 同様の計算を行え. 19. 視聴率調査 ( 世論調査などでもよい で誤差の範囲を ±% に押さえたい場合, 標本の大きさはどのくらいにすればよいか. ただし, 母集団比率が 5% の場合と 1% の場合, それぞれについて求めよ. ただし, 信頼係数を 95% とする.. 失業率の誤差を 1% 以下にするためには, 何人について失業に関する調査を行えばよいか. ただし,p=.5 として求めよ. また,.1% 以下にするためには, 何人の標本が必要か. 1. ある工場の製品の不良品の発生率は% 程度であることがわかっている. 不良品発生率の誤差が 1% 以内になるようにするには, いくつの製品を調べればよいか.95% の信頼係数について求めよ.. 平均貯蓄額を調査するのに, 誤差を 3 万円以下にするには, 何世帯を調査すればよいか. 信頼係数を 95% として答えよ. ただし, 母集団の標準偏差をσ=15 万円とする. 3. 何回かテストを受けて, その偏差値の平均を求めるとき, 誤差を 3 以下にするためには, 何回テストを受ける必要があるか. ただし, 母集団の標準偏差が 5 の場合と の場合, それぞれについて求めよ. 4.99 ページの練習問題 8 1

統計学 Ⅱ(16 11-1 章 1 章仮説検定練習問題 1. 過去 5 回の模擬テストの偏差値は,5,51,51,51,51 であった. (1 データの平均, 分散, 標準偏差を求めよ. ( 自由度 4 の t 分布の 97.5% 点, すなわち P( t a. 975 となる a を求めよ. (3 母平均 μ の信頼係数 95% の信頼区間を求めよ. 答えは信頼区間を求めた段階で, 小数第 位で四捨五入し, 小数第 1 位まで求めよ. (4 偏差値の平均が 5 を上回ったかについて,(3 の結果とあわせて簡単に理由をつけて答 えよ. (5 (4 を仮説検定の問題として次のように考えた. 文中の ( に最もよくあてはまる語句 数値を答えよ まず : 5,H : 5 というつの仮説を立てた. ここで H は ( H 1 仮説, H 1 は ( 仮説と呼ばれる.H が正しいとすると, X 5 T 1 は, 自由度 ( の t 分布に従うことがわかっている. そこで,T の実現値 t (t 値 を計算すると ( となる. 自由度 ( の t 分布で P( a t a. 95 を満たす a の値は t 分布表より ( である. t (t 値 の絶対値は a よりも大きいので, H は有意水準 ( % で ( される. したがって, 偏差値の平均は 5 ではないという結論が得られる. x x x ( x x 1 5 51 3 51 4 51 5 51 合計平均 信頼係数 95% の信頼区間の公式 ( x t.975, x t 1.975 1 13

統計学 Ⅱ(16 11-1 章. ある工場では, 内容量が 3 グラムとなるように缶詰を生産している. 生産された缶詰から無作為に選んだ5 個の内容量を調べたところ,99,99,99,3,31 ( 単位 : グラム だった. (1 データの平均, 分散, 標準偏差を求めよ. ( 自由度 4 の t 分布の 97.5% 点, すなわち P( t a. 975 となる a を求めよ. (3 母平均 μ の信頼係数 95% の信頼区間を求めよ. 答えは信頼区間を求めた段階で, 小数第 位で四捨五入し, 小数第 1 位まで求めよ. (4 この工場で生産される缶詰の内容量が 3 グラムを下回ったかについて, (3 の結果を もとに簡単に理由をつけて答えよ. (5 (4 を仮説検定の問題として次のように考えた. 文中の ( に最もよくあてはまる語句 数値を答えよ まず : 3, H : 3というつの仮説を立てた. ここで H は ( H 1 仮説, H 1 は ( 仮説と呼ばれる.H が正しいとすると, X 3 T 1 は, 自由度 ( の t 分布に従うことがわかっている. そこで,T の実現値 t (t 値 を計算すると ( となる. 自由度 ( の t 分布で P( a t a. 95 を満たす a の値は t 分布表より ( である. t(t 値 の値は a よりも絶対値が小さいので,H は ( 5% で ( されない. よって, 缶詰の内容量が 3 グラムであるという仮説は否定されない. x x x ( x x 1 99 99 3 99 4 3 5 31 合計平均 信頼係数 95% の信頼区間の公式 ( x t.975, x t.975 1 1 14