母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Similar documents
Microsoft PowerPoint - stat-2014-[9] pptx

EBNと疫学

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

情報工学概論

第7章

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - statistics pptx

基礎統計

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

_KyoukaNaiyou_No.4

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - statistics pptx

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

Microsoft PowerPoint - 測量学.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - Statistics[B]

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

不偏推定量

untitled

Microsoft PowerPoint - statistics pptx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft Word - Stattext07.doc

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

スライド 1

講義「○○○○」

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft PowerPoint - sc7.ppt [互換モード]

FdData中間期末数学3年

経営統計学

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft PowerPoint - Inoue-statistics [互換モード]

untitled

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

Microsoft Word - Stattext12.doc

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

PowerPoint Presentation

確ç”⁄ㆮå�ºæœ¬

2016年度 九州大・理系数学

データ解析

Probit , Mixed logit

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Medical3

様々なミクロ計量モデル†

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

Microsoft Word - apstattext04.docx

スライド 1

統計Ⅰ 第1回 序説~確率

2015年度 信州大・医系数学

統計的データ解析

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

モジュール1のまとめ

<4D F736F F D208CF68BA48C6F8DCF8A C30342C CFA90B68C6F8DCF8A7782CC8AEE967B92E8979D32288F4390B394C529332E646F63>

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎2.ppt

2014年度 名古屋大・理系数学

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

経済統計分析1 イントロダクション

Microsoft Word - 補論3.2

数学の学び方のヒント

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

3章 度数分布とヒストグラム

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

<4D F736F F D208C51985F82CD82B682DF82CC88EA95E A>

スライド 1

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft Word - 微分入門.doc

4 3. (a) 2 (b) 1 2 xy xz- x , 4 R1 R2 R1 R xz- 2(a) 2(b) B 1 B 2 B 1 B 2 2

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

Microsoft Word - Stattext13.doc

2011年度 大阪大・理系数学

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

2014年度 信州大・医系数学

数値計算法

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft Word - appendix_b

Microsoft Word - Stattext11.doc

Microsoft Word - lec_student-chp3_1-representative

2018年度 筑波大・理系数学

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

PowerPoint プレゼンテーション

Microsoft PowerPoint - CVM.ppt [互換モード]

DVIOUT

0415

DVIOUT-SS_Ma

Microsoft Word - apstattext05.docx

Microsoft PowerPoint - mp11-02.pptx

学習指導要領

<4D F736F F F696E74202D A6D82A982B3955D89BF82CC979D89F082C9954B977682C8939D8C768A7782CC8AEE91622E B8CDD8AB B83685D>

Transcription:

. 無作為標本. 基本的用語 推測統計における基本的な用語を確認する 母集団 調査の対象になる集団のこと 最終的に, 判断の対象になる集団である 母集団の個体 母集団を構成する つ つのもののこと 母集団は個体の集まりである 個体の特性値 個体の特性を表す数値のこと 身長や体重など 特性値は, 変量ともいう 4 有限母集団と無限母集団 個体の個数が有限の母集団を 有限母集団, 個体の個数が無限の母集団を 無限母集団 という 5 標本 サンプル 母集団から取り出した, いくつかの個体の集まりのこと 6 標本抽出 母集団から標本を取り出すこと 7 標本調査 母集団の特徴を推測するために, 標本抽出を行い, 抽出された標本を調べること 8 統計的推測 標本を用いて母集団の性質を推測すること 9 母集団の大きさ サイズ 母集団に含まれる個体の個数のこと これは, 有限母集団に対する用語である 0 標本の大きさ サイズ 標本に含まれる個体の個数のこと 無作為抽出 ランダムサンプリング 母集団の各個体を等しい確率で抽出する方法 無作為標本 ランダムサンプル 無作為抽出によって選ばれた標本 母集団分布 個体の特性値 を確率変数と考えたときの, の確率分布のこと 4 母平均 母分散 母標準偏差 の確率変数 の平均 E, 分散 V, 標準偏差 を, それぞれ, 母平均, 母分散, 母標準偏差という

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散, 母標準偏差などは, 母数である 統計的推測では, 母数を推測する. 大きさ の無作為標本の取り出し方 大きさ の無作為標本の取り出し方 母集団から大きさ の無作為標本を取り出すとは, 母集団から 個の個体を無作為に取 り出すことである これを 試行 と考える 試行 : 母集団 個の個体,,,,, が, 大きさ の つの無作為標本である, この取り出し方には, 以下の 通りの方法がある A 同時に取り出す方法 母集団から無作為に 個の個体を同時に取り出す方法である B 非復元無作為抽出 非復元で個体を 個ずつ無作為に取り出し, 全部で 個の個体を取り出す方法であ る 非復元とは, 母集団から取り出した個体は母集団に戻さずに, 次の個体を取り出 すことである C 復元無作為抽出 復元で個体を 個ずつ無作為に取り出し, 全部で 個の個体を取り出す方法である 復元とは, 母集団から取り出した個体は必ず母集団に戻してから, 次の個体を取り出 すことである 標本から母集団の特徴を推測するのが統計的推測である より良い推測を行うためには, かたよった標本ではなく, 母集団をよく反映するような標本を抽出する必要がある よく言われるように, 標本は 母集団の良い縮図 でなければならない そのために, 無作為抽出が基本になる 無作為抽出にすれば, どの個体の選ばれる確率も等確率になるので, 個の個体を取り出す という行為が, 確率における 試行 になる よって, 確率論が適用できる 無作為抽出にしなければ, その行為は試行にはならず, 確率計算ができない 個の個体の取り出し方には, 通りの方法がある 非復元抽出では, 個体を取り出すた

びに母集団から個体が減っていくので, 毎回の試行は, 試行として独立ではない 一方, 復元抽出では, 毎回, 全く同じ母集団から個体を取り出すことになるので, 毎回の試行は互いに独立である つまり, 独立試行になる 4 現実の標本調査は, 同時に取り出す である 例えば,00 人の意見を調べるために, 0 人を選んでアンケート調査をする この 0 人は, 同時に取り出された人たちである ただし, 以下の A や B は数学的に面倒なので,C の方法を考えていく 推測統計では C を考える 例母集団は 枚のカードからなり, 以下の図のように, カードには数字が書かれている このとき, 大きさ の無作為標本は, 取り出し方によって, 以下のようになる 母集団 標本抽出 大きさ の標本 枚のカード A 試行 : 無作為に 枚のカードを同時に取り出す 大きさ の無作為標本は右の通り 標本の個数 : C 各標本が選ばれる確率 :/ 4 標本は 組み合わせ 大きさ の無作為標本 {, {, {, } } } 標本が選ばれる確率 / / / B 試行 : 大きさ の標本の非復元無作為抽出 大きさ の無作為標本は右の通り 標本の個数 : 6 各標本が選ばれる確率 :/6 4 標本は 順列 大きさ の無作為標本 標本が選ばれる確率 大きさ の無作為標本 標本が選ばれる確率, /6, /6, /6, /6, /6, /6 C 試行 : 大きさ の標本の復元無作為抽出 大きさ の無作為標本は右の通り 標本の個数 : 9 各標本が選ばれる確率 :/9 4 標本は 重複順列 大きさ の無作為標本 標本が選ばれる確率 大きさ の無作為標本 標本が選ばれる確率, /9, /9, /9, /9, /9, /9,,, /9 /9 /9

. 大きさ の標本変量 標本変量の定義 母集団 の個体の特性値を で表す この母集団に対して, 次の試行 T を考える 試行 T : 大きさ の標本の復元無作為抽出 大きさ の標本,,, に対して, i 番目に取り出した個体 i の特性値を i で表すと, 標本から特性値の組が定まる i,,, 特性値の組,,, 各は, 試行 T の結果に対して値をとる変数になるので, 確率変数になる 4 この確率変数の組,,, を, 大きさ の標本変量と呼ぶ 5 試行 T の標本空間は, の 個の直積 であり,T の標本点 大きさ の無作為標本 とは, この直積の要素のことである 6 母集団 の大きさが N のときは, 大きさ の無作為標本の個数は N N N N 標本変量の性質大きさ の標本変量,,, について, 以下が成り立つ 確率変数,,, は独立である,,, のいずれの確率分布も, の確率分布 母集団分布 に等しい E E E E 母平均 4 V V V V 母分散 標本変量に関する注意テキストでは, 標本変量,,, るが, 以下では, 標本変量と呼ぶことにする を 大きさ の無作為標本 と呼んでい 上記のすべては自明である 前述したように, 復元無作為抽出は独立試行であるから,,,, が独立になることは, 自明である また, これらの確率分布が母集団分布に一致することも自明である 確率分布が等しいので, E E E E 4

V V V V となることも自明である 以下の例題を参照 試行 T は, 大きさ の標本の復元無作為抽出 であるが, これは, の 個の直積から つの要素を無作為に抽出する試行と同じである 母集団 大きさ の標本の復元無作為抽出 大きさ の無作為標本,,, 上と下は同じ試行 つの要素の,,, の 個の直積無作為抽出,,, 大きさ の無作為標本 大きさ の標本変量 個の独立な確率変数 統計学の解説書によっては, 母集団は, 個体の集まりではなく, 個体の特性値の集まりを指している場合も多い 例えば,000 人の学生の身長が調査対象の場合,000 人の学生ではなく,000 個の身長の数値の集まりを母集団とする さらに, 選ばれた 0 人の学生ではなく, 選ばれた 0 人の身長の集まりを標本と呼ぶ これは, 身長という特性値を決めれば, 関心があるのは身長のデータのみだからである このような考え方では, 標本は, 母集団から抽出された特性値 x の集まり x, x,, x を意味する 4 また, 無作為標本という用語は, 厳密には次のように定義される 確率変数,,, が独立であり, すべての i が同じ確率分布に従っているとき,,,, を 大きさ の無作為標本 という テキストは, この本来の定義に従っ て説明しているが, 抽象的であるので, ここでは,,, を標本変量と呼び, 実際 に選ばれた個体の集まりを無作為標本と呼ぶことにする i 例題 母集団 を, 次の数字の集まりとする また, その数字を で表す {,,, 4, 5, 6 } この母集団に対して, 次の試行を行う 試行 T : 大きさ の標本の復元無作為抽出 さらに, この試行から定まる大きさ の標本変量を,,, とする の確率分布を求めよ 5

,,, は独立であることを示せ,,, のいずれの確率分布も, の確率分布 母集団分布 に等しいことを 示せ 4 次が成立することを示せ E E E E V V V V 解説 母集団 {,,, 4, 5, 6 } から 個の個体を無作為に選ぶという試行と, 個のサイコロを 回投げるという試行は同じである さらに, から, 復元で個体を 個ずつ無作為に取り出し, 全部で 個取り出すという試行 T は, 個のサイコロを 回投げるという試行と同じである よって, サイコロ投げで表現すれば, 標本変量,,, における i とは 個のサイコロを 回投げたときの, i 回目に出た目の数のことである 従って,,,, が独立であること, i の確率分布が次のようになることは自明である さらに, これは の確率分布 母集団分布 と一致する i 4 5 6 計 4 5 6 計 P / 6 / 6 / 6 / 6 / 6 / 6 P / 6 / 6 / 6 / 6 / 6 / 6 確率分布が等しいので,4 の等式も自明になる 例題 枚のカードからなる母集団があり, 数字 のカードは 枚, 数字 のカードは 枚とする カードの数字を とし, この母集団に対して, 試行 T : 大きさ の標本の復元無作為抽出 を考え, 大きさ の標本変量を, とする 母集団 試行 T : 大きさ の標本の復元無作為抽出 大きさ の標本 大きさ の標本変量,, 枚目のカードの数字 カードの数字 枚目のカードの数字 の確率分布, の確率分布, の確率分布を求めよ 大きさ の無作為標本をすべて求めよ 6

解説 復元無作為抽出であるから, の確率分布も, の確率分布も, の確率分布 母集団分布 に等しいので, 次のようになる 計 計 計 P / / P / / P / / また, 大きさ の無作為標本の個数は 9 であり, 右のようになる 数字 のカードは 枚あるが, これらは異なる個体なので区別する 大きさ の無作為標本 大きさ の無作為標本,,,,,,,,, 4. 標本平均の定義 標本平均の定義大きさ の標本変量,,, から作られる式 を, 大きさ の標本平均といい, で表す すなわち, i i は, 試行 T : 大きさ の標本の復元無作為抽出における確率変数になる の実現値とは, 標本,,, の平均値 x のことである 標本平均 の実現値とは, 標本,,, から定まる特性値の組を x, x,, x で表したとき, x, x,, x の平均値 x のことである すなわち, の 実現値は, 抽出された標本の平均のことである 試行 T の結果 標本点 は, 大きさ の無作為標本,,, 7

8 であり, は, 各標本点に対して値が定まる変数であるので, 確率変数になる 5. 標本平均の平均と分散復元無作為抽出の場合は, 標本平均の平均や分散が容易に計算できる 定理 標本平均の平均と分散 母平均, 母分散の母集団からの大きさの標本変量について, 次が成り立つ 個体の特性値は とする 標本平均 の平均は, 母平均に等しい すなわち E E 標本平均 の分散は, 母分散を標本のサイズで割ったものに等しい すなわち V V 大数の法則 標本のサイズを大きくしていけば, 標本平均の実現値は母平均に近づいていく 証明 の証明は容易である E E E E E E また, は独立であるから, V V V V V V の大数の法則も, より自明である 実際 より, の平均は, 常に母平均に一致する 一方, より, 標本のサイズを大きくしていけば, の分散の値は 0 に近づいていくので, の実現値のばらつきがどんどん小さくなり, その実現値は平均のまわりに集まってくるのである なお, のときは, である,,,,,, /

例 標本平均 の平均 E は, のすべての実現値 標本の平均 の平均ことである これが, 母平均に一致するという事実は, 非常に重要である 簡単な例で確認しておこう いま, 母集団は, 数字が書かれた 枚のカードからなり, 従って, 標本平均は 数字 のカード 枚 数字 のカード 枚 数字 のカード 枚 とする カードの数字を とし, 母集団からの大きさ の標本変量, の確率分布 母集団分布 は, 当然, 次のようになる を考える 従って, 母平均 と母分散 は, 次のとおり は,, の平均, は,, の分 散のことである ここで, の平均や分散はすぐに分かるが, あえてその確率分布を求めて計算してみよう {,, } とおくと, の標本空間は である 試行 T : 大きさ の復元無作為抽出 であり, 標本の個数は 9 9 個の標本点に対する の実現値は, 右の通りであり, この 9 個の実現値の平均が E である 確率を求めると, 例えば,, と, であるから, P.5 計 P / / / E V E E 9.5 となる標本点は この確率は,9 個の実現値における.5 の相対度数である 従って, の確率分布は次のようになる 4 9 4 標本 母集団 の実現値,,.5,,.5,,.5,,.5, 9

.5.5 計 P / 9 / 9 / 9 / 9 / 9 よって, E.5.5 9 9 9 9 9 V 9.5 9 9.5 9 9 従って, 確かに次が成立している E 母平均, V 母分散 標本のサイズ なお, 標本平均 の確率分布を図示すれば次のようになり, 正規分布のような形になってい る そこでは, 母平均 での確率が最大であり, 左右対称のグラフになっている 0.5 0.4 0. 0. 0. 0.5.5 6. 中心極限定理 母集団分布は正規分布であるとは限らないし, また, その形が想定できない場合も多い しかし, 標本平均を考えると, どのような母集団であっても, 標本のサイズをある程度大きくすれば, 標本平均の分布は近似的に正規分布になるということが, 以下の中心極限定理で保証されている この定理は, 統計学における著しい結果であり, 最も重要な定理である 中心極限定理を実際に適用できるのは, 大標本の場合である 大標本とは, 標本のサイズ が大きい標本のことであるが, の値の基準値は解説書によって多少異なる ここでは, 0 の場合を, 大標本と呼ぶことにする 0

中心極限定理 母平均, 母分散 の母集団からの大きさ の標本変量,,, について, を大きくしていけば, 標本平均 の確率分布は, 正規分布 N, に限りなく近づいていく 特に, 大標本 0 の場合は, ~ N, と見なしてよい よって, このとき を標準化して Z とおくと, Z ~ N 0, となる 7. 正規母集団の標本平均 定理 正規母集団の場合 正規母集団 N, からの大きさ の標本変量,,, について, の値に 関係がなく, 標本平均 は正規分布に従う すなわち ~ N, 母集団分布が正規分布をなしている場合, その母集団を正規母集団という つまり, 母集団の個体の特性値を としたとき, の確率分布がすでに正規分布に従っ ている場合, すなわち, ~ N, であるとき, この母集団を正規母集団 N, と表現する 正規母集団に対して, 復元無作為抽出を行った場合は, 標本のサイズ に関係がなく, 標本平均 は正規分布に従う 4 上記の定理は, 正規分布の再生性から, ただちに導かれる,,, i のいずれの確率分布も, 母集団分布 N, に等しいので, ~ N, i,,, よって,p.7 の定理から, とにかく,,, の 次結合である

は正規分布をなすので, ~ N E, V 一方,p.80 の定理より, E E, V 従って, ~ N, となる V 例題 A 地方の中学 年生全体に実施されたテストの成績は平均点 6.5 点, 標準偏差 8 点であった このとき, この地方の中学 年生から無作為抽出した 00 人の平均点が 64 点以上になる確率を求めよ 母集団 A 地方の中学 年生全体 母平均 母標準偏差 6.5 8 無作為抽出 00 標本平均 の実現値大きさ 00 の標本 64 解説 詳しく説明しよう このような問題では, まず, 母集団はどれであるかに注意する必要があ るが, ここでは, 明らかに A 地方の中学 年生全体が母集団である 従って, 母集団のサイ ズは非常に大きいと判断できるので, 復元の議論を適用してよい これについては後述 この問題は, 大きさ 00 の標本平均 について, 確率 を求めよという問題である 標本のサイズは 00 であるから, 0 であり, 大標本である よって, 中心極限定 理により, は正規分布 8 N, すなわち N 6.5, 00 に従うと考えてよい 正規母集団であれば, の値に関係なく, はこの正規分布に従って いる P 64

8 8 の標準偏差は, 0. 8 でり, を標準化して 00 0 6.5 Z 0.8 とおくと, Z ~ N 0, である よって, P 64 P 64 P Z 64 6.5 0.8 P Z.88 0.9699 0.00 上記のような計算はワンパターンであり, 結局, の確率分布が分かるわけであるから, それに関する確率計算はいくらでもできる 上記の結果には, 次のような意味がある 母集団から 00 人抽出したとき,00 人の平均点が 64 点以上になる確率は, 約 0.0 である 非常に小さな値である 大ざっぱに言えば,00 人抽出するという試行を 00 回繰り返したとき, 抽出した 00 人の平均点が 64 点以上になる場合は 回程度しか起こらないということである 00 回中 回程度しか起こらないような出来事は, 非常に珍しい現象である 逆に言えば, 現実に行った 回の試行で,00 人の平均点が 64 点以上になることは, ほとんどないといってよい このような考え方が, 統計的仮説検定の基礎になる 8. 非復元抽出の場合 中心極限定理は復元抽出の場合の話であるが, 非復元抽出ではどのようになるのだろうか 問題は, 大きさ の標本,,, から決まる確率変数,,, の独立性で ある 母集団のサイズ N が非常に大きく, 標本のサイズ がそれほど大きくない場合は, 非復元 抽出であっても復元抽出と考えてよい 例えば, 母集団のサイズが N 000 であり, 標本のサイズが 0 の場合, 非復元で 最初に 個の個体を取っても, 個目の個体 を取るときは母集団には 999 個の個体が 残っている 個目の個体を取るときは, 母集団にはまだ 998 個の個体が残っている 個目や 個目にどのような個体を取っても, そのことが 個目の個体の抽出結果に大きな影響を与え るとは考えにくい 標本のサイズも 0 であるので, 個の個体を取る試行を 0 回繰り返す操作は, 各 回の結果が他の回には影響を与えない試行, つまり 0 回の独立試行と考えてよい よって, この非復元抽出は, 復元抽出と考えてよいだろう もちろん, 標本のサイズが 00 のような大きな値になれば,00 個の個体を取る試行は, 00 回の独立試行とは考えられない このように, 標本のサイズ に比べて母集団のサイズ

N が大きい場合は, 非復元抽出であっても復元抽出と考えてよく,,,, であると見なして良い は独立 4 このことを, 標本の個数で確認してみよう 母集団のサイズを N, 標本のサイズを とす ると, 以下のようになる 非復元抽出の場合 大きさ の標本,,, の個数は N P 復元抽出の場合 N 大きさ の標本,,, の個数は N P N であるが, ここで P / N を計算すると, これは, に比べて N が非常に大きいときは, P / N の値は に近くなり, P N を示す つまり, 上記の と の個数がだいたい等しくなってしまい, 非復元と復元の違い が少なくなるのである 5 統計的推測は, 一般に, 無限母集団を想定して議論される 無限母集団とは母集団の個体 が無限に多くある母集団のことだが, 実際には, 次のような場合は, 無限母集団と見なして 議論するのが普通である 母集団のサイズが非常に大きい場合 個体が無限に多くあると考えられる場合 母集団のサイズが標本のサイズと比べて大きい場合 実用的には, 有限母集団でも 母集団のサイズ 標本のサイズ 0 を満たすときは, 通常は無限母集団と考えてよい このような無限母集団では, 非復元であっても復元の議論を適用してよい 6 以下のような場合は, 通常, 無限母集団と見なされる 日本の全有権者が母集団であり, 調査のために 000 人の有権者を標本とした場合 ある物を多数回測定して得られるであろう測定データの全体を母集団とし, 実際に測定 して得られた 5 個の測定データが標本の場合 この場合は, 母集団は, 無限回測定した と仮定しての測定データの全体であると判断する N N P N N N { N } N N N N N ある工場で多数生産される部品 A の品質特性 厚さ, 強度など を調べるために, 生産 N N 4

される部品 A の全体, すなわち, 生産された部品 A のみならず, これからも生産されるであろう部品 A の全体を母集団と考えた場合 4 新しく開発した血圧を下げる薬の効能を調べるために, マウスを何匹か選んで実験する場合 この場合, 実験対象となるマウスは多数であり, 正確にその数が分からないのが普通である 従って, 実験対象のマウス全体を無限母集団と考える 逆に言えば, 有限母集団と見なすと, そのサイズを求めるために, マウスの数を数えなければならないことにもなる 7 実際の標本抽出では, 復元における各種の定理が使われていくが 無作為抽出でない場合 無限母集団と見なされない場合 標本のサイズに比べて母集団のサイズがあまり大きくない場合などは, 各種の定理の成立が保証されない状況になる 従って, このような場合は, 統計的推測を慎重に行う必要がある 8 なお, 統計学入門における練習問題のほとんどは, 上記の意味での無限母集団を仮定している 従って, 非復元であっても, 復元の議論 中心極限定理など を適用してよい 5