統計学 Ⅱ(06) 0 章 0 章統計学の基本的な考え方データ = 母集団から抽出された標本とみなす実際に標本抽出されたデータ視聴率, 失業率そうでないデータ GDP, 株価, 為替レート, 試験の得点このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

統計学 Ⅱ(06) 0 章 0 章 0 章標本抽出と標本分布. 母集団と標本 () 視聴率調査 () 有限母集団と無限母集団 (3) データと母集団. 標本抽出法 () 全数調査と標本調査 () 無作為抽出と有意抽出 (3) 単純無作為抽出法 (4) 層別抽出法 (5) 多段抽出法 (6) 系統抽出法 (7) その他の抽出法 3. 標本平均の標本分布 () 標本平均の標本分布の例 () 標本平均の標本分布の平均 (3) 標本平均の標本分布の分散 (4) 有限母集団からの標本平均の標本分布 4. 統計量の標本分布と比率への応用 () 標本分布の考え方 () 統計量とパラメータ, 推定量と推定値 (3) 標本比率の標本分布 (4) 標本比率の標本分布の平均と分散 5. 中心極限定理 () 母集団分布が正規分布の場合 () 中心極限定理 (3) 中心極限定理の応用 6. t 分布 () t 統計量とt 分布 () t 分布表 7. 歪度統計量と尖度統計量の分布母集団と標本 () 視聴率調査名古屋地区である番組をみた人がどのくらいの割合かを表す例ある番組の視聴率が0% であった名古屋地区の0% の人が, その番組を見ていた? 教科書 4-3 ページ自分は調査されていない名古屋地区に住んでいる人すべてを調査してない参考視聴率調査はビデオリサーチによる http//www.videor.co.jp/ide.htm 名古屋地区全体 ( 愛知, 岐阜, 三重の大部分 )................... 視聴率調査のしくみ標本抽出推定調査世帯 (600 世帯 )..... 0% の視聴率?% あくまでも調査した本当に知りたいが視聴率 ( わからない ) 世帯の0% 視聴率調査の対象人口世帯数愛知県 7,40,79,933,80 名古屋市,63,894,0,7 岐阜県,080,773 737,5 三重県,854,74 704,607 三県合計,8,89 4,44,50 資料総務省平成年国勢調査視聴率の調査対象エリアは,3 県のすべてではない愛知県の30 市 6 郡 7 町, 岐阜県の4 市 4 郡 4 町, 三重県の5 市郡 4 町対象は約 375 万千世帯 ( 約 9 万千人 ) 600 0.0006 0.06% しか調査していない 375000 抽出率母集団と標本母集団 (populatio) 本当にしりたい対象 (e. 視聴率の名古屋地区全体 ) 通常は, 調査不可能費用, 時間, 労力標本 (sample) 実際に知ることができる対象 (e.600 世帯 ) 特定の調査対象を何らかの基準によって選ぶほとんどの統計調査は, 標本調査標本から得られた結果 = データ標本調査における課題母集団から, どのように標本を選ぶか標本抽出法 (0 章 ) 標本の結果から, 母集団を情報をどのように予想するか統計的推論推定 ( 章 ),( 仮説 ) 検定 ( 章 ) () 有限母集団と無限母集団母集団の大きさ N 標本の大きさ ( データの個数 ) 視聴率調査母集団の大きさNは有限有限母集団全数調査をすれば, 母集団の情報を知ることができる無限母集団母集団の大きさNが無限サイコロでの目が出る確率を推定するある工場で生産される電球の寿命時間の平均を推定する Nが有限であっても, Nが十分大きければ無限母集団とみなす第章 (4-5 ページ ) 参照

統計学 Ⅱ(06) 0 章 0 章統計学の基本的な考え方データ = 母集団から抽出された標本とみなす実際に標本抽出されたデータ視聴率, 失業率そうでないデータ GDP, 株価, 為替レート, 試験の得点このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0. 理由データ = 標本とみなすことによって様々な統計的手法を適用することができる () 全数調査と標本調査全数調査 ( センサス ) 母集団全体を調査する実施はむずかしい標本抽出法費用, 時間例総務省国勢調査経済センサス標本調査母集団のすべてではなく, その一部を調査するほとんどが標本調査教科書 3-38 ページ視聴率調査標本調査の例関東関西名古屋地区 600 世帯 ( 名古屋地区は以前は50 世帯 ) 九州, 札幌, 仙台地区など 00 世帯失業率総務省労働力調査母集団全国の5 歳以上人口 ( 約億千万人 ) 標本約 0 万人家計の所得貯蓄など総務省家計調査母集団全国の約 508 万世帯 ( 平成年国勢調査による ) = 二人以上の世帯 (3506 万世帯 )+ 単身者世帯 (5 万世帯 ) 標本約 9000 世帯二人以上の世帯 8076 世帯 + 単身者世帯 673 世帯その他ほとんどの調査 ( 内閣支持率, 様々なアンケート調査, 民間給与実態統計調査 ) () 無作為抽出と有意抽出抽出される標本母集団を代表するものでなければならない特定の集団に偏った標本はよくない例視聴率調査で, 特定の年齢層だけを標本に選ぶ街頭インタビュー大統領選挙の例特定の人に偏らないように, 標本をいかに抽出するかを考えるランダムサンプリングと有意抽出偏りのない標本をどのように抽出するかくじびきの原理で抽出ランダムサンプリング ( 無作為抽出法 ) 無作為 ( 確率的 ) に標本を抽出有意抽出 ( ランダムサンプリング以外の抽出 ) 確率的に標本抽出するのではない恣意的に標本を抽出街頭インタビュー, ヒアリングインターネットによる調査調査対象を募集する ( モニター募集など ) 偏った標本なので, 母集団の推定が効率的に行えないランダムサンプリングから得られた標本だと, 標本から母集団への推定がうまくいく独立性を確保できる (3) 単純無作為抽出法偏りのない標本を抽出する特定の人が選ばれやすくならないようにするどの標本も選ばれる確率が等しくなるように標本を抽出する =くじびきの原理単純無作為抽出法 (Simple Radom Samplig) SRS, シンプルランダムサンプリング単にランダムサンプリングと呼ぶこともある

統計学 Ⅱ(06) 0 章 0 章 ( 単純 ) 無作為抽出の抽出方法. 母集団に番号をつける. 母集団の番号ぶんだけのくじをつくる 3. よくかきまぜて, 調査する数 ( 標本の大きさ ) だけくじをひく 4. 選ばれた番号を標本として, 調査対象とする乱数の利用実際はくじのかわりに, 乱数 ( 表 ) が用いられる乱数における数字 (e. 34ページ表 0 ) 数字の並び方に特定の規則はない出やすい数字はないケタの数0 9までの0 個の数字の出てくる頻度はほぼ同じケタの数00 99までの00 個の数字が出てくる頻度はほぼ同じ以下同様に,3ケタ,4ケタ並びやすい数字はない e. のあとにが出やすいなどはない ( のあとの数字は, どの数字もほぼ同じ頻度で出現する ) ランダムサンプリングの例 ( 例 ) 母集団 400 人から5 人の標本を選ぶ. 母集団に,,,400の番号を振る. 乱数表の適当な箇所をスタート地点に選ぶ ( サイコロを振る, 目をつぶって指をあてる ) e. サイコロを回振ったら5と3が出た 5 行目,3 個目の数字からスタート 3. スタート地点から3ケタずつ数字を拾う母集団の大きさが400で3ケタだから 40よりも大きい数字だったら飛ばす 400 以下の数字が5 個出てくるまで数字を拾っていく 9,035,(44),0,309,(98),33 Ecelでの乱数発生 RAND 関数,RANDBETWEEN 関数乱数で同じ番号が出てきたら? 同じ番号が選ばれた場合の対処の仕方. 回目 ( あるいはそれ以上 ) 以降は飛ばす重複を許さない抽出 ( 非復元抽出 ). 同じ番号の人は人分とみなす重複を許す抽出 ( 復元抽出 ) どちらの方法でもよい実際には重複を許さない抽出がとられることが多い ( 同じ人は選ばない理論的には重複を許す抽出の方が正しい有限母集団と無限母集団の項を参照有限母集団における抽出復元抽出と非復元抽出の例簡単な例母集団 =5 人 ( 有限母集団 ) 視聴率調査を考え,5 人のうち3 人が母集団標本 a ある番組を見ていたとする b 母集団の視聴率 =0.6 c 人の標本を抽出する p 0.6 d e 重複を許さない抽出 ( 非復元抽出 ) 人目を抽出するとき, 母集団の視聴率は0.6 もしbが選ばれたら, 人目を抽出するときの母集団視聴率は0.5 同一の母集団視聴率から標本を選べない重複を許す抽出 ( 復元抽出 )無限母集団と同じ人目を抽出しても, 母集団に戻して人目を抽出する常に同一の視聴率から標本を抽出でき, 独立性も確保される (iid) 復元抽出と非復元抽出有限母集団における標本の選び方同じ対象を重複して選んでもよい重複を許す抽出 ( 復元抽出 )無限母集団と同じ同じ対象を度選ぶことはしない重複を許さない抽出 ( 非復元抽出 ) 非復元抽出だと iid にならない同一の母集団からの抽出 iid 独立性復元抽出の方が理論的には望ましいただしNが十分大きければ, 非復元抽出でも,iidと考えることができる 3

統計学 Ⅱ(06) 0 章 0 章ランダムサンプリングの問題点ランダムサンプリング偏りのない標本抽出の基本しかし, 結果として, 偏った標本となり得る ( くじなので, 何が起こるのかはわからない.e. 女子だけが選ばれる ) 母集団を代表する保障はない母集団の完全なリストも必要になるランダムサンプリングを若干修正した標本抽出法が考えられている層化 ( 層別 ) 抽出法多段抽出法系統抽出法実際には, これらの方法がよく用いられている (4) 層化抽出法 ( 層別抽出法 ) 事前に母集団をいくつかのグループ ( 層 ) に分ける各グループ ( 層 ) ごとにランダムサンプリングを行う標本の大きさは, 母集団の各層の大きさに比例させる母集団に関する事前の情報を利用する................... 母集団ランダムサンプリングランダムサンプリングランダムサンプリングランダムサンプリング層化抽出法..... 標本 e. 学生の通学時間調査全学の男女比が 8 であれば 00 人の標本をとるとすると男 60 人, 女 40 人の標本結果として, 偏った標本になることはないしかし, 純粋なシンプルランダムサンプリングとは異なる層化抽出法におけるグループ ( 層 ) 分析の結果に大きな影響を与えると思われる主な属性で, 母集団をグループ分けをする都市階級地域事業所規模 ( 従業員規模 ) 性別年齢大きな影響を与えない属性は用いない層は細かくしすぎない例総務省家計調査県庁所在地, 政令指定都市, 都市階級と地域によって, 市町村を層別して抽出 ( 都道府県はなく, 県庁所在地 ) 国税庁民間給与実態統計調査従業員規模によって, 事業所を抽出 (5) 多段抽出法地域を先に抽出する ( ランダムサンプリングによる ) e. 市町村の抽出調査区の抽出選ばれた地域の中で, ランダムサンプリングによって, 世帯個人を抽出する多段抽出法の利点調査地域が散らばらない時間費用などの面から効率的母集団の完全なリストは必要ない例. 総務省統計局家計調査市町村の抽出国勢調査の調査区を抽出世帯を抽出市町村の抽出は層化抽出層化 3 段抽出 (6) 系統抽出法母集団に割り振られた番号を, 一定の間隔で選んでいく例 800 人から0 人を選ぶ 800 0=40 人に人ずつ抽出する ~40, 4~80, 8~0,,76~800からそれぞれ人を抽出最初の番号を,から40の中から乱数で選択 e.7 7,57,97,,777を標本として抽出より一般的に間隔 = 母集団の大きさ標本の大きさ m N / 最初の番号は乱数で選択 (~mよりつ選択 =K) 選択された乱数に間隔を加えていく系統抽出法 = 等間隔抽出法 K, K m, K m,, K ( ) m 系統抽出法の例視聴率調査 ( ウェブサイト参照 ) 4

統計学 Ⅱ(06) 0 章 0 章 (7) その他の標本抽出法確率比例抽出法 RDD 様々な標本調査法については, 島崎哲彦大竹延幸編 (03) 社会調査の実際学文社などを参考のこといずれの標本抽出法も, ランダムサンプリングが基本になっている教科書 38-44 ページ 3 標本平均の標本分布基本的な考え方データ= 母集団からの標本知りたいのは母集団の情報母集団から, どのように標本を選ぶか標本抽出法 =ランダムサンプリングが基本標本の結果から, 母集団の情報をどのように予想 ( 推定 ) するか標本分布という考え方をもとに推定などを行う () 標本平均の標本分布の例 (38 4 ページ ) N=00 の母集団から大きさ =8 の標本を抽出抽出される標本の組合せを考える重複を許す抽出繰り返し標本を抽出すると, 各標本で標本平均を計算することができるその分布を標本平均の標本分布という表 0, 図 0 3 母集団 N=00,, 3, 99, 00 標本 60, 4, 5 38.375 標本 5, 5, 53.65 8 標本 00 58, 38, 45 5 標本分布のイメージ母集団.............. 標本確率変数,.... 実現値 ( データ ),,, 標本確率変数,,, 標本標本の標本分布実現する前の確率変数として, 標本平均を考える母集団分布の分布 = 母集団分布母集団..............,, 標本 = データ,, の分布 = 母集団分布データ,,, の背後に確率変数,,, を考える ( 母集団 ),,, に共通の母集団分布を想定する (iid) 標本平均の標本分布の例例教科書練習問題 3(6ページ ) N=4の母集団 (0,0,40,90) から =の標本を抽出 ( 重複を許す抽出 ) = N=4 0 0 0 40 90 0,0 = 0,0 5 5

統計学 Ⅱ(06) 0 章 0 章母集団分布母集団分布と特性値 ( 通常は未知 ) i i i -μ ( i -μ) 0 0 3 40 4 90 合計平均分散標準偏差階級度数 0-0 3 0-40 0 40-60 60-80 0 80-00 合計 4 0 母集団分布答. 母平均 μ=35 母分散 σ =5 母標準偏差 σ=35 0 40 60 80 00 標本平均の標本分布 ( 無限母集団 ) 4 =6 通りの標本が考えられる 6 通りの標本番号標本標本平均 0 0 0 0 0 5 3 0 40 0 4 0 90 45 5 0 0 5 6 0 0 0 7 0 40 5 8 0 90 50 9 40 0 0 0 40 0 5 40 40 40 40 90 65 3 90 0 45 4 90 0 50 5 90 40 65 6 90 90 90 標本平均の標本分布 6 4 0 標本平均の標本分布 0 40 60 80 00 母集団 0,0,40,90 母平均 μ=35 母分散 σ =5 母標準偏差 σ=35 階級度数相対度数 0 以上 - 0 未満 4 0.5 0-40 4 0.5 40-60 5 0.35 60-80 0.5 80-00 0.065 合計 6.00 0.4 0.3 0. 0. 0 標本平均の標本分布 0 40 60 80 00 標本平均の標本分布の平均と分散 ( ) 0-35 5 5-30 900 3 0-5 5 4 45 0 00 5 5-30 900 6 0-5 65 7 5-0 00 8 50 5 5 9 0-5 5 0 5-0 00 40 5 5 65 30 900 3 45 0 00 4 50 5 5 5 65 30 900 6 90 55 305 合計 560 0 9800 平均 35 分散 6.5 標準偏差 4.75 標本平均の標本分布の平均は母平均に等しい標本平均平均 =35 母集団 0,0,40,90 母平均 μ=35 母分散 σ =5 母標準偏差 σ=35 の標本分布の = 母平均 μ 分散 =6.5 母分散 σ 5 標準偏差 =4.75 分散は母分散よりも小さい平均すると, もとのデータより真ん中に集まる標本平均の標本分布の平均 =μ( 母平均 ) 標本平均の標本分布分散 = 標準偏差 = 標本平均の標本分布の意味によってを推定する根拠を与える個個のはを当てることはできない有限母集団 ( 重複を許さない抽出 ) の場合は 44 ページ参照 (N が大きければ同じ結論 ) () 標本平均の標本分布の平均,,, iidデータ( ランダムサンプリングによる標本 ),,, iid ( 互いに独立に同一の分布に従う ) 標本平均の標本分布の平均 E( ) E ( ) E( ) E( ) E( ) E ) E( ) E( ) ( (3) 標本平均の標本分布の分散標本平均の標本分布の分散は, 母集団分布の分散より小さい分散の大きさ Var( ) Var ( ) Var( Var( ) Var( ) Var( ) Var( ) Var( ) Var( ) ) 6

統計学 Ⅱ(06) 0 章 0 章実現した個々のはμと等しくない一般的に標本平均の標本分布の特徴 () 平均しかし, の標本分布の平均はμに等しい全体としてみれば ( 平均すれば ), は μ をうまくあてているをμの推定値として用いる根拠を与える但し, 実際にはつの標本, が実現するの標本分布標本平均の標本分布の特徴 () 分散個々のは μ と等しくない正確には μ を当てることはできないの標本分布の分散はを大きくすれば, 分散は小さくなる分散が小さくなると, 実現するは μに近づいていく標本平均の標本分布の特徴 (3) 分布の形母集団分布は左右対称の分布標本平均の標本分布は左右対称になる母集団分布は左右対称のきれいな形の分布をしていなくても標本平均の標本分布はほぼ左右対称になる母集団分布標本平均の標本分布教科書 45-50 ページ 4 統計量の標本分布と比率への応用 () 標本分布の考え方標本平均, 標本分散 y h,,, 実現値 ( データ ) の関数データを実現させる確率変数を考える,,, は,,, から一定の確率で実現した Y=h(,,, ) も確率変数で, 確率分布をもつ= 標本分布 (samplig distributio) () 統計量とパラメータ, 推定量と推定値統計量 Y=h(,,, ) 標本からある特性値を計算するための公式統計量は確率変数統計量の実現値 y=h(,,, ) 確率変数ではない ( 既知 ) パラメータ母集団の特性値 ( 本当に知りたいこと ; 未知 ) 母 ( 集団 ) 平均, 母 ( 集団 ) 比率, 母 ( 集団 ) 分散推定量 (estimator) パラメータを推定するための統計量確率変数推定値 (estimate) 推定量の実現値確率変数ではない母集団の情報 ( 未知 ) 母比率 p 母平均 μ 母分散母標準偏差パラメータと統計量の例推定パラメータ母集団における特性値 ( 本当に知りたい値だが, 未知 ) 確率変数標本比率標本平均標本分散 S 標本標準偏差統計量標本の情報 ( 既知 ) 確率変数の実現値 pˆ S s s 7

統計学 Ⅱ(06) 0 章 0 章比率と平均比率は, 0 データの平均例コインの5 回投げたら回表が出た, 表が出る比率 ( 割合 )=/5=0.4 i 表が出たら, 裏が出たら0をとる変数 5 回のうち回表がでた,,0,0,0 0データの平均 0 0 0 0.4 比率 5 5 比率と平均は同じものしたがって標本分布も比率と平均ではほとんど同じ ( 母 ) 比率がpのとき平均 p 分散 p(-p)=pq ( ただし,q=-p),0 データの平均と分散教科書 50 ページ参照 i i i p ( i p) 0.6 0.36 0.6 0.36 3 0-0.4 0.6 4 0-0.4 0.6 5 0-0.4 0.6 合計 0. 平均 0.4 分散 0.4 p pq pがわかれば分散もわかる ( パラメータはつ ) e. p=0.8の場合, 分散 =pq=0.8 (-0.8)=0.8 0.=0.6 標本比率の標本分布標本比率 = 標本平均 i か0をとる確率変数 i, 0 標本比率は標本平均で表せるただし, P ( i ) p, P ( i 0) pq i の平均 =p i の分散 =pq 標本比率の標本分布の平均と分散 ~ 標本平均の場合とほとんど同じ平均 = 母平均 = 母比率 p 分散 = 母分散 (pq) i i (3) 標本比率の標本分布例教科書練習問題 4,63 ページ標本番号標本データ標本比率 a a.0 a b.0 3 a c 0 0.5 4 a d 0 0.5 5 a e 0 0.5 6 b a.0 7 b b.0 8 b c 0 0.5 9 b d 0 0.5 0 b e 0 0.5 c a 0 0.5 c b 0 0.5 3 c c 0 0 0.0 4 c d 0 0 0.0 5 c e 0 0 0.0 6 d a 0 0.5 7 d b 0 0.5 8 d c 0 0 0.0 9 d d 0 0 0.0 0 d e 0 0 0.0 e a 0 0.5 e b 0 0.5 3 e c 0 0 0.0 4 e d 0 0 0.0 5 e e 0 0 0.0 合計平均 0.0 0.4 母集団 N=5 (,,0,0,0) 母比率 ( 平均 ) p=0.4 母分散 pq=0.4 0.6=0.4 ただし,q=-p 標本平均の場合と同様 p 0.4 標本比率の標本分布平均 =0.4 = 母比率 p 分散 =0. 母分散 pq 標準偏差 =0.34 母集団 a b c d e 4 0 8 6 4 0 0 0.5 pq 0.6 0.4 標本 (4) 標本比率の標本分布の平均と分散標本比率の標本分布の平均 =p( 母比率 ) pq 分散 = 標準偏差 = ( q p) pq 5 中心極限定理 () 母集団分布が正規分布の場合データ iid データであること平均分散分布の形母集団分布正規分布教科書 50-55 ページの標本分布正規分布 8

統計学 Ⅱ(06) 0 章 0 章 () 中心極限定理母集団分布が一般の場合データ iid データが大きい平均分散分布の形母集団分布の標本分布? 正規分布母集団分布標本平均の標本分布標本平均の基準化の標本分布の平均 =μ, 分散標準偏差基準化する Z Zの平均は0, 分散は( 標準偏差は) また, は正規分布にしたがうので,Zも正規分布にしたがう= 中心極限定理 Z ~N(0,) 条件,,, iid 大きい中心極限定理のイメージ母集団 N.............. 標本標本標本標本 N(, ) z z z z の標本分布 ~ Z~N (0,) 中心極限定理データが独立に同一の分布から抽出され (iidデータ) 標本の大きさが十分大きいとき母集団分布がどのような形の分布でも, Z は標準正規分布 N(0,) で近似できる母集団分布標本平均の標本分布 N(, ) 教科書 53 ページ Z の分布 0 N(0,) 標本比率に関する中心極限定理標本比率の標本分布の平均 =p( 母比率 ) 分散 = 標準偏差 = pq pq Z が大きければ, は正規分布 pq N( p, ) で近似できるを基準化 p ~N(0,) pq (3) 中心極限定理の応用 p.54 例題 0. 母集団................... 0.5% 4 % 標本 =5..... P( 0) 0 P( ) 0 0.5 P( Z ) 5 P( Z.5) 0.8944 9

統計学 Ⅱ(06) 0 章 0 章 6 t 分布 () t 統計量と t 分布 i ~N(μ,σ ) のとき iid Z ~N(0,) ただし,μ と σ は一般に未知 σを計算可能な値で置き換える標本標準偏差 S S 置き換えた値を T とする (も-で置き換える) T S S 教科書 55-6 ページ S i ( μ を推定するため ( 章で利用 ) T t 統計量 i ) t 統計量のイメージ母集団 N.............. 標本標本標本標本の標本分布基準化 σをsで置き換え z t s z t s z t s z t s N(, ) Z~N(0,) T ~ 自由度 -のt 分布 t 統計量と t 分布 t 統計量 T は, 標準正規分布 (0,) S ではなく, 自由度 m= の t 分布に従う t 分布では, 標準正規分布より,0から離れた値をとる確率が高い ( スソの厚い分布 ) 左右対称の分布で, 平均は 0 T m S と書くこともある t 分布の形状 t 分布は, 自由度 ( データ数 ) によって形が変わる自由度 =- ET m 0 Var 自由度が大きくなると,t 分布は標準正規分布に近づく t 分布データが少ないとき ( 小標本 ) に利用されるデータ数が多ければ, 標準正規分布 N(0,) を用いて構わない ( t 分布と標準正規分布で結果に大差ない ) T m m m m () t 分布表 (435 ページ ) 各自由度に対して, P(T m < c)=0.95 などに対するcの値を与える a 0.95 自由度によって分布の形が変わるからこの数字が t 分布表に入っている例自由度 0 の場合 P(T<.8)=0.95 P(T<.764)=0.99 P(T<.8)=0.975 P(-.8 <T<.8)=0.95 0

統計学 Ⅱ(06) 0 章 0 章標本抽出と標本分布練習問題.34 ページの表 0- の乱数表を用いて, シンプルランダムサンプリングにより 5000 人の中から 4 人の標本を抽出せよ. ただし, スタートする場所は, 当日の月を列番号, 日の下一桁を行番号として用いよ. また,Ecel の乱数の関数を利用して, 同様の抽出を行え.. 教科書の練習問題 (6 ページ ) 3. 教科書の練習問題 (6 ページ ). さらに視聴率調査, 家計調査についても同様の問いに答えよ. 4. 母集団が 5,3,47,87 という4つの数字からなるとき, 次の問いに答えよ. () 母集団の平均, 分散, 標準偏差を求めよ. i i i -μ ( i -μ) 5 3 3 47 4 87 合計平均分散標準偏差 N () この母集団から重複を許す大きさ (=) の標本を抽出することを考える. このとき, すべての可能な標本を書き出し, それぞれの標本平均を求めよ.() の標本平均を度数分布にまとめよ ( 階級は,0-0,0-40,40-60,60-80,80-00). (3) () の標本平均を度数分布にまとめよ ( 階級は,0-0,0-40,40-60,60-80,80-00). (4) () で求めた標本平均の標本分布の平均, 分散, 標準偏差を求めよ. () (3) N N i i N i 標本平均 0 以上 - 0 未満 0-40 3 40-60 4 60-80 5 80-00 ( ) 標本番号標本標本平均度数 6 7 8 9 0 3 4 5 6 合計 i

統計学 Ⅱ(06) 0 章 5. 母集団が 8,,4,44 という 4 つの数字からなるとき, 次の問いに答えよ. () 母集団の平均, 分散, 標準偏差を求めよ. () この母集団から重複を許す大きさ (=) の標本を抽出することを考える. このとき, すべての可能な標本を書き出し, それぞれの標本平均を求めよ. (3) () の標本平均を度数分布にまとめよ ( 階級は,0-0,0-0,0-30,30-40,40-50). (4) () で求めた標本平均の標本分布の平均, 分散, 標準偏差を求めよ. i i i -μ ( i -μ) 8 3 4 4 44 合計平均 (3) 標本平均 0 以上 -0 未満 0-0 0-30 30-40 40-50 合計分散標準偏差度数 () 標本番号 3 4 5 6 7 8 9 0 3 4 5 6 標本標本平均 6. 母集団が 30,50,60,70,90 という 5 つの数字からなるとき, 問 5と同様の問いに答えよ ( 階級は,0-0,0-40,40-60,60-80,80-00). 7. 母集団の大きさを N=4, 標本の大きさを = とし, 母比率を 0.5 とする ( たとえば, 視聴率調査を考え,4 人を a~d とすると,a がある番組をみた,b,c,d がみていないとする ). みた場合に, みていない場合に 0 という数値を与えるものとする. (),0 で表された母集団の平均と分散を求めよ. () この母集団から重複を許す大きさ (=) の標本を抽出することを考える. このとき, すべての可能な標本を書き出し, それぞれの標本比率を求めよ ( 次ページ ). (3) 標本比率を度数分布にまとめよ. (4) 求めた標本比率の標本分布の平均, 分散, 標準偏差を求めよ.

統計学 Ⅱ(06) 0 章標本番号標本標本比率標本比率度数 0.0 0.5 3.0 4 合計 5 6 7 8 9 0 3 4 5 6 8. 母集団の大きさを N=5, 標本の大きさを = とし, 母比率を 0.6 とする. この母集団から重複を許す大きさ (=) の標本を抽出するとき, 問 7と同様の問いに答えよ. 9. 問 4について, この母集団から重複を許さない大きさ (=) の標本を抽出することを考える. このとき, 問 4()~(4) と同様の問いに答えよ. 0. 問 7で重複を許さない大きさ (=) の標本を抽出するとき, 問 7の ()~(4) と同様の問に答えよ.. 教科書の練習問題 6(63 ページ ). 教科書の練習問題 7(63 ページ ) 3. 教科書の練習問題 8(64 ページ ) 4. 教科書の練習問題 9(64 ページ ) 5. 次の値を満たす a を求めよ. ただし,T は自由度 8 の t 分布に従うとする. () P( T a) 0.95 () P( a T a) 0.95 (3) P( T a) 0.99 (4) P( a T a) 0.99 6. T が自由度 5 の t 分布に従う場合,6 と同じ問いに答えよ. 7. 教科書の練習問題 0(64 ページ ) 8. 次の確率を求めよ. ただし,T は自由度の t 分布に従うとする. () P( T.78) () P(.78 T.78) (3) P( T.79) (4) P(.79 T.79) (5) P( T 3.055) (6) P( 3.055 T 3.055) 3

統計学 Ⅱ(06) 0 章 9. 次の ( ) に最もよくあてはまる記号 ( または数式 ), 語句, 数値を答えよ. ただし, 無限母集団から大きさの標本 ( データの個数が, ただし ) を互いに独立に無作為に抽出することを考え, 母平均を, 母分散を, 母比率を p, q p, 標本平均を, 標本分散を S とする. () ある番組の視聴率調査を 5 人に対して行い, その番組を見ていたら, 見ていなかったら 0 という数値を与えるものとする. その結果,0,0,0,,0 というデータが得られた. このとき視聴率は ( a )% である. また,5 個のデータの平均は ( b ), 分散は ( c ) である. () 標本平均の標本分布の平均は ( d ), 分散は ( e ), 標準偏差は ( f ) である. (3) 標本平均を基準化した Z の分布の平均は ( g ), 分散は ( h ), 標準偏差は ( i ) である. (4) が十分大きければ,(3) の Z は ( j ) 分布で近似することができる. これは ( k ) 定理と呼ばれる. (5) 標本比率の標本分布の平均は ( l ), 分散は ( m ), 標準偏差は ( ) である. ( l ) (6) 標本比率を基準化した Z の分布の平均は ( o ), 分散は ( p ), 標 ( ) 準偏差は ( q ) である. (7) 母集団分布を正規分布とするとき, は自由度 ( r ) の ( s ) 分布に S 従う. また ( s ) 分布は, 自由度が大きい場合,( t ) 分布で近似することができる. (8) ( u ) とは, すべての標本が等しい確率で抽出されるような標本抽出法である. (9) ( v ) とは, 母集団を地域, 都市階級, 従業員規模, 年齢などでグループ分けし, それぞれのグループで ( u ) によって標本を抽出する方法である. (0) ( w ) とは, 母集団に割り振られた番号を等間隔で選び, 標本を抽出する方法である. 4