講義内容 9..4 正規分布 ormal dstrbuto ガウス分布 Gaussa dstrbuto 中心極限定理 サンプルからの母集団統計量の推定 不偏推定量について 確率変数, 確率密度関数 確率密度関数 確率密度関数は積分したら. 平均 : 確率変数 分散 : 例 ある場所, ある日時での気温の確率. : 気温, : 気温 が起こる確率 標本平均とのアナロジー 類推 例 人の身長の分布と平均 分散 度数 人数 平均の計算式 : [ +65cm 3 人 +66cm 4 人 + ]/ 一般に書けば cm きざみの b 身長 分散も同様に
正規分布 ガウス分布 3 確率密度関数 ep π この分布の平均と分散は, mea varace 証明略 正規分布は平均 と分散 によって完全に記述される. 3 + + 3 + 確率変数の範囲と確率 よく用いられる値 + + 68. 7% 95. 45% 3 + 3 99. 73% 96. + 96. 95% N, と表記する N は ormal dstrbuto の N 特に, 平均, 分散 の正規分布 N, を標準正規分布と呼ぶ. 正規分布 ガウス分布 ep π 4 特に, 平均, 分散 の正規分布 N, を標準正規分布と呼ぶ. 標準正規分布 N, 95% 96. 96. 95% の確率で存在する範囲が統計ではしばしば使われる. 標準正規分布では-.96から.96の範囲となる. 平均が同じで分散が異なる正規分布 3 つの関数を模式的に図示しなさい? 分散が同じで平均が異なる正規分布 3 つの関数を模式的に図示しなさい? N, N, N,3 3 N, N, N3, 3
中心極限定理 cetral lmt theorem 5 分布がどのようなものであっても, 平均値, 分散 をもつ母集団からとられた 個のサンプルの平均値の分布は,が大きくなるとき, 正規分布 N, / に近づく. 母集団 例 母集団の分布が一様分布の場合 個集めて平均 5 集める個数 が多いほど分散 / は小さい.? 3 中心極限定理 : 多くの観測値を正規分布で近似する裏付けとなっている サンプルから母集団統計量を推定する 6 命題 : 得られたサンプルからら, その発生母体である母集団の統計量を推定したい. 例 全国の 歳男子の身長の平均と分散を4 人のサンプルから推定したい. 母集団, パラメータ推定 ˆ, ˆ サンプル サンプルの自体の平均と分散 母集団の平均と分散 平均 次の統計量 分散 次の統計量 s どんな関係? 平均 次の統計量 { p p は の生起確率 分散 次の統計量 どんな関係? { p 通常 p は未知であり, 得られたサンプルから統計量を推定するしかない.
不偏推定量 ubased estmator - 平均の不偏推定量 - 7 不偏推定量とは, サンプルから求めた母集団統計量の期待値が, 真の母集団統計量に一致するものをいう., 母集団推定統計量 ˆ, ˆ ˆ, ˆ サンプル { ˆ? { ˆ? サンプル平均を母集団平均の推定値とした場合, サンプル平均の期待値は { { p { となり, 母集団平均に一致する. よって, サンプル平均は, 母集団平均に対する不偏推定量といえる. 成り立てば不偏推定量と言える 分散の不偏推定量 8 サンプルの分散の期待値を計算してみる s { { [ ] { { + { 上式右辺の第 項は { { - で割れば母集団分散に一致することを確認しなさい. 第 3 項は { { 無相関の仮定により, つの異なるサンプルの積の和は になる { 第 項も同様に計算できる. 結局, { s + となり, 母集団分散には一致しないことがわかる
分散の不偏推定量 つづき 直感的解釈 9 なぜ分散の推定を, で割らずに ˆ で与えるか? 直感的解釈仮に母集団の平均 が既知であれば, 個のデータからの分散の推定は ˆ で与えればよい. これに対し, 母集団平均 が未知のために, かわりにサンプル平均を用いた場合の分散を s とすると, s この場合, かならず s が成り立つ. すなわち,s は真の母集団分散を過小に推定する傾向がある. そこで, で割らずに- で割ることでこの過小推定を防ぐ. 真の母集団平均 3 度数母集団分布 サンプルから求めた平均 サンプル の分布 3 正規分布 ガウス分布 ep π 標準正規分布 N, 平均が同じで分散が異なる正規分布 : 小 95% : 大 96. 96. 分散が同じで平均が異なる正規分布 95% の確率で存在する範囲が統計ではしばしば使われる. 標準正規分布では -.96 から.96 の範囲となる. 3 < <
{ { あるサンプルの平均 y y y m m m y 期待値 第 項の導出 { { { { { { { +, { { { + { ゆえに { { { 参考 : 第 3 項
二項分布 bomal dstrbuto 3 例 3 回サイコロを投げて, 回,の目が出る確率を考える. 回 回 回 3 回 P 3 5 5 3 6 6 6 3 5 3 6 6 6 p 3C 5 6 6 3 一般に, 確率 p をもつ事象が, 回の観察で 回起こる確率 P は! P Cp p p p!! P 二項分布の形 この式で表される確率分布を二項分布と呼ぶ. 平均 : p 整数 分散 : p p が大きくなると, 二項分布は正規分布に近づく ポアソン分布 Posso dstrbuto 4 二項分布において, 実験回数 が十分大きい場合, 二項分布はポアソン分布で近似できる. P Cp p e P! 近似 ただし p 平均 が大きければ, ポアソン分布は正規分布に近似できる. 例 千葉市の 日あたりの交通事故件数の分布 日を十分細かくきざんで考える 例えば 分単位. すると, このきざみのなかでは, 事故が起こるか起こらないかの, どちらかの事象のみ起こるとみなせる. つのきざみ内で事故が起こる確率を p とすれば, 日に 件事故が起こる確率は, 二項分布で表せる. 時刻 日平均 5 回, 事故が起こるとする. 二項分布で考えると, 分あたりに事故が起こる確率は p 5/ 4 6 ある 日に, 回起こる確率は, 4 6 P Cp p 4 6 ポアソン分布で考えると 5 e P! 5 事故数二項分布ポアソン分布.668.674.335.3369.84.84 3.43.437 4.7565.7547 5.7577.7547 5 回 6.4648.46 7.455.444 8.656.658 9.368.367.84.83
ポアソン分布の性質とフォトンノイズの例 5 ポアソン分布は, 平均と分散が等しい. me P! m において平均 分散 m p m m [ 暗い ] [ 明るい ] CCD 画素平均をmとする 標準偏差は CCD 画素 平均を m とする 標準偏差は m 例 明るい条件と暗い条件で, 単位時間あたりにCCDの画素に到達するフォトン数を考える. フォトンの到来 CCD の画素に到達するフォトン数はポアソン分布に従う. 時刻 フォトン数 のちらばりを ±の範囲で考えると 8 < < 98 < < カメラのゲインコントロールによって明るさを合わせられることを考えて, それぞれの平均が になるように正規化すると 8 < < 98 < < 以上より, 暗い状態ではノイズが増えることがわかる フォトンノイズという