確率統計レジュメ集 ( 前半 ) 202.04.0 版 立命館大学 電子情報デザイン学科
この講義の目標 進め方 この講義は指定教科書の内容をしっかりと理解することを目的とする. 配布するレジュメは その理解を助けるための資料である. 必ず 教科書に書かれた基礎的な内容をひとつひとつ理解するように努めること. レジュメの空欄の箇所は 教科書からそのヒントを見つけることができる. 予習時に教科書を読み レジュメの空欄を埋める努力をすること. さらに 理解の確認のために 教科書の演習問題を自力で解き 解答を確認するとよい. これらの地道な努力により 真に応用力のある基礎的な実力を身につけることができる. 以上
. 度数分布表と累積度数分布表 2 統計量の把握 ( 章 ) 本日の目標 統計量を扱う方法を知る事象計算の公式確率に関する基礎定理.2 ヒストグラムと累積度数分布図 3 ( 演習 ) 度数分布表 ヒストグラム 4 下記のデータ列が得られた. これを度数分布表 ヒストグラム 累積度数分布図にしなさい. ヒストグラム 累積度数分布図 度数分布表変数度数 4 2 3 3 3 4 2 5 6, 3, 4, 3, 2, 2, 5, 6, 4,,,, 2, 3 度数 5 4 3 2 0 ヒストグラム 2 3 4 5 6 6 4 2 0 8 6 4 2 0 累積度数分布図 2 3 4 5 6.3 代表値 5 偏差 (diviation) 6 算術平均 (arithmetical mean) 基準値 x 0 からの差 : x x 0 ( 基準値は一般的に平均を用いる ) 幾何平均 (geometrical mean) 中央値 (median) 最頻値 (mode)
.4 散布図 7 ( 演習 ) 統計値 8 散布度 ( 散布の度合い ) を示すもの 分散 (variance) 平均からの偏差の 2 乗平均 σ 2 = 標準偏差 (standard deviation) 分散の平方根 σ= 下記のデータ列の統計値を求めよ., 3, 4, 3, 2, 2, 5, 4 平均 2 分散 3 標準偏差 チェビシェフの不等式 分散の上限を与える式 9.5 相関係数 相関図 相関係数 r (- r ) = 0 数学 英語 90 86 66 55 50 44 62 39 44 49 83 64 30 47 95 80 64 4 68 78 3 24 40 27 24 45 4 49 49 43 9 26 35 44 4 4 分散 67 38 標準偏差 25 8 相関係数 0.78 相関図サンプル 英語 00 90 80 70 60 50 40 30 20 0 0 0 20 40 60 80 00 数学 回帰直線とは を最小にする直線または 2 2
3 確率とは? 4 2 確率の公理 (2 章前半 ) 同様に確からしい 硬貨の表 / 裏の出る場合 さいころの,2,3,4,5,6 の各々の目が出る場合 本日の目標 確率の定義 事象 余事象 排反 独立 確率 起こりうるすべての場合が n 通りで それぞれの場合は排他的で 同様に確からしいとき ある事象 A の起こる場合が a 通りである 事象 A の起こる確率は Pr{A} a/n である. 3 事象に対する諸概念 全事象 ( 前提条件 ) サイコロを2 回投げるときの目の出方. {,}, {,2},,{6,6} ---- 36_ 通り 5 事象 事象の場合の数 事象 = 集合 A 事象の場合の数 A ( 集合の要素数 ) 6 事象 ( 調べたい条件 ) 事象 A: サイコロを2 回投げ合計が0 以上である. {4,6}, {5,5}, {5,6}, {6,4},{6,5},{6,6} ---- 6_ 通り 余事象 ( 全事象からある事象を除外した部分 ) Aの余事象: サイコロを2 回投げ合計が0より小さい. {,}, ---- 通り 余事象 全事象 I: サイコロの目の出方 ( すべての場合 ) 事象 A: 合計が0 以上となる目の出方 事象 A: 合計が0 未満となる目の出方 A =? 事象の合成 ある駐車場に置かれている車の集合を全体集合とする. 事象 A: 車は赤い色である 事象 B: 車は日本製である 和事象 A B: 車は赤色または日本製である 積事象 A B: 車は赤く かつ 日本製である 7 排反事象 排反 (= 同時に起きない ) 事象 A: 目の合計が 8 以上である. 事象 B: 目の合計が 8 以下である. 目の合計がちょうど 8 となる場合はどちらにも含まれるので 排反ではない. (A B φ) 事象 A: 目の合計が偶数である. 事象 B: 目の合計が奇数である. 事象 A と事象 B は同時に起こりえないので 排反である.(A B=φ) 8 3
独立事象 9 ( 演習 ) 排反事象と独立事象 20 独立 ( 事象の発生が 他の事象に依存しない ) 事象 A: 目の合計が 0 以上である. 事象 B: 一方の目は 6 である. 事象 A と事象 B は独立か? 事象 A と事象 B が排反であることを式で表現せよ Pr{B A} --- 事象 A が起きたときに 事象 B が発生する確率と Pr{B A} --- 事象 A が起きなかったときに 事象 B が発生する確率を比較する. 事象 A と事象 B が独立であることを式で表現せよ Pr{B A} = Pr{B A} --- 等しければ 独立 順列の数 2 組合せの数 22 順列 (permutation) 異なる n 個のものから r 個とりだして並べる場合の数. 組合せ (combination) 異なる n 個のものから r 個のとりだしかた. ( 並びは無視する ) npr = n (n-) (n-2) (n-r+) = n!/(n-r)! ncr = npr / rpr = 同じものがあるときの 順列の個数の求め方に関して テキストを理解せよ.(p.38-39) ( 演習 ) 23 24 以下の式の意味を説明しなさい. 4
25 二項定理 26 3 事象と組合せ (2 章後半 ) 25 (a + b) 0 パスカルの 3 角形 27 加法定理 28 (a + b) a+ b (a + b) 2 a 2 + 2ab + b 2 (a + b) 3 (a + b) 4 a 3 + 3a 2 b + 3ab 2 + b 3 a 4 + 4a 3 b + 6a 2 b 2 + 4a b 3 + b 4 式で表現すると 4C 0 4 C 4 C 2 4 C 3 4 C 4 (a + b) n-... n-c r- a n-r b r- + n-c r a n-r- b r... (r =,..., n-) (a + b)n... nc r a n-r b r... (r = 0,..., n) 乗法定理 29 独立試行 30 独立に繰り返される操作を独立試行という. ( 問題 ) 以下は独立試行か? 理由と共に答えよ. () コインを投げて表が出るか? 裏がでるか? 式で表現すると (2) 野球のピッチャーが N 回投げる球がストライクになるかどうか? 人間の場合? ロボットの場合? ( 問題 ) A, B が独立の場合はどうなるか考えよ. 5
二項分布 3 ( 演習 ) 多項分布 32 ( 問題 ) テキスト p.47 多項分布の公式が 3 項の場合に成立することを確認せよ. ( 問題 ) 0 回さいころを投げて 4 回 または 2 が出る確率は? ( 問題 2) テキスト p.39 3 行目の式を使って 多項分布の式を証明せよ. 33 相対度数 r/n は, 試行回数 n を大きくするとどうなるか? ベルヌーイの大数の法則 34 アルミ硬貨を投げて 表裏の出る事象を観測 表の出た回数 r 全試行回数 n としたとき 相対度数 r/n は p に限りなく近づく まとめ 35 まとめ 36 以下は どのような定理か? またそれぞれが成立する条件は何か? 条件が成立しない場合はどのように考えればよいか? 以下の意味するところをまとめよ. 独立試行とは どのような試行か? 加法定理 二項分布とはどのような分布か? 乗法定理 ベルヌーイの大数の法則と期待値の概念 6
4 確率変数 (3 章前半 ) 本日の理解目標 確率変数 二項分布の性質とポアソン分布. 離散型確率分布 平均値 ( または期待値 ) E(X) 分散 標準偏差 チェビシェフの不等式とベルヌーイの大数の法則の証明 37 二項分布 確率分布と確率変数確率変数 X 確率分布 X に対する確率の分布 事象 E の起こる確率を p n 回の独立試行を行ったとき 事象 E が X 回起こる確率は? X = x のとき nc x p x q n-x である.(2 章参照 ) 二項分布 38 37 二項分布 39 二項分布の特徴 40 p 小 n 大 p を小さくすると左に偏る.( 図 3.2) n を大きくすると対称型に近似する.( 図 3,3) ポアソン分布 np = m を一定とし n を大きくしたときの分布. ただし m はある程度小さいという前提. n としたとき p 0 nc x p x q n-x e m m x /x! ( 二項分布はポアソン分布に近づく ) ( 補足 ) 4 ポアソン分布とは? 42 n としたとき nc x p x q n-x e m m x /x! となることの証明 (p.86 参照しながら各自証明してみよ ) ( 前提 ) p がかなり小さい n が大きい np = m がある程度小さい ( 例 )P.57 問題 2 n = 400( ページあたりの字数 ) p = 500( 誤植 )/500( ページ )*400( ページあたりの字数 ) np = m = ポアソン分布に従う 7
0 5 ポアソン分布 43 ポアソン分布 ( 実イメージ ) 44 Pr(X=x) =e m m x /x! 0.4 0.35 0.3 0.25 0.2 0.5 0. 0.05 0 0 2 3 4 5 6 m x 2 3 4 n が大きい. 確率が大きいのは x=m 付近である 0.4 0.35 0.3 0.25 0.2 0.5 0. 0.05 0 Pr(X=x) =e m m x /x! m 2 3 4 m x 0 2 3 4 5 6 0.367879 0.367879 0.8394 0.0633 0.05328 0.003066 0.0005 2 0.35335 0.27067 0.27067 0.80447 0.090224 0.036089 0.0203 3 0.049787 0.4936 0.224042 0.224042 0.6803 0.0089 0.050409 4 0.0836 0.073263 0.46525 0.95367 0.95367 0.56293 0.0496 m 0 5 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 00 05 0 5 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 200 205 20 25 220 225 230 235 240 245 250 255 260 265 270 275 280 x 0 2 3 4 5 6 0.367879 0.367879 0.8394 0.0633 0.05328 0.003066 0.0005 2 0.35335 0.27067 0.27067 0.80447 0.090224 0.036089 0.0203 3 0.049787 0.4936 0.224042 0.224042 0.6803 0.0089 0.050409 4 0.0836 0.073263 0.46525 0.95367 0.95367 0.56293 0.0496 ポワソン分布の作成例 45 ポアソン分布 46 P57 例 2 p = 0.0, n = 200, m = np = 2 e m m x /x! m x m=np nは大きな数 pは小さな数 +) Pr(X=0) = e m m 0 /0! = 0.35 Pr(X=) = e m m /! = 0.27 Pr(X=2) = e m m 2 /2! = 0.27 Pr(X=3) = e m m 3 /3! = 0.80 Pr(X 3) = 0.857 Pr(X 4) = - 0.857 = 0.43 47 離散的確率分布 48 P.57 問題 2 n = 400( ページあたりの字数 ) p = 500( 誤植 )/500( ページ )*400( ページあたりの字数 ) np = m = 離散的変数 -- とびとびの値をとる変数 ( 例整数 ) 連続的変数 -- 連続した変数 ( 例実数 ) +) Pr(X=0) = e m m 0 /0! = Pr(X=) = e m m /! = Pr(X=2) = e m m 2 /2! = Pr(X 2) = Pr(X 3) = 確率変数 X の平均値 ( または期待値 ) を E(X) で表す. 8
二項分布の期待度数二項分布 Pr {X =x } = n C x p x q n-x 49 変数変換 50 E(X) = = = =! = =!! = ( 二項定理を使う ) = が導かれる. 同様に E(X+Y) = E(X) + E(Y) も導ける 5 σ 2 の定義をつかって証明せよ 52 p.6 の式の証明の説明 σ 2 (cx)=c 2 σ 2 (X) σ 2 (X+c)=σ 2 (X) 分散と標準偏差 偏差 X-E(X) --- 平均からのずれ 分散 σ 2 = E{(X-E(X)) 2 } 偏差の2 乗平均 標準偏差 σ 分散の正の平方根 二項分布の分散は npq に等しいポアソン分布の分散は m ( 平均 ) に等しい ( 各自 証明してみよ ) 53 ( 公式 III) ( 公式 III ) まとめ 二項分布平均 =np, 分散 =npq ポアソン分布 ( 二項分布の特殊な例 np=m が一定 n が大きく,p が小さい場合 ) 平均 =m, 分散 =m 平均 E(X) E(X+c) = E(X)+c E(cX)=xE(X) E(X+Y) = E(X) + E(Y) 分散 σ 2 (X) = E((X-E(X)) 2 ) σ 2 (cx) =c 2 σ 2 (X) σ 2 (X+c) =σ 2 (X) 54 9
5 確率分布 (3 章中 ) 本日の理解目標 離散型確率分布 ( 多次元 ) 平均 分散 標準偏差の考え方と求め方 共分散 相関係数 確率分布 一様分布 55 複数変数の確率分布 (3.3 節 ) 変数の独立の定義 (p.64 下 ) 確率変数が独立であるときかつそのときにかぎり P r {X=x i, Y=y j }= P r {X=x i }P r {Y=y j } が成立する. 平均値 (p.65) 56 例 をやってみよ 55 確率変数の変換 (p.66-69) 57 分散 標準偏差 相関係数 58 E(X+Y) = E(X)+E(Y) 複数変数の場合も 分散と標準偏差に関して 3.2 節と同様の公理が成立する. E(X Y) = E(X) E(Y) (X,Y が独立の場合 ) 共分散 (covariance) --- 偏差の積の平均 cov(x,y) = E{(X-E(X))(Y-E(Y))} 相関係数 ρ(x,y) = cov(x,y) /σ(x)σ(y) 変数同志の影響度合いを見るときに使う. 59 60 ( ヒント ) 以下の式を使ってやってみよ. cov(x,y) = E{(X-E(X))(Y-E(Y))} ρ(x,y) = cov(x,y) /σ(x)σ(y) E(X-E(X)) = 0 ( な 変数間の相関係数 0 --- 独立 --- 完全相関 0
6 まとめ 62 2 個の確率変数の場合 以下の各式をまとめなさい. 平均 分散 共分散 相関係数 E(XY)=E(X) E(Y) が成立するのはどのような場合か? 成立しない場合は? 一様分布 63 一般の分布 64 連続変数の場合の確率定義 変数 個に対する確率は定義できない. 変数の値の範囲に対して定義 ( ルーレットの例を参照 ) 一様分布 この面積が になる この面積が になる 正規分布 65 標準正規分布 66 N(0,) μ = 0 σ =
6 確率分布 (3 章後半 ) 本日の理解目標 確率分布 一様分布 正規分布 標準正規分布 67 p.2 正規分布表の見方 () φ( 確率 ) x 確率 = 0.587 x? x.298 = 0.298.58 68.007 少数位 67 p.2 正規分布表の見方 (2) 69 正規分布の確率の求め方 70 φ( 確率 ) x 確率 = 0.3 x? 少数位.003 = -.207 X = [a, b] の確率 z a = (a μ) / σ z b = (b μ) / σ を求める...207 -x 表 4 を用いて φ( z a ) φ( z b ) を求める Φ(X)= φ(z b )-φ(z a ) Φ<0.5 のときは x は負の値になる p.8 問題 2,3 をやってみよ. 二項分布と正規分布 7 連続型確率変数の変換 : 離散変数の場合と同様以下の式が成り立つ 72 二項分布の n を十分大きくしていくと正規分布 N(np, npq) に近づく. E(X+c) = E(X)+c E(cX) = c E(X) σ 2 (X) = E(X 2 )-(E(X)) 2 E(X Y) = E(X) E(Y) (X,Y が独立の場合のみ ) 2
2 次元同時確率分布 73 再生性 (X,Y が独立で共に正規分布の時に成立 ) 74 変数 XY が N(μ, σ 2 ), N(μ 2, σ 22 ) に従うとき X±Y は N(μ ±μ 2, σ 22 +σ 22 ) に従う X,Y が独立のとき 分散 標準偏差 相関係数 離散変数の場合と同様 75 正規分布の演習 P.87 問題, 2 を解いてみよ. 76 77 分布図の見方 ~3 章のまとめ 78 7 理解度テスト (~3 章 ) 確率分布に関する特徴量の求め方 独立 排反とは? 様々な分布の特徴 77 3