授 業 担 当 : 徳 永 伸 一 東 京 医 科 歯 科 大 学 教 養 部 数 学 講 座
前 回 ( 第 2 回 )の 授 業 の 概 要 : 第 1 回 ( 教 科 書 第 9 章 順 列 組 合 せと 確 率 ほぼ 全 部 )の 復 習 教 科 書 第 10 章 記 述 統 計 S. TOKUNAGA 2
Overview 確 率 (9 章 ) 記 述 統 計 (10 章 ) 情 報 の 要 約 表 やグラフで 表 す 代 表 値 ( 平 均 など)や 散 布 度 ( 分 散 など)を 求 める 確 率 モデル(11 章 ) 推 測 統 計 (13 章 ~) 推 定 ( 点 推 定 区 間 推 定 ) 仮 説 検 定 S. TOKUNAGA 3
[ 復 習 ]ベイズの 定 理 Bayes Theorem 事 象 A 1,A 2, A r,b Ω について [ 仮 定 ]1 1 k r A k = Ω かつ 2 各 A k は 互 いに 排 反 であるとき, [ 結 論 ] 条 件 付 確 率 P(A 1 B) に 関 して, 以 下 の 公 式 が 成 立 つ. P( A 1 B) = r P( A 1 ) P( B A 1 ) P( A ) P( B A k k ) k = 1 S. TOKUNAGA 4
S. TOKUNAGA 5 [ 復 習 ]r = 2 の 場 合 に 関 する 補 足 r = 2 のとき, 仮 定 の 条 件 は A 2 はA 1 の 余 事 象 と 言 っているのと 同 じ よって _ A 1 = A, A 2 = A として と 書 ける( 仮 定 は 自 動 的 に 満 たされるので 一 般 に 成 り 立 つ 式 となる) ) ( ) ( ) ( ) ( ) ( ) ( ) ( A B P A P A B P A P A B P A P B A P + =
[ 復 習 ] 例 題 (p.75) 事 象 A: 病 気 Xにかかっている 事 象 B: 検 診 で 陽 性 と 判 定 される 陽 性 と 判 定 されたとき 実 際 にその 病 気 にかかって いる 確 率 P(A B)を 求 める 問 題 条 件 : P(B A) = 0.99 P(B A C ) = 0.07 P(A) = 0.01 P(A C ) = 1-0.01 = 0.99 S. TOKUNAGA 6
[ 復 習 ] 例 題 (p.75)の 解 答 と 考 察 P(A B) =(P(A)P(B A))/(P(A)P(B A)+P(A C )P(B A C )) = (0.01 0.99)/(0.01 0.99 + 0.99 0.07) = 0.125 ( 答 ) 意 外 と 小 さい? 考 察 のポイント 検 診 結 果 が 陽 性 でも, 実 際 には 病 気 Xでない 確 率 の 方 がずっと 高 い. しかし1% 12.5%だから 確 率 は10 倍 以 上. 使 い 方 結 果 の 理 解 の 仕 方 ( 患 者 への 伝 え 方 )が 重 要 S. TOKUNAGA 7
[ 復 習 ] 第 10 章 記 述 統 計 Ⅰ. 統 計 データの 種 類 Ⅱ. 度 数 分 布 1. 階 級 と 度 数, 度 数 分 布 表 2. 度 数 分 布 表 の 視 覚 化 (ヒストグラム) Ⅲ.データの 特 性 値 1. 代 表 値 ( 平 均 メディアン モード) 2. 散 布 度 ( 分 散 と 標 準 偏 差 不 偏 分 散 ) S. TOKUNAGA 8
[ 復 習 ]Ⅰ. 統 計 データの 種 類 &Ⅱ. 度 数 分 布 Ⅰ. 統 計 データの 種 類 定 性 的 データ 定 量 的 データ 離 散 的 discreteデータ 連 続 的 continuousデータ 離 散 的 か 連 続 的 かで 数 学 的 な 扱 い 方 が 異 なる Ⅱ. 度 数 分 布 KEYWORDS 度 数 frequence, 度 数 分 布 表, 階 級 class 階 級 値 スタージェスの 公 式 相 対 度 数 累 積 度 数 累 積 相 対 度 数 ヒストグラム S. TOKUNAGA 9
[ 復 習 ] Ⅲ.データの 特 性 値 (1) 代 表 値 と 散 布 度 代 表 値 : 分 布 の 中 心 的 な 位 置 を 示 す. 例 : 平 均 値 mean, 中 央 値 median, 最 頻 値 mode 散 布 度 : 分 布 の 広 がり ばらつきの 度 合 いを 示 す. 例 : 分 散 variance, 標 準 偏 差 standard deviation, 四 分 位 範 囲, 平 均 偏 差 S. TOKUNAGA 10
[ 復 習 ] Ⅲ.データの 特 性 値 (2-3) 1- 代 表 値 [1] 平 均 mean データ x 1,x 2,, x n に 対 し, _ 平 均 x :=( x 1 +x 2 + + x n )/ n = (1/n) x k と 定 義 される 度 数 分 布 表 ( 階 級 数 :m)が 与 えられているときは 階 級 値 x 1,x 2,, x m と 度 数 f 1,f 2,, f m を 用 いて _ x := (1/n) x k f k と 計 算 ( 一 種 の 近 似 計 算 ) [2]メディアンmedianmean= 中 央 値 ( 順 位 的 に 真 ん 中 の 値 ) *データが 偶 数 個 の 場 合 は 真 ん 中 の2つ の 平 均 [3]モードmode= 最 頻 値 ( 度 数 が 最 大 となる 値 or 階 S. TOKUNAGA 11
[ 復 習 ] Ⅲ.データの 特 性 値 (4-5) 1- 散 布 度 [1] 分 散 variance と 標 準 偏 差 standard deviation _ データ x 1,x 2,, x n の 平 均 x に 対 し, _ 分 散 σ 2 :={ ( x kーx ) 2 } / n 階 級 値 x 1,x 2,,x m と 度 数 f 1,f 2,, f m を 用 いると _ σ 2 := (1/n) (x k -x) 2 f k 標 準 偏 差 = σ 2 の 正 の 平 方 根 すなわち σ:= (σ 2 ) S. TOKUNAGA 12
[ 復 習 ] Ⅲ.データの 特 性 値 (6) [2] 不 偏 分 散 unbiased variance _ データ x 1, x 2,, x n の 平 均 x に 対 し, _ 不 偏 分 散 U 2 :={ ( x kーx ) 2 } /(n-1) nではなく(n-1)で 割 る 理 由 : 不 偏 性 ( 第 13 章 Ⅱ) バラツキの 度 合 いを 表 す 指 標 としては 同 等. nが 十 分 大 きいときにはnで 割 っても(n-1)で 割 って も 大 差 ない. (たとえばn=10000で 有 効 数 字 3 桁 なら 無 視 できる) S. TOKUNAGA 13
[ 復 習 ] Ⅲ.データの 特 性 値 (7) 不 偏 分 散 についての 補 足 本 によっては 1 分 散 を 不 偏 分 散 の 形 で 定 義 2 分 散 は 同 じだが 標 本 分 散 を 不 偏 分 散 の 形 で 定 義 しているケースもあり 用 語 の 使 い 方 が 統 一 さ れていない( 以 前 使 用 していた 教 科 書 でも 標 本 分 散 = 不 偏 分 散 としていた). 上 記 12のケースでは 標 準 偏 差 ないし 標 本 標 準 偏 差 を 不 偏 分 散 の 正 の 平 方 根 U= U 2 で 定 義 ( 復 習 ここまで) S. TOKUNAGA 14
第 11 章 確 率 変 数 と 確 率 分 布 はじめに 確 率 変 数 は, 確 率 統 計 の 学 習 において もっとも 基 本 的 かつ 重 要 な 概 念 であるが きちんと 理 解 するのは 意 外 と 難 しい. ( 一 度 わかってしまえば 簡 単 だが) ということを 頭 に 留 めておきましょう. S. TOKUNAGA 15
第 11 章 確 率 変 数 と 確 率 分 布 Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 Ⅱ. 確 率 変 数 の 特 性 値 期 待 値 ( 平 均 ), 分 散 など Ⅲ. 確 率 変 数 の 独 立 性 Ⅳ. 代 表 的 な 確 率 分 布 2 項 分 布, 正 規 分 布 など Ⅴ. 中 心 極 限 定 理 と 正 規 近 似 Ⅵ. 標 本 分 布 S. TOKUNAGA 16
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (1) 1- 確 率 変 数 の 定 義 [ 定 義 ] 標 本 空 間 Ω 上 の 実 数 値 関 数 ( 各 根 元 事 象 に 実 数 を 対 応 させたもの)を 確 率 変 数 random variable という. とり 得 る 値 が 離 散 的 離 散 型 確 率 変 数 とり 得 る 値 が 連 続 的 連 続 型 確 率 変 数 S. TOKUNAGA 17
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (2) 教 科 書 p.83 例 1 Ω: サイコロを 振 ったときの, 目 の 出 方 で 定 まる 事 象 全 体 の 集 合. サイコロを 振 って1の 目 が 出 る は 事 象. サイコロを 振 ってi の 目 が 出 る という 事 象 ω i に 整 数 i を 対 応 させる 関 数 をX(=X(ω i ))とおく と,Xは( 離 散 型 ) 確 率 変 数 となる. 確 率 変 数 Xに 対 し, X=1 X 4 Xは 偶 数 などは 事 象. S. TOKUNAGA 18
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (3) 2- 離 散 型 確 率 変 数 の 確 率 分 布 [ 定 義 ] 離 散 型 確 率 変 数 Xのとる 値 xと, Xがその 値 をとる 確 率 P(X=x)との 対 応 関 係 を(Xの) 確 率 分 布 という. 教 科 書 p.84 例 3 X:サイコロを1 回 振 ったときの 目 の 値. Xの 確 率 分 布 ( 離 散 型 ): k 1 2 3 4 5 6 P(X=k) 1/6 1/6 1/6 1/6 1/6 1/6 関 数 f(x)=p(x=x) を Xの 確 率 分 布 とよんで 差 し 支 えない S. TOKUNAGA 19
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (4) 離 散 型 確 率 変 数 の 性 質 : 離 散 型 確 率 変 数 Xの 取 り 得 る 値 をx 1,x 2, とする. f(x) = P(X=x) とおくと,f は 確 率 の 性 質 ( 公 理 )より f(x k ) 0 (k=1,2, ) かつΣf(x k )=1 を 満 たすことがただちに 導 ける. 次 に 連 続 型 確 率 変 数 へ S. TOKUNAGA 20
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (5) 3- 連 続 型 確 率 変 数 の 確 率 分 布 教 科 書 p.83 例 2: ある 短 大 の1 年 生 から 無 作 為 に 選 んだ1 名 の 身 長 をXcmと すると,Xは 連 続 型 確 率 変 数. (とり 得 る 値 が 連 続 的 になっただけ) では Xが 連 続 型 確 率 変 数 のとき, 離 散 型 の 場 合 と 同 様 に 確 率 変 数 Xのとる 値 xと, 確 率 P(X=x)との 対 応 関 係 (もしくは 関 数 f(x)=p(x=x) そのもの) を( 連 続 型 ) 確 率 分 布 と 呼 んで 良 いだろうか? S. TOKUNAGA 21
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (6) そもそも 連 続 型 確 率 変 数 Xと 確 率 との 対 応 関 係 とは? [ 注 意 ]Xが 連 続 型 確 率 変 数 のとき, ( 特 殊 な 例 を 除 き)ほとんどすべての 値 xに 対 して P(X=x)=0である! つまり S. TOKUNAGA 22
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (7) 連 続 型 確 率 分 布 は f(x)=p(x=x)のような 関 数 で 表 すことはできない. そこでこれに 代 わるものとして 確 率 密 度 関 数 を 導 入. [ 定 義 ] f(x) 0, - x f(x)dx = 1であり, P(a X b)= a x b f(x)dx であるような 関 数 f を, 連 続 型 確 率 変 数 Xの 確 率 密 度 関 数 という. すなわち 連 続 型 確 率 分 布 は, 確 率 密 度 関 数 により 表 される. S. TOKUNAGA 23
連 続 型 確 率 分 布 の 例 教 科 書 p.85 例 4 一 様 分 布 a,bを 定 数 とするとき, 密 度 関 数 f(x)=p(x=x)=1/(b-a) (a x b) f(x)=p(x=x)=0 (x<aまたはx>b) であらわされる 確 率 分 布 を 一 様 分 布 という. このときXは 一 様 確 率 変 数 または 一 様 乱 数 EXCEL 課 題 で 用 いるRAND 関 数 の 値 はa=0,b=1とした 一 様 乱 数. S. TOKUNAGA 24
Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 (8) [ 注 意 ] F(x)=P(X x) をXの 累 積 分 布 関 数 という. 図 11-1(b), 11-2(b)でイメージをつかんでください. 累 積 を 省 略 して 分 布 関 数 と 呼 ばれることも 多 く, 紛 らわしいので 気 をつけましょう. Excelの 関 数 BINOMDIST で4つ 目 の 引 数 を TRUE にした 場 合 がこれに 相 当 ( Excel 実 習 の 際 に 確 認 を) S. TOKUNAGA 25
Ⅱ. 確 率 変 数 の 特 性 値 (1) 1- 期 待 値 と 分 散 標 準 偏 差 の 定 義 確 率 変 数 Xの 平 均 (= 期 待 値 expectation)e(x) を 次 式 で 定 義 : E(X):= x k P(X=x k ) (Xが 離 散 型 ) E(X):= x f(x)dx (Xが 連 続 型 ) (ただしf(x)はXの 確 率 密 度 関 数 ) Xの 値 を 繰 り 返 し 取 り 出 したとき,それらの 平 均 値 は 回 数 を 増 やすほどE(X)に 近 づくと 考 えられる S. TOKUNAGA 26
Ⅱ. 確 率 変 数 の 特 性 値 (2) μ=e(x)とするとき, 確 率 変 数 の 分 散 variancev(x)を V(X):=E((X-μ) 2 ) で 定 義.すなわち, V(X)= ( x iーμ) 2 P(X=x i ) (Xが 離 散 型 ) V(X)= (xーμ) 2 f(x) dx (Xが 連 続 型 ) 分 散 V(X)は,Xのばらつき, 変 動 の 指 標 となる. V(X)=σ 2 と 表 すことも 多 い. Xの 標 準 偏 差 σ=σ(x):= σ 2 S. TOKUNAGA 27
Ⅱ. 確 率 変 数 の 特 性 値 (3) 期 待 値 ( 平 均 )Eの 性 質 : Xを 確 率 変 数, a,b を 定 数 (constant)とするとき, E(X+b) =E(X)+b E(aX) = ae(x) が 成 り 立 つ. 以 上 合 わせて E(aX+b) =ae(x)+b より 一 般 には, 定 数 a,bと 関 数 f,g に 対 して E(af(X)+bg(X)) = ae(f(x)) + be(g(x)) ( 教 科 書 には 載 っていません) S. TOKUNAGA 28
Ⅱ. 確 率 変 数 の 特 性 値 (4) 分 散 の 性 質 :(Xは 確 率 変 数,a,b は 定 数 ) V(X+b) = E((X+b-E(X+b)) 2 ) =E((X+b-E(X)-b) 2 ) =E((X-E(X)) 2 ) = V(X) V(aX) = E((aX-E(aX)) 2 ) =E((aX-aE(X)) 2 ) =E(a 2 (X-E(X)) 2 ) = a 2 V(X) 以 上 合 わせて V(aX+b) = a 2 V(X) S. TOKUNAGA 29
Ⅱ. 確 率 変 数 の 特 性 値 (5) 以 下 は 有 名 な 公 式 ですが, 教 科 書 には 載 っていません. 分 散 の 公 式 :(μ=e(x)とする) V(X) = E(X 2 ) - E(X ) 2 [ 証 明 ] V(X) = E((X-μ) 2 ) = E((X 2-2Xμ+μ 2 ) ) = E(X 2 ) -2μ E(X ) +μ 2 = E(X 2 ) - E(X ) 2 (*) 注 意 :(*)で 公 式 E(af(X)+bg(X)) = ae(f(x)) + be(g(x)) を 使 ってます. S. TOKUNAGA 30
Ⅱ. 確 率 変 数 の 特 性 値 (6) 教 科 書 p.87 例 5 X:サイコロを1 回 振 ったときの 目 の 値 とする. Xの 確 率 分 布 ( 離 散 型 ): k 1 2 3 4 5 6 P(X=k) 1/6 1/6 1/6 1/6 1/6 1/6 E(X) = kp(x=k) = (1+2+ +6)/6 =7/2= 3.5 V(X) = (k-3.5) 2 P(X=k) = ((1-3.5) 2 +(2-3.5) 2 + +(6-3.5) 2 )/6 = 35/12 = 2.916666 S. TOKUNAGA 31
教 科 書 p.87 問 題 4 Z:サイコロを2 回 振 ったときの 目 の 和 の 値 とする. このときZの 確 率 分 布 ( 離 散 型 )は: k 2 3 4 7 8 12 P(X=k) 1/36 2/36 3/36 6/36 5/36 1/36 E(Z) = kp(z=k) = 2 1/36 + 3 2/36 + +12/36 = 7 = 2 3.5 V(Z) = (k-7) 2 P(Z=k) = = 35/6 = 2 35/12 S. TOKUNAGA 32
期 待 値 の 加 法 性 (その1) 実 は 任 意 の 確 率 変 数 X,Yに 対 し E(X+Y) = E(X)+E(Y) が 成 り 立 っている!( 期 待 値 の 加 法 性 ) 先 の 例 2だと,サイコロを2 回 振 ったとき X:1 回 目 に 出 る 目 の 値,Y :2 回 目 に 出 る 目 の 値 とすれば, E(X)=E(Y) = 3.5 となり,Z=X+Yなので E(Z) = 3.5+3.5 = 7 S. TOKUNAGA 33
期 待 値 の 加 法 性 (その2) Z n :サイコロをn 回 振 ったときの 目 の 和 とすれば, E(Z n )=3.5n も 成 り 立 つ. さらに 一 般 に, 任 意 の 定 数 a 1,a 2,,a n と 任 意 の 確 率 変 数 X 1,X 2,,X n に 対 し E(Σa k X k )=Σa k E(X k ) が 成 り 立 つ( 期 待 値 の 線 形 性 ). ところで, 分 散 については? S. TOKUNAGA 34
分 散 の 加 法 性 と 確 率 変 数 の 独 立 性 先 のサイコロを2 回 振 る 例 では, 分 散 についても V(Z) = 2 35/12 が 成 り 立 っていた. 実 は Z n :サイコロをn 回 振 ったときの 目 の 和 とすれば, V(Z n ) = n (35/12) も 成 り 立 っている. しかし, 分 散 の 加 法 性 V(X+Y) = V(X)+V(Y) は( 期 待 値 の 加 法 性 と 違 って)いつでも 成 り 立 つわけではない! 成 り 立 つための( 十 分 ) 条 件 : 確 率 変 数 の 独 立 性 ( 詳 しい 説 明 は 次 回 ) S. TOKUNAGA 35
第 11 章 確 率 変 数 と 確 率 分 布 Ⅰ. 確 率 変 数 と 確 率 分 布 の 定 義 Ⅱ. 確 率 変 数 の 特 性 値 期 待 値 ( 平 均 ), 分 散 など *** 今 日 はこの 辺 まで*** Ⅲ. 確 率 変 数 の 独 立 性 Ⅳ. 代 表 的 な 確 率 分 布 2 項 分 布, 正 規 分 布 など Ⅴ. 中 心 極 限 定 理 と 正 規 近 似 Ⅵ. 標 本 分 布 S. TOKUNAGA 36