Microsoft PowerPoint - statistics08_03.ppt [互換モード]

Similar documents
統計Ⅰ 第1回 序説~確率

統計Ⅰ 第1回 序説~確率

Microsoft PowerPoint 確率レジュメA

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - 基礎・経済統計6.ppt

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

モジュール1のまとめ

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

統計学 Ⅱ8-9 章 確率分布 確率の条件 8 ページ p: 確率関数 p は の関数とみなせる 確率分布 : すべてのに関する = または p の分布 グラフや表で表わすことが多い サイコロの例 : 計 縦軸は p または = 棒の幅は 線 確率 p.. = / / / / / / サイコロの目の

スライド 1

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

散布度

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

情報工学概論

基礎統計

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

6.1 (P (P (P (P (P (P (, P (, P.

Microsoft PowerPoint - 測量学.ppt [互換モード]

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft PowerPoint ppt

スライド 1

Microsoft Word - lec_student-chp3_1-representative

I L01( Wed) : Time-stamp: Wed 07:38 JST hig e, ( ) L01 I(2017) 1 / 19

6.1 (P (P (P (P (P (P (, P (, P.101

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

経営統計学

講義「○○○○」

_KyoukaNaiyou_No.4

スライド 1

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

renshumondai-kaito.dvi

データ解析

不偏推定量

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - Ⅱ(リスク計量化入門).ppt

tokei01.dvi

スライド 1

統計的データ解析

Microsoft PowerPoint - stat-2014-[9] pptx

Probit , Mixed logit

第4回

Microsoft PowerPoint - データ解析基礎2.ppt

Medical3

【補足資料】確率・統計の基礎知識

様々なミクロ計量モデル†

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

学習指導要領

EBNと疫学

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft Word - Stattext07.doc

3章 度数分布とヒストグラム

学力スタンダード(様式1)

代表値

第7章

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - 7.pptx

Microsoft PowerPoint - statistics pptx

ベイズ統計入門

3章 度数分布とヒストグラム

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

統計学入門 練習問題解答集

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

PowerPoint Presentation

離散数学

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - Inoue-statistics [互換モード]

学習指導要領

untitled

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

カイ二乗フィット検定、パラメータの誤差

Information Theory

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

日心TWS

Microsoft PowerPoint - sc7.ppt [互換モード]

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

青焼 1章[15-52].indd

Microsoft Word - Stattext12.doc

確率・統計の基礎知識

Microsoft Word - apstattext04.docx

Hara-statistics

Microsoft PowerPoint - 4.pptx

Microsoft Word - Stattext13.doc

stat-base_ppt [互換モード]

相関係数と偏差ベクトル

Microsoft Word - 保健医療統計学112817完成版.docx

学習指導要領

Microsoft Word - Stattext11.doc

学習指導要領

数学の学び方のヒント

Microsoft PowerPoint - Econometrics pptx

Transcription:

授業担当 : 徳永伸一 東京医科歯科大学教養部 数学講座 前回 ( 第 2 回 ) の授業の概要 : 第 1 回 ( 教科書第 9 章 順列 組合せと確率 ほぼ全部 ) の復習 教科書第 10 章 記述統計 S. TOKUNAGA 2 1

Overview 確率 (9 章 ) 記述統計 (10 章 ) 情報の要約 表やグラフで表す 代表値 ( 平均など ) や散布度 ( 分散など ) を求める 確率モデル (11 章 ) 推測統計 (13 章 ~) 推定 ( 点推定 区間推定 ) 仮説検定 S. TOKUNAGA 3 [ 復習 ] ベイズの定理 Bayes Theorem 事象 A 1,A 2, A r,b Ω について [ 仮定 ]1 1 k r A k = Ω かつ 2 各 A k は互いに排反であるとき, [ 結論 ] 条件付確率 P(A 1 B) に関して, 以下の公式が成立つ. P( A1 ) P( B A1 ) P ( A 1 B ) = r P( A ) P( B k = 1 k A k ) S. TOKUNAGA 4 2

[ 復習 ]r = 2 の場合に関する補足 r = 2 のとき, 仮定の条件は A 2 は A 1 の余事象 と言っているのと同じ よって _ A 1 = A, A 2 = A として P ( A B ) = P ( A ) P ( B A ) P( A) P( B A) + P( A) P( B A) と書ける ( 仮定は自動的に満たされるので一般に成り立つ式となる ) S. TOKUNAGA 5 [ 復習 ] 例題 (p.75) 事象 A: 病気 Xにかかっている 事象 B: 検診で陽性と判定される 陽性と判定されたとき 実際にその病気にかかっている確率 P(A B) を求める問題 条件 : P(B A) = 0.99 P(B A C ) =007 0.07 P(A) = 0.01 P(A C ) = 1-0.01 = 0.99 S. TOKUNAGA 6 3

[ 復習 ] 例題 (p.75) の解答と考察 P(A B) =(P(A)P(B A))/(P(A)P(B A)+P(A C )P(B A C )) = (001 (0.01 0.99)/(0.01 0.99 099)/(001 099+ 0.99 0.07) 099 007) = 0.125 ( 答 ) 意外と小さい? 考察のポイント 検診結果が陽性でも, 実際には病気 Xでない確率の方がずっと高い. しかし 1% 12.5% だから確率は 10 倍以上. 使い方 結果の理解の仕方 ( 患者への伝え方 ) が重要 S. TOKUNAGA 7 [ 復習 ] 第 10 章記述統計 Ⅰ. 統計データの種類 Ⅱ. 度数分布 1. 階級と度数, 度数分布表 2. 度数分布表の視覚化 ( ヒストグラム ) Ⅲ. データの特性値 1. 代表値 ( 平均 メディアン モード ) 2. 散布度 ( 分散と標準偏差 不偏分散 ) S. TOKUNAGA 8 4

[ 復習 ]Ⅰ. 統計データの種類 &Ⅱ. 度数分布 Ⅰ. 統計データの種類 定性的データ 定量的データ 離散的 discreteデータ 連続的 continuousデータ 離散的 か 連続的 かで数学的な扱い方が異なる Ⅱ. 度数分布 KEYWORDS 度数 frequence, 度数分布表, 階級 class 階級値 スタージェスの公式 相対度数 累積度数 累積相対度数 ヒストグラム S. TOKUNAGA 9 [ 復習 ] Ⅲ. データの特性値 (1) 代表値と散布度 代表値 : 分布の中心的な位置を示す. 例 : 平均値 mean, 中央値 median, 最頻値 mode 散布度 : 分布の広がり ばらつきの度合いを示す. 例 : 分散 variance, 標準偏差 standard deviation, 四分位範囲, 平均偏差 S. TOKUNAGA 10 5

[ 復習 ] Ⅲ. データの特性値 (2-3) 1- 代表値 [1] 平均 mean データ x 1,x 2,, x n に対し, _ 平均 x :=( x 1 +x 2 + + x n )/ n = (1/n) x k と定義される 度数分布表 ( 階級数 :m) が与えられているときは階級値 x 1,x 2,, x m と度数 f 1,f 2,, f m を用いて _ x:=(1/n) x k f k と計算 ( 一種の近似計算 ) [2] メディアンmedianmean= 中央値 ( 順位的に真ん中の値 ) * データが偶数個の場合は 真ん中の2つ の平均 [3] モードmode= 最頻値 ( 度数が最大となる値 or 階級値 ) S. TOKUNAGA 11 [ 復習 ] Ⅲ. データの特性値 (4-5) 2- 散布度 [1] 分散 variance と標準偏差 standard deviation _ データ x 1,x 2,, x n の平均 x に対し, _ 分散 σ 2 :={ ( x k ー x ) 2 } / n 階級値 x 1,x 2,,x m と度数 f 1,f 2,, f m を用いると _ σ 2 := (1/n) (x k -x) 2 f k 標準偏差 = σ 2 の正の平方根 すなわち σ:= (σ 2 ) S. TOKUNAGA 12 6

[ 復習 ] Ⅲ. データの特性値 (6) [2] 不偏分散 unbiased variance _ データ x 1, x 2,, x n の平均 x に対し, _ 不偏分散 U 2 :={ ( x k ー x ) 2 } /(n-1) nではなく (n-1) で割る理由 : 不偏性 ( 第 13 章 Ⅱ) バラツキの度合いを表す指標としては同等. nが十分大きいときにはnで割っても (n-1) で割っても大差ない. ( たとえばn=10000で有効数字 3 桁なら無視できる ) S. TOKUNAGA 13 [ 復習 ] Ⅲ. データの特性値 (7) 不偏分散についての補足 本によっては 1 分散 を不偏分散の形で定義 2 分散 は同じだが 標本分散 を不偏分散の形で定義しているケースもあり 用語の使い方が統一されていない ( 以前使用していた教科書でも 標本分散 = 不偏分散 としていた ). 上記 12のケースでは 標準偏差ないし標本標準偏差を不偏分散の正の平方根 U= U 2 で定義 ( 復習ここまで ) S. TOKUNAGA 14 7

第 11 章確率変数と確率分布 はじめに確率変数は, 確率 統計の学習においてもっとも基本的かつ重要な概念であるが きちんと理解するのは意外と難しい. ( 一度わかってしまえば簡単だが ) ということを頭に留めておきましょう. S. TOKUNAGA 15 第 11 章確率変数と確率分布 Ⅰ. 確率変数と確率分布の定義 Ⅱ. 確率変数の特性値 期待値 ( 平均 ), 分散など Ⅲ. 確率変数の独立性 Ⅳ. 代表的な確率分布 2 項分布, 正規分布など Ⅴ. 中心極限定理と正規近似 Ⅵ. 標本分布 S. TOKUNAGA 16 8

Ⅰ. 確率変数と確率分布の定義 (1) 1- 確率変数の定義 [ 定義 ] 標本空間 Ω 上の実数値関数 ( 各根元事象に実数を対応させたもの ) を確率変数 random variable という. とり得る値が離散的 離散型確率変数 とり得る値が連続的 連続型確率変数 S. TOKUNAGA 17 Ⅰ. 確率変数と確率分布の定義 (2) 教科書 p.83 例 1 Ω: サイコロを振ったときの, 目の出方で定まる事象全体の集合. サイコロを振って 1 の目が出る は事象. サイコロを振って i の目が出る という事象 ω i に整数 i を対応させる関数を X(=X(ω i )) とおくと,X は ( 離散型 ) 確率変数となる. 確率変数 X に対し, X=1 X 4 X は偶数 などは事象. S. TOKUNAGA 18 9

Ⅰ. 確率変数と確率分布の定義 (3) 2- 離散型確率変数の確率分布 [ 定義 ] 離散型確率変数 X のとる値 x と, X がその値をとる確率 P(X=x) との対応関係を (Xの) 確率分布という. 教科書 p.84 例 3 X: サイコロを 1 回振ったときの目の値. X の確率分布 ( 離散型 ): k 1 2 3 4 5 6 P(X=k) 1/6 1/6 1/6 1/6 1/6 1/6 関数 f(x)=p(x=x) を X の確率分布 とよんで差し支えない S. TOKUNAGA 19 Ⅰ. 確率変数と確率分布の定義 (4) 離散型確率変数の性質 : 離散型確率変数 X の取り得る値を x 1,x 2, とする. 1 2 f(x) = P(X=x) とおくと,f は確率の性質 ( 公理 ) より f(x k ) 0 (k=1,2, ) かつ Σf(x k )=1 を満たすことがただちに導ける. 次に連続型確率変数へ S. TOKUNAGA 20 10

Ⅰ. 確率変数と確率分布の定義 (5) 3- 連続型確率変数の確率分布教科書 p.83 例 2: ある短大の1 年生から無作為に選んだ1 名の身長 をXcmとすると,XX は連続型確率変数. ( とり得る値が連続的になっただけ ) では X が連続型確率変数のとき, 離散型の場合と同様に 確率変数 X のとる値 x と, 確率 P(X=x) との対応関係 ( もしくは関数 f(x)=p(x=x) そのもの ) を ( 連続型 ) 確率分布と呼んで良いだろうか? S. TOKUNAGA 21 Ⅰ. 確率変数と確率分布の定義 (6) そもそも 連続型確率変数 Xと確率との対応関係 とは? [ 注意 ]Xが連続型確率変数のとき, ( 特殊な例を除き ) ほとんどすべての値 xに対して P(X=x)=0 である! つまり S. TOKUNAGA 22 11

Ⅰ. 確率変数と確率分布の定義 (7) 連続型確率分布は f(x)=p(x=x) ( ) のような関数で表すことはできない. そこでこれに代わるものとして確率密度関数を導入. [ 定義 ] f(x) 0, - x f(x)dx = 1であり, P(a X b)= a x b f(x)dx であるような関数 f を, 連続型確率変数 Xの確率密度関数という. すなわち連続型確率分布は, 確率密度関数により表される. S. TOKUNAGA 23 連続型確率分布の例 教科書 p.85 例 4 一様分布 a,b を定数とするとき, 密度関数 f(x)=p(x=x)=1/(b-a) (a x b) f(x)=p(x=x)=0 (x<aまたはx>b) であらわされる確率分布を一様分布という. このとき X は一様確率変数または一様乱数 EXCEL 課題で用いる RAND 関数の値は a=0,b=1 とした一様乱数. S. TOKUNAGA 24 12

Ⅰ. 確率変数と確率分布の定義 (8) [ 注意 ] F(x)=P(X x) をXの累積分布関数という. 図 11-1(b), 11-2(b) でイメージをつかんでください. 累積 を省略して分布関数と呼ばれることも多く, 紛らわしいので気をつけましょう. Excelの関数 BINOMDIST で4つ目の引数を TRUE にした場合がこれに相当 ( Excel 実習の際に確認を ) S. TOKUNAGA 25 Ⅱ. 確率変数の特性値 (1) 1- 期待値と分散 標準偏差の定義確率変数 Xの平均 (= 期待値 expectation)e(x) を次式で定義 : E(X):= x k P(X=x k ) (Xが離散型) E(X):= x f(x)dx (Xが連続型) ( ただし f(x) は X の確率密度関数 ) X の値を繰り返し取り出したとき, それらの平均値は回数を増やすほど E(X) に近づくと考えられる S. TOKUNAGA 26 13

Ⅱ. 確率変数の特性値 (2) μ=e(x) とするとき, 確率変数の分散 variancev(x) を V(X):=E((X-μ) 2 ) で定義. すなわち, V(X)= ( x i ー μ) 2 P(X=x i ) (Xが離散型) V(X)= (x ー μ) 2 f(x) dx (X が連続型 ) 分散 V(X) は,X のばらつき, 変動の指標となる. V(X)=σ 2 と表すことも多い. X の標準偏差 σ=σ(x):= σ 2 S. TOKUNAGA 27 Ⅱ. 確率変数の特性値 (3) 期待値 ( 平均 )E の性質 : Xを確率変数, a,b を定数 (constant) とするとき, E(X+b) = E(X)+b E(aX) = ae(x) が成り立つ. 以上合わせて E(aX+b) = ae(x)+b より一般には, 定数 a,b と関数 f,g に対して E(af(X)+bg(X)) =ae(f(x)) + be(g(x)) ( 教科書には載っていません ) S. TOKUNAGA 28 14

Ⅱ. 確率変数の特性値 (4) 分散の性質 :(X は確率変数,a,b は定数 ) V(X+b) = E((X+b-E(X+b)) 2 ) =E((X+b-E(X)-b) E(X) b) 2 ) =E((X-E(X)) 2 ) = V(X) V(aX) = E((aX-E(aX)) 2 ) =E((aX-aE(X)) ae(x)) 2 ) =E(a 2 (X-E(X)) 2 ) = a 2 V(X) 以上合わせて V(aX+b) = a 2 V(X) S. TOKUNAGA 29 Ⅱ. 確率変数の特性値 (5) 以下は有名な公式ですが, 教科書には載っていません. 分散の公式 :(μ=e(x) とする ) V(X) = E(X 2 ) -E(X ) 2 [ 証明 ] V(X) = E((X-μ) 2 ) =E((X 2-2Xμ+μ 2 ) ) =E(X 2 ) -2μ E(X ) +μ 2 = E(X 2 ) -E(X ) 2 (*) 注意 :(*) で公式 E(af(X)+bg(X)) = ae(f(x)) + be(g(x)) を使ってます. S. TOKUNAGA 30 15

Ⅱ. 確率変数の特性値 (6) 教科書 p.87 例 5 X: サイコロを 1 回振ったときの目の値とする. X の確率分布 ( 離散型 ): k 1 2 3 4 5 6 P(X=k) 1/6 1/6 1/6 1/6 1/6 1/6 E(X) = kp(x=k) = (1+2+ +6)/6 =7/2= 3.5 V(X) = (k-3.5) 2 P(X=k) = ((1-3.5) 2 +(2-3.5) 2 + +(6-3.5) 2 )/6 = 35/12 = 2.916666 S. TOKUNAGA 31 教科書 p.87 問題 4 Z: サイコロを 2 回振ったときの目の和の値とする. このとき Z の確率分布 ( 離散型 ) は : k 2 3 4 7 8 12 P(X= X=k) 1/36 2/36 3/36 6/36 5/36 1/36 E(Z) = kp(z=k) = 2 1/36 + 3 2/36 + +12/36 =7=2 3.5 V(Z) = (k-7) 2 P(Z=k) = = 35/6 = 2 35/12 S. TOKUNAGA 32 16

期待値の加法性 ( その 1) 実は 任意の確率変数 X,Yに対し E(X+Y) = E(X)+E(Y) が成り立っている!( 期待値の加法性 ) 先の例 2だと, サイコロを2 回振ったとき X:1 回目に出る目の値,Y :2 回目に出る目の値とすれば, E(X)=E(Y) = 3.5 となり,Z=X+Yなので E(Z) = 3.5+3.5 = 7 S. TOKUNAGA 33 期待値の加法性 ( その 2) Z n : サイコロをn 回振ったときの目の和とすれば, E(Z n )=35n 3.5n も成り立つ. さらに一般に, 任意の定数 a 1,a 2,,a n と任意の確率変数 X 1,X 2,,X n に対し E(Σa k X k )=Σa k E(X k ) が成り立つ ( 期待値の線形性 ). ところで, 分散については? S. TOKUNAGA 34 17

分散の加法性と確率変数の独立性先のサイコロを2 回振る例では, 分散についても V(Z) = 2 35/12 が成り立っていた. 実は Z n : サイコロを n 回振ったときの目の和とすれば, V(Z n ) = n (35/12) も成り立っている. しかし, 分散の加法性 V(X+Y) = V(X)+V(Y) は ( 期待値の加法性 と違って ) いつでも成り立つわけではない! 成り立つための ( 十分 ) 条件 : 確率変数の独立性 ( 詳しい説明は次回 ) S. TOKUNAGA 35 第 11 章確率変数と確率分布 Ⅰ. 確率変数と確率分布の定義 Ⅱ. 確率変数の特性値 期待値 ( 平均 ), 分散など *** 今日はこの辺まで *** Ⅲ. 確率変数の独立性 Ⅳ. 代表的な確率分布 2 項分布, 正規分布など Ⅴ. 中心極限定理と正規近似 Ⅵ. 標本分布 S. TOKUNAGA 36 18