EBNと疫学

Similar documents
<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

基礎統計

情報工学概論

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

統計的データ解析

講義「○○○○」

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - stat-2014-[9] pptx

青焼 1章[15-52].indd

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - sc7.ppt [互換モード]

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

不偏推定量

Microsoft PowerPoint - statistics pptx

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - Statistics[B]

Medical3

第7章

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

統計学の基礎から学ぶ実験計画法ー1

Microsoft Word - Stattext12.doc

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Medical3

Microsoft Word - Stattext13.doc

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

PowerPoint プレゼンテーション

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft Word - appendix_b

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

数値計算法

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

スライド 1

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

スライド 1

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 )

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

カイ二乗フィット検定、パラメータの誤差

PowerPoint プレゼンテーション

Microsoft PowerPoint - ch04j

数値計算法

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

モジュール1のまとめ

Microsoft PowerPoint - 測量学.ppt [互換モード]

経済統計分析1 イントロダクション

Microsoft PowerPoint - Quality11.ppt

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

日心TWS

Microsoft Word - Stattext11.doc

Microsoft Word - å“Ÿåłžå¸°173.docx

システムデザイン System Design

untitled

Microsoft PowerPoint - Econometrics pptx

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

データ科学2.pptx

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

MT2-Slides-13.pptx

0415

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

_KyoukaNaiyou_No.4

Microsoft Word - apstattext04.docx

13章 回帰分析

スライド 1

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

Microsoft PowerPoint DegreesOfFreedom.ppt [互換モード]

Microsoft Word - apstattext05.docx

. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

解析センターを知っていただく キャンペーン

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

untitled

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

JUSE-StatWorks/V5 ユーザーズマニュアル

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft PowerPoint - データ解析基礎2.ppt

基礎統計

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Probit , Mixed logit

Transcription:

推定と検定 57

( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定 58

全数調査と標本調査 全数調査 ( 国勢調査, 人口動態統計など ) 母集団全員に調査をしてデータを得る コストがかかる 平成 12 年度の国勢調査 約 690 億円! 集計結果に標本誤差は含まれない ( 精度が高い ) 精度は高いがコストが膨大 精度はそこまで高くなくていいからコストを抑えたい 標本調査 標本調査 ( サンプリング調査 ) 母集団の一部 ( 標本 ) に調査をしてデータを得る 全数調査と比較するとコストが低い 集計結果に標本誤差が含まれる

標本調査から母集団の特性を推定する 母数 ( パラメータ ) 母集団の特性値 ( 平均, 分散, 相関係数など ) 推定 標本のデータから母数 ( パラメータ ) を推し量ること 推定には大きく分けて 2 種類 点推定 母集団の特性値に最も近い値を推定する 区間推定 点推定値の誤差やばらつきを推定する 抽出 標本 ( サンプル ) 50 人 母集団 10000 人 推定 60

いろいろな点推定値 母平均 ( 母集団での平均 ) の点推定値 標本平均 標本調査のデータから計算できる平均 母比率 ( 母集団での比率 ) の点推定値 標本比率を使う 標本調査のデータから計算できる比率 母分散 ( 母集団での分散 ) の点推定値 不偏分散 分散を計算する時の分母に N( 標本数 )-1 を使ったもの 母標準偏差 ( 母集団での標準偏差 ) の点推定値 不偏標準偏差 不偏分散の平方根をとったもの

点推定の例 学生 2 得点偏差偏差 (x) (x-m) (x-m) 2 A 61-9 81 B 74 4 16 C 55-15 225 D 85 15 225 E 68-2 4 F 72 2 4 G 64-6 36 H 80 10 100 I 82 12 144 J 59-11 121 平均 (m) 70 不偏分散 (s 2 ) 106.2 不偏標準偏差 (s) 10.3 左の 10 人のサンプルの例 高校生全国共通試験を受けた人のうち, 10 人分のデータ 標本平均 =70.0 不偏分散 =106.2 不偏標準偏差 =10.3 62

推定には誤差がつきもの 誤差を定量化したい - 標準誤差 (Standard Error; SE) 点推定値の分布のばらつき 何度も母集団からサンプリングした時の 点推定値の標準偏差 母標準偏差がわかっている場合 標準誤差 = 母標準偏差 標本数 母標準偏差がわからない場合 母標準偏差の代わりに母標準偏差の推定値の不偏標準偏差を使う 標準誤差 = 不偏標準偏差 標本数 標本数 ( サンプル数 ) が多くなるほど標準誤差は小さくなる 63

区間推定 信頼区間 区間推定 母数が入る区間を推定 信頼度 区間推定が的中する確率 区間推定をする際に自分で決める 90% 95% 99% が使われることが多い 信頼区間 区間推定で求められる区間 信頼度と合わせて〇〇 % 信頼区間という使い方をする 信頼度が 95% の信頼区間なら 95% 信頼区間 同じ母集団から同じ数の標本を抽出して区間推定することを繰り返した時に 信頼度の確率で母数が含まれる区間 先ほどの共通試験の例でいうと 全受験者から 10 人分のデータを抽出してきて 95% 信頼区間を出すのを 100 回繰り返すと 5 回は 95% 信頼区間に全受験者の平均点が含まれない 信頼区間が狭いほど 推定の精度が高い 64

点数 50 60 70 80 90 10000 人の母集団から 10 人の標本を抽出して 95% 信頼区間を出すことを 100 回繰り返した時の例 母集団での平均は 70 印は標本平均上下の線は信頼区間 赤色のものは信頼区間が母集団の平均値を含まないもの 100 回中 5 回 95% 信頼区間に母平均の 70 が含まれていない

平均値の区間推定 - 母分散がわかっている場合 平均の点推定値 M の 95% 信頼区間は (M-1.96 標準誤差 M+1.96 標準誤差 ) この信頼区間は母集団での母分散を用いて標準誤差を出し 区間推定をしている ふつうは母集団の分散はわからないことがほとんど そのとき 母集団の分散の推定値として分散を計算するときに 偏差の 2 乗の和を n-1 で割って計算すると母集団の分散の推定値になると言われている 不偏分散 という 66

平均値の区間推定 - 母分散がわからない場合 不偏分散を使って平均が 0 分散が 1 になるように標準化すると標準正規分布でなく t 分布と呼ばれる正規分布に似た分布に従う T 分布は標本数 n から 1 を引いた値 ( 自由度 ) によって形が異なる 自由度が無限大になると標準正規分布になる 自由度 30 くらいではほぼ正規分布と考えて良い 0.0 0.1 0.2 0.3 0.4-4 -2 0 2 4 x 自由度 =1 自由度 =2 自由度 =5 自由度 =20 標準正規分布 95% 信頼区間は m-t n-1 (2.5%) SE m+t n-1 (2.5%) SE 67

平均値の区間推定の例 学生 2 得点偏差偏差 (x) (x-m) (x-m) 2 A 61-9 81 B 74 4 16 C 55-15 225 D 85 15 225 E 68-2 4 F 72 2 4 G 64-6 36 H 80 10 100 I 82 12 144 J 59-11 121 平均 (m) 70 不偏分散 (s 2 ) 106.2 不偏標準偏差 (s) 10.3 不偏分散は 106.2 点推定値は 70 標準誤差 = 10.3 10 3.3 t 9 (2.5%)=2.26 (t 分布表より ) 95% 信頼区間は (62.5 77.5) t の値は古くは t 分布表を参照したが 近年はコンピュータが計算してくれる 68

信頼区間は基本的には 信頼区間の幅 点推定値 ±1.96 標準誤差で囲まれた区間 標準誤差が小さくなると区間は狭くなる 点推定値が 10 不偏分散が 8 n=4 (2.16 17.84) n=9 (4.77 15.23) n=25 (6.86 13.14) n=400 (9.22 10.78) 信頼区間の幅が狭くなるほど正確な推定になる 標本数 ( サンプルサイズ ) が大きくなると正確に推定できやすい 69

仮説 ( 統計的 ) 検定 母集団の特性についての予想 ( 仮説 ) が正しいか間違っているかを標本調査のデータから判断する方法 母集団全体のデータが取れる全数調査では検定は必要ない 仮説が正しいかどうかをどのように判断する? 日本に住んでいる人は男性と女性どちらが多いか? 住んでいる人全員の性別を調べる ( 国勢調査 690 億円 ) もう少しコストを抑えて判断したい 標本調査のデータから判断する ( 仮説検定 ) 十分な数の標本を母集団から無作為に抽出すれば一定の精度で可能 判断が間違っていることもある α エラーと β エラー ( 後述 ) 70

帰無仮説と対立仮説 帰無仮説 (H 0 ) 母数の値を明確に指定する仮説 帰無仮説の例 新しく開発した血圧を下げる薬の効果は従来の薬の効果と同じ 日本に住んでいる男性の比率と女性の比率は同じ ( 男女比は 1:1) 対立仮説 (H 1 ) 帰無仮説の正反対の内容の仮説 対立仮説の例 新しく開発した血圧を下げる薬の効果は従来の薬の効果と同じではない 日本に住んでいる男性の比率と女性の比率は同じではない 全事象 帰無仮説 対立仮説 71

仮説検定の考え方 対立仮説が正しいことを直接示すのは難しい 母数がひとつに定まっていない 新しく開発した血圧を下げる薬の効果は従来の薬の効果と同じではない 新しい薬のほうが 10mmHg 血圧が下がる 新しい薬のほうが 20mmHg 血圧が下がる 日本に住んでいる男性の比率と女性の比率は同じではない 男性 40% 女性 60% 男性 70% 女性 60% 母数が定まっている帰無仮説が正しいかどうか検討して 正しくなければ対立仮説が正しいということにしよう どうやって帰無仮説が正しいかを検討する? 帰無仮説が正しいと仮定して 標本のデータが偶然得られる確率 (= 有意確率 ) を計算 確率分布がわかっている指標 (= 検定統計量 ) を使って有意確率を計算 有意確率が一定水準 (= 有意水準 ) を下回ったら帰無仮説が間違っていると判断する 有意水準は 5% がよく使われる

1. 帰無仮説を設定する 仮説検定の手順 帰無仮説を設定すれば対立仮説も決まる 2. 有意水準を決める 3. 検定統計量を計算する 検討する仮説によって統計量は変わる 平均の差を検定する場合は t 値 クロス表の検定ならカイ二乗値など 4. 検定統計量から有意確率を求める 5. 帰無仮説を棄却するか判断する 有意確率が有意水準を下回れば帰無仮説を棄却 (= 帰無仮説が間違っていると考える ) 有意確率が有意水準以上であれば帰無仮説を採択 (= 帰無仮説が間違っているとはいえない )

検定で生じる 2 つの誤りの確率 第 1 種の過誤 (α エラー ) 帰無仮説が本当は正しかったが棄却してしまったこと 母集団では 差がない のに 差があった としてしまった 第 1 種の過誤が生じる確率をα( アルファ ) という アルファは有意水準と同じ 第 2 種の過誤 (β エラー ) 対立仮説が正しかったが帰無仮説を棄却できなかったこと 母集団では 差がある のに 差がない としてしまった 第 2 種の過誤が生じる確率をβ( ベータ ) という 通常の検定ではベータはあまり相手にされない 74

両側検定と片側検定 差がない という帰無仮説の対立仮説には 2 通りが考えられる 日本に住んでいる男性の比率と女性の比率は同じではない 男性比率 < 女性比率 男性比率 > 女性比率 両方共ありうると考えて検定をするのが両側検定 一般には両側検定を行う どちらか一方しかありえないと考えて検定をするのが片側検定 両側検定より帰無仮説が棄却されやすい 75