Microsoft PowerPoint - sc7.ppt [互換モード]

Similar documents
基礎統計

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

EBNと疫学

Medical3

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

情報工学概論

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

講義「○○○○」

統計的データ解析

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - statistics pptx

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

第7章

様々なミクロ計量モデル†

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

不偏推定量

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - statistics pptx

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

スライド 1

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

統計学の基礎から学ぶ実験計画法ー1

Microsoft Word - å“Ÿåłžå¸°173.docx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

スライド 1

Microsoft PowerPoint - ch04j

Microsoft Word - appendix_b

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Microsoft PowerPoint - stat-2014-[9] pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

PowerPoint プレゼンテーション

Microsoft Word - Stattext11.doc

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

PowerPoint プレゼンテーション

Microsoft PowerPoint - CVM.ppt [互換モード]

Medical3

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft Word - Stattext12.doc

新たな基礎年金制度の構築に向けて

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

経済統計分析1 イントロダクション

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Probit , Mixed logit

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

数値計算法

> > <., vs. > x 2 x y = ax 2 + bx + c y = 0 2 ax 2 + bx + c = 0 y = 0 x ( x ) y = ax 2 + bx + c D = b 2 4ac (1) D > 0 x (2) D = 0 x (3

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft PowerPoint - A1.ppt [互換モード]

基礎数理 ()Aさんは確定拠出年金の加入者となった 投資商品は収益率がそれぞれ独立な正規分布 N(7, σ ), N(, σ y ) に従う,Y から選択することとした の過去 8 年間の収益率の実績は {8,,,5,,-,6,}(%) Y の過去 6 年間の収益率の実績は {,,,4,,}(%)

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

日本内科学会雑誌第98巻第4号

日本内科学会雑誌第97巻第7号

tnbp59-21_Web:P2/ky132379509610002944

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

モジュール1のまとめ

青焼 1章[15-52].indd

Microsoft PowerPoint - statistics pptx

EBNと疫学

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313691E63589F194E497A682C695AA8A84955C2E >

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

Microsoft Word - Stattext13.doc

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

データ解析

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

統計Ⅰ 第1回 序説~確率

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - Econometrics pptx

Microsoft Word - 保健医療統計学112817完成版.docx

スライド 1

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

untitled

MT2-Slides-13.pptx

Ł\”ƒ-2005

ベイズ統計入門

第90回日本感染症学会学術講演会抄録(I)

Microsoft Word - apstattext03.docx

第86回日本感染症学会総会学術集会後抄録(I)

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

<8C6F8DCF8CA48B86985F8F D342D E656339>

日本内科学会雑誌第102巻第4号

Microsoft Word - apstattext05.docx

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft Word - reg2.doc

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313791E63589F194E497A682C695AA8A84955C2E >

Excelにおける回帰分析(最小二乗法)の手順と出力

Transcription:

/ 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると その母集団から無作為抽出されたxの値は確率変数となり それは次のようなベルヌーイ分布に従う 確率 1-pp p 0 1 ベルヌーイ確率変数は 0 か 1 の値をとり 1 をとる確率が p 0 をとる確率 1-p の離散確率変数である ベルヌーイ確率変数の平均は p 分散は p(1-p) となる x 3 4

点推定 従って 次の式が成立する 母集団のタコ焼き器の所有率 p の自然な推定量は x の標本平均であろう このは,pの不偏かつ一致推定量であり その意味で望ましい推定量である 区間推定 xの平均はp 分散はp(1-p) であるので, 定理 5.3( 中心極限定理 ) より,n が大きいとき, 次の z は標準正規分布に従う. n が大きいときには をに置き換えることで 母比率 (xの母平均)pの95% 信頼区間を次のように計算することができる 90% 信頼区間は 上記の 1.96 を 1.65 に置き換えたもので表され 99% 信頼区間は それを 2.58 に置き換たもので表される 5 6 12 1.2 比率の検定 母比率が 50% を超えているかどうかを検定する 帰無仮説が正しいとき そして n が十分に大きいとき 次の z は標準正規分布に従う 母比率の差の検定定理 7.1 母数 p a のベルヌーイ母集団から無作為抽出された大きさ n a の標本の標本平均を 母数 p b のベルヌーイ母集団から無作為抽出された大きさn b の標本の標本平均をで表すとき nが大きければ その標本平均の差は 以下の平均 m 分散 vの正規分布に近似的に従う 片側検定なので もし観測値から計算される z の値が165 1.65 を超えるならば 95% 水準で帰無仮説は棄却される 一般に 母比率がαを超えているかどうかを検定するときには 次のzを用いて片側検定を行う 両比率に差があるかどうかだけを検定したい場合には 帰無仮説 対立仮説は次のように表される 7 8

帰無仮説が正しいとき 次の z は n が大きいときに標準正規分布に従う ただし p 0 =p a =p b である p 0 の値はわからないので これを次ので置き換えて 標準正規分布に基づく検定を行う 9 10 21 2.1 独立性の検定 居住地 ( 都市部か農村部か ) と里山保全に対する評価との間に何らかの関係があるかどうかを調べたいとしよう 2) 両質問の回答形式が単一回答で 選択肢が二つのとき クロス集計表は次のように表される 表側の行数が r 表頭の列数が k のクロス集計表を r k クロス集計表という この場合は 2 2 クロス集計表ということになる もし居住地と里山保全に対する評価との間に何の関係もないならば すなわち居住地が都市部か農村部かということと里山保全を重要だと考えるかどうかということが互いに独立であるならば 次の四つの式が成立するはずである 帰無仮説 表 7.1 居住地別に見た里山保全に対する評価 里山保全は重要 a c a+c 里山保全は重要でない b d b+d 合計 a+b c+d n=a+b+c+d そして 期待される各セルの観測値数は次のようになる 11 12

このとき 次の式で計算される ( 検定 ) 統計量は 自由度 1 のカイ二乗分布に近似的に従う ここで バー がついていないものは実際の観測値数を バー がついているものは期待される観測値数を表している 観測値からこの値を計算し カイ二乗分布表に基づいて 検定を行う これを独立性の検定という 有意水準に対応する棄却域は次のとおり この検定の対立仮説は 居住地が都市部か農村部かということと里山保全を重要だと考えるかどうかということは互いに独立ではない ということになるが それはここでは 都市部の人には里山保全を重要だと思う人が多い か 農村部の人には里山保全を重要だと思う人が多い のいずれかを意味する もし 都市部で里山保全が重要だと思う人の割合が 農村部のそれを上回っているのであれば 対立仮説を前者に 逆であれば 対立仮説を後者にしてしまってよい 補正カイ二乗検定 2 2 クロス集計表で a b c d のいずれかが 5 以下の場合には 検定統計量がカイ二乗分布でうまく近似されない このときには 検定統計量を次のように補正する ( イエーツの補正 ) 13 14 22 2.2 オッズ比 居住地が都市部か農村部か と 里山保全を重要だと思うかどうか について 母集団の構成が次の二つのケースをのケ考える 表 7.2 居住地別に見た里山保全に対する評価 ( 母集団の構成 ケース A) 都市部農村部全体 度数 % 度数 % 度数 % 里山保全は重要 9000 42.9% 2000 25.0% 11000 37.9% 里山保全は重要でない 12000 57.1% 6000 75.0% 18000 62.1% 合計 21000 100.0% 8000 100.0% 29000 100.0% 表 7.3 居住地別に見た里山保全に対する評価 ( 母集団の構成 ケースB) 度数 % 度数 % 度数 % 里山保全は重要 14000 66.7% 2000 25.0% 16000 55.2% 里山保全は重要でない 7000 33.3% 6000 75.0% 13000 44.8% 合計 21000 100.0% 8000 100.0% 29000 100.0% どちらも 都市部の人には里山保全が重要だと思う人が多い ということになるが ケースAでは 少しだけ多い のに対して ケースBでは とても多い ことを示している 15 この関係の強さを測る指標の一つにオッズ比 (Odds Ratio) がある 表 7.4 居住地別に見た里山保全に対する評価 ( 母集団の構成 一般表記 ) 里山保全は重要 α γ α+γ 里山保全は重要でない β δ β+δ 合計 α+β γ+δ Ω=α+β+γ+δ オッズ比は二つの質問の回答が独立であるとき 1 となり 関係が強いほど1から離れる また オッズ比の自然対数をとった対数オッズ比もしばしば示される 対数オッズ比は 二つの質問が独立であるとき 0 となり 関係が強いほど 0 から離れる 16

オッズ比の推定 点推定 得られたクロス集計結果からαδ/βγ すなわちad/bc/ を計算する 区間推定 オッズ比を φとすると 標本対数オッズ比は 平均がlnφ φ 分散が次のvの正規分布で近似される 従って 標本対数オッズ比の95% 信頼区間は 点推定される標本オッズ比 (=ad/bc) を用いて 次のように表される 23 2.3 一般的な独立性の検定 表 7.5 情報提供の有無別に見た遺伝子組み換え食品の安全性評価 情報あり 情報なし 全体 安全だと思う a d a+d 危険だと思う b e b+e わからない c f c+f 合計 a+b+c d+e+f n=a+b+c+d+e+f r kのケースにおいても 基本的に検定の手続きは同じ 上記のような 3 2 の場合 2 2 のケースと同様に まずは各セルの期待される観測値数を計算する オッズ比の形に戻すと その 95% 信頼区間は次のようになる exp は指数関数 (e 2.72 を底とする数式のべき乗 ) を表している 17 18 次に検定統計量を次のように計算する. r k の場合 検定統計量は自由度 (r-1) (k-1) のカイ二乗分布に従う この例では (3-1) (2-1) で 自由度は2となる あとはカイ二乗分布表に基づいて検定を行う 注 1. 本章は 岩田 (1983) 第 8 章 森棟 (2000) の第 6 章 第 8 章を参考にした 2. 農林統計では 各市町村は 都市的地域 平地農業地域 平地農業地域 中間農業地域 山間農業地域 に区分される ここでの 都市部 は 都市的地域 を 農村部 は残りの三つの地域をイメージしている 各地域の定義については http://www.maff.go. jp/yougo_syu/toukei.htmlを参照のこと 引用文献 岩田暁一 (1983) 経済分析のための統計的方法第 2 版 東洋経済 森棟公夫 (2000) 統計学入門第 2 版 新世社 19 20