Microsoft PowerPoint DegreesOfFreedom.ppt [互換モード]

Similar documents
Microsoft PowerPoint saitama2.ppt [互換モード]

EBNと疫学

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

統計的データ解析

基礎統計

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

スライド 1

情報工学概論

Microsoft Word - Stattext12.doc

Microsoft Word - å“Ÿåłžå¸°173.docx

モジュール1のまとめ

不偏推定量

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - 三次元座標測定 ppt

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

経済統計分析1 イントロダクション

講義「○○○○」

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - ch04j

Microsoft Word - Stattext13.doc

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - Stattext07.doc

不確かさ 資料 1/8

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

PowerPoint プレゼンテーション

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

JCG201S101-03(HP)

untitled

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft PowerPoint - statistics pptx

第7章

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft PowerPoint - statistics pptx

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

数値計算法

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

θ T [N] φ T os φ mg T sin φ mg tn φ T sin φ mg tn φ θ 0 sin θ tn θ θ sin φ tn φ φ θ φ mg θ f J mg f π J mg π J J 4π f mg 4π f () () /8

Microsoft PowerPoint - ANOVA_SHIRONO.pptx

日心TWS

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft Word - Stattext11.doc

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

データ科学2.pptx

数値計算法

Microsoft Word - apstattext04.docx

Microsoft Word - IntroductionToUncertainty_ doc

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Microsoft PowerPoint - stat-2014-[9] pptx

<4D F736F F D AA90CD939D8C7692C789C C F33816A8A6D92E894C52E646F63>

<4D F736F F F696E74202D2091AA92E882C982A882AF82E995738A6D82A982B382CC88D396A182C68D6C82A695FB2E B8CDD8AB B83685D>

Microsoft PowerPoint - 測量学.ppt [互換モード]

スライド 1

様々なミクロ計量モデル†

布に従う しかし サイコロが均質でなく偏っていて の出る確率がひとつひとつ異なっているならば 二項分布でなくなる そこで このような場合に の出る確率が同じであるサイコロをもっている対象者をひとつのグループにまとめてしまえば このグループの中では回数分布は二項分布になる 全グループの合計の分布を求め

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

Microsoft PowerPoint - Inoue-statistics [互換モード]

Microsoft Word - thesis.doc

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Hara-statistics

Microsoft Word - 【機2完1可1】はかりガイド改訂案(反映)【HP用】

Medical3

質量計の管理におけるはかり・分銅の不確かさの求め方について

Medical3

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

13章 回帰分析

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft PowerPoint - Econometrics pptx

MT2-Slides-13.pptx

青焼 1章[15-52].indd

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

JCG202S11-03_1396

経営統計学

Microsoft PowerPoint - JAIMAセミナー(MCM) ppt [互換モード]

横浜市環境科学研究所

Microsoft PowerPoint - Statistics[B]

Microsoft Word - appendix_b

Microsoft Word - apstattext05.docx

PowerPoint プレゼンテーション

測量士補 重要事項「標準偏差」

1.民営化

データ解析

_KyoukaNaiyou_No.4

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft PowerPoint - 基礎・経済統計6.ppt

<4D F736F F F696E74202D A6D82A982B3955D89BF82CC979D89F082C9954B977682C8939D8C768A7782CC8AEE91622E B8CDD8AB B83685D>

Transcription:

統計的仮説検定から 有効自由度に至るまでを 産業技術総合研究所計測標準研究部門 計量標準システム科計量標準基盤研究室 城野克広 <k.shirono@aist.go.jp> 1

統計的仮説検定から有効自由度に至るまでを 計測の分野では 95 % 信頼区間を持って拡張不確かさとすることが多いです 拡張不確かさは 測定の結果について 合理的に測定量に結び付けられ得る値の分布の大部分を含むと期待される区間を定める量 と定義されています しかし 古典的統計に基づいた拡張不確かさは 測定の結果について 合理的に測定量に結び付けられ得る値の分布の 95 % を含むと期待される区間を定める量 ではありません そして 私もそのことを承知しながら 面倒臭さのために そのように 嘘 をつくこともあります そんな謝罪の気持ちも込めて Web 公開用のこの資料では その辺りできる限り詳しく説明してみたいと思います 統計的仮説検定から有効自由度に至るまでを 産業技術総合研究所城野克広 <k.shirono@aist.go.jp> 2

1. 統計的仮説検定 3

仮説を立てよう 仮説検定 とは 仮説が正しいかどうか確かめること である 仮説 1 空はいつも青い 仮説 2 どの場面でも長嶋茂雄の背番号は3 番 仮説 3 すべての白鳥は白い 正しいだろうか? 4

夕焼けは赤いし 夜空は黒い 仮説を立てよう 実際にはすべて正しくはない このとき仮説は棄却されたという 最初の監督時代は 90 次は 33 オーストラリアの黒鳥はハクチョウ属の鳥類 5

統計的仮説検定 くじ引き用のドラム を考えよう ドラムAには赤が99 個青が1 個 ドラムBには赤が1 個青が99 個 仮説 このドラムが B である はどうしたら 確かめられるか? 6

統計的仮説検定 もちろん観察事実は必要 一回ドラムを回して 赤が出たとしたら? 赤 7

統計的仮説検定 仮説 = このドラムは B だ このドラムが B なら赤い玉が出る確率は 1% 以下しかないから 多分間違っている これを 有意水準 1% で仮説は棄却される という 8

統計的仮説検定 このとき 仮説 = このドラムは A だ は 確かめられたといえるのか? 上の仮説を帰無仮説とすると棄却はされないが 棄却されないことは積極的に支持されることとは異なる 一方で ドラム A と B しかないなら ドラム B ではないからドラム A だ は成り立つだろう 9

統計的仮説検定 このように 統計を用いた検定では棄却されて初めて結論が出る つまり 仮説は棄却されるために立てる このことから 仮説を 帰無 きむ 仮説 と呼ぶことがある また 帰無仮説が正しくないとき その背反として成り立つ仮説 を対立仮説という このように 帰無仮説を立て 有意水準を定め 検定を行う ことを 統計的仮説検定 と呼ぶ さあ 仮説を立ててみよう! 10

仮説を立てよう 1 効果の検定 血圧を下げるための薬を服用したとしよう 薬に効き目があったかどうかを判断するために仮説を立ててみよう 11

仮説を立てよう 1 効果があったかどうかを知りたいときには 効果がなかったらどうかを考える 仮説 = 血圧はいつもの血圧である もし これが棄却されれば 血圧に変化があるということである もちろん いつもの血圧より大きい でもよいのだが 実際の手続きを考えると結構面倒なことになる 12

仮説を立てよう 2 区間推定 あるサンプルに含まれている有機物 A の濃度を知りたい 測定して得られるのは 測定の不確かさの分だけずれた値であり 本当の値ではない 本当の値が どの範囲にあるか 知るための仮説はどのようなものがふさわしいだろうか? 13

仮説を立てよう 2 仮説 1 = 濃度は ( 測定値より小さい )a である 仮説 2 = 濃度は ( 測定値より大きい )b である 両方が棄却されれば 本当の濃度 cはa < c < bであると結論づけることができる!! このように検定を組み合わせて区間を定めることを区間推定と呼ぶ 14

言い訳? 厳密な定義の話 本資料では 信頼区間とは 両側検定の採択域である というストーリーでお話して行こうと思うが 一般的には 信頼区間とは 両側検定の採択域である と等価である (= 信頼区間と両側検定の採択域は たまたま 一致する ) という言い方がされることが多い そもそもの信頼区間は そのやり方で推定すると真の値がその区間に含まれる確率が 95 % になるようなやり方で定めた区間 という定義がよくされる しかし これではどう計算を始めたらよいのか 全く見当がつかない ( ような気がする ) このため 統計学的な厳密さはさておいて 実用的な観点から 信頼区間とは 両側検定の採択域である という立場から説明していこうと思う 15

正規分布による検定 片側検定 ブタ肉を 100 g の注文を受けたとき 100 g 以下ではクレームがつく ブタ肉の計量のばらつきが 1g の標準偏差がある正規分布に従う場合 何 g 以上ときのみ販売すれば ブタ肉が 100 g 以下のときに 誤って 100 g として売ってしまうことを 1% 以下に防ぐことができるか? ( 注 ) 通常ここでいう標準偏差ははかりの校正の標準不確かさに繰り返しの不確かさを足したものである 単純な繰り返しの変動や環境条件などの変動がある場合には 校正の不確かさだけでは十分ではない 16

正規分布による検定 仮説 = ブタ肉は 100 g である つまり考えなくてはいけないのは 下の 真の平均が 100 g の正規分布 である = 1g 計測値を中心とする正規分布を考えるのではなく 仮説に基づいた分布を考える = 100g 17

正規分布の特徴 + 1.64 + 1.96( + 2) + 2.33 + 2.58 + 2.97 ( + 3) 99.85 % 99.5 % 0.15 % 0.5 % 99 % 1 % 97.5 % 2.5 % 95 % 5 % 18

正規分布による検定 今回の場合に当てはめると = 1g = 100g + 2.33 = 102.33 g 99 % 1 % 本当のブタ肉が 100 g より少ないなら 102.33 g 以上 に計量される確率は 1 % 以下ということが分かる 19

正規分布による検定 論理を確認してみよう 計量値が 102.33 g 以上であれば 仮説 = ブタ肉は 100 g である は有意水準 1 % で棄却される 本当のブタ肉が 100 g より少ないなら 102.33 g 以上 に計量される確率は 1 % 以下である 102.33 g 以上 の時販売すれば 本当のブタ肉が 100 g より少ないときに 誤って売る確率は 1 % 以下である 20

こぼれ話 : 統計でできること 制御したい確率 を制御する検定ができているかは しっかりとチェックする必要がある 例えば 本当は 100 g 以下のブタ肉にも関わらず 100 g 以上として販売してしまう確率 と 100 g 以上として販売したブタ肉が本当は 100 g 以下である確率 は違う 実は後者は古典的な統計で考えるのは非常に困難である 古典的な統計では 本当は だったとき という結果になる確率 を考えるものであり 結果が であったとき 本当は である確率 はなじまない ちなみに 本当は である確率 を考える統計をベイズ統計と呼び 古典的な統計とは一線を画す統計理論として注目を浴びている 21

2.t 分布を用いた検定 22

t 分布を理解しよう 正規分布の検定では 本当の標準偏差 や近い値が分かっているときに用いることができるが t 分布は 本当の標準偏差 や近い値が分からないときに用いる しかし t 分布も計測値が 正規分布に従う ことは前提としていることには注意が必要 = 1 = 2 = 3 = 4 23

t 分布の正体 t 分布の導出 あるコンセントの電圧を測る 5 回の測定から平均値を 100.0 V 1 回の測定の標準偏差を ( 不偏 ) 推定し 0.1 V と求めた もし たまたま 本当の電圧の平均値が 100.0 V であるとすると 次にもう一度電圧を測定したとき 100.0 V±2 0.1 V の範囲つまり 99.8 V から 100.2 V の区間に測定値が入る確率はおよそ 95 % と考えてよいだろうか もちろん 問題にするからには間違っているわけだが なぜ間違っているのか 95 % より大きくなるか小さくなるかを考えてみよう 24

t 分布の正体 もし測定値が平均 100 V 標準偏差 0.1 V の正規分布なら 一つの測定値が 99.8 V から 100.2 V の間に入る確率はおよそ 95 % のはず 1.96( 2) + 1.96( + 2) 2.5 % 95 % 2.5 % 25

s 2 t 分布の正体 ポイントは 分散の推定の不確かさ 1 5 1 x i xi x 5 i 1 この式は この式を使って何度も何度も分散を計算するとその平均値が本当の分散になるということに過ぎない 何度も何度も分散を計算すると? 2 26

t 分布の正体 仮説に基づいた分布から 何度も何度も 分散を計算すると = 100.0 V = 0.1V 何度も何度も!! {x i } s 2 1 5 1 x i xi x 5 i 1 2 27

t 分布の正体 新しい分布ができる!! 頻度 その平均値が 2 = 0.01 V 2 である 計算された s 2 (x i ) 28

t 分布の正体 この分布を見てわかるように 不偏分散は本当の分散よりも小さく推定してしまうことの方が 大きく推定してしまうことよりも多い 確率密度 0.01 V 2 大きい方に尾を引くため それにつられて 平均値は大きくなる 59 % 41 % s 2 29

t 分布の正体 結果として 95 % よりも小さい確率でしか 2s と +2s の間には次の測定値は入らない 2s > 95 % + 2s 2 + 2 2.5 % 95 % 2.5 % 30

t 分布の正体 では 実際のところ何 % になるかというと 過去の計測は 未来の計測は 分散の分布から適当に一つ値 s 2 を取って 平方根 s を取ることに相当する 正規分布から適当に一つの値 x をとってくることに相当する これを繰り返して 2s < x < 2s となる確率を計算すればよい

t 分布の正体 2 < (x )/s < 2 でもいい つまり 分散の分布から適当に一つ値 s 2 を取って 平方根 s を取る 正規分布から適当に一つの値 x をとる t x s 何度も何度も!! を計算する 32

t 分布の正体 新しくできた t 値の分布について 2 < t < 2 となっている確率を計算すればよい ( の値は関係ない ( 次スライド )) 88 % 2 0 2 t x s 88 % と求まり 95 % より小さいことが分かる 33

t 分布の正体 t x s の分布が t 分布である 実は この分布は繰返し回数にしか依存しない分布である ちなみに繰返し回数無限大の t 分布は正規分布に一致する 繰り返し数ー 1 を自由度と呼び 繰り返し 数 n 回のときの t 値の分布を 自由度 (n 1 ) の t 分布 と呼ぶ 34

t 分布による区間推定 両側検定による区間推定 ブロックの長さの測定を行った 10 回繰返しから平均値 10 cm が得られた また その平均値のばらつきの標準偏差は 0.1 cm と不偏推定された このブロックの長さはどう報告すればよいか? 測定のばらつきは正規分布に従うとする 35

t 分布による区間推定 仮説 1 = 本当の長さは a(< 10 cm) である 仮説 2 = 本当の長さは b(> 10 cm) である 仮説は正規分布のときと変わらない 真の平均が a と b の正規分布を考える しかし分散は未知 = a = b 36

t 分布の特徴 測定値が平均より大きくずれる場合も 小さくずれる場合も考える 例えば t 値は繰り返し 10 回のとき ( 2.26 +2.26) の範囲に 95 % の測定値が入る 2.5 % 95 % 2.5 % 2.26 2.26 37

t 分布による区間推定 本当の長さが a であるとき t = (10 cm a)/0.1 cm というような 0 からかけ離れた値が計測される確率は 5 % である ような a を見つければ 仮説 = 本当の長さは a(< 10 cm) である は有意水準 5 % で棄却されるから 本当の長さは a より大きい となる t 10 a 0.1 2.26 a = 9.774 cm 2.5 % 2.26 95 % 2.26 2.5 % 38

t 分布による区間推定 t = (10 b)/0.1 = 2.26 から b = 10.226 cm も求まる 仮説 1 = 本当の長さは 9.77 cm である 仮説 2 = 本当の長さは 10.23 cm である 両方が有意水準 5 % で棄却され 95 % 信頼区間は 長さは 9.77 cm から 10.23 cm の間である と結論づけることができる! 39

こぼれ話 : 仮説と区間推定 この区間推定で考えているのは 仮説が正しいときの分布 であり 正規分布である 計測値から考えられる本当の値の分布 が t 分布になるように考えるのは 古典的な統計の考え方からいうとおかしい つまり 例の問題なら 区間推定において 下のような分布は一切出てこないのである 95 % 信頼区間とは その範囲に本当の平均があるなら 得られたデータが出てくる確率が 5 % 以上はある区間 という 一呼吸おいて考えないとよく分からない区間なのである 2.5 % 9.77 cm 95 % 2.5 % 10.0 cm 10.23 cm 前述のベイズ統計では左の分布が出てくる 興味のある方はベイズ統計について勉強してください 40

クイズ 区間推定 あるサンプルに含まれている有機物 A の濃度が 5 つの試料について測定した結果 平均値が 5.0 mg/l と求まった その平均値のばらつきの標準偏差は 0.2 mg/l である 試料のばらつきに比べて 計測の不確かさが無視できるほど小さいとき この有機物の濃度はどのように報告したらよいか? なお自由度 4 の t 分布において ( 2.78 +2.78 ) の範囲に 95 % の t 値が入ることが知られている 41

t 分布のまとめ t 分布を用いる検定は 本当の標準偏差 や近い値が分からないときに 平均値について議論したいときに用いることができる t 分布の形状は繰返し回数で変わる 95 % 信頼区間は ( 計測値 )±(t 分布の上側の 5 % 点 ) ( 推定された標準偏差 ) で与えられる 42

3. 拡張不確かさと区間推定 43

拡張不確かさを算出しよう 包含係数 k を 95 % になるようにちゃんと計算するべきという意見がある 95 % の意味するところは t 分布の区間推定説明したが 実際の不確かさ評価においては単純な t 分布で済みそうな話はほとんどない それではどのように計算されるのであろうか? その計算ために用いられているのはかなり大胆な近似法ー Welch-Satterthwaite 近似である 44

Welch-Satterthwaite 近似による区間推定 有効自由度を用いた区間推定ある液体の体積 vを 5 回反復測定し 測定データ {100.0, 100.3, 99.9, 99.7, 100.1 cm 3 } を得た この体積計は校正を受け そのずれは調整されている 校正値 v 0 の 95 % 信頼区間は ±0.88 cm 3 であり 信頼区間は自由度 11 の t 分布から求められた この液体の体積が 5 回反復の平均から 100.0 cm 3 と報告されるとき その 95 % 信頼区間を求めよ 45

Welch-Satterthwaite 近似による区間推定 不確かさ要因は繰返しと温度の不確かさのみである 2 つの要因の標準不確かさを以下のように求める 体積測定の平均値の不確かさは u 1 n 1 n 1 n 1 2 3 v sv sv v v 0.1000 cm 体積計の校正値 v 0 の不確かさは u k 3 U 0.088 cm 0 cm 自由度 11の t分布 5% 点の大きさ 2.20 3 v 0.040 n k 1 k 46

Welch-Satterthwaite 近似による区間推定 なお 体積の平均値 vも校正値 v 0 も体積測定への感度は1である 体積の標準不確かさは u 2 2 2 2 v c u v c u v v 3 2 3 0.1000 cm 0.04 cm 0.1077 cm 3 v 0 これも実験分散である しかし 単独の正規分布から取られた値ではないので t 分布と直接関連づけることはできない これを克服するために 近似的に関連づけようとするのが Welch-Satterthwaite 近似である 0 2 47

Welch-Satterthwaite の近似 独立な m 個の不確かさ成分 u 1 (y) u 2 (y) u m (y) があり それぞれの自由度 (= 実験回数 1) を 1 2 m とすると 測定結果 (y, u c (y)) は以下の式で計算される自由度 eff の t 分布に近似できる u 4 c 4 4 4 y u y u y u y eff 有効自由度 1 この eff を有効自由度と呼ぶ 1 2 2 m m 感度係数 c 1 c m を用いて u 4 c m 4 4 y c i u xi eff i 1 i とも書ける 48

Welch-Satterthwaite 近似による区間推定 例に当てはめると 3 4 3 4 0.1077 cm 0.1000 cm 3 0.04 cm eff 5 1 11 4 eff 5.33 数式の上では 自由度が整数でない t 分布も生成可能である この図は自由度 5.33 の t 分布 非整数の eff が定義の上で おかしいと思うなら 自由度 5 の t 分布を用いてもよいだろう 2.52 95 % 2.52 t 49

Welch-Satterthwaite 近似による区間推定 95 % 信頼区間の幅は ±2.52 u(v) ~ 0.25 cm 3 仮説 1 = 本当の体積は 99.75 cm 3 である 仮説 2 = 本当の体積は 100.25 cm 3 である 両方が有意水準 5 % で棄却され 95 % 信頼区間は 99.75 cm 3 から 100.25 cm 3 で与えられる! 50

Welch-Satterthwaite 近似の背景 Welch-Satterthwaite 近似の背景には実験分散は先の正規分布から得られた不偏分散の分布に従うと 近似 することにある さて 分散の分布の分散を考えると u 2 (s 2 ) = 2 4 / で与えられるから 2 y u y u y 2 2 u c 1 2 両辺の分散を取る y ~ u c (y) 1 ~ u 1 (y) この近似もかなり大胆である 2 u 4 c 4 y 2 4 1 1 2 4 2 4 4 y u y u y 1 1 2 2 Welch-Satterthwaite の式 2 51

自由度 自由度 = 実験回数 1 の定義は不十分で もっと複雑な検討が必要である また B タイプの標準不確かさに対応できていないのは明らかである その妥当性はともかく 実用上は Welch-Satterthwaite を用いるために 以下の自由度の決定方法を用いる場合がほとんどである Aタイプ評価した不確かさの場合自由度 = 実験回数 1 Bタイプ評価で校正証明書に有効自由度の記載がある場合自由度 = 校正証明書に記載の有効自由度 B タイプ評価でそれ以外の場合自由度 = ( 無限大 ) 回帰で求めたパラメータなどではこうではないが 多くの場合はこれで問題ない 他の方法もある (GUM 付属書 G.4.2) 次ページ 52

自由度 もしも B タイプで評価された不確かさの成分が正規分布に従うならば 自由度 B に対して u 2 (s 2 ) = 2 4 / B が成立することから以下のように定めることもある 標準偏差 s について考えると モデル式 s = (s 2 ) 1/2 から u 2 2 d s s 2 d s 1 2 B 2 u 1 2 2 2 2 s s u 1 4 ux ux 2 1 4 2 ~ 1 s 2 2 B つまり 標準不確かさが標準的にどのくらい不確かかという値を入れる もちろん 元が正規分布でないときにはなんの根拠もないし 標準不確かさがどのくらい不確かかに関する明確な情報があることも少ない 53

4 c u 4 4 v u y u 0 0 eff v 0 拡張不確かさ 例ある液体の体積 v を 5 回反復測定し 測定データ {100.0, 100.3, 99.9, 99.7, 100.1 cm 3 } を得た この体積計の表示の誤差は 0.1 cm 3 を超えないと知られている この液体の体積が 5 回反復の平均から 100.0 cm 3 と報告されるとき 95 % 信頼区間を求めよ 表示の標準不確かさ 0.1/ 3 = 0.05774 cm 3 の自由度を v0 = ( 無限大 ) として 4 2 2 4 4 v 0.1 0.05774 0.1 0.05774 eff ~ 7.11 で 包含係数 k = t U (7.11, 0.95) = 2.36 として U ku c eff 3 3 v 2.36 0.1155 cm 0.27 cm 4

拡張不確かさのまとめ Welch-Satterthwaite 近似は複数の不確かさ要因がある場合に用いることができる近似的な区間推定方法である 実験分散は正規分布からの不偏分散の分布とは直接関係ないので 数学的根拠は不十分だが 慎重な判断をしたいときには よく使われている方法である 個人的には 正規分布とみなして 有意水準を小さくすることで信頼区間を大きくする方が 同じように慎重な判断をするのにも 理論的な整合性は高いように思う 特に この範囲に真の値が入っていないと即クレームがつく というような状況ではそもそも標準偏差の2~3 倍の区間では小さすぎるだろう 55

おわりに 56

おわりに この資料では 95 % 信頼区間とは何か? と 有効自由度とは何か? に力を割いて説明した ともにわかりにくい概念の上に立ち しかも有効自由度はその根拠が曖昧なものであるとは言えるが その性質をよく理解すれば 特にどの試験を何回実験したら 望む精度が得られるのか? という検討においては 実用上役に立つ指標であろう 57

参考資料 (Excel での計算方法 分布表 ) 58

Excel で検定 正規分布のパーセント点は以下の式で求めることができる = NORMINV( 下側パーセント, 平均, 標準偏差 ) t 分布のパーセント点は以下の式で求めることができる = TINV( 両側パーセント, 自由度 ) 例えば 自由度 9 の t 分布の上側 95 % 信頼区間は = TINV(0.10, 9) = 1.83 から求めることができる また TINV 関数は非整数の自由度には使えないので Welch- Satterthwaite 近似を用いた場合には 以下の式を使うことがある = SQRT( 自由度 /BETAINV( 両側パーセント, 自由度 /2,1/2)- 自由度 ) 59

正規分布表 片側 ( 上側 ) パーセント点 両側パーセント点 確率 p の最終桁 確率 p の最終桁 0 1 2 3 4 5 6 7 8 9 0.001 3.0902 3.0618 3.0357 3.0115 2.9889 2.9677 2.9478 2.929 2.9112 2.8943 0.002 2.8782 2.8627 2.848 2.8338 2.8202 2.807 2.7944 2.7822 2.7703 2.7589 0.003 2.7478 2.737 2.7266 2.7164 2.7065 2.6968 2.6874 2.6783 2.6693 2.6606 0.004 2.6521 2.6437 2.6356 2.6276 2.6197 2.6121 2.6045 2.5972 2.5899 2.5828 0.005 2.5758 2.569 2.5622 2.5556 2.5491 2.5427 2.5364 2.5302 2.5241 2.5181 0.006 2.5121 2.5063 2.5006 2.4949 2.4893 2.4838 2.4783 2.473 2.4677 2.4624 0.007 2.4573 2.4522 2.4471 2.4422 2.4372 2.4324 2.4276 2.4228 2.4181 2.4135 0.008 2.4089 2.4044 2.3999 2.3954 2.3911 2.3867 2.3824 2.3781 2.3739 2.3698 0.009 2.3656 2.3615 2.3575 2.3535 2.3495 2.3455 2.3416 2.3378 2.3339 2.3301 0.01 2.3263 2.2904 2.2571 2.2262 2.1973 2.1701 2.1444 2.1201 2.0969 2.0749 0.02 2.0537 2.0335 2.0141 1.9954 1.9774 1.96 1.9431 1.9268 1.911 1.8957 0.03 1.8808 1.8663 1.8522 1.8384 1.825 1.8119 1.7991 1.7866 1.7744 1.7624 0.04 1.7507 1.7392 1.7279 1.7169 1.706 1.6954 1.6849 1.6747 1.6646 1.6546 0.05 1.6449 1.6352 1.6258 1.6164 1.6072 1.5982 1.5893 1.5805 1.5718 1.5632 0.06 1.5548 1.5464 1.5382 1.5301 1.522 1.5141 1.5063 1.4985 1.4909 1.4833 0.07 1.4758 1.4684 1.4611 1.4538 1.4466 1.4395 1.4325 1.4255 1.4187 1.4118 0.08 1.4051 1.3984 1.3917 1.3852 1.3787 1.3722 1.3658 1.3595 1.3532 1.3469 0.09 1.3408 1.3346 1.3285 1.3225 1.3165 1.3106 1.3047 1.2988 1.293 1.2873 0.1 1.2816 1.2265 1.175 1.1264 1.0803 1.0364 0.9945 0.9542 0.9154 0.8779 0.2 0.8416 0.8064 0.7722 0.7388 0.7063 0.6745 0.6433 0.6128 0.5828 0.5534 0.3 0.5244 0.4959 0.4677 0.4399 0.4125 0.3853 0.3585 0.3319 0.3055 0.2793 0.4 0.2533 0.2275 0.2019 0.1764 0.151 0.1257 0.1004 0.0753 0.0502 0.0251 0.5 0 0 1 2 3 4 5 6 7 8 9 0.001 3.2905 3.2636 3.2389 3.216 3.1947 3.1747 3.1559 3.1382 3.1214 3.1054 0.002 3.0902 3.0757 3.0618 3.0485 3.0357 3.0233 3.0115 3 2.9889 2.9781 0.003 2.9677 2.9576 2.9478 2.9383 2.929 2.92 2.9112 2.9027 2.8943 2.8861 0.004 2.8782 2.8704 2.8627 2.8553 2.848 2.8408 2.8338 2.8269 2.8202 2.8135 0.005 2.807 2.8006 2.7944 2.7882 2.7822 2.7762 2.7703 2.7646 2.7589 2.7533 0.006 2.7478 2.7424 2.737 2.7317 2.7266 2.7214 2.7164 2.7114 2.7065 2.7016 0.007 2.6968 2.6921 2.6874 2.6828 2.6783 2.6738 2.6693 2.6649 2.6606 2.6563 0.008 2.6521 2.6479 2.6437 2.6396 2.6356 2.6315 2.6276 2.6236 2.6197 2.6159 0.009 2.6121 2.6083 2.6045 2.6008 2.5972 2.5935 2.5899 2.5863 2.5828 2.5793 0.01 2.5758 2.5427 2.5121 2.4838 2.4573 2.4324 2.4089 2.3867 2.3656 2.3455 0.02 2.3263 2.308 2.2904 2.2734 2.2571 2.2414 2.2262 2.2115 2.1973 2.1835 0.03 2.1701 2.1571 2.1444 2.1321 2.1201 2.1084 2.0969 2.0858 2.0749 2.0642 0.04 2.0537 2.0435 2.0335 2.0237 2.0141 2.0047 1.9954 1.9863 1.9774 1.9686 0.05 1.96 1.9515 1.9431 1.9349 1.9268 1.9189 1.911 1.9033 1.8957 1.8882 0.06 1.8808 1.8735 1.8663 1.8592 1.8522 1.8453 1.8384 1.8317 1.825 1.8184 0.07 1.8119 1.8055 1.7991 1.7928 1.7866 1.7805 1.7744 1.7684 1.7624 1.7565 0.08 1.7507 1.7449 1.7392 1.7335 1.7279 1.7224 1.7169 1.7114 1.706 1.7007 0.09 1.6954 1.6901 1.6849 1.6798 1.6747 1.6696 1.6646 1.6596 1.6546 1.6497 0.1 1.6449 1.5982 1.5548 1.5141 1.4758 1.4395 1.4051 1.3722 1.3408 1.3106 0.2 1.2816 1.2536 1.2265 1.2004 1.175 1.1503 1.1264 1.1031 1.0803 1.0581 0.3 1.0364 1.0152 0.9945 0.9741 0.9542 0.9346 0.9154 0.8965 0.8779 0.8596 0.4 0.8416 0.8239 0.8064 0.7892 0.7722 0.7554 0.7388 0.7225 0.7063 0.6903 0.5 0.6745 0.6588 0.6433 0.628 0.6128 0.5978 0.5828 0.5681 0.5534 0.5388 確率 p の最終桁の前まで 確率 p の最終桁の前まで 60

t 分布表 片側 ( 上側 ) パーセント点 両側パーセント点 p p 0.001 0.0025 0.005 0.01 0.025 0.05 0.1 0.001 0.0025 0.005 0.01 0.025 0.05 0.1 1 318.31 127.32 63.657 31.821 12.706 6.3138 3.0777 1 636.62 254.65 127.32 63.657 25.452 12.706 6.3138 2 22.327 14.089 9.9248 6.9646 4.3027 2.92 1.8856 2 31.599 19.962 14.089 9.9248 6.2053 4.3027 2.92 3 10.215 7.4533 5.8409 4.5407 3.1824 2.3534 1.6377 3 12.924 9.4649 7.4533 5.8409 4.1765 3.1824 2.3534 4 7.1732 5.5976 4.6041 3.7469 2.7764 2.1318 1.5332 4 8.6103 6.7583 5.5976 4.6041 3.4954 2.7764 2.1318 5 5.8934 4.7733 4.0321 3.3649 2.5706 2.015 1.4759 5 6.8688 5.6042 4.7733 4.0321 3.1634 2.5706 2.015 6 5.2076 4.3168 3.7074 3.1427 2.4469 1.9432 1.4398 6 5.9588 4.9807 4.3168 3.7074 2.9687 2.4469 1.9432 7 4.7853 4.0293 3.4995 2.998 2.3646 1.8946 1.4149 7 5.4079 4.5946 4.0293 3.4995 2.8412 2.3646 1.8946 8 4.5008 3.8325 3.3554 2.8965 2.306 1.8595 1.3968 8 5.0413 4.3335 3.8325 3.3554 2.7515 2.306 1.8595 9 4.2968 3.6897 3.2498 2.8214 2.2622 1.8331 1.383 9 4.7809 4.1458 3.6897 3.2498 2.685 2.2622 1.8331 10 4.1437 3.5814 3.1693 2.7638 2.2281 1.8125 1.3722 10 4.5869 4.0045 3.5814 3.1693 2.6338 2.2281 1.8125 11 4.0247 3.4966 3.1058 2.7181 2.201 1.7959 1.3634 11 4.437 3.8945 3.4966 3.1058 2.5931 2.201 1.7959 12 3.9296 3.4284 3.0545 2.681 2.1788 1.7823 1.3562 12 4.3178 3.8065 3.4284 3.0545 2.56 2.1788 1.7823 13 3.852 3.3725 3.0123 2.6503 2.1604 1.7709 1.3502 13 4.2208 3.7345 3.3725 3.0123 2.5326 2.1604 1.7709 14 3.7874 3.3257 2.9768 2.6245 2.1448 1.7613 1.345 14 4.1405 3.6746 3.3257 2.9768 2.5096 2.1448 1.7613 15 3.7328 3.286 2.9467 2.6025 2.1314 1.7531 1.3406 15 4.0728 3.6239 3.286 2.9467 2.4899 2.1314 1.7531 20 3.5518 3.1534 2.8453 2.528 2.086 1.7247 1.3253 20 3.8495 3.4554 3.1534 2.8453 2.4231 2.086 1.7247 25 3.4502 3.0782 2.7874 2.4851 2.0595 1.7081 1.3163 25 3.7251 3.3606 3.0782 2.7874 2.3846 2.0595 1.7081 30 3.3852 3.0298 2.75 2.4573 2.0423 1.6973 1.3104 30 3.646 3.2999 3.0298 2.75 2.3596 2.0423 1.6973 40 3.3069 2.9712 2.7045 2.4233 2.0211 1.6839 1.3031 40 3.551 3.2266 2.9712 2.7045 2.3289 2.0211 1.6839 50 3.2614 2.937 2.6778 2.4033 2.0086 1.6759 1.2987 50 3.496 3.184 2.937 2.6778 2.3109 2.0086 1.6759 60 3.2317 2.9146 2.6603 2.3901 2.0003 1.6706 1.2958 60 3.4602 3.1562 2.9146 2.6603 2.299 2.0003 1.6706 80 3.1953 2.887 2.6387 2.3739 1.9901 1.6641 1.2922 80 3.4163 3.122 2.887 2.6387 2.2844 1.9901 1.6641 100 3.1737 2.8707 2.6259 2.3642 1.984 1.6602 1.2901 100 3.3905 3.1018 2.8707 2.6259 2.2757 1.984 1.6602 120 3.1595 2.8599 2.6174 2.3578 1.9799 1.6577 1.2886 120 3.3735 3.0885 2.8599 2.6174 2.2699 1.9799 1.6577 3.0902 2.807 2.5758 2.3263 1.96 1.6449 1.2816 3.2905 3.0233 2.807 2.5758 2.2414 1.96 1.6449 61