カイ二乗フィット検定、パラメータの誤差

Similar documents
統計的データ解析

統計的データ解析

最小二乗フィット、カイ二乗フィット、gnuplot

数値計算法

数値計算法

スライド 1

講義「○○○○」

スライド 1

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

基礎統計

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - e-stat(OLS).pptx

データ解析

Microsoft PowerPoint - 資料04 重回帰分析.ppt

情報工学概論

EBNと疫学

Microsoft Word - Time Series Basic - Modeling.doc

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - H21生物計算化学2.ppt

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Probit , Mixed logit

解析センターを知っていただく キャンペーン

様々なミクロ計量モデル†

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

モジュール1のまとめ

経済統計分析1 イントロダクション

スライド 1

ベイズ統計入門

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Medical3

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - sc7.ppt [互換モード]

PowerPoint プレゼンテーション

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

ビジネス統計 統計基礎とエクセル分析 正誤表

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft Word - reg.doc

Microsoft Word - å“Ÿåłžå¸°173.docx

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

第7章

Microsoft Word - 補論3.2

ii 3.,. 4. F. ( ), ,,. 8.,. 1. (75% ) (25% ) =7 24, =7 25, =7 26 (. ). 1.,, ( ). 3.,...,.,.,.,.,. ( ) (1 2 )., ( ), 0., 1., 0,.

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft PowerPoint - ch04j

SAP11_03

Microsoft Word - Stattext13.doc

PowerPoint プレゼンテーション

Microsoft PowerPoint - Econometrics pptx

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - Inoue-statistics [互換モード]

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

スライド 1

Medical3

青焼 1章[15-52].indd

Microsoft Word - Stattext12.doc

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Microsoft PowerPoint - Statistics[B]

_KyoukaNaiyou_No.4

Microsoft PowerPoint - 測量学.ppt [互換モード]

生命情報学

Microsoft PowerPoint - 11JUN03

DVIOUT-17syoze

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

, ( ξ/) ξ(x), ( ξ/) x = x 1,. ξ ξ ( ξ, u) = 0. M LS ξ ξ (6) u,, u M LS 3).,.. ξ x ξ = ξ(x),, 1. J = (ξ ξ, V [ξ ] 1 (ξ ξ )) (7) ( ξ, u) = 0, = 1,..., N

日心TWS

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

スライド 1

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

2011年度 大阪大・理系数学

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft Word - reg2.doc

Hara-statistics

2011年度 筑波大・理系数学

航空機の運動方程式

不偏推定量

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

mt1-slides-03.pptx

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

頻出問題の解法 4. 絶対値を含む関数 4.1 絶対値を含む関数 絶対値を含む関数の扱い方関数 X = { X ( X 0 のとき ) X ( X <0 のとき ) であるから, 絶対値の 中身 の符号の変わり目で変数の範囲を場合分けし, 絶対値記号をはずす 例 y= x 2 2 x = x ( x

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

1.民営化

2014年度 名古屋大・理系数学

構造方程式モデリング Structural Equation Modeling (SEM)

Part () () Γ Part ,

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

PowerPoint プレゼンテーション

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

T2K 実験 南野彰宏 ( 京都大学 ) 他 T2Kコラボレーション平成 25 年度宇宙線研究所共同利用成果発表会 2013 年 12 月 20 日 1

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

13章 回帰分析

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

DiMAGE Scan Multi PRO

Transcription:

統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 )

問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσ σ σ σ x y x y a σx + σ y ( ). x にも誤差がある場合どのように扱うべきか?x,y が独立で それぞれ正規分布に従う誤差をもっているとして 直線モデルの場合を例にとって考えよ ( ヒント : 上の式 ). y の値のモデル点まわりの分布が正規分布からずれている場合 最尤法に立ち戻って考える必要がある 例えばポアソン分布の場合は どうなるか? 尤度をあらわす式をかき 直線モデルのパラメータ a,b を決めるための手順を示せ 3. 6keV 付近で およそ 0eVFWHM 程度のエネルギー分解能をもつ検出器がある エネルギー分解能を ev の誤差 ( 標準偏差 ) で求めるためには X 線イベントをどのくらい集める必要があるか 4. ガウシアン + 定数のモデルで与えられたデータ点をカイ 乗フィットせよ 出力されるフィット結果の数字の意味 ( 定義 ) を調べること また ガウシアン関数として 二通りの形 (0/4 の資料参照 ) を試し 積分強度とその誤差を計算し 共分散の寄与を確認せよ 追加 :3x3 ピクセル内に 光子入るイベントを % 以下にする条件

カイ二乗分布の確率分布の積分あてはめの良さの検定 reduced-χ の値の表 ( 対応する χ の値を超える確率 P と自由度 ν の関数として表示されている ) 最小二乗フィットによりモデルパラメータを最適化した際の χ 値を求める 上記の χ 値 ( 以上の値 ) を得る確率を表から調べる 確率があまりにも小さければ何か間違っている ( 例えばモデルが適当でない ) Data Reducto ad Error Aalyss for the Physcal Sceces, Bevgto & Robso より

http://cluster.f7.ems.okayama-u.ac.jp/~ya/jscscd/table/ch.html にも同様の表 ( 但し reduced ch-squared ではなく ch-squared の値 ) が掲載されている Excel なら CHIDIST,CHIINV

フィットのよさに関するカイ二乗検定 [ 問題例 ] 7 組の測定データ (x,y ) (=,..,7) で X の誤差は無視できるほど小さく y の誤差は σ とする これを y=ax+b の直線モデルを仮定し a,b をフリーパラメータとしてカイ二乗フィットする 自由度は 7-=5 χ m の値 によって どのような判断をするか? 例えば χ m=5.を得た場合 自由度 5のχ 分布で5. 以上の値を得る確率は0.99% 結論例 : 危険率 %( 以上 ) でこのモデルは棄却される 結論例 : 危険率 0.5% ではこのモデルは棄却されない χ m=6.0を得た場合 自由度 5 の χ 分布で 6.0 以上の値を得る確率は 3% 結論例 : ( 危険率 0% では ) このモデルは棄却されない χ m=0.55 を得た場合 自由度 5 の χ 分布で 0.55 以下の値を得る確率は % 結論例 : χ m の値が小さすぎる ( と危険率 % で結論できる ) 誤差の評価が不適当である可能性が大きい

モデルの妥当性の検討 [ 問題例 ] 7 組の測定データ (x,y ) (=,..,7) で Xの誤差は無視できるほど小さく y の誤差はσ とする これをa,bをフリーパラメータとする3 種のモデルを用いて それぞれカイ二乗フィットする 自由度はいずれも5 A) y=ax+bのモデルa) に対してχ m=5.0 B) y=ax b のモデルB) に対してχ m=6.0 C) y=aexp(-x/b) のモデルC) に対してχ m=5. [ 結論例 ] モデルC) は危険率 % で棄却される 一方 モデルA),B) は棄却されない モデル A) がモデル B) より適当という結論は このカイ二乗フィットのみからは導かれないことに注意

パラメータの推定誤差 最適化したパラメータはあくまでもパラメータの真の値の推定値 必ず推定誤差がある 直線モデルの場合 誤差伝播側より計算できる σ σ a = = a σ = y Δ σ = = b x b σ = y Δ σ y( x) y ax b y χ = = σ = σ Pab (,) を最大にする=χ を最小にする χ = 0, χ = 0 a b からχ を最小にするab, として xy x y a = Δ σ σ σ σ x y x xy b = Δ σ σ σ σ x x ただしΔ= σ σ σ

任意関数の最小二乗 ( カイ二乗 ) フィット 任意の関数形 yx () をモデルに採用した場合でも y y( x) χ = σ を最小にするようパラメータを決定する m χ ν m χ パラメータの数をとしては自由度 = の分布に従うことが期待される パラメータの誤差の推定 : χ を最小にするパラメータ値 a に対して χ をだけ増加させる χ m Δ χ = a aχm +Δa+ aχm Δa ( ) の値 を探す aの誤差範囲 (パラメータ68% 信頼水準 ) はaχm Δ a から aχm +Δa+

カイ二乗フィットのパラメータ推定誤差 回の測定でデータの組 ( x, y ),...,( x y ) が得られたとし y,..., yの測定誤差, ( ただし正規分布するランダム誤差 ) をσ,..., σとする これらのデータ点は p 個のパラメータで指定されるモデルf(; x a,..., a ) に 正規分布に従う誤差が 付加されたデータで構成される母集団から採取されたと仮定する パラメータの真の値 ( これは不可知 ) を( a,..., a ) と仮定すると尤度 ( データ点の組が得られる確率は ) は Pa (,..., a ) = exp ( y ) f( x; a,..., ap) p = σ σ π y f( x; a,..., ap) p expの中身をχ と定義する χ は自由度 の χ 分布に従う = σ 一方 Pa (,..., a ) を最大にするようなパラメータの組 (= 最適パラメータ ) を( aˆ,..., aˆ ) と y ˆ ˆ f( x; a,..., ap) するとこれはχ の最小値 χm = を与える = σ χ m はp 個のパラメータによって調整して最小化を行ったので自由度が p減って 自由度の χ 分布に従う - p p p p

カイ二乗フィットのパラメータ推定誤差 ( ) f x a,..., a a,..., a ( aˆ,..., aˆ ) ; p が pの線形関数の場合 p がχ の最小値を与えることに 注意すると ( y ( ; )) ( ˆ ˆ f xa,..., ap y f x; a,..., ap) ( ) p Δ χ = Aj aj aj = σ j= Δχ という形にかけるはず ( =0) δj = とすると a A Pa (,..., a ) = Fa (,..., aを含まない関数 ) p ( ) p m ; p p m j p j j= exp δj π ( ˆ ) ( a ˆ j aj) これからΔχ χ χ は自由度 pの χ 分布に従うことがわかる f x a,..., a がa,..., a の線形関数でない場合は このような形にはかけないが Δχ χ χ は自由度 pの χ 分布で近似する δ j

カイ二乗フィットのパラメータ誤差推定 ( パラメータの数による信頼区間の違い ) パラメータ a,a それぞれのの 68% 信頼区間は Δχ = であるが (a,a ) の組の 68% 信頼区間は Δχ =.3 の楕円で囲まれた領域になる Numercal Recpes C, 技術評論社より転載 上の表で自由度とは ( 注目する ) パラメータの数

最小二乗 ( カイ二乗 ) フィットのまとめ 最尤法が根拠 ただし 測定値 y のモデル点からのばらつきが正規分布で近似できる場合に限定 χ を最小にするパラメータが最良推定値 あてはめの良さ モデルの妥当性は χ の値が自由度 -m に近いかどうかで評価できる パラメータの誤差 ( 信頼区間 ) は Δ χ から推定できる

カイ二乗フィットの計算手法 モデル関数が多項式の場合 行列計算 ( 連立方程式 ) で解ける 一般の関数形のモデルでχ を最小化する方法 Grd Search Gradet Search Expaso Method χ をbest ftパラメータ付近で放物面で近似する モデル関数をbest ftパラメータ付近で線形化する Gradet-Expaso algorthm (Marquardt method) 詳細は Data Reducto ad Error Aalyss for the Physcal Sceces, Bevgto & Robso 等を参考のこと

問題 D. xspec におけるカイ 乗フィットの実例を紹介せよ. デルタカイ 乗 = がパラメータの推定誤差になることを y(x)=b のモデルの例で示せ 3. デルタカイ 乗 = がパラメータの推定誤差になることを 一般的な場合 ( ただし各パラメータは独立な場合 ) に関して説明せよ ( 配布資料にかいている内容を理解して説明をせよ ) 4. F-test を説明せよ 特にカイ 乗フィットでモデルパラメータを増やす際の検定について