数値計算法 - PDF Free Download

数値計算法 011/5/5 林田清 ( 大阪大学大学院理学研究科 )

レポート課題 1( 締め切りは 5/5) 平均値と標準偏差を求めるプログラム入力 : データの数データデータは以下の 10 個 ( 例えばある月の最高気温 ( )10 日分 ) 34.3,5.0,3.,34.6,.9,7.7,30.6,5.8,3.0,31.3 出力 :( 標本 ) 平均値標準偏差ソースプログラムと出力結果をメイルの本文にして khclass@ess.sc.osaka-u.ac.jp までメイルせよ実行形式は添付しないことメイルのタイトルは report1_ 学籍番号とすること他の人のソースプログラムと結果をそのままコピーするのはダメ計算結果が正しいことを別プログラム or 別データで計算しよう

あてはめの良さ (Goodness of Ft) t y n ( ) n y y x y ax b ( 直線モデルの場合 ) 1 1 は自由度 n m( mはパラメータの数直線の場合 a, bで) のカイ自乗分布に従う期待値は n- m これがあてはめの良さ ( 仮定したモデル関数の妥当性パラメータab, が適当であること測定誤差が正しく評価されていること ) の基準になるを自由度で割った ( / ) をreduced ch-squareという y( x) は中心 0, 標準偏差 1の正規分布に従う gnuplot の ft では自由度は degrees of freedom (ndf) : として reduced は varance of resduals (reduced chsquare) = WSSR/ndf : として表示されている

分布自由度 nの ( カ平均値 0, 標準偏差 1の正規分布に従う変数 xの自乗和 n x =1 分布を自由度 nの分布と呼ぶ一般に自由度の分布は f / 1 / / ( ) {( ) e }/ ( / ) 期待値 E イ二乗 ) 分布 ( ) 分散 V( ) n ( x ) 平均値, 標準偏差の正規分布に従うも自由度 nの分布 n =1 ( x x) =1 はしかし自由度 n 1の分布の従う

カイ二乗分布の確率分布の積分あてはめの良さの検定 reduced-χ の値の表 ( 対応する χ の値を超える確率 P と自由度の関数として表示されている ) 最小二乗フィットによりモデルパラメータを最適化した際の χ 値を求める上記の χ 値 ( 以上の値 ) を得る確率を表から調べる Data Reducton and Error Analyss for the Physcal Scences, Bevngton & Robnson より確率があまりにも小さければ何か間違っている ( 例えばモデル

http://cluster.f7.ems.okayama-u.ac.jp/~yan/jscscd/table/ch.html にも同様の表 ( 但し reduced ch-squared ではなく ch-squared の値 ) が掲載されている Excel なら CHIDIST,CHIINV

パラメータの推定誤差参考最適化したパラメータはあくまでもパラメータの真の値の推定値必ず推定誤差がある直線モデルの場合誤差伝播側より計算できる a 1 1 n a 1 y n b 1 x b 1 y

任意関数の最小二乗 ( カイ二乗 ) フィット任意の関数形 yx ( ) をモデルに採用した場合でも n y y( x) 1 を最小にするようパラメータを決定するパラメータの数をmとしては自由度 = n mの分布に従うことが期待されるパラメータの誤差の推定 : を最小にするパラメータ値 a に対してを1だけ増加させる mn ( ) aの値 a a a a を探す 1 mn mn aの誤差範囲 (1パラメータ68% 信頼水準 ) はamn aから amn a

カイ二乗フィットのパラメータ誤差推定 ( パラメータの数による信頼区間の違い ) 参考パラメータ a 1,a それぞれのの 68% 信頼区間は Δχ =1 であるが (a 1,a ) の組の 68% 信頼区間は Δχ =.3 の楕円で囲まれ Numercal Recpes n C, 技術評論社より転載上の表で自由度とは ( 注目する ) パラメータの数

グラフの書き方練習 gnuplot 端末で gnuplotとうつと起動する簡単関数やファイルに書き込んだデータをプロットできる使い方は help というコマンドで参照できるインターネットで参照できる日本語のマニュアルもあり http://lagendra.s.kanazawa-u.ac.jp/ogursu/manuals/gnuplotntro/ http://lagendra.s.kanazawa-u.ac.jp/ogursu/manuals/gnuplot/

gnuplot の練習データファイル ( 例えば ) xye.dat を用意する 1.0. 0..0.9 0.1 3.0 4.3 0.3 4.0 5.0 0.1 5.0 5.8 0.3 端末で gnuplot とうつと起動する続いて以下の操作を試してみる plot "xye.dat" usng 1::3 wth yerrorbars set xrange[0.0:7.0] set yrange[0.0:7.0] f(x)=a*x+b ft f(x) "xye.dat" usng 1::3 va a,b ( ここで表示されるフィット結果を理解せよ ) replot f(x) 次に各点の誤差を無視した ( 重みづけなしの ) フィットを比較のためやってみると g(x)=c*x+d ft g(x) "xye.dat" usng 1: va c,d replot f(x),g(x)

最小二乗 ( カイ二乗 ) フィットのまとめ最尤法が根拠ただし測定値 y のモデル点からのばらつきが正規分布で近似できる場合に限定を最小にするパラメータが最良推定値あてはめの良さモデルの妥当性はの値が自由度 n-m に近いかどうかで評価できるパラメータの誤差 ( 信頼区間 ) はから推定できる

参考 ) 最尤法の直接的な利用 1 K 0 中間子の寿命の測定 K 0 中間子の生成点は生成に伴う二次荷電粒子の飛跡から崩壊点と運動量は崩壊後のパイ中間子の飛跡と運動量の測定から決められる点線の領域内で崩壊が起こった現象だけ取り扱う観測した崩壊イベントの平均が寿命の最良推定値になるか? No Data Reducton and Error Analyss for the Physcal Scences, Bevngton & Robnson より

参考 ) 最尤法の直接的な利用 0 時間 t だけ生き延びるK 中間子を観測する確率 P A p( t ; ) A e t / t / ( ; ) は寿命の粒子が ~ ここでAは定められた領域内で崩壊が起こり検出できる効率 0 K 中間子の生成点崩壊点の位置や運動量寿命に依存する p t e t t dtの間に崩壊する確率 Aはtやと独立ではないことに注意 0 生成点と運動量が決まっているK 中間子に対して点線領域に入るまでの距離を d, 出る ( 崩壊が起こらなかったとして ) までの距離をdとし対応する時間をt, t とする Aは次のように規格化する t t a b a a b tb t / t Pdt A e dt N L( ) P A e 1 1 a N 1 N個のイベントについて尤度は t / これを最大にするようなが求めたい答え b

参考 ) 最尤法の直接的な利用 3 L( ) P A e 1 1 のかわりに t M ( ) ln L( ) ln A を最大にすることを考える例 1) t 0, t のとき ( 粒子の寿命に対して測定領域が十分大きい場合 ) 1 A 1/ でM ( ) t N ln dm ( ) 1 N t 0 / より t N d 例 )( t 0), t ( ) が共通の値である場合 A 1/ N a a t 0 b e t / b N dt b t / 1 1 e t / b t t M ( ) ln L ln A N ln N ln 1 e dm ( ) 0をみたすが寿命の最尤推定値 d t / b

最尤法の直接利用と最小二乗法最小二乗法を使えないとき= 分布が正規分布でないときビンまとめしヒストグラムをつくると 1ビンあたりに含まれるデータ数が十分大きい場合正規分布で近似できるこの場合最小二乗法が使えるようになるただしもともとのデータ数が小さい場合は適用付加最尤法の直接利用複雑なモンテカルロ計算が必要になるような場合 ( 例 :K 中間子の寿命測定 ) も最尤法の直接利用が効果的 M=1/ より最尤法で決めたパラメータ誤差を推定できるしかし最尤法の直接利用ではあてはめの良さを評価する適当な指標 ( 最小二乗法の χ のような ) がない

確率分布検定区間推定いろいろな確率分布二項分布ポアッソン分布正規 ( ガウス分布 ) t 分布 χ 乗分布統計的検定仮説の当否を統計的に検証する区間推定真の値の範囲を統計的に推定する相関係数個のパラメータ間の関連を調べる

二項分布ポアッソン分布二項分布 n! x PB ( x; n, p) p (1 p) ( n x)! x! x pn np(1 p) (1 p) ポアッソン分布二項分布でp 1の極限 Px ( ; ) x x e x! nx 0.4 0.3 0. 0.1 Posson Dstrbuton 1 3 4 5 10 0 0 5 10 15 x 参考 ) 視聴率の誤差について http://www.vdeor.co.jp/ratng/wh/07.htm

ポアッソン分布の導出その 1 二項分布 n! 1 n! PB ( x; n, p) p (1 p) p (1 p) (1 p) ( n x)! x! x! ( n x)! pn n 1/ p 1 (1 p) lm (1 p) e p0 p0 e lm lm p0 np(1 p) (1 p) x PB ( x; n, p) Pp ( x; ) e x! x n x x x n においてを一定に保ったまま p 1の極限を考える n! x n (for x n) ( n x)! x (1 p) 1 px

ポアッソン分布 0.4 0.3 Posson Dstrbuton 1 3 4 5 10 0. ポアッソン分布の例 0 放射線源の1 秒あたりの崩壊数放射線源の測定で1 時間当たりの検出カウント数 1000 人の集団の中で今日が誕生日の人の数ポアッソン分布の統計誤差平均値の平方根 ( 複数回の測定ができないとき )1 回の測定値の平方根で置き換えるときもあるポアッソン分布と正規分布平均値が大きいとき ( 例えば 0 以上 ) ではポアッソン分布は平均値分散の正規分布で近似できる 0.1 0 5 10 15 x

正規分布 1 Px ( ;, ) exp x Bevngton &Robnson より

参考 ) 分布自由度 nの ( カ平均値 0, 標準偏差 1の正規分布に従う変数 xの自乗和 n x =1 分布を自由度 nの分布と呼ぶ一般に自由度の分布は f / 1 / / ( ) {( ) e }/ ( / ) 期待値 E イ二乗 ) 分布 ( ) 分散 V( ) n ( x ) 平均値, 標準偏差の正規分布に従うも自由度 nの分布 n =1 ( x x) =1 はしかし自由度 n 1の分布の従う

統計的検定 (statstcal test) 例 )xの10 回の測定平均値が0.45 標準偏差が0.05 仮説 H:( 例 ) 母集団での平均値は0.5である本当は対立仮説 H': 母集団での平均値は0.5でないを示したいので Hを帰無仮説という H': 母集団での平均値は0.5より小さい ( 大きい ) の場合も有り得る両側検定片側検定平均値 0.5 標準偏差 0.05の母集団から10 個の標本をサンプルした場合に平均値が0.45 以下になる ( あるいは0.45 以下 0.55 以上になる ) 確率 Pは? Pが定められた危険率 ( 有意水準 )aより小さい : 仮説は誤り正しい可能性を棄てる危険性 aを伴って大きい : 仮説は否定できない危険率 ( 有意水準 )=sgnfcance level

いろいろな検定母平均の検定 : 正規分布母集団の分散が既知でない場合 ->t 分布母平均の差の検定 ->t 分布母分散の検定 : 分布母分散の比の検定 :F 分布相関の有無の検定 : 相関係数の表

区間推定 f(t) 例 )n 回の測定の平均値がxと求まったとき母平均の存在する範囲はどのように推定できるか? -t ( /) N-1 1- / +t ( /) N-1 t 母集団の分布は正規分布 (, ) と仮定すると標本平均は正規分布 (, /n) に従う ( x ) / s / nは自由度 n 1の t分布に従う確率 1-となる区間は -t ( /) ( t ( /) N-1 x ) / s / n N-1 変形して x-t N-1( /) s / n x t N-1( /) s / n が信頼係数 100 (1- ) % での母平均の信頼区間 nが大きいときにはt 分布のかわりに正規分布を使い x-z( /) s / n x z( /) s / n で近似するときもある信頼区間 =confdence nterval 信頼係数 =confdence level

信頼区間の推定正規分布の場合 -<x-< にくる確率 68.3% -<x-< にくる確率 95.5% -3<x-<3 にくる確率 99.7% -1.96<x-<1.96 にくる確率 95% -.58<x-<.58 にくる確率 99%

相関係数二つの測定量 x,y の間に ( 線形 ) 相関があるかどうか 1に近ければ正の相関 -1に近ければ負の相関ゼロなら相関なし r N x y x y N x x N y y 1/ 1/ r=0.89 r=-0.05 r=-0.95

相関係数の検定 Data Reducton and Error Analyss for the Physcal Scences, Bevngton & Robnson より