14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Similar documents
Microsoft PowerPoint - 資料04 重回帰分析.ppt

スライド 1

スライド 1

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - 補論3.2

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - e-stat(OLS).pptx

13章 回帰分析

様々なミクロ計量モデル†

Probit , Mixed logit

データ解析

memo

統計的データ解析

スライド 1

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft PowerPoint - 三次元座標測定 ppt

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - Inoue-statistics [互換モード]

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft Word - å“Ÿåłžå¸°173.docx

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

横浜市環境科学研究所

数値計算法

ビジネス統計 統計基礎とエクセル分析 正誤表

1.民営化

講義「○○○○」

Microsoft Word - reg2.doc

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

PowerPoint プレゼンテーション

Microsoft PowerPoint - 10.pptx

Microsoft Word - reg.doc

スライド 1

Microsoft PowerPoint - sc7.ppt [互換モード]

vecrot

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft Word - thesis.doc

基礎統計

航空機の運動方程式

Microsoft Word - mstattext02.docx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

学習指導要領

PowerPoint プレゼンテーション

スライド タイトルなし

Microsoft Word - 8章(CI).doc

ベイズ統計入門

Microsoft PowerPoint - H21生物計算化学2.ppt

国土技術政策総合研究所 研究資料

テンソル ( その ) テンソル ( その ) スカラー ( 階のテンソル ) スカラー ( 階のテンソル ) 階数 ベクトル ( 階のテンソル ) ベクトル ( 階のテンソル ) 行列表現 シンボリック表現 [ ]

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

景気指標の新しい動向

PowerPoint Presentation

日心TWS

数値計算法

Matrix and summation convention Kronecker delta δ ij 1 = 0 ( i = j) ( i j) permutation symbol e ijk = (even permutation) (odd permutation) (othe

EBNと疫学

線形代数とは

PowerPoint プレゼンテーション

線積分.indd

学習指導要領

SAP11_03

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - 第3回2.ppt

ディジタル信号処理

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - 9.pptx

スライド 1

Microsoft Word doc

航空機の運動方程式

2014年度 名古屋大・理系数学

Microsoft Word - Stattext07.doc

構造方程式モデリング Structural Equation Modeling (SEM)

2016年度 京都大・文系数学

第7章

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

情報工学概論

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft PowerPoint - 測量学.ppt [互換モード]

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

2011年度 大阪大・理系数学

表計算ソフトの基礎 31 5 最小二 ( 自 ) 乗法 (Least squares method) 理工系の実験などでは, たいてい測定が行われる. ただし, 測定コストを減らすため, 粗い測定を行い, 得られた ( 誤差を含む ) 測定点群を説明することができる, 真の特性として何らかの関数 (

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

2 図微小要素の流体の流入出 方向の断面の流体の流入出の収支断面 Ⅰ から微小要素に流入出する流体の流量 Q 断面 Ⅰ は 以下のように定式化できる Q 断面 Ⅰ 流量 密度 流速 断面 Ⅰ の面積 微小要素の断面 Ⅰ から だけ移動した断面 Ⅱ を流入出する流体の流量 Q 断面 Ⅱ は以下のように

多次元レーザー分光で探る凝縮分子系の超高速動力学

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

09.pptx

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

Microsoft PowerPoint - statistics pptx

因子分析

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

フィードバック ~ 様々な電子回路の性質 ~ 実験 (1) 目的実験 (1) では 非反転増幅器の増幅率や位相差が 回路を構成する抵抗値や入力信号の周波数によってどのように変わるのかを調べる 実験方法 図 1 のような自由振動回路を組み オペアンプの + 入力端子を接地したときの出力電圧 が 0 と

数学 ⅡB < 公理 > 公理を論拠に定義を用いて定理を証明する 1 大小関係の公理 順序 (a > b, a = b, a > b 1 つ成立 a > b, b > c a > c 成立 ) 順序と演算 (a > b a + c > b + c (a > b, c > 0 ac > bc) 2 図

Microsoft PowerPoint - 配布資料・演習18.pptx

測量試補 重要事項

Transcription:

14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を さんと くんが測定し さんは 0.67 mmol/l という結 果を くんは 0.7 mmol/l という結果を出したとしよう さんと くんの技量が同じ なら カルシウム濃度として平均値 0.70 mmol/l を採用することになるだろう でも さ んの技量の方が くんより高く さんの分析値の標準偏差が 0.0 mmol/l くんの標準 偏差が 0.04 mmol/l であることが分かっているとしたら カルシウム濃度はいくらと推定 するのがよいだろうか? こうした問題を扱うのに カルシウム濃度としてもっともありそうな値を採用するという考え方がある 正規分布を仮定すると カルシウム濃度を t とした時 さんが くんが を与える確率 P(, は次式で与えられる : P (, 1 ( ep σ ( σ pσ σ ここで さん くんの測定値の標準偏差を それぞれ σ σ とした カルシウム濃度 t が分 からないのだが この P(, がもっとも大きくなるように t を推定するというのがこの立 場である 確率 P(, がもっとも大きくなるのは ( ( + σ σ がもっとも小さくなる時 つまり t の推定値 t e は にそれぞれ分散の逆数だけの重みを付けた平均 t e ( σ 1 σ σ + + σ であり その分散 ( 信頼区間の分散 は t e σ σ σ + σ で与えられる 先の例では さんの標準偏差 0.0 mmol/l は くんの標準偏差 0.04-1/6 -

14 化学実験法 II( 吉村 ( 洋 014.6.1. mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は 0.018 mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手法を 多変数のパラメーターに拡張したのが最小 乗法とみることができる 最小 乗法によるパラメータの決定 実験条件 を変えて物性値 の測定を N 回行ったデータ (, ( 1,,, N があり の測定値 にはかたよりがなく精密さが一定で ( 分散 σ 実験条件 には誤差がないもの としよう ここで には に対し次の線形の関係が成立しているものとし パラメータ a と b を定めることを考える a + b 最小 乗法は 先のカルシウム濃度の推定で考えたように 測定値のばらつきが正規分布に 従うと仮定し もっとも確率密度が高くなるように a b を決める手法と考えてよい ここで は測定値 の分散がすべて等しいとしているので 残差 乗和 Σ( a b が最小にすればよい * それには次の方程式 ( 正規方程式 を解けばよい ( q は q について の総和 q Σq a + b a + Nb ここからパラメータは次のように定まる N a ( / N b a N N 最小 乗法で定めた直線は点 (, を通る ( ここで, はそれぞれ のデータセット の平均 /N /N また残差 乗和の最小値 mn は mn (b + a で与えられる もっと一般的に実験条件が温度 圧力 濃度等の m 個の要素で与えられる場合には m 成 分の実験条件を与えるベクトル と m 個のパラメータのベクトル a を用い t a という 関係に N 個の実験条件 X(X は N 行 m 列の行列 に対する N 個の実験結果 Y を当てはめる問題と見ることができる 残差 乗和は (Y Xa で表され 正規方程式は次のコンパクトな形で表示できる : * この文脈では 与えられたデータセットについて分散を最小にするようにパラメーターを決めていると考えてもよい ( 不偏最小分散推定 ガウス - マルコフの定理 かつて計算機等の利用が不便だった時代 簡易な推定法として実験データを グループに分け それぞれのデータセットの平均値となる 点を結んで 直線関係をえる手法も行われた - /6 -

14 化学実験法 II( 吉村 ( 洋 014.6.1. txxa t XY パラメータ a はこの連立方程式の解なので 形式的に次のように書ける : a ( t XX 1 t XY また残差 乗和の最小値は次式で与えられる : mn t Y (Y Xa ここでは X として m 個の要素からなる実験条件を考えたが 1 個の要素 について測定値 を の m 1 次の多項式に当てはめる問題は {1,,,..., m 1 } という基底ベクトルの線形結合で関数 ( への当てはめを行うことと考えれば 同様の扱いが可能であることがわかる 少し具体的に 次方程式 a 0 + a 1 + a への当てはめの問題だとすると 正規方程式は次の形に整理できる : {1}{1} a 0 + {1}{} a 1 + {1}{ }a {1}{} {}{1} a 0 + {}{} a 1 + {}{ }a {}{} { }{} a 0 + { }{} a 1 + { }{ }a { }{} ここで { n } は N 個の要素からなるベクトル ( 1 n, n, 3 n,, N n で {u}{v} は内積を表す もとの の値が (0, q, q, 3q,, (N 1q のように等間隔に取られている場合などには 基底を変換して互いに直交する n 次の多項式 p n( を用いて {1, p 1(, p (,..., p m 1( } という基底を用い 正規方程式を対角化して より見通しのよい形にすることも可能である ( 等間隔のデータの場合にはチェビシェフの多項式 * が用いられる パラメータの信頼区間測定データ の分散をσ とすると 最小 乗法で定めたパラメータ a の分散は次のように求めることができる まず a の表現を整理して N N N N a とすれば は互いに独立なので a N N σ σ ( N ( N ここで ( N N N + N N + N N( N なので a N N σ ( σ /[N ] * 近似理論で登場する有名なチェビシェフの多項式 cos(k cos -1 とは別物なので注意 - 3/6 -

14 化学実験法 II( 吉村 ( 洋 014.6.1. 同様にして b N ab N σ σ を得ることができる 推定パラメータの信頼区間の大きさは 測定値の標準偏差 σ に比例し データ点の数の平方根 N と実験条件の幅 ( N /N に反比例する 測定データの分散 σ が分かっていないときには次式で推定することになる : σ mn N ( b N + a 測定データを a + b に当てはめてパラメータ a b を推定する時 できるだけ の範囲を広くとって測定する ( N /N を大きくする のが望ましく 切片 b の評価には 0 付近の値を取る ( を小さくする のが望ましい なお得られるパラメータ a, b の信頼区間は一般に独立でない ( ab 0 特に原点から 方向に遠く離れたデータ ( が大きい を用いてパラメーターを推定するときには 信頼区間の精密な評価には注意が必要である 実験条件が m 個の要素で与えられる場合に パラメータ a の共分散行列 a t a は次式で与えられる a t a ( t XX 1 t X Y t Y X ( t XX 1 ( t XX 1 σ 重みの異なるデータの取扱い異なる精度を持った測定値 を取り扱う場合 それぞれの測定値の分散をσ とすると 1/σ の重みを付けた残差 乗和 * を最小にすることを考えればよい : * ( a b σ 化学で出会う典型的な例としては たとえば有効数字 3ケタのデータの線形の式へのあてはめ 相対誤差が一定と見なせるデータのあてはめの問題がある ただし相対誤差が一定の場合でも その対数を取ったものへの線形の式のあてはめは 先の分散一定とした取り扱いで十分であることに注意する : ln [ 0(1 ± δ] ln 0 ± δ したがって例えばサーミスターの抵抗 R を各温度で有効数字 4 ケタ程度で測定し そこからサーミスターの温度依存性を与える関係式 R 0ep(/T の パラメーターを決める場合には ln (R/Ω と 1/T について 分散を一定と仮定して前節の扱いに従えばよい なお多次元のデータを扱う一般的な場合には 重み因子の行列 W を考え (W は対角要素が 1/σ の対角行列 残差 乗和は t (Y XaW(Y Xa で表され 正規方程式は次の形で表示できる : txwxa t XWY - 4/6 -

14 化学実験法 II( 吉村 ( 洋 014.6.1. したがってパラメータは次式で与えられることになる : a ( t XWX 1 t XWY 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場 観測データの変動を説明する立場からは 次の関係式を想定する (, はそれぞれ のデータセットの平均 /N /N: a( 観測データの変動を説明するために条件 を持ち出すことの当否を問題とするには この形がはっきりしている ( こうした立場では回帰 regresson 分析と呼ぶことが多い と の間の相関の強さを示す量として相関係数がある : N r ( / ( N ( N と のデータ点 (, 間に直線関係が正確に成立すれば相関係数は ±1 はずれが大きくなるに従って 0 に近づく 相関係数 r は決定係数 ( 寄与率 r の形で扱われることも多い N r mn 1 N 決定係数は条件 に対する依存性を考慮することで どこまで観測データのゆらぎ ( 残差 乗和 を説明できたかを示すものといえ 完全に説明できれば 1 依存性を考慮してもゆらぎに変動がない場合には 0 になる 化学では多くの場合 相関があることが自明でパラメーターの推定に重きが置かれるが そもそもの相関のあるなしについては 決定係数に基づいた検定が必要になる 実験条件の誤差の影響 実験条件 には誤差がないとしてきたが 実際には実験条件にも測定値 と同程度の誤差が見込まれる場合も多い こうした場合の線形の関係式のパラメータ推定について考えてみよう 問題を明確にするために先のデータセット (, ( 1,,, N について c + d という関係を仮定し を の関数として処方箋通りに最小 乗法でパラメーターを決めてみたとしよう すると勾配 c に注目すると N c N である さてここで a + b という関係を想定すれば a 1/c になりそうである しかし先に最小 乗法で得た a についての表式をみると ac r 1 より逆数関係は成り立たない いわば に対し をプロットするか に対し をプロットするかで d/d の値が異なるのは 実験条件の誤差をどのように考慮するかによっている - 5/6 -

14 化学実験法 II( 吉村 ( 洋 014.6.1. 問題 学生番号 氏名 N 個の一連のデータ ( 1, 1, (,,..., ( N, N を 測定値 の分散が によらずσ で一定であるとして a という関係式に最小 乗法であてはめることを考える る係数 a を表せ また推定される係数 a の分散はどのようにあらわされるか? を用いて推定され - 6/6 -