データ解析

Similar documents
学習指導要領

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft Word - 微分入門.doc

スライド 1

スライド 1

2011年度 大阪大・理系数学

Microsoft PowerPoint - e-stat(OLS).pptx

カイ二乗フィット検定、パラメータの誤差

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

スライド 1

統計的データ解析

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

PowerPoint プレゼンテーション

様々なミクロ計量モデル†

学習指導要領

Hara-statistics

1 対 1 対応の演習例題を解いてみた 微分法とその応用 例題 1 極限 微分係数の定義 (2) 関数 f ( x) は任意の実数 x について微分可能なのは明らか f ( 1, f ( 1) ) と ( 1 + h, f ( 1 + h)

2018年度 2次数学セレクション(微分と積分)

Microsoft PowerPoint - Inoue-statistics [互換モード]

Microsoft Word - Stattext07.doc

重要例題113

2011年度 東京大・文系数学

平成 年 月 7 日 ( 土 第 75 回数学教育実践研究会アスティ 45 ビル F セミナールーム A 札幌医科大学 年 P ab, を正の定数とする 平面上において ( a, を中心とする円 Q 4 C と (, b を中心とする円 C が 原点 O で外接している また P を円 C 上の点と

Microsoft Word - å“Ÿåłžå¸°173.docx

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - Time Series Basic - Modeling.doc

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

講義「○○○○」

Microsoft Word - NumericalComputation.docx

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Probit , Mixed logit

数学 Ⅲ 微分法の応用 大学入試問題 ( 教科書程度 ) 1 問 1 (1) 次の各問に答えよ (ⅰ) 極限 を求めよ 年会津大学 ( 前期 ) (ⅱ) 極限値 を求めよ 年愛媛大学 ( 前期 ) (ⅲ) 無限等比級数 が収束するような実数 の範囲と そのときの和を求めよ 年広島市立大学 ( 前期

学力スタンダード(様式1)

【指導のポイント】

学習指導要領

2018年度 筑波大・理系数学

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

学習指導要領

横浜市環境科学研究所

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - statistics pptx

学習指導要領

<8D828D5A838A817C A77425F91E6318FCD2E6D6364>

2017年度 長崎大・医系数学

学習指導要領

数値計算法

0415

テレビ講座追加資料1105

学習指導要領

2015年度 信州大・医系数学

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

Microsoft PowerPoint - 10.pptx

1 次関数 1 次関数の式 1 次の表は, ろうそくを燃やした時間 x 分と残りのろうそくの長さ ycm の関係を表しています 次の問いに答えなさい x( 分 ) y(cm ) (1) 上の表のをうめなさい (2) ろうそくは,5 分間に何 cm 短くなっていく

Microsoft PowerPoint - H21生物計算化学2.ppt

2016年度 筑波大・理系数学

平成 30 年度 前期選抜学力検査問題 数学 ( 2 時間目 45 分 ) 受検番号氏名 注 意 1 問題は, 表と裏にあります 2 答えは, すべて解答欄に記入しなさい 1 次の (1)~(7) の問いに答えなさい (1) -3 (-6+4) を計算しなさい 表合計 2 次の (1)~(6) の問

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - NA03-09black.ppt

13章 回帰分析

Microsoft PowerPoint - 配布資料・演習18.pptx

日本内科学会雑誌第97巻第7号

日本内科学会雑誌第98巻第4号

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

基礎統計

第4回

喨微勃挹稉弑

経済数学演習問題 2018 年 5 月 29 日 I a, b, c R n に対して a + b + c 2 = a 2 + b 2 + c 2 + 2( a, b) + 2( b, c) + 2( a, c) が成立することを示しましょう.( 線型代数学 教科書 13 ページ 演習 1.17)

社会保険料の賃金への影響について

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - 9.pptx

Microsoft PowerPoint - 9.pptx

2017年度 京都大・文系数学

散布度

( 表紙 )

2014年度 東京大・文系数学

2014年度 千葉大・医系数学

DVIOUT-SS_Ma

パソコンシミュレータの現状

学習指導要領

Microsoft Word - スーパーナビ 第6回 数学.docx

2017年度 金沢大・理系数学

埼玉県学力 学習状況調査 ( 中学校 ) 復習シート第 3 学年数学 組 番 号 名 前 ( 数と式 を問う問題 ) 1 次の計算をしなさい レベル 6~8 1 (27x-36y+18) (-9) 答え 2 15x 2 y 5xy 2 3 答え 2 次の各問いに答えなさい レベル 9 10 (1)

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

【FdData中間期末過去問題】中学数学2年(連立方程式計算/加減法/代入法/係数決定)

2013年度 信州大・医系数学

2011年度 筑波大・理系数学

Microsoft Word - reg2.doc

Problem P5

PowerPoint プレゼンテーション

学習指導要領

平成 31 年度 前期選抜学力検査問題 数学 ( 2 時間目 45 分 ) 受検番号氏名 注 意 1 問題は, 表と裏にあります 2 答えは, すべて解答欄に記入しなさい 1 次の (1)~(7) の問いに答えなさい (1) 3 (-2 2 ) を計算しなさい 表合計 2 次の (1)~(6) の問

Microsoft PowerPoint - 10.pptx

mt1-slides-03.pptx

Microsoft PowerPoint - 基礎・経済統計6.ppt

_KyoukaNaiyou_No.4

英語                                    英-1

Transcription:

データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0

データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第 回 試験 -

第 回 Σ の計算. 個のデータの足し算 データ セット,,,, 3 K データの表記 データ番号 データの種類 足し算の表記 データ番号 終了番号 開始番号 3 L データ番号が ずつ加算 Σ の基本的な規則 ( : 定数 ). 平方根の計算 : 5. 3 5 X 3. 5 6 7 0 0 0 0 0 + 5 3 + 5 5 3 0 3 9 5 6 + 3 9 0 9 3 0 6 7 7 0 + 3 0 6 3 0 6 5 7 0 9 0 0 + 5 5 3 5 3 0 6 3 0 X 7 7 7 5 0 0 + X Y Y Y Y Y Y Y

課題 Σ の計算得点 /5 次の式を足し算に展開しなさい ( 各 0.5 点 ) 3 5 5 5 次の式を Σ でまとめなさい ( 各 0.5 点 ) 3 5 6 63 8 05 3 3 8 65 3 3. の平方根を求める 空欄に適切な 桁の整数を記入しなさい ( 全 点 ). 7 7 3. + 7 + 7 8 9 3 7 5 0 0 + 7 9 3 5 7 0 0 + 7 0 8 3

第 回 ヒストグラム ヒストグラム ある範囲内の測定値が何回現れたかを示す度数分布表に基づいて作成された棒グラフ 測定されやすい値 ( 平均 ) や測定値のばらつき ( 標準偏差 ) を大まかに視認できる ヒストグラムの作成手順 最大値と最小値を調べる 区間を設定する 3 度数分布表を作成する ヒストグラム ( 棒グラフ ) を描く 例題 組 A 班の 00m 走のタイム [ 秒 ] 番号 3 5 6 7 8 9 0 タイム [ 秒 ] 6. 3.9 5.8 7.5.7.3 5.. 6. 5.3 度数分布表の作成 最小値 =.7 秒 最大値 = 7.5 秒.8 秒の差 秒間隔で区間を設定 最小値以下 最大値以上 タイム [ 秒 ] 3 5 6 7 8 計 度数 3 0 ヒストグラムの作成 以上 3 未満 3 以上 未満 3 度数 0 3 3 5 5 6 6 7 7 8 8 9 タイム [ 秒 ]

課題 ヒストグラム得点 /5 ある樹木の葉の横幅を測定し, 表のような計 30 個の測定値を得た ( 単位 :mm) 6. 7.9 5. 7.0 6.0.3 9. 6. 8. 9.. 5. 5.8 9.5.9. 6. 30.3 3..8 8. 6.0 6. 8...9 6.0.0 3.. 最小値と最大値を調べ, 空欄に記入しなさい ( 各 0. 点 ) 最小値 = 最大値 = mm mm mm 間隔で区間を設定し, 度数分布表を作成しなさい ( 各 0. 点 ) 葉幅 [mm] 計 度数 30 3 問 の度数分布表をもとに, ヒストグラムを作成しなさい ( 全 点 ) 0 9 8 7 6 度数 5 3 0 8 0 6 8 30 3 3 葉幅 [mm] 5

第 3 回 平均と標準偏差 ある実験で音速を測定したところ, 下記の結果が得られた 測定番号 3 5 音速 [m/s] 3 33 33 3 3 測定値の合計. 平均 測定値の個数 測定値 [m/s] 代表値 測定値 - 代表値 3 33-33 0 33 0 3 + 3 - 計 ) 測定値 代表値の合計 平均 代表値 33 3.8 [m/s] 測定値の個数 5. 標準偏差 測定値 平均の合計測定値の個数 測定値 [m/s] 平均 測定値 - 平均 ( 測定値 - 平均 ) 3 3.8-0.8 0.6 33 +0. 0.0 33 +0. 0.0 3 +.. 3-0.8 0.6 計 ).80.8 標準偏差 0.7 0.8366L m/s 5 3. 測定結果の表記 平均 ± 標準偏差単位 6

課題 3 平均と標準偏差得点 /5 バネに様々な重さのおもりをつるし, バネの伸びを測った その測定結果からバネ定数を計算 したとき, 以下の結果が得られた バネ定数の推定値を求めよ 測定番号 3 5 6 7 8 9 0 バネ定数 [/m] 86 85 8 89 85 89 87 85 8 85 測定値 代表値 測定値 - 代表値 平均 測定値 - 平均 ( 測定値 - 平均 ) 86 85 85 8 89 85 89 87 85 85 85 計計計 ( 各 0. 点 ) 7 平均 85 85. 7 /m ( 各 0. 点 ) 0 標準偏差. 68 0 /m ( 小数点以下 桁まで表示 ) ( 各 0.5 点 ) バネ定数の推定値 85 /m ( 小数点以下 桁まで表示 ) ( 各 0.5 点 ) 7

第 回 誤差の伝播 つの測定値, が存在するとき, 測定値の和 の誤差 を求める を測定したとき, 次のつの測定値が等しい確率で得られたとする,,, その標準偏差は である 3 を測定したとき, 次のつの測定値が等しい確率で得られたとする,,, その標準偏差は である 3 を測定したとき, 次の つの測定値が等しい確率で得られることが期待される,,,, その標準偏差は, 測定値 [m/s] 平均測定値 - 平均 ( 測定値 - 平均 ) 計 計 より, よって, 測定値 と である の和は 一般に,,, 3 3,, の和は, L L 3 3 8

課題 誤差の伝播得点 /5 3 個のおもり A,B,C がある おもりの重さをそれぞれ 5 回ずつ測定したところ, 次表の結 果が得られた おもり A 測定番号 3 5 重さ [kg].3.0.8.3. おもり B 測定番号 3 5 重さ [kg] 3. 3.8 3.5 3.0 3.6 おもり C 測定番号 3 5 重さ [kg].8..6.8.9 おもり A,B,C の重さの平均値および標準偏差を求めよ ただし, 平均および標準偏差は, 小数点以下 桁目を四捨五入し, 小数点以下 桁まで表示せよ ( 各 0.5 点 ) 平均 [kg] 標準偏差 [kg] おもり A おもり B おもり C おもり A,B,C の重さの合計およびその測定誤差を求めよ ただし, 合計の測定誤差は, 小数点以下 桁目を四捨五入し, 小数点以下 桁まで表示せよ ( 各 点 ) ± kg 9

第 5 回 正規分布 正規分布 f() = 自然界で測定された値が満たす確率密度分布 f e α : 真値 β : 分布の幅 α=.5,β= の場合 0.5 α 山のピーク 最も測定されやすい値 0. 確率密度 0.3 0. 0. β 山のそでの広がり 測定値のばらつきの大きさ 0 0 0.5.5.5 3 3.5.5 5 測定値 の測定値 が得られる確率 = ~ の範囲で確率密度関数を積分した値 確率密度 確率 p f d 測定値 の測定値 が得られる確率 3 3 0.68 (68%) 0.95 (95%) 0.99 (99%) 測定値測定値測定値 0

課題 5 正規分布得点 /5 表は, 次式で表される正規分布 f()(α=0,β=) の値を示す f e f f t dt f の値を用いて, 正規分布のグラフを描け ( 点 ) 0. 0.0 0.399 0.000 0. 0.39 0. 0.368 0.6 0.333 0.8 0.90 確率密度 f() 0.3 0. 0..0 0.. 0.9. 0.50.6 0..8 0.079.0 0.05. 0.035. 0.0.6 0.0.8 0.008 3.0 0.00 0 0 3 数値積分によって, 表の f t dt の値を求めよ 3 f t dt のグラフを描け 確率 f()d 0.9 0.8 0.7 0.6 0.5 0. 0.3 0. 0. 0 ( 各 0. 点 ) ( 点 ) 0 3

第 6 回最尤性原理 ( さいゆうせいげんり ) 最尤性原理 個の測定値,,, があるとき, これらの測定値が得られる確率を最大とする α および β が真値および分布の幅の最良推定値である 測定値が真値 α, 分布の幅 β の正規分布に従うとき, 測定値 が k k となる確率 k P は, 近似的に次式で表される k k k k e d e P 測定値,,, が同時に得られる確率 P は, e P P P P L 確率 P を最大にする α と β が, 真値および分布の幅の最良推定値となる 真値 α の最良推定値確率 P が α のみの関数であるとすると, 定数 と を用いて,P は次式のように表される g e e P ここで,,, g と が定数の場合, 確率 P が最大となるには g が最小となればよい g であるから, g は のとき, 最小値 をもつ すなわち, 真値 α の最良推定値は平均値である

課題 6 最尤性原理得点 /5 最尤性原理について説明せよ ( 点 ) 次の 0 個の測定値 がある 3 5 6 7 8 9 0 3 3 () g の式を求めよ ( 各 0.5 点 ) g () g(α) を最小とする α の値を求めよ (0.5 点 ) (3) g(α) のグラフを描け ( 点 ) 50 0 30 g(α) 0 0 0 0 3 α 3

第 7 回 正規分布の 分布の幅 分布の幅 β の最良推定値 確率 P が β のみの関数であるとすると, と を用いて P は次式のように表される P e e ここで,,, 最尤性原理に従い,P が最大となる γ の値を求める P dp e は下図のようなグラフであり,Pが最大となるγでは 0 d となる P 0.8 0.6 0. P e 0, 3, 0 0. 0 0 3 5 6 γ k dp d e 0 現実的な測定値では, 分布の幅 β は 0 を満たすことから, 0 かつ である よって, このとき, となり, 分布の幅 βの最良推定値は, 測定値 の標準偏差に相当する

課題 7 正規分布の 分布の幅 得点 /5 次式の微分を求めよ ( 各 0.5 点 ) () () (3) 3 d d d d e d d e e d () d e (5) d d 次の 式について, 以下の問いに答えよ 3 3 () 式の微分を求めよ (0.5 点 ) d d () 式の極大値, 極小値, および, そのときの の値を求めよ (0.5 点 ) 極大値となる 極大値 極小値となる 極小値 5

6 第 8 回最小二乗法最小二乗法測定値との差の 乗和が最小となる関数の式を求める方法測定値,,,,,, に最もよく当てはまる直線の式 を求める 仮定 : () 測定値 は正規分布に従う () 測定値 の真値は, 分布の幅は である 最尤性原理により, 測定値 が得られる確率を最大とする および を求める 測定値,,, が同時に得られる確率 P は, e P であり, 分布の幅 σ を定数とみなす場合, 確率 P が最大となるには, g, が最小となればよい g, が最小となる点では, 0 d dg かつ 0 d dg となることから, と の連立一次方程式 および を解いて, 0 6 8 0 0 3 5 6 7 8 9 0

課題 8 最小二乗法得点 /5 最小二乗法を用いて, 個の測定値 る指数関数の式 e,,,,,, を求める 以下の空欄に適切な式を記入せよ に最もよく当てはま 測定値 の真値をe, 分布の幅を とするとき, 測定値 が得られる確率 P は, P (0.5 点 ) となる 測定値,,, が同時に得られる確率 Pは, (0.5 点 ) P であり, 確率 P が最大となるには, g, ( 点 ) が最小となればよい よって, dg d dg d (0.5 点 ) (0.5 点 ) 0 0 式と 式を, と について解く ( 点 ) ( 点 ) 7

第 9 回 最小二乗法の練習 個の測定値,,,,, Det, を表す最適な直線の式 : Det Det 練習問題 : エアトラック上を滑る台車の位置を測定した 台車の速さの最良推定値, および, 時刻 0 秒における台車の位置の最良推定値を求めよ 時刻 [ 秒 ] 3 台車の位置 [cm].6. 3.7 5.0 ( 解 ) 時刻 台車の位置.6.6..8 3 3 3.7 9. 5.0 6 0.0 計 0.7 30 37.5 Det 30 0 0 37.5 0.7.5 cm/ 秒 0 台車の速さ 30.7 0 37.5 0.3 cm 0 時刻 0 秒における台車の位置 8

課題 9 最小二乗法の練習得点 /5 エアトラック上を滑る台車の位置を測定した 時刻 [ 秒 ] 3 5 台車の位置 [cm] -. 0. 3.5.9 7.6 () 横軸を時刻, 縦軸を台車の位置としてグラフを描け ( 点 ) 8 7 6 5 3 0 - - -3 0 3 5 6 () 台車の速さの最良推定値, および, 時刻 0 秒における台車の位置の最良推定値を求めよ 時刻 台車の位置 -. 0. 3 3 3.5.9 各 0. 点 5 5 7.6 計 各 0.3 点 台車の速さ cm/ 秒 ( 小数点以下 桁まで表示 ) 時刻 0 秒における台車の位置 cm ( 小数点以下 桁まで表示 ) 9

0 第 0 回最小二乗法の推定誤差最小二乗法で求めた直線の式 の傾き および切片 の推定誤差を求める 第 回 誤差の伝播 の復習測定値,,, の和は ( : 測定値, : 測定誤差 ), L L 測定値 の誤差がすべて同じ値 ( ) であると仮定すると, の誤差 = の誤差 = であることから, Det Det Det Det のとき, であることから,

課題 0 最小二乗法の推定誤差得点 /5 のとき, であることを証明する 以下の空欄に適切な式を記入せよ ( 各 点 ) 0 K K K のとき, K が成り立つと仮定する K のとき, K K K K K K K K K K K 同上 K 0 となり, の任意のに対して, が成立する 一般に, のとき, 式の値は無限大に発散する そのため, のとき, となる

第 回推定誤差の計算 練習問題 : エアトラック上を滑る台車の位置を測定した 台車の速さの最良推定値, および, 時刻 0 秒における台車の位置の最良推定値を求めよ 時刻 [ 秒 ] 3 台車の位置 [cm]..0 3.. ( 解 )...07 0.03 0.0009.0.0. -0. 0.096 3 3 3. 9 0. 3. 0.9 0.036. 6 6.8.8-0.08 0.006 計 0 0.7 30 3. 0.0630 Det 30 0 0 3.00.7.07 cm/ 秒 0 300.7 0 3. 0 cm 0 0.063 0.9L 0.9L 0. 065L cm/ 秒 30 0.9L 0. 075L cm よって, 台車の速さ =.07±0.03 cm/ 秒 時刻 0 秒における台車の位置 = 0.00±0.07 cm

課題 推定誤差の計算得点 /5 エアトラック上を滑る台車の位置を測定した 時刻 [ 秒 ] 3 5 台車の位置 [cm].9.7 3. 3..0 () 横軸を時刻, 縦軸を台車の位置としてグラフを描け ( 点 ) 5 台車の位置 [cm] 3 0 0 3 5 6 時刻 [ 秒 ] () 台車の速さの最良推定値, および, 時刻 0 秒における台車の位置の最良推定値を求めよ 各 0. 点.9.7 3 3 3. 3. 5 5.0 計 各 0. 点 台車の速さ ± cm/ 秒 ( 小数点以下 桁まで表示 ) 時刻 0 秒における台車の位置 ± cm ( 小数点以下 桁まで表示 ) 直線の当てはめ誤差 σ cm cm ( 小数点以下 桁まで表示 ) 3