Microsoft Word - Time Series Basic - Modeling.doc

Similar documents
様々なミクロ計量モデル†

ベイズ統計入門

Probit , Mixed logit

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

統計的データ解析

データ解析

memo

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - 補論3.2

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

スライド 1

PowerPoint Presentation

講義「○○○○」

Microsoft Word - å“Ÿåłžå¸°173.docx

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft Word - reg.doc

パソコンシミュレータの現状

景気指標の新しい動向

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

基礎統計

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

横浜市環境科学研究所

数値計算法

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

1.民営化

Microsoft Word - 微分入門.doc

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - Statistics[B]

Microsoft Word - thesis.doc

Microsoft PowerPoint - 測量学.ppt [互換モード]

ビジネス統計 統計基礎とエクセル分析 正誤表

 

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

Microsoft PowerPoint - sc7.ppt [互換モード]

13章 回帰分析

Microsoft Word - Stattext07.doc

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

1/17 平成 29 年 3 月 25 日 ( 土 ) 午前 11 時 1 分量子力学とクライン ゴルドン方程式 ( 学部 3 年次秋学期向 ) 量子力学とクライン ゴルドン方程式 素粒子の満たす場 y ( x,t) の運動方程式 : クライン ゴルドン方程式 : æ 3 ö ç å è m= 0

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

2011年度 大阪大・理系数学

Microsoft PowerPoint - 基礎・経済統計6.ppt

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

航空機の運動方程式

Microsoft Word - reg2.doc

Microsoft Word - Matlab_R_MLE.docx

Microsoft PowerPoint - 三次元座標測定 ppt

統計学的画像再構成法である

OpRisk VaR3.2 Presentation

SAP11_03

国土技術政策総合研究所 研究資料

ディジタル信号処理

スライド 1

生命情報学

第7章

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

微分方程式による現象記述と解きかた

Microsoft PowerPoint - 10.pptx

( 最初の等号は,N =0, 番目は,j= のとき j =0 による ) j>r のときは p =0 から和の上限は r で十分 定義 命題 3 ⑵ 実数 ( 0) に対して, ⑴ =[] []=( 0 または ) =[6]+[] [4] [3] [] =( 0 または ) 実数 に対して, π()

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F D208CF68BA48C6F8DCF8A C30342C CFA90B68C6F8DCF8A7782CC8AEE967B92E8979D32288F4390B394C529332E646F63>

スライド 1

スライド 1

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

受信機時計誤差項の が残ったままであるが これをも消去するのが 重位相差である. 重位相差ある時刻に 衛星 から送られてくる搬送波位相データを 台の受信機 でそれぞれ測定する このとき各受信機で測定された衛星 からの搬送波位相データを Φ Φ とし 同様に衛星 からの搬送波位相データを Φ Φ とす

Hara-statistics

Microsoft PowerPoint - H21生物計算化学2.ppt

Microsoft PowerPoint - Inoue-statistics [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

航空機の運動方程式

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

DVIOUT

0415

最小二乗フィット、カイ二乗フィット、gnuplot

Microsoft PowerPoint - 14回パラメータ推定配布用.pptx

DVIOUT-SS_Ma

Microsoft Word - mathtext8.doc

PowerPoint プレゼンテーション

資料の概要 レイリー分布 (Rayleigh distribution) について 周波数が一定で 振幅及び位相が不規則に変動する多重波 ( 正弦波 ) の合成受信電界強度の確率分布はレイリー密度分布に従う 多数の反射波やダクト伝搬路による多重波が到来して合成される場合 この分布に従うことになる マ

PowerPoint プレゼンテーション

数値計算法

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

untitled

If(A) Vx(V) 1 最小 2 乗法で実験式のパラメータが導出できる測定で得られたデータをよく近似する式を実験式という. その利点は (M1) 多量のデータの特徴を一つの式で簡潔に表現できること. また (M2) y = f ( x ) の関係から, 任意の x のときの y が求まるので,

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

経済統計分析1 イントロダクション

学習指導要領

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Transcription:

時系列解析入門 モデリング. 確率分布と統計的モデル が確率変数 (radom varable のとき すべての実数 R に対して となる確 率 Prob( が定められる これを の関数とみなして G( Prob ( とあらわすとき G( を確率変数 の分布関数 (probablt dstrbuto ucto と呼 ぶ 時系列解析で用いられる確率変数は通常連続型と呼ばれるもので その分布関数は ( t ( < t< G ( ( tdt を満たす関数の積分によって と表現できる このとき ( を密度関数 (dest, probablt dest ucto と呼 ぶ 逆に分布関数が与えられると 任意のa< b に対してa< b となる確率が b ( Ga ( ( d Gb によって求められる a 代表的な密度関数として以下がある 正規分布 ( ガウス分布 ormal dstrbuto ( ( ep, < < π 平均 分散 れる と表記され (, で (, は標準正規分布と呼ば コーシー分布 (Cauch dstrbuto (, < < π {( } ピアソン分布族 (Pearso aml o dstrbuto c (, < < b π {( } b ただし ( c Γb Γ b Γ で b のときコーシー分布 b / としたとき自由度 の と一致する また を正の整数として (

t 分布 (t-dstrbuto と呼ばれる 指数分布 (epoetal dstrbuto ( λ λe,, < χ 分布 (ch-square dstrbuto ( / e Γ, <, は自由度と呼ばれる のとき指数分布となる 重指数分布 (double epoetal dsbtuto ( e e 一様分布 (uorm dstrbuto ( ( ba, a< b, other ある密度関数から得られるデータを 確率変数の実現値 (realzato という 反対に 観 測するデータの背後に確率変数を想定し データはその確率変数の実現値として得られた ものと考えるとき この確率変数を特徴付ける密度関数 ( を真のモデル (true model と呼ぶ 通常この真のモデルは未知であるから 与えられたデータから確率分布を推定する必要が ある このとき データから推定された密度関数は統計的モデル (statstcal model と呼 ばれ ( と表される 時系列データの場合はさらに 同時分布 (,, を考える必要がある 時系列,, を標本平均 ˆ と標本自己共分散関数 Ĉ によって表現するということは 次元ベクトル ( T が平均ベクトル ˆ ( ˆ,, ˆ T,, 分散共分散行列

ˆ ˆ C C ˆ C の多次元正規分布に従うとするモデルを想定していることに相当する このようなモデル は正規分布に従う定常時系列を柔軟に表現できるが データ数 に対して 個の未知 数 ˆ ˆ,, C を推定することになり データの情報を効率よく縮約することにはなら ない. KL 情報量とエントロピー最大化原理 現実のデータを生成する真のモデルを ( それを近似した統計的モデルを ( と表すことにする 統計モデリングでは ( になるべく 近い ( を求めることが主要な目的になる そのためにはモデル ( のよさを客観的に評価する基準が必要になる ここではそ の基準としてカルバック ライブラー情報量 (Kullbac-Lebler ormato 以下 KL 情 報量 を用いる ( 番目の等式は モデルが連続型の確率分布の場合 ( ( ( ( ( I ; Elo lo ( d この KL 情報量は 以下の性質を持っている I( ; I( ; ( ( また KL 情報量の符号を反転した量 B ( ; I( ; は一般化されたエントロピー (etrop とも呼ばれ 想定した分布 ( から 個の実現値をとった時に その相対度数 分布が真の分布 ( と等しくなる確率のを近似的に与える 従って KL 情報量が小さ いほど確率分布 は に近いと考えることができる 統計モデルはデータ,, に基づいて真の分布 ( を近似したもので そのよさは KL 情報量 I ( ; で評価できる 統計的モデリングにおいて B ( ; I( ; を最大とする ようにモデルを構築しようとするのがエントロピー最大化原理 (etrop mamzato prcple である 例えば 真のモデル ( およびそれを近似したモデル ( 考える がともに正規分布である場合を

( ( ep, π ( ( ep, π この場合 ( ( ( ( lo lo となるので KL 情報量は ( ( ( ( ( ( lo E E lo lo E ; I で与えられる と が正規分布の場合の KL 情報量の計算は簡単だが そうでない場合は数値計算によって求められる 例えば以下の台形公式などが用いられる ( ( ( { } ( ( ( ( ( h h h I lo ; ˆ ただし 3. KL 情報量の推定と対数尤度実際の統計解析の場面では真の分布は未知であるため KL 情報量は実際の統計モデルの評価に用いられることはほとんどない 真の分布 ( の代わりに ( から独立に観測されたデータ,, が与えられている場合 モデル ( の KL 情報量を以下の方法で推定する エントロピー最大化原理に従って最も良いモデルを求めるためには ( ( I B ; ; を

最大 I ( ; を最小とするモデルを求めればよい KL 情報量は I( ; Elo( Elo( と二つの項に分解できる 右辺第 項は ( が与えられないと計算できないが モデル ( には依存しない一定の値を取るので無視できる 右辺第 項は平均対数尤度 (epected lo-lelhood と呼ばれる量で 密度関数を持つ連続型のモデルの場合は E lo ( lo( ( d と表現できる この平均対数尤度も ( が未知の場合には直接計算できないが データ が密度関数 ( に従って生成されることから 大数の法則によりデータ数が の時 lo ( E lo( が成り立つ 従って KL 情報量 ( (lo-lelhood l ( I ; を最小とするモデルの代わりに 対数尤度 lo を最大とするようなモデルを選べば 近似的にエントロ ピーを最大にすることができる また その指数をとった L ( と呼ばれる は尤度 (lelhood 時系列解析のモデルでは 通常観測値が独立に得られるという仮定は成り立たない この ような一般の場合には 尤度は,, の同時分布を用いて L,, ( と定義される この場合対数尤度は となる ( l lol lo,, 4. 最尤法によるパラメータの推定 モデルがθ をパラメータとするパラメトリックモデルで ( ( θ の形をしている場 合には 対数尤度 l はパラメータ θ の関数と考えることができる したがって θ を明示的 に表し l ( θ lo lo を θ の対数尤度関数と呼ぶ ( θ ( 独立の場合 (,, ( θ 一般の場合 対数尤度関数 l( θ はθ で定まるモデルの良さを評価した量なので ( θ l を最大とする θ を選

ぶことによって パラメトリックモデル ( θ のパラメータの最適な値を定めることがで きる このように対数尤度あるいは尤度を最大化することによりパラメータを推定する方 法は最尤法 (mamzato lelhood method と呼ばれる また最尤法で推定されたパラ メータを θˆ と表し 最尤推定値 (mamum lelhood estmate と呼ぶ 例として 平均 分散 の正規分布モデル ( ep π ( のパラメータ を最尤法で推定する この場合対数尤度関数は l ( loπ ( したがって l( を最大とするためには S ( ( を最小とする を求めればよいので S( の一階導関数を とおくことによって ˆ が得られる S( ( のように二乗和を最小にすることによりパラメータを推 定する方法は 最小二乗法 (least squares method と呼ばれる 一般に時系列モデルのパラメータ θ の最尤推定値を求めるためには 擬似ニュートン法によ る数値的最適化 (umercal optmzato が用いられる パラメータθ の初期値 θ の値を l 定めたときの対数尤度の値 l( θ と一階微分が与えられると θ θ θ を繰り返して ( θ λ H 自動的に決定される l θ l の極大点を自動的に求める ステップ幅 λ とヘッセ行列の逆行列 H は 5. AIC( 赤池情報量基準 最大対数尤度はそのままでは異なるモデル間の比較には用いることができない 最尤推定 値 θˆ で規定されるモデルは ( θˆ l が E lo ( θˆ の推定量として正の偏りを持つためで ある この偏差は パラメータの推定とモデルの評価のための平均対数尤度の推定に同じ

データを 度用いたことによって生じる E を lo ( θˆ を l( ( ˆ θ lo ˆ θ C E E lo ( ( ˆ θ lo ˆ θ とおく このとき ( θˆ l をC だけ補正し l( θˆ C によって推定したときに生じる平均的な偏り とすることにより E lo ( θˆ の 偏りのない推定量を求めることができる ここでC となることから 赤池情報量 基準 (AIC: Aae Iormato Crtero が得られる ( ˆ θ AIC l ( 最大対数尤度 ( パラメータ数 6. データ変換 正規分布しなかったり分散が一定でない時系列のデータも 対数変換すれば変動が小さく なったり正規分布に近づいたりする 対数変換を含む一般的のデータ変換として Bo-Co 変換 z λ (, λ lo λ, λ がある Bo-Co 変換は定数を無視すると λ のとき対数 λ のとき逆数 λ. 5 のとき平方根 λ のとき原データをとる変換となる AIC を用いると データに適した変換を定めるパラメータλ を選択することができる h z に従う場合 元データ Bo-Co 変換によって変換されたデータ z ( が密度関数 ( の密度関数は ただし dh d ( ( h( dh d は変換のヤコビアン (Jacoba と呼ばれる これは 変換したデータの モデルが変換前のデータに関してもひとつのモデルを定めていることを示している 例えば 原データ および変換されたデータz に正規分布を当てはめたときの AIC の値を それぞれAIC AIC とする このとき z

AIC ' z AIC z lo dh d の値をAIC と比較することにより 原データと変換後データのどちらかが正規分布に近い ' かを判断することができる すなわちAIC <AIC z の場合は原データのほうがよいことに ' ' なる 一方 AIC >AIC z の場合は変換した方がよいことがわかる さらに AICz が最小にな るようにすることによって Bo-Co 変換の最適な λ の値を選択することもできる 実際 の時系列データでは Bo-Co 変換を行った後 色々な時系列モデルを当てはめることが多 いので その場合には時系列モデルの AIC を Bo-Co 変換のヤコビアンを使って補正する 必要がある