C5 統計的時系列モデリング

Similar documents
Microsoft PowerPoint - 時系列解析(10)_講義用.pptx

PowerPoint プレゼンテーション

日心TWS

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

講義「○○○○」

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

SAP11_03

横浜市環境科学研究所

Probit , Mixed logit

 

博士学位請求論文審査報告書 申請者 : 植松良公 論文題目 :Statistical Analysis of Nonlinear Time Series 1. 論文の主題と構成経済時系列分析においては, 基礎となる理論は定常性や線形性を仮定して構築されるが, 実際の経済データにおいては, 非定常性や

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

イクル成分 のみから 需要側の動きの 仮置き値 の作成を行う これにより 次 QE から 2 次 QE への改定幅を縮小させることが期待される 本改善策は 22 年 4-6 月期 次 QE から導入する 本改善策の効果について 一定の仮定をおいて試算を行ったところ 民間企業設備の 2 年 7-9 月

ベイズ統計入門

PowerPoint プレゼンテーション

Microsoft Word - 補論3.2

Microsoft Word - Time Series Basic - Modeling.doc

統計的データ解析

JUSE-StatWorks/V5 ユーザーズマニュアル

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

スライド 1

PowerPoint プレゼンテーション

スライド 1

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

Microsoft Word - å“Ÿåłžå¸°173.docx

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

PowerPoint プレゼンテーション

スライド 1

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

景気指標の新しい動向

Microsoft PowerPoint - Econometrics pptx

C3 データ可視化とツール

Microsoft Word - ㅎ㇤ㇺå®ı璃ㆨAIã†®æŁ°ç’ƒ.docx

Microsoft PowerPoint - statistics pptx

1.民営化

ビジネス統計 統計基礎とエクセル分析 正誤表

Missing Data NMF

Microsoft Word - mstattext02.docx

PowerPoint プレゼンテーション

Microsoft PowerPoint - LectureB1handout.ppt [互換モード]

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - ch10j

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft Word doc

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

英国統計学会の統計検定試験 季節調整関連問題の解答例 本解答例は 英国統計学会 (The Royal Statistical Society 以下 RSS 1) ) が公表している Higher Certificate 試験に関する解答例のうち 見本問題および 2007 年から 2010 年までの季

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

OpRisk VaR3.2 Presentation

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint - stat-2014-[9] pptx

314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft PowerPoint - e-stat(OLS).pptx

様々なミクロ計量モデル†

第1章 低下から停滞に転じた鉱工業生産

情報工学概論

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft PowerPoint - sc7.ppt [互換モード]

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft PowerPoint - ch04j

スライド 1

PowerPoint プレゼンテーション

因子分析

Introduction to System Identification


Microsoft PowerPoint - LectureB1_17woAN.pptx

PowerPoint プレゼンテーション

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

サーバに関するヘドニック回帰式(再推計結果)

Excelを用いた行列演算

Microsoft PowerPoint - 基礎・経済統計6.ppt

スライド 1

今日の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか

Learning Bayesian Network from data 本論文はデータから大規模なベイジアン ネットワークを構築する TPDA(Three Phase Dependency Analysis) のアルゴリズムを記述 2002 年の発表だが 現在も大規模用 BN モデルのベンチマークと

Microsoft Word - appendix_b

Microsoft Word - eviews6_

基礎統計

EBNと疫学

ディジタル信号処理

untitled

Coding theorems for correlated sources with cooperative information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

数値計算法

パソコンシミュレータの現状

リスク分析・シミュレーション

<4D F736F F F696E74202D2091E6824F82518FCD E838B C68CEB82E894AD90B B2E >

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft Word - lec_student-chp3_1-representative

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

MFIV となる Volatility Index Japan(VXJ) を日次で算出 公表している VIX 等と同様にTは約 1 ヶ月に設定 近似ターゲットは V t である 現行バージョンの計算方法は CBOE 方式に準じているが CSFI ではより高い精度で V t を近似する方法を研究開発中

Transcription:

< 第 5 回 > 統計的時系列モデリング 統計数理研究所 川崎能典 kawasaki@ism.ac.jp

統計的時系列モデリング 概要 データサイエンティスト育成クラッシュコース データサイエンティストとして時系列解析を学ぶ際に知っておくべき体系について 定常 非定常 データの変換 平滑化事前分布 状態空間モデルをキーワードに学ぶ 1. 定常時系列 2. 定常から非定常へ : 変換の利用 3. 定常から非定常へ : 平滑化事前分布 4. 状態空間モデル

データサイエンティスト育成クラッシュコース 1. 定常時系列 時系列データ = 確率過程の実現値 ( 見本過程 ) X(t, ω): 時間 t を止めれば確率変数 根源事象 ω を固定すれば数列 時系列解析の目的 : X(t, ω) の 道の分布 を知りたい 大きな制約 : 時系列解析では殆どの場合 ω のドローは一回きり ( 同一条件下での繰り返し実験に基づく観測が困難 ) 一時点一個のデータしかないのに 各時点での値の出方を支配する確率法則はもちろん 道全体が従う確率法則も導き出したい ( かなり無理な注文 ) 時間軸方向でのある種の一様性の仮定が必要 = 定常性 (stationary)

確率過程の見本過程 (sample path) Sample Paths from AR(2) ω 2 ω 1 ω 3 Sample Paths -10-5 0 5 10 0 10 20 30 40 50 60 Time

300 本の見本過程を重ね描き 300 Sample Paths from AR(2) Sample Paths -10-5 0 5 10 0 10 20 30 40 50 60 Time

各時点での四分位点 Quantiles based on 10001 sample paths 平均と分散が時間によらず一定 25%, 50%, 75% quantiles of realized pahts -6-4 -2 0 2 4 6 ここでは N として実験しているが これと同じ効果が T で得られる ( エルゴード性 ) 0 10 20 30 40 50 60 Time

データサイエンティスト育成クラッシュコース 2. 定常から非定常へ : 変換の利用 定常時系列モデルの代表 :ARMA モデル 現実にはこのクラスで対処できる範囲は限られている どうする? データを変換して定常時系列モデルに帰着 対数変換 : 指数的トレンドを線形化 Box-Cox 変換 : 対数変換を含む巾変換のクラス 階差 : トレンドの除去 季節階差 : 季節変動の除去 Box-Jenkins 法 : 標本自己相関 偏自己相関を手がかりにしたモデルの特定化 推定 事後評価 ( 診断検定 ) を含む一連の手続き 原著 Box and Jenkins (1970) あるいは最新版 Box et al. (2008) にあたらなくても 類書多数

6.50 6.25 log_airline エアラインモデル : 推定と予測 pred Box and Jenkins (1970), Time Series Analysis 6.00 5.75 5.50 5.25 5.00 4.75 英国の航空機搭乗者数の時系列データへのモデルあてはめと予測 1957 年以前のデータで推定 58 年 1 月以降 3 年分長期予測 49 50 51 52 53 54 55 56 57 58 59 60 61

エアラインモデル : 予測の信頼区間 おおよそ 95% の信頼区間を付けると左の通り 多くの問題では毎期毎期データ更新の度にモデル更新と予測更新を繰り返せるはずで これより誤差幅は小さいはず

データサイエンティスト育成クラッシュコース 3. 定常から非定常へ : 平滑化事前分布 例 : 季節調整モデル 観測値 = トレンド + 季節成分 + 不規則成分 1 個の観測値から 3 つ ( 本質的には 2 つ ) の未知量をひねり出す必要 無理難題の度合いが増しているように見える 時点の近い成分どうしは値が近い という制約を置けば推定可能 ( 平滑化事前分布 ) 観測不能な時系列要素 ( パラメータ ) に対する確率的な制約を置くことで実効パラメータ数を減らす パラメータに確率分布を仮定することから ベイズモデリングの一種と言える

成分分解の例 すぐ後に事例紹介で再掲

データサイエンティスト育成クラッシュコース なぜ分けてモデル化するか? 不確実性の度合いが違うものを別々にモデル化することで 全体として推定 予測の不確実性を低減できる Box-Jenkins 法 ( 季節 ARIMA モデル ) では 成分分解はしないが 実質的に同様の効果を内包している ( 階差 季節階差 ) 大まかな動きをモデル化した後で残る 一見残り滓のような残差系列から構造を見つけるのが統計学の真骨頂

データサイエンティスト育成クラッシュコース 統計的モデリングとは? 現象のモデル化にあたって 不確実性の表現に確率分布を仮定 物理モデルのような意味でのデータの 真の生成構造 にこだわらず データの動きを模倣するモデルや入出力関係をうまく近似してくれるモデルを探索する データのバラツキの元となる事象を特定化し 不断にモデル改善につなげる

データサイエンティスト育成クラッシュコース 7.9 7.8 7.7 例 : 英国交通事故死傷者数 ( 月次時系列 ) log UK drivers KSI 1969 年 1 月 ~1984 年 12 月 明らかな季節性 傾向としては全体に低減 ところどころ大きな下落 7.6 7.5 どうモデル化するか? 7.4 7.3 7.2 7.1 7.0 0 20 40 60 80 100 120 140 160 180

トレンド 季節性 不規則変動

モデリング事例 1: 外生時系列の利用 7.75 log UK drivers KSI deterministic level + beta*log(petrol PRICE) 大きく水準線を外している箇所がある 7.50 7.25 7.00 1970 1975 1980 1985 モデルに線形項として入れ込むと 大まかな傾向線を示してくれる 7.75 7.50 7.25 log UK drivers KSI against log PETROL PRICE deterministic level + beta*log(petrol PRICE) ガソリン価格 ( 横軸 ) と交通事故死傷者数 ( 縦軸 ) には負の相関 7.00-2.50-2.45-2.40-2.35-2.30-2.25-2.20-2.15-2.10-2.05

モデリング事例 2: 構造変化の取り込み 1983 年 2 月 英国でシートベルト着用を義務づける法令が施行 83 年 2 月にレベルシフト 施工前 ( 横軸 0.0) と施工後 (1.0) での死傷者数の 散布図 残りは ガソリン価格 季節性 トレンド項で説明できそう

データサイエンティスト育成クラッシュコース 4. 状態空間モデル 前節で示したモデリングは 線形ガウス状態空間モデルの一例 状態空間モデルは モデルのモデル あるいは メタモデル 実用的な時系列モデルの殆どは 時系列の分布を規定する本質的な変数群 ( 状態 ) のマルコフ遷移と それら変数群と観測値を結びつける関係式で表現される 状態空間モデルの枠組みでは 状態の推定 ( 予測 フィルタ 平滑化 ) と尤度計算の方法が統一的に与えられる つまり 一度この形で習得しておけば応用がきく 適用例としては おおまかに信号抽出型か時変係数型かに分けられる

データサイエンティスト育成クラッシュコース 時系列の尤度 時系列の最大の特徴は 時間的に近接する観測値に相関があること 独立同一分布の場合のように 個々の密度のかけ算で尤度を定義できない! 時系列モデルの場合は 一期先予測誤差の累積 として尤度を表現し それを数値的に最大化する これを尤度の予測誤差分解という データサイエンティストとして 後々応用力を高めるためには 単にパッケージを利用するだけでなく 予測誤差分解を自らプログラミングで体感しておく必要がある 北川 (2005) の第 9 章を熟読 第 10~13 章で応用のイメージを膨らませる

データサイエンティスト育成クラッシュコース 最前線に向かって 最前線 : 状態遷移を非線形化 応答変数の非ガウス化 Particle filter, MCMC 抱えている具体的問題でこれらが要請される場合は 北川 (2005) の第 14 章 15 章まで学習 季節 ARIMA, 線形ガウス状態空間モデルに基づく成分分解型時系列モデルは 成熟段階に達した技術で使いやすい ソフトウェア実装も選択肢多数 需要分析をはじめとして広く浸透 多変量の場合 : 多変量 AR( 北川 2005, 6.7, 7.6, 7.7 節 ) が基本だが 高次元の場合 闇雲に適用する前に 全ての変数を同時決定するようなモデルが求められているかどうか再検討したほうがよい

データサイエンティスト育成クラッシュコース 参考文献 1. 北川源四郎 時系列解析入門 ( 岩波書店 2005 年 ) 2. Box, G. E. P., Jenkins, G. M. and Reinsel, G. C., Time Series Analysis: Forecasting and Control 4 th ed., Wiley, 2008. 3. A. C. ハーベイ 時系列モデル入門 ( 国友直人 山本拓訳 東大出版会 1985 年 ) 4. 田中勝人 現代時系列分析 ( 岩波書店 2006 年 ) 5. Commandeur, J. J. F. and Koopman, S. J., An Introduction to State Space Time Series Analysis, Oxford University Press, 2007. [ シーエーピー出版から和訳あり ]