時系列データ解析による予測と最適化 ~エネルギー需要、発電、価格のモデリング~

Similar documents
時系列データ解析による予測と最適化 ~エネルギー需要、発電、価格のモデリング~

AI技術の紹介とセンサーデータ解析への応用

Presentation Title

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - 資料04 重回帰分析.ppt

PowerPoint プレゼンテーション

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

国土技術政策総合研究所資料

PowerPoint プレゼンテーション

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Presentation Title

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

McCain & McCleary (1979) The Statistical Analysis of the Simple Interrupted Time-Series Quasi-Experiment

Microsoft Word - eviews6_

博士学位請求論文審査報告書 申請者 : 植松良公 論文題目 :Statistical Analysis of Nonlinear Time Series 1. 論文の主題と構成経済時系列分析においては, 基礎となる理論は定常性や線形性を仮定して構築されるが, 実際の経済データにおいては, 非定常性や

景気指標の新しい動向

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

MATLAB®製品紹介セミナー

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

SAP11_03

横浜市環境科学研究所

日心TWS

Probit , Mixed logit

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

スライド 1

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft Word - 補論3.2

スライド 1

PowerPoint プレゼンテーション

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

C5 統計的時系列モデリング

Microsoft Word - reg2.doc

JUSE-StatWorks/V5 ユーザーズマニュアル

ベイズ統計入門

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft PowerPoint - e-stat(OLS).pptx

Rの基本操作

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - Econometrics pptx

1.民営化

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

最小二乗法とロバスト推定

 

Microsoft Word - eviews2_

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

して 車種に応じて一定額の補助金を支給するというものである この補助金政策は エコカー普及によるCO 2 排出量を削減することに加え 自動車販売促進によってリーマンショック後の大不況を改善するという 2 つの目的を謳って実施された しかし 白井 (2010) によると このエコカー補助金政策による

データサイエンス講座第 3 回機械学習その 2 ロジスティクス回帰 カーネル法とサポートベクターマシン アンサンブル学習

MATLAB ではじめる画像処理とロボットビジョン ~ 機械学習による物体認識と SLAM~ MathWorks Japan アプリケーションエンジニアリング部信号処理 通信 木川田亘 2015 The MathWorks, 1Inc.

memo

Signal Processing Toolbox

Missing Data NMF

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

Introduction to System Identification

Microsoft PowerPoint - 時系列解析(10)_講義用.pptx

解析センターを知っていただく キャンペーン

1

目次 ガウス過程 (Gaussian Process; GP) 序論 GPによる回帰 GPによる識別 GP 状態空間モデル 概括 GP 状態空間モデルによる音楽ムードの推定

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - Time Series Basic - Modeling.doc

PowerPoint Presentation

データ分析のまとめ方

あらまし 本研究では, 後楽園キャンパス 5 号館の消費電力量の分析および予測を行う. まず消費電力量を重回帰モデルで表し, 消費電力量の要因とその影響の大きさを調べる. 次に, 予測精度を上げるために重回帰モデルによる残差を時系列モデルで表す. これにより得られた消費電力モデルを用いて前後の年度に

モンテカルロ・フィルタを用いた金融時系列分析

狭山デポ様IBM移設予定機器 _ppt [Compatibility Mode]

スライド 1

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

中央アジアにおける内陸国物流の実態

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

13章 回帰分析

PowerPoint プレゼンテーション

Takeuchi, J., and Yamanishi, K.: A Unifying Framework for Detecting Outliers and Change Points from Time Series, IEEE Trans. on Knowledge and Data Eng

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft Word - SPSS2007s5.doc

OpRisk VaR3.2 Presentation

今回 次回の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ Danger!! (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか これは次回)

統計的データ解析

Microsoft Word doc

Microsoft Word - appendix_b

Microsoft Word - reg.doc

Microsoft Word - 計量研修テキスト_第5版).doc

回帰分析 重回帰(3)

Microsoft PowerPoint - 三次元座標測定 ppt

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

プログラムのゴールと特徴 プログラムのゴールデータ分析職 ( データサイエンティストでなくとも ) に求められる高度な統計学や機械学習の理論とスキルを体系立てて理解し ビジネス課題に適用できる人材の育成を目指します 具体的には以下のことができるようになることを目指します 高度なデータ分析技術を用いて

構造方程式モデリング Structural Equation Modeling (SEM)

Microsoft PowerPoint - ch10j

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

先物 オプションレポート 2016 年 8 月号 日経平均スポット ボラティリティ日次パスの関数 ARCH モデリング 甲南大学経済学部 石田功 1. はじめに 2011 年 11 月 21 日から 2016 年 5 月 31 日の日経平均株価の 5 分間対数変化率 (%) の 2 乗を計算すれば

今日の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか


Microsoft PowerPoint - データ解析発表2用パワポ

Microsoft PowerPoint - ch04j

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint - 6.PID制御.pptx

DVIOUT-Efinance04_

Transcription:

MATLAB による時系列データ解析と予測 MahWorks Japan アプリケーションエンジニアリング部テクニカルコンピューティング 中川慶子 2015 The MahWorks, Inc. 1

アジェンダ 需要予測 : 時系列データモデリング 1. データの準備 データの取得 生データの前処理 2. 機械学習 非線形重回帰 ニューラルネットワーク RNN 3. 自己回帰系モデル ARIMA/GARCHモデル VARモデル 2

需要予測 目的 : 過去データから未来の電力需要を予測する 変数 : 1. 温度 2. 湿度 3. 時刻 4. 曜日 5. 休日 祝日フラグ 6. 前週の同時刻電力需要 7. 前日の同時刻電力需要 8. 前日の平均電力需要 3

1. データの準備構造化データをまとめる CSV 気象データ エクセル祝日情報 データベース電力 4

便利ツール Time Table 時系列データ用テーブル リサンプリングと自動補完 Tall 配列 R2016b R2016b メモリに入り切らないデータを逐次読み込みにより処理 並列分散処理対応 Signal Processing Toolbox 信号生成と前処理 ( ノイズ除去など ) 測定と特徴抽出 ( ピーク検出など ) たたみ込みと相関計算 スペクトル解析 ( パワースペクトル コヒーレンス ) 信号解析環境 SPTool フィルタ設計環境 FDATool 5

アジェンダ 需要予測 : 時系列データモデリング 1. データの準備 データの取得 生データの前処理 2. 機械学習 非線形重回帰 ニューラルネットワーク RNN 3. 自己回帰系モデル ARIMA/GARCHモデル VARモデル 6

需要予測 目的 : 過去データから未来の電力需要を予測する 変数 : 1. 温度 2. 湿度 3. 時刻 4. 曜日 5. 休日 祝日フラグ 6. 前週の同時刻電力需要 7. 前日の同時刻電力需要 8. 前日の平均電力需要 7

需要予測重回帰分析 非線形重回帰分析 y = b 1 sin Σ i b i x i + b 2 sin(σ i b i x i ) + b 3 sin(σ i b i x i ) 相関のプロット corrplo 多重共線性の検定 colines Economerics Toolbox 最小二乗法を使いましたがエラーが正規分布していますか? 正規分布の検定 es Saisics and Machine Learning Toolbox 8

需要予測ニューラルネットワーク 誤差逆伝搬法 : ターゲット ( 応答 ) とのズレの分だけウエイトをずらす ニューラルネットワーク : ne = fine(20); ne = rain(ne, rainx', rainy'); forecasload = sim(ne, esx')'; Neural Nework Toolbox ( 参考 ) 決定木 : Trees = TreeBagger(100, rainx, rainy); forecasload = predic(rees, esx); Saisics and Machine Learning Toolbox 9

需要予測リカレントニューラルネットワーク フィードバック 過去データも基底 ( 変数 ) に含めて係数を推定する リカレントニューラルネットワーク : ne = layrecne(1:2, 10); [Xs,Xi,Ai,Ts] = prepares(ne,rainxc,rainyc); ne = rain(ne,xs,ts,xi,ai); forecasload = sim(ne, esx', Xf, Af); Neural Nework Toolbox 10

MATLAB における機械学習 訓練データなし 教師なし学習 機械学習 訓練データあり 教師あり学習 クラスタリング回帰分類 K- 平均法階層的クラスタリングニューラルネット混合ガウス分布自己組織化マップ 線形回帰モデル一般化線形回帰モデル非線形回帰モデル回帰木アンサンブル学習ニューラルネット 線形判別器 2 次判別器 K- 最近傍識別単純ベイズ分類決定木アンサンブル学習ニューラルネットサポートベクターマシン 11

アジェンダ 需要予測 : 時系列データモデリング 1. データの準備 データの取得 生データの前処理 2. 機械学習 非線形重回帰 ニューラルネットワーク RNN 3. 自己回帰系モデル ARIMA/GARCHモデル VARモデル 12

モデルの選択 1 単変量モデル ARIMA Auoregressive Inegraed Moving Average 自らの過去データと移動平均に依存するモデル GARCH Generalized Auoregressive condiional heeroskedasiciy 時系列のボラティリテも含んだモデル 定常な時系列データに対して使える 13

Box Jenkins 法 時系列モデルによる予測の手順 定常性 のあ AR と MA 過程 係数パラメータ 観測データを るデータにする ラグを決める を推定する 使った検証 14

1. 定常性などの検証 Economerics Toolbox 定常性はありますか? 単位根検定 uni roo es Augmened Dickey-Fuller 検定 adfes Phillips-Perron 検定 ppes KPSS 検定 ( トレンド定常性 ) kpsses 定常性 のあるデータにする ARCH/GARCH 効果はありますか? Engle 検定 arches Ljung-Box Q-es lbqes 15

概念 定常性 のあるデータにする 定常 なデータとは? 定常 : 平均と標準偏差などが時間によらず一定 非定常であるが単位根を持つとは? N 回微分をすると定常過程になる 300 250 Trend Saionary Difference Saionary Trend Line 200 150 100 50 0-50 0 100 200 300 400 500 600 700 800 900 1000 16

Sample Parial Auocorrelaions Sample Auocorrelaion Sample Parial Auocorrelaions Sample Auocorrelaion 2. ラグ次数を決める Economerics Toolbox AR と MA 過程ラグを決める 偏自己相関係数 AR 項のラグ 1 0.5 PACF: Reurns 1 0.5 ACF: Reurns 自己相関係数 MA 項のラグ 0 0-0.5 0 5 10 15 20 Lag PACF: Reurns 2 1-0.5 0 5 10 15 20 Lag ACF: Reurns 2 1 二乗データの偏自己相関係数 分散の AR 項のラグ 0.5 0-0.5 0 5 10 15 20 Lag 0.5 0-0.5 0 5 10 15 20 Lag 二乗データの自己相関係数 分散の MR 項のラグ 17

ARIMA モデル AR と MA 過程ラグを決める AR(1) wih consan erm y = δ + a 1 y 1 + ε ARIMA(1,1,1) I (inegraed) は微分の階数 y y 1 = δ +a 1 (y 1 y 2 ) + ε + b 1 ε 1 MA(1) = moving average y = ε + b 1 ε 1 ARMA(1,1) wih consan erm y = δ + a 1 y 1 + ε + b 1 ε 1 18

19 GARCH Model Defaul model: GARCH(1,1) 1 2 1 2 1 1 2 A G C y 標準偏差も含めた時系列モデル ) (0, ~ 2 1 2 1 2 2 1 1 Q j j j P i i i M j j j R i i i N A G b y a y Generalized ARCH MA AR AR と MA 過程ラグを決める

アジェンダ 需要予測 : 時系列データモデリング 1. データの準備 データの取得 生データの前処理 2. 機械学習 非線形重回帰 ニューラルネットワーク RNN 3. 自己回帰系モデル ARIMA/GARCHモデル VARモデル 20

モデルの選択 3 Vecor Auoregressive (VAR) 複数の時系列 ( ベクトル ) のモデル 1. 電力需要量 2. 月次平均最高気温 3. 月次平均最低気温 4. 人口 5. 失業率 6. GDP 時系列間の線形な相互依存性を利用する 21

22 6 変量 VAR(p) モデル 1. Y は ( 縦 ) ベクトルで与えられた時系列 2. a は定数ベクトル 3. W は平均が 0 ベクトルで 共分散行列 Q の 6 次元正規分布に従う乱数 y y y y 6 5 2 1

モデルの選択 3 Vecor Auoregressive (VAR) 複数の時系列 ( ベクトル ) のモデル 1. 電力需要量 2. 月次平均最高気温 3. 月次平均最低気温 4. 人口 5. 失業率 6. GDP 時系列間の線形な相互依存性を利用する 多重共線性に注意 スケーリングに注意 23

予測のステップ Economerics Toolbox 0. 前処理 1. モデルの設定 2. データによる学習 フィッティング 3. 予測 4. 検証 ARIMA: garchmdl = garch(1,1); Model = arima( D, 1, Seasonaliy, 12, 'MALags', 1, 'SMALags', 1, 'Variance', garchmdl); Fi = esimae(model, Fin); FY = forecas(fi, 12, 'Y0', Fin); VAR: Model = vgxse('n', numel(yseries), 'Consan', rue, 'nar', nar, 'Series', YSeries); Fi = vgxvarx(model, Y); FY = vgxpred(fi, Horizon, [], Y, [], NumPahs); 24

VAR モデルによる解析 Economerics Toolbox Spec = vgxse('n', numel(yseries), 'Consan', rue, 'nar', nar, 'Series', YSeries); Spec = vgxvarx(spec, Y); FI = vgxproc(spec, WX, [], Y1) 各時系列の標準偏差を設定することでインパルス応答を見ることもできる 25

まとめ時系列データ解析 非定常 定常 一変量 確率微分方程式回帰分析 NARX ARIMA GARCH 多変量 機械学習決定木などニューラルネットワーク RNN 重回帰分析 VAR エラーが正規分布している場合 黒 :Financial Toolbox 青 :Saisics and Machine Learning Toolbox 茶 :Neural Nework Toolbox 紫 :Economerics Toolbox 26

ご紹介したツールボックス Neural Nework Toolbox ニューラルネットワークの構築 学習 データフィッティング クラスタリング パターン認識 深層学習 GPU による計算の高速化 Daabase Toolbox 各種データベースへのアクセス ODBC JDBC GUI を用いた対話的なアクセスと SQL の作成 Economeric Toolbox 時系列モデル GARCH ARIMAX VAR 状態空間モデル パラメータ推定 モデルの検証 27