PowerPoint プレゼンテーション

Similar documents
例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

PowerPoint Presentation

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

DVIOUT

Microsoft PowerPoint - H22制御工学I-10回.ppt

Microsoft PowerPoint - H22制御工学I-2回.ppt

SAP11_03

PowerPoint プレゼンテーション

3. みせかけの相関単位根系列が注目されるのは これを持つ変数同士の回帰には意味がないためだ 単位根系列で代表的なドリフト付きランダムウォークを発生させてそれを確かめてみよう yと xという変数名の系列をを作成する yt=0.5+yt-1+et xt=0.1+xt-1+et 初期値を y は 10

航空機の運動方程式

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

Microsoft PowerPoint - 10.pptx

パソコンシミュレータの現状

景気指標の新しい動向

様々なミクロ計量モデル†

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

カイ二乗フィット検定、パラメータの誤差

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

横浜市環境科学研究所

Microsoft PowerPoint - e-stat(OLS).pptx

航空機の運動方程式

Microsoft PowerPoint - 資料04 重回帰分析.ppt

工業数学F2-04(ウェブ用).pptx

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

スライド 1

Microsoft PowerPoint - 第3回2.ppt

ディジタル信号処理

Microsoft Word ã‡»ã…«ã‡ªã…¼ã…‹ã…žã…‹ã…³ã†¨åłºæœ›å•¤(佒芤喋çfl�)

1. 線形シフト不変システムと z 変換 ここで言う システム とは? 入力数列 T[ ] 出力数列 一意変換 ( 演算子 ) 概念的には,, x 2, x 1, x 0, x 1, x 2, を入力すると, y 2, y 1, y 0, y 1, y 2, が出力される. 線形システム : 線形シ

1.民営化

Microsoft PowerPoint - H21生物計算化学2.ppt

以下 変数の上のドットは時間に関する微分を表わしている (ex. 2 dx d x x, x 2 dt dt ) 付録 E 非線形微分方程式の平衡点の安定性解析 E-1) 非線形方程式の線形近似特に言及してこなかったが これまでは線形微分方程式 ( x や x, x などがすべて 1 次で なおかつ

学習指導要領

Microsoft PowerPoint - CSA_B3_EX2.pptx

数値計算で学ぶ物理学 4 放物運動と惑星運動 地上のように下向きに重力がはたらいているような場においては 物体を投げると放物運動をする 一方 中心星のまわりの重力場中では 惑星は 円 だ円 放物線または双曲線を描きながら運動する ここでは 放物運動と惑星運動を 運動方程式を導出したうえで 数値シミュ

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - Time Series Basic - Modeling.doc

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

Microsoft PowerPoint - LectureB1handout.ppt [互換モード]

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

Probit , Mixed logit

Microsoft PowerPoint - 物情数学C(2012)(フーリエ前半)_up

Microsoft PowerPoint - aep_1.ppt [互換モード]

博士学位請求論文審査報告書 申請者 : 植松良公 論文題目 :Statistical Analysis of Nonlinear Time Series 1. 論文の主題と構成経済時系列分析においては, 基礎となる理論は定常性や線形性を仮定して構築されるが, 実際の経済データにおいては, 非定常性や

学習指導要領

ベイズ統計入門

今回用いる例データ lh( 小文字のエル ) ある女性の血液中の黄体ホルモンを 10 分間隔で測定した時系列データ UKgas 1960 年 ~1986 年のイギリスのガス消費量を四半期ごとに観測した時系列データ ldeaths 1974 年 ~1979 年のイギリスで喘息 気管支炎 肺気腫による死

データ解析

統計的データ解析

スライド 1

DVIOUT-SS_Ma

学習指導要領

Microsoft PowerPoint - 時系列解析(11)_講義用.pptx

09.pptx

PowerPoint プレゼンテーション

Microsoft PowerPoint - LectureB1_17woAN.pptx

Microsoft Word - 訋é⁄‘組渋å�¦H29æœ�末試é¨fi解ç�fl仟㆓.docx

Microsoft PowerPoint - 10.pptx

memo

<4D F736F F D B4389F D985F F4B89DB91E88250>

生命情報学

ボルツマンマシンの高速化

Microsoft PowerPoint - Inoue-statistics [互換モード]

Chap2

日心TWS

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

多次元レーザー分光で探る凝縮分子系の超高速動力学

PowerPoint プレゼンテーション

untitled

学習指導要領

PowerPoint プレゼンテーション

Matrix and summation convention Kronecker delta δ ij 1 = 0 ( i = j) ( i j) permutation symbol e ijk = (even permutation) (odd permutation) (othe

講義「○○○○」

(Microsoft Word - PLL\203f\203\202\216\221\227\277-2-\203T\203\223\203v\203\213.doc)

Microsoft Word - NumericalComputation.docx

. 分析内容及びデータ () 分析内容中長期の代表的金利である円金利スワップを題材に 年 -5 年物のイールドスプレッドの変動を自己回帰誤差モデル * により時系列分析を行った * ) 自己回帰誤差モデル一般に自己回帰モデルは線形回帰モデルと同様な考え方で 外生変数の無いT 期間だけ遅れのある従属変

DVIOUT

<4D F736F F D2094F795AA95FB92F68EAE82CC89F082AB95FB E646F63>

数学の世界

"éı”ç·ıå½¢ 微勃挹稉弑

重要例題113

1/17 平成 29 年 3 月 25 日 ( 土 ) 午前 11 時 1 分量子力学とクライン ゴルドン方程式 ( 学部 3 年次秋学期向 ) 量子力学とクライン ゴルドン方程式 素粒子の満たす場 y ( x,t) の運動方程式 : クライン ゴルドン方程式 : æ 3 ö ç å è m= 0

画像解析論(2) 講義内容

Microsoft PowerPoint - 三次元座標測定 ppt

スライド 1

まとめ Fourr 級数展開 周期 の関数の場合 co, co Fourr 級数展開 周期 の関数の場合 co, co Fourr 変換と逆変換 フーリエ逆変換 フーリエ変換

フーリエ変換 ラプラス変換 - まとめ Fourr 級数展開 周期 の関数の場合 co b, b co Fourr 級数展開 周期 の関数の場合 co b, b co Fourr 変換と逆変換 フーリエ逆変換 フーリエ変換

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

PowerPoint Presentation

Microsoft Word - å“Ÿåłžå¸°173.docx

Excelを用いた行列演算

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

解析力学B - 第11回: 正準変換

Microsoft Word - ㅎ㇤ㇺå®ı璃ㆨAIã†®æŁ°ç’ƒ.docx

Microsoft PowerPoint - NA03-09black.ppt

Microsoft Word - thesis.doc

PowerPoint プレゼンテーション

Microsoft PowerPoint - mp11-06.pptx

Transcription:

データ解析 第 7 回 : 時系列分析 渡辺澄夫

過去から未来を予測する 観測データ 回帰 判別分析 解析方法 主成分 因子 クラスタ分析 時系列予測

時系列を予測する 無限個の確率変数 ( 確率変数が作る無限数列 ){X(t) ; t は整数 } を生成する情報源を考える {X(t)} を確率過程という 確率過程に ついて過去の値から未来を予測するにはどうしたらよいだろうか X(t-K),X(t-K+1),,X(t-1) 真の情報源 X(t) 過去から未来を予測する

時系列解析について 時系列解析や空間データ解析には極めて多くの研究があり 一回の講義ですべてを紹介することはできません ここでは 時系列解析の入門の概要だけを述べます 時系列においてはデータは独立でないため 独立なデータ を扱う方法とは異なる理論と方法が必要になります

1 時系列の定常性 非定常性

定常性 確率過程 { X(t) ; t は整数 } を考える ( 実数の数列に値をとる確率変数 ) 定義.(1) X(t) が強定常過程であるとは 任意の整数 n について (X(t),X(t+1),,X(t+n)) の同時確率密度関数が t によらないときをいう (2) X(t) が弱定常過程であるとは任意の t について E[ X(t) 2 ] が有限 であり 任意の整数 n について E[X(t)X(t+n)] が t によらないときをいう ( 注意 ) 任意の整数 t と n について (X(t),X(t+1),,X(t+n)) が正規 分布に従う場合には 強定常過程であることと弱定常過程であることは 同値であるが 一般には同値ではない

定常と非定常 時系列の予測を行なう場合には 何らかの意味で定常性が仮定されて いる ( 定常だと考えて予測している ) ことが普通である 確率的でない関数 f(t) で X(t) f(t) が定常であるようなものが あらかじめ分かっている場合には X(t) f(t) を解析すればよい 差分 X(t+1) - X(t) やさらに高階差分を取ることで定常になる場合には 差分で得られる時系列を解析する 定常であるかどうかを調べたい場合には定常性をチェックする検定法も ある

例 正規雑音 ( 白色雑音 : 定常 ) ランダムウォーク ( 非定常 )

例 単調増加 + 周期関数 + 正規雑音 ( 非定常 ) 上の差分 ( 周期があるので定常ではないが定常に近づいた )

2 時系列の解析

Z 変換と逆変換 時系列 x(t) ( t は整数 ) を考える 複素数 z 0 の関数 (Fx)(z) を (Fx)(z) = Σ z -t x(t) t= - 定義して (Fx)(z) を x(t) の Z 変換という x(t) から (Fx)(z) への対応は 線形写像である 特に z=exp(ik) や z=exp(k) の場合はフーリエ変換や ラプラス変換になるので Z 変換はそれらの一般化である 逆変換 1 (F -1 f)(n) = z n-1 f(z) dz ( 積分路はf(z) の極を含む ) 2πi が存在する ( 例 1) x(t) = δ tk のとき (Fx)(z) = z -k. x(t) k ( 例 2) y(t) = x(t-n) のとき (Fy)(z) = z -n (Fx)(z)

Z 変換の応用例 Z 変換により 時間の移動 と z -1 をかけること が等価になる ( 例 ) 与えられた y(t) に対して y(t) = x(t) + 2x(t-1) + 3x(t-2) を満たす x(t) を求めたい時は Z 変換したものの関係 (Fy)(z) = (1+2z -1 +3z -2 ) (Fx)(z) から 1/(1+2z -1 +3z -2 ) (Fy)(z) = (Fx)(z) を導出し 逆 Z 変換を適用することで x(t) = F -1 { (Fy)(z) /(1+2z -1 +3z -2 ) } (t) を得る

可解 な問題の構造 数学における 解ける問題 は下記の構造を持つことが多い 例 : 行列の n 乗 非線形可解方程式など x(t) 等価変形 (Fx)(z) 直接は 解けない かんたんに 解ける y(t) 等価変形 (Fy)(z)

3 時系列解析のモデル 実世界にある時系列は無限に複雑であることが多いが これを性質の良く分かっているモデルを用いて推測する ことが行なわれている まずモデルについて説明する

1 自己回帰過程 (AR, Auto Regressive Process) 時刻 t における X(t) はそれよりも K 時刻前までの重みつき和と雑音 で生成される時系列のモデルである : X(t) = K - Σ a k X(t-k) + e(t) k=1 ここで {a 1,,a K } は定数である 次のように書くことができる K X(t) + Σ a k X(t-k) = e(t) k=1

注意 : 自己回帰過程 (AR) K Z 変換を計算すると (1+ Σ a k Z -k )(Fx)(z) = (Fe)(z) が得られる k=1 K 次代数方程式 (zを変数とする) 1+ Σ a k Z -k =0 を特性多項式という 代数方程式は複素数の範囲で多重度を含めて K 個の解を持っている ( 代数学の基本定理 ) ので 1+ Σ a k Z -k は因数数分解できる その解の絶対値がすべて1よりも小さければ 分数関数 1/(1+ Σ a k Z -k ) の無限部分分数展開は収束するが そうでない場合は収束しない このことは 対応 e(t) x(t) が発散し 定常性を持たないことを意味する そこで 自己回帰過程では ( 定常性を満たす必要がある場合には ) 上記の特性方式の解の絶対値がすべて1よりも小さいことを要請する

問 1 次の方程式を満たす時系列が定常であるような A の範囲を求めよ X(t) + A x(t-1) - 0.25 x(t-2) -0.25A x(t-3) + e(t) =0 次の方程式を満たす時系列が定常であるような A の範囲を求めよ ただし次の恒等式を用いてもよい z 3 + A z 2-0.25 z - 0.25A = (z - 0.5)(z+0.5)(z+A)

自己回帰過程の例 X(t)=0.3X(t-1) + 0.3X(t-2) + 0.2X(t-3) + 0.1X(t-4) + e(t) X(t)=0.3X(t-1) + 0.3X(t-2) + 0.3X(t-3) + 0.1X(t-4) + e(t)

注意 : 単位根の問題 AR 過程で特性方程式の解の絶対値が1( 単位根 ) を含む場合には 定常過程ではなく ランダムウォークになる 単位根を持つ二つの過程 X(t) と Y(t) があるとき X(t) から Y(t) への回帰を行なうと 本来は存在しない回帰関係が存在するように見えてしまうことからしばしば実問題における解析ミスの原因になることが知られている

2 移動平均過程 (MA, Moving Average Process) 時刻 t における X(t) はそれよりも K 時刻前までの雑音 e(t) の 重みつき和で生成される時系列のモデルである : K X(t) = Σ b k e(t-k) + b 0 e(t) k=1 ここで {b 0,b 1,,b K } は定数である

注意 : 移動平均過程 (MA) Z 変換を計算すると (Fx)(z) = (b 0 + Σ b k Z -k )(Fe)(z) が得られる K K k=1 今度は もしも特性方程式 (b 0 + Σ b k Z -k ) = 0 の解の絶対値が 1 より k=1 小さいものがあると対応 x(t) e(t) が発散し x(t) から e(t) が安定的に推測できないことを意味する そこで 上記の特性方式の解の絶対値がすべて1よりも大きいことを要請する

移動平均過程の例 X(t)=0.5e(t)+0.5e(t-1) + 0.5e(t-2) + 0.5e(t-3) + 0.5e(t-4) X(t)=e(t) - 0.8e(t-1) + 0.6e(t-2) - 0.4e(t-3) + 0.2e(t-4)

3 自己回帰移動平均過程 (ARMA) AR 過程と MV 過程の両方を持つ時系列のモデルである : K X(t) + Σ a k X(t-k) = Σ b k e(t-k) + b 0 e(t) K k=1 k=1 ここで {a 1,,a K,b 0,b 1,,b K } は定数である さらに差分すると ARMA 過程になるような時系列を ARIMA 過程という (Auto Regressive Integrated Moving Average Process). MV, ARMA,ARIMA においてはパラメータの推定をデータから解析的に行なうことはできない また最小二乗法でない方法についても研究がなされている

4 状態空間モデル ( 潜在変数モデル ) Y(1) Y(2) Y(3) 観測できない X(1) X(2) X(3) 観測できる 観測できない時系列 { Y(t) } が存在して 観測できる時系列 { X(t) } が { Y(t) } から生成されるモデル 関数 f, g が線形のときはカルマンフィルタと呼ばれることがある X(t) = f(y(t),a) + 雑音 Y(t) = g(y(t-1),y(t-2),b) + 雑音この推定をベイズ法で行うときの技法として パーティクル フィルタがとてもよく研究されている

隠れマルコフモデル = 確率オートマトン 状態空間モデルの一種であるが 音声言語や遺伝子解析で用いられる 状態 状態 状態 出力出力出力 非線形予測 時系列の予測に深層学習などの新しい方法が適用されるようになってきた 精度において優れているが 学習データから異なる状況に対するロバスト性の問題などが問題

5 高次元データの解析 宇宙 太陽 地球 気象 海 農業 水産業 地震 電力 疫学 環境学 量子現象 交通流など時間と空間を変数に持つデータは実世界にとてもたくさん存在する 物理法則がほぼわかっているものと 物理法則自体が不明であってモデルにより推定されているものがある ある時刻と場所 (t,x) における量は確率変数であり X(x,t) が ( 時空間上の ) 確率微分方程式で表され その統計的推定が行われる

6 長期の予測は難しい ( または不可能 ) 時系列を与える真の法則がわかっていても 初期値の わずかなずれが長期的に大きな差になることがある 7 予測が難しい問題 ( または不可能 ) 金融恐慌の仕組みがわかったとしてもいつおきるかを予測することは難しい 地震が起きる仕組みがわかったとしても何十万年の単位での予測ができるだけであるといわれている

4 時系列の推定 いちばん簡単な線形予測モデルと深層学習で時系列を 学習してみよう

時系列解析における前処理 実世界における時系列の解析を行う場合 昼夜 曜日 季節などの 影響がある問題では そうした要因を取り除くか 付加的なモデルを いれて推定するなどが有用である 時系列だけでなく空間上のデータについても同様である

自己回帰過程を用いた推定 AR 過程を用いて推測する場合 二乗誤差を最小にすることでパラメータの 推定を行なうことができる X(t) = Σ a k X(t-k) ( 符号注意 ) の場合には T K Σ { X(t) - Σ a k X(t-k) } 2 t=k+1 k=1 を {a 1,,a K } について最小化 最小二乗法で得られるパラメータは T が無限大に近づく時 真の時系列に対して最適なパラメータに収束するか? 一般的には難しい問題であるが {X(t)} が正規分布であるときには n のときE[X(t)X(t+n)] 0 が十分条件である

(1) { X(t) ; t=1,2,,t} を得る T K 計算手順 (2) Σ { X(t) - Σ a k X(t-k) } 2 を {a 1,,a K } について最小化 t=k+1 k=1 T 行列 S km = Σ X(t-k) X(t-m) t=k+1 T (1 k,m K) ベクトル v k = Σ X(t) X(t-k) (1 k K) t=k+1 とおくと 推定されたパラメータは a* = S -1 v K (3) 予測式 X(t) = Σ (a*) k X(t-k) を得る k=1 (4) 方程式 1- Σ (a*) k z -k = 0 ( 符号注意 ) の解の絶対値で 1 よりも大きい ものがあるときは推定された時系列は定常ではない ( 定常でなくても 予測はできるが注意が必要である )

線形予測 (5 次式 )

線形予測 (5 次式 )

問 2 T Σ { X(t) - a 1 X(t-1) - a 2 X(t-2) } 2 t=3 を最小にする {a 1,a 2 } を求めよ

例 ある月の白菜の値段を それよりも 30 ヶ月前までの白菜の値段を用いて予測するための関数 x(t) = f(x(t-1),x(t-2),,x(t-30)) を推定するという問題を考える (30 よりも少ない場合も含めて考える ) 時系列予測の例 :1970 年 1 月から 2013 年 12 月までの白菜の値段 政府統計の総合窓口 のデータを使用しています http://www.e-stat.go.jp/sg1/estat/estattopportal.do ( 注意 ) 時系列では 季節 曜日 昼夜の影響を受けると分かっている場合にはそれらの情報も入力に使うとより精度の良い予測ができますが ここでは単純な予測問題を扱います 2018/12/20

例白菜の値段を AR 過程 (30) で予測 定常ではないようです たぶんバブルの前と後で法則が変化していると思います しかし これは演習なので AR 過程でどのくらい予測できるかやってみましょう 特性方程式の解の最大絶対値は 1.0023 でした ( 定常ではない ) 値段 月 学習データ 250 個赤 : 真青 : 予測 値段 月 テストデータ 250 個赤 : 真青 : 予測

どのくらい過去の月まで使うのがよいか AR( 次元 ) 解析学習誤差とテスト誤差 2018/12/20 学習誤差 テスト誤差 推測につかうモデルの次元 特性方程式の解の絶対値の最大値が 1 よりも小さくなるのは 9 次元までだった 深層学習によるテスト誤差

参考 : 深層学習で学習し予測してみた 値段 学習データ赤 : 真青 : 予測 値段 月 テストデータ赤 : 真青 : 予測 2018/12/20 Mathematical Learning Theory 月

全結合 畳み込みネットワーク 時間 時間 ( 注 ) 第 1 層から第 2 層までの結合の初期値に線形予測で得られた結合加重を用いています 2018/12/20

問 3 白菜の値段の線形予測における回帰係数は下記のようになった ここからわかることを述べよ 回帰係数 前月 1 年前 2 年前 最近 過去