Microsoft Word - Time Series Basic - Modeling.doc

時系列解析入門モデリング. 確率分布と統計的モデルが確率変数 (radom varable のときすべての実数 R に対してとなる確率 Prob( が定められるこれをの関数とみなして G( Prob ( とあらわすとき G( を確率変数の分布関数 (probablt dstrbuto ucto と呼ぶ時系列解析で用いられる確率変数は通常連続型と呼ばれるものでその分布関数は ( t ( < t< G ( ( tdt を満たす関数の積分によってと表現できるこのとき ( を密度関数 (dest, probablt dest ucto と呼ぶ逆に分布関数が与えられると任意のa< b に対してa< b となる確率が b ( Ga ( ( d Gb によって求められる a 代表的な密度関数として以下がある正規分布 ( ガウス分布 ormal dstrbuto ( ( ep, < < π 平均分散れると表記され (, で (, は標準正規分布と呼ばコーシー分布 (Cauch dstrbuto (, < < π {( } ピアソン分布族 (Pearso aml o dstrbuto c (, < < b π {( } b ただし ( c Γb Γ b Γ で b のときコーシー分布 b / としたとき自由度のと一致するまたを正の整数として (

t 分布 (t-dstrbuto と呼ばれる指数分布 (epoetal dstrbuto ( λ λe,, < χ 分布 (ch-square dstrbuto ( / e Γ, <, は自由度と呼ばれるのとき指数分布となる重指数分布 (double epoetal dsbtuto ( e e 一様分布 (uorm dstrbuto ( ( ba, a< b, other ある密度関数から得られるデータを確率変数の実現値 (realzato という反対に観測するデータの背後に確率変数を想定しデータはその確率変数の実現値として得られたものと考えるときこの確率変数を特徴付ける密度関数 ( を真のモデル (true model と呼ぶ通常この真のモデルは未知であるから与えられたデータから確率分布を推定する必要があるこのときデータから推定された密度関数は統計的モデル (statstcal model と呼ばれ ( と表される時系列データの場合はさらに同時分布 (,, を考える必要がある時系列,, を標本平均 ˆ と標本自己共分散関数 Ĉ によって表現するということは次元ベクトル ( T が平均ベクトル ˆ ( ˆ,, ˆ T,, 分散共分散行列

ˆ ˆ C C ˆ C の多次元正規分布に従うとするモデルを想定していることに相当するこのようなモデルは正規分布に従う定常時系列を柔軟に表現できるがデータ数に対して個の未知数 ˆ ˆ,, C を推定することになりデータの情報を効率よく縮約することにはならない. KL 情報量とエントロピー最大化原理現実のデータを生成する真のモデルを ( それを近似した統計的モデルを ( と表すことにする統計モデリングでは ( になるべく近い ( を求めることが主要な目的になるそのためにはモデル ( のよさを客観的に評価する基準が必要になるここではその基準としてカルバックライブラー情報量 (Kullbac-Lebler ormato 以下 KL 情報量を用いる ( 番目の等式はモデルが連続型の確率分布の場合 ( ( ( ( ( I ; Elo lo ( d この KL 情報量は以下の性質を持っている I( ; I( ; ( ( また KL 情報量の符号を反転した量 B ( ; I( ; は一般化されたエントロピー (etrop とも呼ばれ想定した分布 ( から個の実現値をとった時にその相対度数分布が真の分布 ( と等しくなる確率のを近似的に与える従って KL 情報量が小さいほど確率分布はに近いと考えることができる統計モデルはデータ,, に基づいて真の分布 ( を近似したものでそのよさは KL 情報量 I ( ; で評価できる統計的モデリングにおいて B ( ; I( ; を最大とするようにモデルを構築しようとするのがエントロピー最大化原理 (etrop mamzato prcple である例えば真のモデル ( およびそれを近似したモデル ( 考えるがともに正規分布である場合を

( ( ep, π ( ( ep, π この場合 ( ( ( ( lo lo となるので KL 情報量は ( ( ( ( ( ( lo E E lo lo E ; I で与えられるとが正規分布の場合の KL 情報量の計算は簡単だがそうでない場合は数値計算によって求められる例えば以下の台形公式などが用いられる ( ( ( { } ( ( ( ( ( h h h I lo ; ˆ ただし 3. KL 情報量の推定と対数尤度実際の統計解析の場面では真の分布は未知であるため KL 情報量は実際の統計モデルの評価に用いられることはほとんどない真の分布 ( の代わりに ( から独立に観測されたデータ,, が与えられている場合モデル ( の KL 情報量を以下の方法で推定するエントロピー最大化原理に従って最も良いモデルを求めるためには ( ( I B ; ; を

最大 I ( ; を最小とするモデルを求めればよい KL 情報量は I( ; Elo( Elo( と二つの項に分解できる右辺第項は ( が与えられないと計算できないがモデル ( には依存しない一定の値を取るので無視できる右辺第項は平均対数尤度 (epected lo-lelhood と呼ばれる量で密度関数を持つ連続型のモデルの場合は E lo ( lo( ( d と表現できるこの平均対数尤度も ( が未知の場合には直接計算できないがデータが密度関数 ( に従って生成されることから大数の法則によりデータ数がの時 lo ( E lo( が成り立つ従って KL 情報量 ( (lo-lelhood l ( I ; を最小とするモデルの代わりに対数尤度 lo を最大とするようなモデルを選べば近似的にエントロピーを最大にすることができるまたその指数をとった L ( と呼ばれるは尤度 (lelhood 時系列解析のモデルでは通常観測値が独立に得られるという仮定は成り立たないこのような一般の場合には尤度は,, の同時分布を用いて L,, ( と定義されるこの場合対数尤度はとなる ( l lol lo,, 4. 最尤法によるパラメータの推定モデルがθ をパラメータとするパラメトリックモデルで ( ( θ の形をしている場合には対数尤度 l はパラメータ θ の関数と考えることができるしたがって θ を明示的に表し l ( θ lo lo を θ の対数尤度関数と呼ぶ ( θ ( 独立の場合 (,, ( θ 一般の場合対数尤度関数 l( θ はθ で定まるモデルの良さを評価した量なので ( θ l を最大とする θ を選

ぶことによってパラメトリックモデル ( θ のパラメータの最適な値を定めることができるこのように対数尤度あるいは尤度を最大化することによりパラメータを推定する方法は最尤法 (mamzato lelhood method と呼ばれるまた最尤法で推定されたパラメータを θˆ と表し最尤推定値 (mamum lelhood estmate と呼ぶ例として平均分散の正規分布モデル ( ep π ( のパラメータを最尤法で推定するこの場合対数尤度関数は l ( loπ ( したがって l( を最大とするためには S ( ( を最小とするを求めればよいので S( の一階導関数をとおくことによって ˆ が得られる S( ( のように二乗和を最小にすることによりパラメータを推定する方法は最小二乗法 (least squares method と呼ばれる一般に時系列モデルのパラメータ θ の最尤推定値を求めるためには擬似ニュートン法による数値的最適化 (umercal optmzato が用いられるパラメータθ の初期値 θ の値を l 定めたときの対数尤度の値 l( θ と一階微分が与えられると θ θ θ を繰り返して ( θ λ H 自動的に決定される l θ l の極大点を自動的に求めるステップ幅 λ とヘッセ行列の逆行列 H は 5. AIC( 赤池情報量基準最大対数尤度はそのままでは異なるモデル間の比較には用いることができない最尤推定値 θˆ で規定されるモデルは ( θˆ l が E lo ( θˆ の推定量として正の偏りを持つためであるこの偏差はパラメータの推定とモデルの評価のための平均対数尤度の推定に同じ

データを度用いたことによって生じる E を lo ( θˆ を l( ( ˆ θ lo ˆ θ C E E lo ( ( ˆ θ lo ˆ θ とおくこのとき ( θˆ l をC だけ補正し l( θˆ C によって推定したときに生じる平均的な偏りとすることにより E lo ( θˆ の偏りのない推定量を求めることができるここでC となることから赤池情報量基準 (AIC: Aae Iormato Crtero が得られる ( ˆ θ AIC l ( 最大対数尤度 ( パラメータ数 6. データ変換正規分布しなかったり分散が一定でない時系列のデータも対数変換すれば変動が小さくなったり正規分布に近づいたりする対数変換を含む一般的のデータ変換として Bo-Co 変換 z λ (, λ lo λ, λ がある Bo-Co 変換は定数を無視すると λ のとき対数 λ のとき逆数 λ. 5 のとき平方根 λ のとき原データをとる変換となる AIC を用いるとデータに適した変換を定めるパラメータλ を選択することができる h z に従う場合元データ Bo-Co 変換によって変換されたデータ z ( が密度関数 ( の密度関数はただし dh d ( ( h( dh d は変換のヤコビアン (Jacoba と呼ばれるこれは変換したデータのモデルが変換前のデータに関してもひとつのモデルを定めていることを示している例えば原データおよび変換されたデータz に正規分布を当てはめたときの AIC の値をそれぞれAIC AIC とするこのとき z

AIC ' z AIC z lo dh d の値をAIC と比較することにより原データと変換後データのどちらかが正規分布に近い ' かを判断することができるすなわちAIC <AIC z の場合は原データのほうがよいことに ' ' なる一方 AIC >AIC z の場合は変換した方がよいことがわかるさらに AICz が最小になるようにすることによって Bo-Co 変換の最適な λ の値を選択することもできる実際の時系列データでは Bo-Co 変換を行った後色々な時系列モデルを当てはめることが多いのでその場合には時系列モデルの AIC を Bo-Co 変換のヤコビアンを使って補正する必要がある