Microsoft Word - Matlab_R_MLE.docx - PDF 無料ダウンロード

R と Matlab による最尤最尤推定推定のコードコードの作成. 最尤法とは? 簡単に言うと尤度関数を最大にするように未知パラメーターの値を決める事以下では観測されたデータを {y,, y, y } としそのベクトルを Y = [y,,y ] 未知パラメーターのベクトルを θ = [θ,,θ q ] とするまた尤度関数を L(θ と表すとする ( 尤度関数は未知パラメーターの関数 ( データ ( の分布が連続型の場合個の確率変数 {y,, y, y } の同時密度関数 f (y,, y, y ;θ を未知パラメーターの関数とみなしたものが尤度関数つまり L(θ = f (y,, y, y ;θ これを最大化するようなパラメーター θ の値が最尤推定値通常尤度関数ではなくその対数をとった対数尤度関数 logl(θ を最大化するようなパラメーターを求める ( そちらの方が計算が簡単なので ( 例 y, =,, は独立に平均 µ 分散 σ の正規分布に従っているとするこの場合推定したい未知パラメーターは θ= [µ, σ ] これを最尤法で推定するまず y の密度関数は f ( y ; πσ ( y exp σ µ, σ = でありさらに y,,, は独立なので {y,, y, y } の同時密度関数は y それぞれの密度関数を掛け合わせたものすなわち f ( y σ,..., y ; µ, σ = f ( y ; µ, σ L f ( y ; µ, σ f ( y ; µ, であるこれより対数尤度関数は log L( θ = log f ( y = log f ( y = = log,..., y ; µ, σ ; µ, σ + L+ log f ( y log f ( y ; µ, σ πσ ( y exp σ = log(π log( σ σ となるちなみにこれを最大化する µ と σ の値は ˆµ MLE = y, σ = MLE y t= ; µ, σ + log f ( y ; µ, σ ˆ ( ( y MLE この資料は私のゼミおよび講義で R の使用法を説明するために作成した資料ですホームページ上で公開しており自由に参照して頂いて構いませんただし内容について一応検証してありますが間違いがあるかもしれません間違いがあった場合でもそれによって生じるいかなる損害不利益について責任は負いかねますのでご了承ください

である ( データ ( の分布が離散型の場合 {y,, y, y } の同時確率関数を p(y,,y,y ;θ とするとこれをパラメーターの関数として見たものが尤度関数 ( 例 y, =,, はそれぞれ独立に確率 α (0 < α < でを取るベルヌーイ分布に従っているとするこの場合推定したい未知パラメーターは θ = α これを最尤法で推定するまず y の確率関数は y y p( y ; p = α ( α でありさらに y,,, は独立なので {y,, y, y } の同時確率関数は y のそれぞれの確率関数を掛け合わせたものすなわち p,..., y; α = p( y; α L p( y; α p( y ; α ( y であるこれより対数尤度関数はとなる log L( θ = log p( y = log p( y = = logα,..., y ; α ; α + L+ log p( y ; α + log p( y ; α log p( y ; α y + log( α ( y 最尤法はモデルが複雑になると尤度関数すなわち同時密度関数を求めるのが難しくなるがそれ以外は考え方はどの場合も上記とまったく同じ対数尤度関数さえ求まれば ( もっというとパラメーターの関数として対数尤度関数を計算するやり方さえ分かれば明示的に求まらなくてもいい最尤法で推定できる. Matlab による最尤法のプログラム Matlab は自分で関数をつくる事ができるその自作した関数に対して fmuc 関数を用いてその関数の値を最小 ( 大化する変数 ( パラメーターの値を求める例として先ほどの正規分布の平均 µ と分散 σ を推定するプログラムの書き方を説明するこれには関数ファイルを作る必要があるのでまず関数ファイルについて簡単に説明する例えば y = f (x, f (x = 3x という関数のファイルを作ってみようまずスクリプトファイルを新しく開く (m-fle と呼ばれるそこに fucto y = fuc(x y = 3*x^;

と書いて fuc.m という名前でどこかわかりやすい場所に保存する (m ファイルの拡張子は.m これで新たに fuc という関数が Matlab で使えるようになった一般に fucto 出力変数名 = 関数名 ( 入力変数名出力変数名 = 具体的な関数の形というように関数を記述するこの関数を使うには Matlab のコマンドウィンドウでパスの設定をクリックしもし検索パスのところに先ほどの fuc.m を置いたディレクトリがなければフォルダーを追加でそのディレクトリを追加する ( 追加したら保存閉じるコマンドウィンドウ上で >> fuc(5 と入力してエンターを押すと as = 75 と表示されこの関数が使用可能である事がわかるまた >> y= fuc(3 のように計算結果に名前 ( ここでは y を付ければ y は y = 7 となるマトラブでは足し算 (+ 引き算 (- 割り算 (/ 掛け算 (* を用いる事ができるさらに行列の演算などもできるこれらについてここでは詳しくは説明しないマトラブは R と並んで有名なソフトウエアであり Web 上を検索すればその説明が多く見つかる詳しくは Web で検索して資料を発見して欲しい次にこの関数を最小化する点を求めてみよう実際にはこれは 0 である事はすぐにわかるが目的関数がこのように簡単でない場合数値計算で解かなくてはならないのでその練習としてやってみるこれには fmuc 関数を使う fmuc は関数の制約なしの非線形最小化を行う関数である制約なし関数とは入力変数の動く範囲に制約をおかないすなわちこの場合 x は < x < の範囲の値でこの範囲において f(x が最小値を取る x の値を求める事になる先ほどの関数 fuc の最小値を求めるには ( ここで 00 とは計算を始める時の x の初期値である 3

>> fmuc( 'fuc',00 と入力すると ( 間にいろいろ出るのは無視して答として as =.8567495036359e-09 と出力される最後の e-09 は 0 9 を表している実際の値の 0 に非常に近い値が出ているのがわかるこれを用いて尤度関数の最大化を行う尤度関数を最大化するという事はその負の値を最小化する事と等しいことに注意しようここでは先ほどの正規分布の平均 µ と分散 σ を推定してみようこの時問題となるのは先ほども述べたように fmuc はある目的関数を最小化する引数の値を求める関数なので目的関数は対数尤度関数の負の値とする事と無制約の最小化を行うのでパラメーターに非負制約等がある場合例えば分散などは σ = exp( h などとし h ( < h < の関数として目的関数を記述する必要がある事である以上に注意してまず対数尤度関数のファイルを作るこれは fucto y = ormalllf(t,y m=t(; v=exp(t(; = legth(y; f = -0.5**log(*p-0.5**log(v-(/(*v*(Y-m'*(Y-m; y= -f; ed のように入力する ( 変数名 y, 関数名 ormalllf 入力変数名 T, Y は任意ここで入力変数として T は T= [ µ, log( σ ] を考えており T( はその番目の要素 T( はその番目の要素であり行目は T( と exp(t( にそれぞれ m と v という名前をつけるという意味であるつまり m が µ で v がσ に相当する分散は非負の値なのでもとの変数を変換して非負の領域しか動かないようにしている事に注意また観測値はベクトル Y [ y,..., y ] として与えられることを想定しており 3 行目の Y m は列を表しているよって (Y-m *(Y-m は y y = M というベクトル (Y m はその転置行 4

y ( y y µ [ y L y ] M = を表しているまた ( の計算は Y m のそれぞれの成分を乗して和をとるという操 y 作であるのでより直接的に sum((y-m.^ として計算する事もできるここで A.^k はベクトル ( または行列 A のそれぞれの成分を成分ごとに k 乗する事を表しており sum(b はベクトル b の成分の和を計算するコマンドであるよって先ほどのプログラムの中で (Y-m *(Y-m の部分は sum((y-m.^ で置き換えても計算結果は同じになる最尤法用の関数を書くときは最初の引数を未知パラメーターのベクトルつ目の引数を観測値とする ( ようにするとよい次にこの関数を最小化する未知パラメーターの値を求めようこれには fmuc 関数を使う fmuc は関数の制約なしの非線形最小化を行う関数新たにスクリプトファイルを作成して omalmle.m として保存しようこのファイルでは以下のように記述する fucto t = ormalmle(t0,y s0 =[t0(,log(t0(]'; optos = optmset('largescale','off','dervatvecheck','off',... 'GradObj','off','TolX',e-6,'Dsplay','off',... 'Dagostcs','off','MaxIter',000000; s=fmuc('ormalllf',s0,optos,y; t = [s(,exp(s(]'; ( 行目と3 行めの最後はで終わっている事に注意これはコマンドが次の行に続く事を意味するこの関数 omalmle(t0,y は観測値ベクトルYが与えられたもとで初期値 t0より計算を始めて目的関数 ormalllf(t,y を最小化するパラメーターベクトルTの値を返す関数になっている基本的には行目の fucto t = ormalmle(t0,y 行目の初期値に関する s0 =[t0(,log(t0(]'; という部分および最後の行の t=fmuc( ormalllf,t0,optos,y; の部分を適宜変えれば自作の ( 対数尤度関数について同じことができる真ん中のoptos のところは最適化をどのように行うかを指定するもので基本的には変更する必要はない ( 推定がうまくいかない時などに変更する fmuc 関数とoptmset 関数について詳しくはコマンド画面上で help 5

fmuc および help optmset と入力して ( エンターキーを押してヘルプを見るこの関数を使って正規分布のパラメーターを最尤推定してみようまず平均 µ =, 分散 σ = 5 の正規分布に従う標本を発生させるこれは rad 関数を用いる rad 関数は rad(k,j で標準正規分布に従う k 行 j 列の行列を発生させる >>Y=sqrt(5*rad(00,+ とすると 00 行列の N(, 5 に従う標本を発生させる事ができる ( ちなみに Y=sqrt(5*rad(00,+; のように最後にセミコロンを付けると発生させたデータは表示されないちなみにこの場合の最尤推定値は明示的に求められここで発生させた標本に対してはµˆ =.7578685753, ˆ σ MLE = 6.688977636843 となった ( これは実際に発生させた標本に応じて異なるのでここで説明されたのと同じようにやっても必ずしも同じにならない事に注意では先ほどの関数を用い数値計算によって最尤推定してみよう最適化の初期値として t0 = [0, ] を用いる MLE >> t=ormalmle(t0,y t =.759004800967 6.68894054575 上記の実際の最尤推定値に非常に近いことがわかる Matlab による最尤推定の基本は以上のようになる対数尤度関数を記述する関数のファイルさえ作ればあとはほぼ先ほどの m ファイルを少し書き換えてあげれば ( 初期値の部分や目的関数名を変更する等実行できる 3. R による最尤法のプログラム R でも基本的には同じである R による関数の作成使用再使用については R における自分で作成した関数の使い方を参照のことここでは先ほどの Matlab を用いて行ったことと同じことを R で行ってみる下記の説明は R の初心者にはわかりずらい部分がある特に実際の関数の書き方についてはほどんど何も説明していない R の関数の書き方については Web で検索するとたくさん参考になる資料を見つけることができるのでそれらを見るなりして覚えて欲しい例えば http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html などには初心者の人にもわかりやすくたくさん有用なことが書いてあるので参照してほしい R のコンソール上でファイル新しいスクリプトを開き以下のように入力して testmle.r 6

という名前にしてファイルを保存し以下のように入力する ormalllf = fucto(y{ =legth(y; fucto(t{m=t[]; v=exp(t[]; f=-0.5**log(*p-0.5**log(v-(/(*v*sum((y-m ^; y=-f; retur(y}} ormalmle = fucto(t0,y{ s0=c(t0[],log(t0[]; s=optm(s0,ormalllf(y,gr=null,method=c("bfgs" retur( t=c( s$par[],exp(s$par[] } 上記のプログラムは Matlab と似ているがもちろん要所要所で違っているただつの関数 ormalllf とormalMLE の使い方はほぼ同じである最初のormalLLF というのが対数尤度関数を計算する関数次の ormalmle というのが与えられた観測ベクトル Y と初期値 t0 に対して µ と σ を推定する最尤法のプログラムであるこれらの関数を R に読み込ますには R における自分で作成した関数の使い方でやったように source コマンドを用いてもいいがより簡単にコンソール上のというアイコンを用いてもよい具体的には先ほど入力した関数式を全て選択した状態で上記のアイコンを押すすると選択した部分が全て R に読み込まれる (R のコンソール上に入力される先程と同じように正規乱数を発生させてそれを観測値として期待値と分散を推定してみよう R では正規乱数は rorm(,m,s という関数で発生させられるここでは発生させる標本数 m は期待値の値 s は標準偏差の値である ( 分散ではない事に注意期待値分散 5 の正規乱数を 00 個発生させるには > Y=rorm(00,,sqrt(5 とする実際に発生させて先ほどと同様に最尤推定値を計算してみると µˆ MLE =.064848, ˆ σ MLE = 5.059784 となるそれでは先ほど同様作成したプログラムで推定してみると ( 初期値としては t0=c(0, を使用 > t=ormalmle(t0,y > t 7

[].064848 5.059784 となる正確な最尤推定値と ( 少なくとも小数点以下 6 桁までは一致していることがわかるちなみにこの発生させたデータを保存してマトラブに読み込ませてマトラブで作成したプログラムで推定すると >> t = ormalmle([0,]',y t =.064847936464 5.059784357777 となった同じ結果であるこのようにして R で最尤推定を行うプログラムを書くことができる対数尤度関数を計算する関数と初期条件のところをちょっと変えれば上記のプログラムは他のモデルにも使用できる 8