構造方程式モデリング Structural Equation Modeling (SEM)

時間でだいたいわかる構造方程式モデリング Structural Equaton Modlng (SEM)

構造方程式モデリングとは何か構造方程式モデリング (Structural Equaton Modlng, SEM) とは : 別名共分散構造分析 (coaranc structural analyss) 構成概念やの性質を調べるために集めた多くのを同時に分析するための統計的方法本来構造方程式モデリングは主に以下の3つを含みます共分散構造分析 (coaranc structural analyss) 潜在混合分布モデル (latnt mxtur modl) 潜在クラスモデル (latnt class modl) 潜在変数潜在変数のないモデル連続変数質的変数連続変数質的変数多変量解析との対応共分散構造分析回帰分析判別分析潜在混合モデル数量化 I 類潜在クラスモデル数量化 II 類当面潜在変数共に連続変数を用いる共分散構造分析だけを扱いそれを SEM と呼ぶことにします

SEM とは何か以下の二つの方程式の合体と言えます測定方程式いわゆる因子分析構造方程式いわゆるパス回帰因子の回帰分析だ! と覚えればわかりやすいと思いますこの部分が因子分析 ( 構造を示す ) 因子因子この部分が回帰分析 ( 因果関係を示す ) 3

因子分析ってなんでしたっけつまり観測された変数は何らかの隠された要因 (Factor) が基になっているという考えでその要因の影響を相関 ( つまり分散共分散 ) で判別しようとうする考え 0.5 0. 0.35 Factor 頭文字を取って一般にであらわす実はがどのような値を取ろうとあまり意味はない Factor がどれだけ影響しているかが重要この値を因子負荷量という 4

回帰分析ってなんでしたっけもちろん簡単なことですが説明変数 ( 基準変数または独立変数 ) 被説明変数 ( 予測変数または目的変数 ) 誤差 () 誤差って何? と思うかもつい忘れがちです式で書けば Y a + a x + a x +... + 0 5

回帰分析の解き方教室教科書によると回帰分析の母数の推定方法は以下の 3 通りでそのいずれでも解は一致します最小乗法最尤法モーメント法ここでは共分散構造分析の基礎となるモーメント法を紹介します 6

モーメント法による単回帰モデルの母数推定以下の単回帰式の母数を推定する x x + β + E[] μ 0 E[ x ] 0 両辺の期待値を計算する E[ x ] E[ x + β + ] E[ x ] + E[ β ] + E[ ] μ μ + β β μ μ * この仮定はつまり誤差の平均の期待値は 0 で誤差と独立変数は無相関であるとしているこれは回帰分析における基本的な仮定単回帰式の両辺に確率変数をかけ期待値を取る E[ x x ] E[ x x ] + βe[ x ] + E[ x ] σ σ σ m m σ m σ m + βμ β μ μ だから σ Σ Σ σ m σ /σ x m + μ( μ μ) σ m + μμ μμ ' ( 共分散行列は積率行列から平均の二乗の行列をひいたもの ) から μμ μ μ σ ( m μ μ ) 7

続モーメント法による単回帰モデルの母数推定前のページではごちゃごちゃやりましたが要は最終的に以下のようになりました σ ˆ s β x / σ / s ˆ x β μ μ ここで大事なのは母数 ( パラメータ ) のを変数の分散と共分散の統計量で推定することができたということです 8

さて測定方程式測定方程式は前に言ったように因子分析のことです別の言い方をすれば構成概念を扱う方程式です例えば以下のパス図は右の式で表します ( 変数の添え字は矢印のささる方指す方の順そうすると行列で都合がいい ) 3 3 3 3 E E 3 [ ] E [ ] 0, V [ ] [ ] 0, V [ ] E [ ] 0 j j + + + 3 0( j) σ 9

測定方程式の共分散構造共分散を母数の関数で表現することを構造化といい共分散 ( 行列 ) を方程式モデルの母数で表現したものを共分散構造といいます前ページの測定方程式の場合以下のようになります σ Σ σ σ 3 σ σ 3 σ 3 + σ 3 + σ + σ これは回帰分析のモーメント法と同じことになりました測定方程式ではが平均 0 分散に仮定されているので途中の計算で消え最後は母数だけになってしまうのです 3 3 3 0

測定方程式の行列表記測定方程式を行列表記すると以下のようになります + E E E [ ] o [] o [ ] O そして共分散構造は以下のようになります Σ Σ + ' r Σ 潜在変数の相関がある場合にパラメータが含まれます誤差間に相関がある場合にパラメータが含まれます

構造方程式 3 3 3 + + 3 3 3 3 0 0 0 0 0 0 0 は構造変数ベクトル残差ベクトルまたは外生変数ベクトルを番目の要素として持つ内生変数であればをが外生変数であればは構造方程式は回帰分析をつないでいくと思えばいい矢印がささる変数を内生変数ささらない変数を外生変数といいます内生変数にはかならず誤差があります実際のデータでは無理に潜在変数を作らず構造方程式を使ったほうがいい場合が多いようです

構造方程式の共分散構造補足 : 残差とは他の構造変数から説明されなかった残りであるから他から説明されなかった変数 ( 外生変数 ) はその変数自身が残差となる補足 : の対角成分は常に0 補足 3: が外生変数であればの行は常にゼロベクトル共分散構造の行列表記 I ( I ) T ( I ) T Σ + + ' TΣ T ' o 逆に言えば外生変数でなければ共分散は仮定できません外生変数間に共分散がある場合にパラメータが含まれます 3

4 構造方程式モデル最後の山ですがここまで行列がわからなければその意味はよくわかりません最初に言ったように測定方程式と構造方程式を合体させたものなので行列式も両者を合体させたものです dj j cj j bj j aj j x x x x への係数から : への係数から : ( 因子負荷行列 ) への係数から : への係数から : : に関する残差変数 : に関する残差変数ここで d c b a c b d a d d +

5 構造方程式モデル測定方程式も構造方程式もこの特殊なケースとなります共分散構造 + + o o O O O O O O c b 構造方程式測定方程式 [ ] ( ) d d d u ' ' u Σ Σ Σ Σ Σ T G GTΣ Σ I T O I G

識別問題連立方程式には不能 ( 解が存在しない ) と不定 ( 解が無数に存在する ) があります不能の場合は解が存在しませんが近似解の推定によって母数を求めますというか無理やり連立方程式を作っているのでほとんどこの不能であることは確かです不定の場合この方程式は識別できません十分条件をクリアすれば方程式は識別できます十分条件とはそれが満たされればモデルは識別されるが満たされないからといってもモデルが識別されるとは限らないという条件です一方それが満たされればモデルは確実に識別されずそれが満たされるからといってモデルが必ず識別されるとは限らない条件を必要条件といいます 6

SEM のコツ mos を動かしていて悩まされるのがこの識別問題です教科書によれば以下の 3 つが識別を行うコツだそうです. 十分条件による識別. ソフトウエアによる識別 ( これは力技です ) 3. ノウハウによる識別十分条件による識別を行えばモデルは必ず識別されます ( 広がりは少ないが ) d 構成概念をいくつか用意一つの構成概念だけを測定するをおのおの 3 つ以上づつ用意各々の構成概念に関してそれを測定しているから任意につ選んでそのへの係数をに固定構成概念が外生変数なら分散をに固定 ( 逆に言えば外生変数でなければ分散は設定する必要ない ) との間に単方向両方向のパスを引く後はもう少し面倒くさい識別条件があるがこれで行えばだいたい大丈夫のようです 7

SEM のコツその教科書によればこんなノウハウによるコツが紹介されていますすべての残差変数 ( 外生変数,, 誤差変数, d ) には分散を設定外生的な複数の構造変数の間には共分散を設定 ( と j と j と j ) 事前情報に反しない限り外生的な構造変数には誤差変数が刺さらない誤差変数間の共分散誤差変数と外生的な構造変数との間には共分散を設定しない事前情報に反しない限り内生的なにはつつ誤差変数がささる内生的な構成概念にはつつ誤差変数がささる内生的な変数の分散は設定しない (mosではもともとできない?) 内生変数間内生変数と外生変数間の共分散は設定しないモデル中の推定すべき母数の総数 ( 自由度パラメータ ) はの分散 ( +) / n x n x と共分散の和を超えないの各々に関しそこからでている単方向の矢を任意に一つ選んでその係数の値をに固定する標準化解ならば問題ない外生変数の時は分散を固定 d 8

適合度指標一時間で終わるために最後ははしょります χ 検定まああまり役に立たないと割り切ったほうがいいと思います GFI 簡単に言うと母数によって表現された共分散とデータによる共分散の差ですが最もよく 0.9 以上必要とのことですが自由度が大きくなると母数が少ない時には数字があがらないとのこと無理に上げなくてもいいかもあるいは母数が多ければGFIもあがりますこれはRに似ていますね教科書はの数を少なくしろといっています (30 以下 ) RMR 残差平方平均平方根まあ残差のことですね 0が最もよい GFI 自由度修正済みのGFI 修正済みRみたいなもの CFI 比較適合度指標 0からまでの範囲に収まりがもっともよい IC ご存知ですが複数モデルを比較するときに用いるとよい他にもごちゃごちゃたくさんありますが省略最初はを少なくしてGFIだけ使っていれば大丈夫だと思いますまた母数の検定はできますのでこれはmos を参照してください 9