<4D F736F F F696E74202D A328CC B835E89F090CD89898F4B814096F689AA>

Similar documents
スライド 1

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Medical3

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

統計的データ解析

Microsoft PowerPoint - e-stat(OLS).pptx

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

因子分析

Microsoft Word - å“Ÿåłžå¸°173.docx

PowerPoint プレゼンテーション

Medical3

ビジネス統計 統計基礎とエクセル分析 正誤表

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

EBNと疫学

基礎統計

Microsoft PowerPoint - sc7.ppt [互換モード]

様々なミクロ計量モデル†

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

ANOVA

Microsoft Word - SPSS2007s5.doc

Microsoft Word - mstattext02.docx

Microsoft Word - Stattext13.doc

情報工学概論

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - appendix_b

日心TWS

講義「○○○○」

Probit , Mixed logit

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

相関分析・偏相関分析

数値計算法

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

13章 回帰分析

1.民営化

MedicalStatisticsForAll.indd

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - Stattext12.doc

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - 補論3.2

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft Word - apstattext04.docx

スライド タイトルなし

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

PowerPoint プレゼンテーション

横浜市環境科学研究所

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft PowerPoint - ch04j

Chapter 1 Epidemiological Terminology

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

構造方程式モデリング Structural Equation Modeling (SEM)

みっちりGLM

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

Microsoft PowerPoint - A1.ppt [互換モード]

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft Word - reg.doc

Microsoft PowerPoint - 基礎・経済統計6.ppt

青焼 1章[15-52].indd

memo

Microsoft Word - 教育経済学:課題1.docx

サーバに関するヘドニック回帰式(再推計結果)

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - Econometrics

経済統計分析1 イントロダクション

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定


Microsoft Word - SDA2012kadai07.doc

ベイズ統計入門

Microsoft Word - 保健医療統計学112817完成版.docx

スライド 1

一般化線型モデルとは? R 従属変数群が独立変数群の一次結合と誤差で表されるという形のモデルを線型モデルという ( 回帰分析はデータへの線型モデルの当てはめである ) 式で書けば Y = β 0 + βx + ε R では glm( ) という関数で実行する glm( ) は量的なデータが正規分布に

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft Word - mstattext01.docx

<4D F736F F F696E74202D F95618A7789EF B836A F838C834E B88E38A77939D8C76322E >

正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 220

評価点の差と選択率 実際には ほとんど評価点が同じときは, どちらも選択される可能性がある 評価点の差が大きいときは, 片方しか選ばれない. A が圧倒的に劣る A が選ばれることはほとんどない 選択肢 A が選ばれる可能性 0 つは同じ魅力 0% ずつ A が圧倒的に良いほとんど A だけが選ばれ

日本言語科学会(JSLS)チュートリアル講演会 平成13年12月16日(日)午前10時30分から午後4時30分 慶應義塾大学三田キャンパス東館6階G-SEC Lab   言語研究のための統計解析 「論理」学としての思考法,「美」学としての提示法

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

<4D F736F F F696E74202D E738A5889BB8BE688E68A4F82CC926E89BF908492E882C98AD682B782E98CA48B862E707074>

喨微勃挹稉弑

Taro-13semiamos.jtd

Transcription:

ロジスティスク回帰分析 2014/4/30 教育学研究科 M1 柳岡開地 はじめに 統計が苦手な人による統計が苦手な人への説明にしたい ( すごーく分かっている人の説明は, 逆に分かりにくい ) クリティカルな質問には面食らいます 自分の研究を材料に, 架空のデータでロジスティク回帰分析を実践してみた ( 一種の宣伝でもあるのです!) 1 2 回帰分析と同じところ ロジスティック回帰分析は線形回帰分析 ( 先週のかわむらくんの発表してくれた ) と同様に, 従属変数を y = ax+b と表す ( 説明変数が多くなれば, y = ax 1 +bx 2 +c となります ) 説明 や 予測 を目的としている ( ロジスティック回帰分析は, もともと疫学研究において複数個存在する リスクファクター を検討するために用いられた ) 3 回帰分析と違うところ 何が違う? 線形回帰分析 従属変数が量的変数 ロジスティック回帰分析 従属変数が質的変数 (2 値変数で, 賛成 反対, 有 無 ) 説明変数は連続値でも名義変数でも大丈夫 4

ロジスティック回帰分析の種類 質的変数は何も 2 値データだけとは限らない 今回扱わないが次の 3 つがある 2 値変数の場合 = ロジスティック回帰分析 順序尺度の場合 = 順序ロジット分析 従属変数が 3 つ以上の場合 = 多項ロジット分析 ( 中日, 阪神, 巨人 ) 5 回帰分析と違うところ 別に質的変数でも, 重回帰分析したらよくない? 現に SPSS は結果をはじき出してくれる う ん 残念! 重要なのは, 従属変数が正規分布に従うかどうか 質的変数は従わない 回帰分析はデータの分布に正規分布が仮定されている 6 ロジスティック回帰分析のいいところ 独立変数の尺度, 分布型に対して厳密な仮定をおいていない 係数としてオッズ比を求めることができ, 解釈が容易である 各対象者につき, 事象の起こる確率を求められる ロジスティック回帰分析の理論的なところ ロジット変換をなぜするのか ロジスティック回帰モデル ( 欠点も一応 ) モデル構築の判定基準が数種類あり, これを基準にすれば最適な結果が得られると断言できない 対馬 (2010) より引用 7 8

なんでロジスティック? ロジスティック回帰 (Logistic regression) のロジスティックって何? ロジット関数を用いるかららしい ロジットとは, 0から1の値をとるpに対して, p logit ( p ) =log = log ( p ) log (1 p) です 1 p なぜ log が出てくるんだ! 高校生以来 9 ロジスティック回帰の考え方 ロジスティック回帰では, 2 値データの 1 が出る正起確率を求めたい 確率なので, 0 から 1 の範囲に限定される しかし, y = ax+b では, y は無限の値をとりえてしまう そこで, y に細工を加えよう さきほどページの ロジット変換 を行うことで, 0 から 1 の範囲をとっぱらってしまおうという試み 10 ロジスティック回帰モデル X =(x 1, x 2,, x r ) という状態のもとで, 現象が発生する条件付き確率を p(x) で表す これは次のように表されることが多い p(x) = Pr{ 発生 x 1, x 2,, x r }= F (x 1, x r ) たとえば, 1 個の変数の影響を線形な変数として, Z = β 0 +β 1 x 1 とおく ロジスティック回帰モデル log p(x) 1 p(x) = β 0 +β 1 x 1 となる 右辺の形は重回帰分析によく似ているさらに, 両辺の指数をとると, p(x) = exp (β 0 +β 1 x 1 ) 1 p(x) F (Z) = p(x) = exp(z) 1 exp(z) ロジスティック関数 丹後他 (1996) より引用 11 この分母に非発生率, 分子に発生率を算出したものをオッズと呼び, 発生確率が非発生確率の何倍かを意味している 普通の比丹後他 (1996) より引用 12

ロジスティック回帰分析の結果を判定する指標 オッズ比について 係数について ( 最尤法 ) 13 オッズ比 しかし, 実際ロジスティック回帰分析の結果に出てくるのはオッズ比 ( 比の比 ) オッズ比とはなにか? A 条件と B 条件があった場合, オッズ比は A のオッズ B のオッズ = オッズ比 exp(b 1 ) つまり, 要因 x 1 が 1 単位増加するに伴って生じるオッズの増大を意味している ( 割り算することで他の要因が消える ) オッズではだめなのか? 14 オッズ比 忘れ物があるかどうか A 君 B 君オッズ ない 90 99 0.99/0.90 = 1.1 ある 10 1 0.01/0.10 = 0.1 A 君 B 君オッズない 50 55 0.55/0.50 = 1.1 ある 50 45 0.45/0.50 = 0.9 90 99と50 55が同じ比になってしまう そこで, オッズ比! 15 オッズ比 忘れ物があるかどうか A 君 B 君オッズ比 ない 90 99 0.99/1-0.99 = 11 ある 10 1 0.9 /1 0.9 A 君 B 君オッズ比ない 50 55 0.55 /1 0.55= 1.22 ある 50 45 0.50 /1 0.50 90 99の方がオッズ比が高いななめ掛けで割り算をしてもよい 16

オッズ比の信頼区間 95% 信頼区間同一の調査, 同一の計算方法を用いた場合, 推定した信頼区間の中に 100 回中 95 回入る ロジスティック回帰分析では, Wald 信頼区間 exp(β±1.96 標準誤差 ) βは回帰係数 この 95% 信頼区間に 1 を含まなければ, その要因は 5% 水準で有意, 1 を含めば 5% 水準で有意ではない 17 最尤法 線形回帰分析では, 最小 2 乗法により係数を求めた ロジスティック回帰分析では, 別に最尤法という手段で係数の値を求める 最尤法とは の前に尤度って何? 尤度とは, 観測データの下での仮説の尤もらしさ である つまり, 観測データが出てしまっている状態で, ある係数の確率分布を当てはめようとする試みなのである 18 最尤法 尤度が最大のときの係数が尤もらしいのは, 観測データの実際の分布に似たような形になるからである 係数が尤もらしいと観測データの少ないところの確率が低くなり, 観測データの多いところの確率が高くなる よって, 尤度が大きくなる最尤法を用いる モデルの適合度の評価 Hosmer-Lemeshow 検定 正判別率 19 20

モデルの適合度 適合度を調べる Hosmer-Lemeshow 検定標本サンプルを 10 分の 1 に分けて, 各グループのモデルの良さを検討する 観測値と予測値の適合を評価するため, Χ 2 検定を行う 帰無仮説 : 観測値 = 期待値 ( ロジスティック回帰モデルはデータに適合する ) 対立仮説 : 観測値 期待値 ( ロジスティック回帰モデルはデータに適合しない ) p <.05 ならばモデルが適合していないことになる 21 モデルの適合度 適合度を調べる判別分割表 各対象者のスコア S を算出して, 確率 p(x) を求める p(x) = 0.5 として判別したとき, 分割表を作成する 右下の全体の % が 100 に近ければ, モデルの適合度は高いと言える モデルに適合しているかどうかの基準は 70% 22 注意点 ロジスティック回帰分析にも多重共線性の問題が存在する 回帰式に, 相関の高い変数を組み合わせていれたときに, 回帰式が変な値をとる場合が存在する 確認手段として, 相関係数が r >.90 となるような相関の高い変数の組み合わせが存在するかがある 線形回帰分析のように, 値を出して調べてくれるところが SPSS にはない 23 自分の研究とからめてみた! いつもは当然のようにうまくいくこと ( 自分の研究は服の着替え ) でも, いつもと異なる 状況に立たされたとき幼児はどうするの? 注目したのは 後戻り をするかしないか では, いつもと異なる 状況で後戻りができるのは, どうして? そこで, プラニングと実行機能が与える影響について検討してみた 架空のデータだけど, ロジスティック回帰分析だ! 24

1 SPSSを起動 2 分析 回帰 二項ロジスティック を選択する 3 従属変数 のところに人形課題をいれる 4 共変量 のところにプラニング, 抑制, シフティング, アップデーティングをいれる 25 26 5 方法は強制投入法で行う 6 オプション をクリック 分類プロット, Hosmer-Lemeshowの適合度, Exp (B) の信頼区間 にチェックし, 続行 27 28

29 30 31 分類プロットは 1 と 0 が左右に分かれたグラフの場合うまく予測しているといえる 32

ちょっと まった! 今までした分析では, 参加児の月齢や語彙能力を統制できていない プラニングと実行機能が果たす役割を直接検討できたわけではない 月齢と語彙能力を統制して, ロジスティック回帰分析を行いたい 階層的ロジスティック分析 1 SPSSを起動 2 分析 回帰 二項ロジスティック を選択する 33 34 3 従属変数 のところに人形課題をいれる 4 共変量 のところに, まず月齢と語彙検査をいれる 5 次 を押して, ブロック 2 のところにプラニング, 抑制, シフティング, アップデーティングをいれる OK 35 36

注意点 オッズ比の信頼区間 今回の架空データをみると, プラニングのオッズ比の信頼区間が異様に大きいことが分かる なぜか? 可能性 1 多重共線性の問題で相関の確認が必要可能性 2 プラニングの 1~7 点の間に 0 人のセルがある 今回は可能性 2 で, プラニングは独立変数として適切ではないといえる 37 38 注意点 変数選択法 1 強制投入法 複数の説明変数を同時にモデルに投入する 独立変数の重要性の順序などの仮説がない場合に使用 2 変数増加法指定した独立変数のうち従属変数に最も強く関連している変数が選ばれ, 以後順番に相関の強い変数が選ばれる 39 注意点 3 変数減少法指定した独立変数のうち従属変数に対して最も関連が弱く有意でない変数から順番に削除されていく 2,3 には種類がある変数増加 ( 減少 ) 法 : 尤度比 ( 推奨されている?) 変数増加 ( 減少 ) 法 :Wald 変数増加 ( 減少 ) 法 : 条件付きなど 40

変数選択法の選択 では, 分析の際には強制選択法か変数増加 ( 減少 ) 法 : 尤度比の方法で結果が異なるのか 方法のところを変数減少法 : 尤度比に変えてみる 実際に比較してみた 41 42 43 44

結果の違い なんで結果が違うのでしょうか? みんなで考えよう! 結果の違い ステップ 2 では, アップデーティングを除いた他の独立変数で, 別の回帰式を作っている 結果が違うのは当たり前! 今回の架空のデータの結果から言えるのは, 幼児が いつもと異なる 状況に対応するのにシフティングが重要な役割を果たしている可能性が高いということ 45 46 次回の予定 近々ではないですが いつか縦断研究をしたいと思っています マルチレベル分析とかほかにも色々とあると思いますが どれか 1 つやりたいなと思っています 文献 南風原朝和 (2002) 心理学統計の基礎有裴閣アルマ 平山るみ (2003) ロジスティック回帰分析. http://kyoumu.educ.kyotou.ac.jp/cogpsy/personal/kusumi/datasem03/hirayama.files/frame.htm 石村貞夫 謝承泰 久保田基夫 (2001) よく分かる医学 歯学 薬学のための統計解析. 東京図書 羅嬉穎 (2008) ロジスティック回帰分析. http://www.educ.kyotou.ac.jp/cogpsy/personal/kusumi/datasem08/logistic.pdf 小塩真司 (2007) SPSS と Amos による心理 調査データ解析 因子分析 共分散構造分析まで. 東京図書. 丹後俊郎 山岡和枝 高木晴良 (1996) 統計ライブラリーロジスティック回帰分析 SAS を利用した統計解析の実際. 朝倉出版. 対馬栄輝 (2007) SPSS で学ぶ医療系データ解析. 東京図書. 対馬栄輝 (2010). 医療系研究論文の読み方 まとめ方 論文の PECO から正しい統計的判断まで. 東京図書 47 48