NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Similar documents
様々なミクロ計量モデル†

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

スライド 1

Probit , Mixed logit

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Statistical inference for one-sample proportion

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

講義「○○○○」

JMP V4 による生存時間分析

横浜市環境科学研究所

Microsoft Word - 補論3.2

カイ二乗フィット検定、パラメータの誤差

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

第90回日本感染症学会学術講演会抄録(I)

Microsoft PowerPoint - 測量学.ppt [互換モード]

Ł\”ƒ-2005

解析センターを知っていただく キャンペーン

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

統計的データ解析

PowerPoint プレゼンテーション

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

O1-1 O1-2 O1-3 O1-4 O1-5 O1-6

スライド 1

基礎統計

ベイズ統計入門

データ解析

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

統計学的画像再構成法である

Microsoft PowerPoint - R-stat-intro_13.ppt [互換モード]

パソコンシミュレータの現状

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

Microsoft Word - Stattext12.doc

Microsoft Word doc

all.dvi


切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

例 e 指数関数的に減衰する信号を h( a < + a a すると, それらのラプラス変換は, H ( ) { e } e インパルス応答が h( a < ( ただし a >, U( ) { } となるシステムにステップ信号 ( y( のラプラス変換 Y () は, Y ( ) H ( ) X (

meiji_resume_1.PDF

B

スライド 1

PowerPoint プレゼンテーション

2 値データの Intraclass Correlation Coefficient の推定マクロプログラム 稲葉洋介 1 田中紀子 1 1 国立国際医療研究センターデータサイエンス部生物統計研究室 Macro program for calculating Intraclass Correlati

スライド 1

untitled

2011年度 大阪大・理系数学

<4D F736F F D2091E63489F190B691B68E9E8AD489F090CD2E646F6378>

N cos s s cos ψ e e e e 3 3 e e 3 e 3 e

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

Problem P5

医系の統計入門第 2 版 サンプルページ この本の定価 判型などは, 以下の URL からご覧いただけます. このサンプルページの内容は, 第 2 版 1 刷発行時のものです.

<4D F736F F D208EF596BD8E8E8CB B835E82CC939D8C7689F090CD5F F30345F3130>

スライド 1

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

PowerPoint Presentation

スライド 1

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

要旨 : データステップ及び SGPLOT プロシジャにおける POLYGON/TEXT ステートメントを利用した SAS プログラムステップフローチャートを生成する SAS プログラムを紹介する キーワード :SGPLOT, フローチャート, 可視化 2

Microsoft PowerPoint - SASユーザ総会2016_MRCT_送付用.pptx

スライド 1

青焼 1章[15-52].indd

kubo2015ngt6 p.2 ( ( (MLE 8 y i L(q q log L(q q 0 ˆq log L(q / q = 0 q ˆq = = = * ˆq = 0.46 ( 8 y 0.46 y y y i kubo (ht

kubostat2017b p.1 agenda I 2017 (b) probability distribution and maximum likelihood estimation :

ファーマコメトリクス研究に 要求されるスキル及び そのための教育 (Sun) 第 1 回ファーマコメトリクス研究会 株式会社ベルシステム 24 医薬関連サービス事業本部生物統計局薬物動態解析グループ笠井英史

曲線 = f () は を媒介変数とする自然な媒介変数表示 =,= f () をもつので, これを利用して説明する 以下,f () は定義域で連続であると仮定する 例えば, 直線 =c が曲線 = f () の漸近線になるとする 曲線 = f () 上の点 P(,f ()) が直線 =c に近づくこ

OpRisk VaR3.2 Presentation

Microsoft PowerPoint - SPECTPETの原理2012.ppt [互換モード]

Microsoft PowerPoint - 資料04 重回帰分析.ppt

「国債の金利推定モデルに関する研究会」報告書

4 段階推定法とは 予測に使うモデルの紹介 4 段階推定法の課題 2

Transcription:

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK

要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull 加速モデル Cox 比例ハザードモデルの場合を例として 生存時間解析を試みた そして LIFEREGプロシジャやPHREGプロシジャと同等な解析結果を得ることが可能であることを示した このことを通して 生存時間解析の習得及び応用において NLMIXED プロシジャが強力な道具となり得ることを示した キーワード : 最尤法 指数分布 Weibull 加速モデル Cox 比例ハザードモデル 2

目的 生存時間解析のような複雑な統計解析でも SAS が全部やってくれる SAS の計算内容の詳細を必ずしも理解する必要がない その理論や計算アルゴリズムがなかなか身に付かない 自分で IML などを用いてプログラムを書くことが望ましい 発表の目的 : でも 最尤法のアルゴリズムを自分で書くのはかなり面倒 NLMIXED プロシジャが一般的な最尤推定の計算ルーチンを提供 幾つかのモデルを例として 生存時間解析のプログラムをNLMIXEDプロシジャを用いて書くことができることを示す NLMIXEDプロシジャが生存時間解析を含む統計計算において非常に強力な道具であることを理解してもらうこと 3

生存時間解析における最尤推定 指数分布 Weibull 分布 及びその別の形 Weibull 加速モデル 発表内容 Cox 比例ハザードモデル タイのない場合 ( タイのある場合は論文参照 ) まとめ 4

生存関数及び確率密度関数 生存時間 T が連続の場合のみを考える 確率密度関数 Probability density function: 生存関数 Survival function: ここで θ は分布のパラメタ f (t; θ ), t 0 St ( ; θ ) = PT ( > t ; θ ) = 1 fs ( ; θ ) ds 0 t 5

データ及び尤度 データ 生存時間 : t 1, t 2, t 3,,t n ( 打切り例の場合は最終生存確認時間 ) イベント情報 : δ 1, δ 2, δ 3,,δ n, イベントありなら δ i =1 打切りなら δ i = 0 i 番目の症例の尤度への寄与 L i イベント発現例 : 確率密度 : L i = f (t i ; θ ) 打ち切り例 : t i まで生存したという情報を利用 : L i = S (t i ; θ ) 尤度 : これらを全症例分かけ合わせて n n δi 1 δi L( θ) = [ f( t ; θ) S( t ; θ) ] 対数尤度 : これを対数変換して n i i i i= 1 i= 1 n l ( θ ) = log L ( θ ) = [ δ log f ( t ; θ ) + (1 δ )log S ( t θ )] i i i i i i= 1 i= 1 6

生存時間の 生存関数 最尤推定 確率密度関数の2つさえ定義されれば 対数尤度が定義され あとは最尤法を適用するだけ NLMIXEDプロシジャを利用できる 本来は非線形混合効果モデルのためのプロシジャ しかし 最尤推定のための一般的な機能が利用可能能 NLMIXEDプロシジャのMODELステートメントに MODEL dependent-variable ~ general(ll) を指定 ここで LL はユーザー定義の対数尤度関数 7

指数分布 Exponential distribution ハザード ( 定数 ): ht ()= λ 生存関数 : St () = e λt 確率密度関数 : ft () = λe λt ( 以下 関数の括弧の中のパラメタは省略 ) 8

PROC NLMIXED による指数分布の当てはめ df=1e8 は t 分布ではなく 正規分布に基づく推測をするために付加 λt ft () = λe St λ () = t 対数尤度 e9

指数分布 : PROC NLMIXED からの出力 10

Weibull 分布 ハザード関数 : ht () = λγ 1 t γ λ: scale parameter, γ : shape parameter 生存関数 : St () = exp( λt γ ) 確率密度関数 : ft t t γ 1 γ ( ) = λγ exp( λ ) γ =1の場合は h (t) = λ となり これは指数分布となる 11

Weibull 分布の当てはめ PROC NLMIXED γ 1 γ ft ( ) = λγ t exp( λt ) St () = exp( λ t γ ) Output 12

Weibull 分布の別の形 教科書によく載っているWeibull 分布の生存関数 : St ( ) = exp( λ t γ ) (1) この形では拡張性に乏しいので 変数およびパラメタの変換を行う : すなわち w = log( t), σ = 1/ γ, μ = (log λ) / σ t = exp( w ), γ = 1/ σ, λ = exp( μ / σ ) これらを (1) に代入し 対数生存時間 w を用いた生存関数は w μ SW ( w) = exp{ exp( μ / σ)[exp( w)] 1/ σ } = exp[ exp( )] σ これより w の確率密度関数は f W 1 w w ( w) exp( μ μ = )exp[ exp( )] σ σ σ 13

Weibull 分布の別の形の当てはめ PROC NLMIXED 1 w μ w μ fw w = σ σ σ w μ SW ( w) = exp[ exp( )] σ f ( ) exp( )exp[ exp( )] PROC LIFEREG 14

Weibull 分布の別の形 : 結果の比較 PROC NLMIXED からの Output PROC LIFEREG からの Output 15

加速モデル Accelerated failure time (AFT) model; 一般論 2 つの治療群があり それぞれの生存関数を S 0 (t) および S 1 (t) と表わすとする この 2 つの生存関数の間に S () t = S ( t a), a> 0 1 0 という関係が成り立つと仮定する a は加速パラメタ 通常は a =exp( β ) とおき 先ほどの式は S () t = S ( t exp( - β )), - < β < 1 0 となり β が推定すべきパラメタとされる 治療群を表わす変数を z とし z =0は標準治療群 z =1 は新規治療群を表わすものとすると zが与えられた場合の生存関数は Stz ( ; ) = S ( t exp( - β z )) = S ( exp( log t - βz )), z= 0, 1 0 0 16

Weibull 分布を仮定した場合 Weibull 加速 (AFT) モデル 先ほどは w=log t によって変数変換した w についての生存関数 確率密度関数を考えたが その代わりに それに群の効果を線形の形で付加した w = log t β z, z =0,1 を用いると 先述のものと全く同じ生存関数 確率密度関数を用いることが できる 17

Weibull AFT model の数値例 18

Weibull AFT model の数値例 PROC NLMIXED PROC LIFEREG 先述のプログラムに 先述のプログラムのモデルに が追加されただけ 19

Weibull AFT model の結果の比較 PROC NLMIXED からの Output PROC LIFEREG からの Output 20

データ Cox 比例ハザード (PH) モデル r 人の死亡例における生存時間を小さい順に並べる 生存時間 t (1) t (2) t (3) t (r) 治療群を表わす変数 z (1) z (2) z (2) z (r) ここで z (i) = 0 は標準治療群 z (i) = 1 は新規治療群を表わす 生存時間に同順位 ( タイ ) は存在しないものと仮定する 21

部分尤度 partial likelihood ( 式の誘導等の詳細な説明は省略しますが ) PL r = = i = 1 j R t exp( β ) ( i ) z() i exp( βz ) ( ) j ここで r は全イベント数 t (i) は (i) 番目のイベント発現時点 z (i) は (i) 番目の時点にイベント発現した症例の群の情報 β は群の効果を表わすパラメタ R(t (i) ) は時点 t (i) におけるリスクセット ( 時点 t (i) においてリスクに曝されている症例の集合 ) 22

前出の数値例 Cox PH モデルの数値例 リスクセット z i t i δ i (i) z (i) t (i) δ (i) のサイズ 0 2 1 1 0 2 1 10 0 5 0 2 1 3 1 9 0 11 1 3 0 5 0 8 0 15 1 4 1 6 1 7 0 21 1 5 0 11 1 6 t 1 3 1 i の順に並べ替え 6 1 12 0 5 1 6 1 7 0 15 1 4 1 12 0 8 0 21 1 3 1 24 1 9 1 24 1 2 1 48 1 10 1 48 1 1 23

部分尤度の計算 t (1) =2の死亡例の部分尤度への寄与 β 0 (i) t (i) δ (i) z (i) e PL = 1 2 1 0 e + e + e + e + e + e + e + e + e + e 2 3 1 1 t (2) = 3 の死亡例の部分尤度への寄与 β 1 3 5 0 0 e PL(2) = β 1 β 0 β 1 β 0 β 1 β 0 β 0 β 1 β 1 e + e + e + e + e + e + e + e + e 4 6 1 1 PL (1) β 0 β 1 β 0 β 1 β 0 β 1 β 0 β 0 β 1 β 1 5 11 1 0 t (3) =5ではイベント発現がないので無視 6 12 0 1 7 15 1 0 t (4) =6の死亡例の部分尤度への寄与 β 1 β 1 8 21 1 0 e PL = 9 24 1 1 e + e + e + e + e + e + e 10 48 1 1 (4) β 1 β 0 β 1 β 0 β 0 β 1 β 1 24

事前のデータ加工 25

各行は各イベント発現時点に対応 加工後のデータセット z1~z10は各時点におけるリスクセットに含まれる各症例の群の情報 26

Cox PH モデルの PROC NLMIXED によるあてはめ PL r = i exp( β ) z() i exp( 1 β z ) ( ) = j R t リスクセットに含まれる例数分だけ回す ( i ) 部分尤度の分母部分 j 27

Cox PH モデルの結果の比較 PROC NLMIXEDからのOutput PROC PHREG からの Output 28

同順位 ( タイ ) のある場合 Cox 比例ハザードモデルにおいて同順位が存在する場合には幾つかの計算法がある Breslowの近似を用いる場合には 多少プログラムが複雑になるものの NLMIXEDプロシジャを用いて計算可能である ( 論文参照 ) 29

まとめ パラメトリックな生存時間解析においては 確率密度関数及び生存関数さえ定義すれば NLMIXED プロシジャを用いて最尤推定が可能 SAS のプロシジャを用いての生存時間解析もその計算内容を理解 確認することができ ブラック ボックスでなくすることができる LIFEREG プロシジャがサポートしていないような生存時間分布でも その確率密度関数及び生存関数さえ定義できれば 推定可能 更に 混合分布モデルや Piecewise exponential model などのより複雑なモデルにも応用可能 Cox 比例ハザードモデル解析で示されたように 事前のデータ加工等の工夫を加えることによって より複雑な計算アルゴリズムの最尤推定であっても 問題によっては計算できる可能性が示唆された このようにPROC NLMIXEDが生存時間解析において非常に強力な道具であり 更なる応用の可能性が示唆された 30