日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チーム 日本新薬 ( 株 ) 田中慎一
留意点 本発表は, 先日公開された 生存時間型応答の評価指標 -RMST(restricted mean survival) を理解する - について, 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チームが本シンポジウムの趣旨を踏まえ, 再構成したものである 2
発表構成 1. RMSTの定義と性質 2. RMSTの統計的推測 Kaplan-Meier 法によるRMSTの推定 治療群間の比較 3. SAS プログラミング時の留意点 SASプログラム 2つの分散の性質 4. まとめ 3
1. RMST の定義と性質 4
RMST の定義 境界時間 τ 内でのイベント発現までの時間に対する平均値 イベント発現までの時間を T, 境界時間 τ 内での生存時間を X τ = min T, τ とした場合,X τ の平均値 が RMST μ τ = E X τ = E min T, τ 5
RMST の解釈 生存時間 T の生存関数を S t とすると,RMST は, と表現できる RMST は, 境界時間 τ 内における生存関数の曲線下面積 としても解釈できる 生存割合 τ μ τ = න S t dt 0 μ(τ) 0 τ 生存時間 6
生存時間 X τ の分散 境界時間 τ 内での生存時間 X τ の分散は, と表せる σ 2 τ = Var X τ = E X 2 τ E X τ 2 τ = 2 න ts t dt න 0 0 この分散は必要症例数計算時に使用される τ S t dt 2 X τ の期待値 (RMST) 及び分散は, 生存関数から求められる. 実際の解析では, 観測データから生存関数を推定し,RMST を推定することになる. 7
2. RMST の統計的推測 8
RMST の推定量 Royston and Parmar (2013) により,Kaplan-Meier 法による生存曲線を積分する方法が示されている D μ τ = j=0 t j+1 t j S t j S t は Kaplan-Meier 法による生存曲線の推定量 t 1 < t 2 < < t D は境界時間 τ 内での D 個のイベント発現時点 t 0 = 0,t D+1 = τ 9
RMST の推定量 μ τ の分散 Greenwood の公式により, Var μ τ D = j=1 D i=j t i+1 t i S t i 2 d j Y j Y j d j Y j はイベントが発現した時点 t j でのリスク集合の大きさ d j は時点 t j でのイベント数 リスク集合 0 t 0 t 1 t 2 t D Y 1 Y 2 Y D τ t D+1 = τ イベント数 d 1 d 2 d D 10
治療群間の比較 (RMST の差 ) 群 g( 対照薬群を 0, 実薬群を 1) の RMST の推定量を μ g τ, その分散を Var μ g τ 2 群のRMSTの差の推定量 μ 1 τ μ 0 τ 分散 Var μ 1 τ μ 0 τ = Var μ 1 τ + Var μ 0 τ 11
差の信頼区間 検定統計量 2 群の差の 100 1 α % 信頼区間 μ 1 τ μ 0 τ ± z Τ α 2 Var μ 1 τ + Var μ 0 τ z α は標準正規分布の上側 100α% 帰無仮説 H 0 : μ 1 τ μ 0 τ = 0 対立仮説 H 1 : μ 1 τ μ 0 τ 0 検定統計量 μ 1 τ μ 0 τ s D = Var μ 1 τ + Var μ 0 τ s D は漸近的に標準正規分布に従う 12
3. SAS プログラミング時の留意点 13
RMST を求めるための SAS プログラム lifetest プロシジャ timelim オプションを利用 構文 timelim=l には境界時間 τ を表す数値を指定 time は時間変数 censor は打ち切り変数 (0 は打ち切りを表す ) 14
例 データセット SAMPLE TIME CENSOR 1 0 2 1 3 1 4 1 5 0 SAS プログラム 15
出力結果 16
SAS プログラミング時の留意点 SAS/STAT(R) 14.1 User's Guide 抜粋 TIMELIM=time-limit specifies the time limit used in the estimation of the mean survival time and its standard error. The mean survival time can be shown to be the area under the Kaplan Meier survival curve. However, if the largest observed time in the data is censored, the area under the survival curve is not a closed area. In such a situation, you can choose a time limit L and estimate the mean survival curve limited to a time L (Lee 1992, pp. 72 76). This option is ignored if the largest observed time is an event time. timelim に指定した時間より後にイベントが発現している場合, 強制的に最終イベント発現時点までの RMST が算出される 17
例 ( 境界時間 τ = 3 の場合 ) TIME 1 0 2 1 3= τ 1 4 1 5 0 CENSOR 最終イベント SAS プログラム 出力結果 最終イベント発現時点 ( 時点 4) までのRMSTが出力されてしまう 18
事前に, データセットの加工が必要 DATA ステップで, 境界時間 τ より後に発生したイベントを打ち切りに変換したデータセットを作成する 境界時間 τ = 3 の場合 TIME CENSOR 1 0 2 1 3 1 4 1 5 0 TIME CENSOR 1 0 2 1 3 1 4 0 5 0 19
lifetest プロシジャによる標準誤差 Var μ τ = m D m 1 j=1 D i=j t i+1 t i S t i 2 d j Y j Y j d j Y j はイベントが発現した時点 t j でのリスク集合の大きさ d j は時点 t j でのイベント数.m = σ D j=1 d j 一方,Klein (2003),Collett (2015) 等では mτ m 1 を掛けない分散が記載されている 20
2 つの分散の性質 D D 2 Var_Klein = t i+1 t i S t i d j j=1 i=j Y j Y j d j Var_SAS = m D D t i+1 t i S t i 2 d j m 1 j=1 i=j Y j Y j d j シミュレーションにより, 被験者 i i = 1,, n の生存時間 T i が指数分布に従う 境界時間 τ 内での打ち切りが存在しない これらの場合について,2 つの分散の性質を確認 イベント数による影響を評価 21
RMST の推定量 μ τ の分散 境界時間 τ 内で打ち切りが存在しないとき, RMST の推定量 μ τ は各被験者の生存時間 X i τ の単純平均 n μ τ = 1 n i=1 X i τ 境界時間 τ 内での生存時間を X i τ = min T i, τ となるため, その分散は Var μ τ = Var X i τ Τn 22
T i がハザード λ の指数分布に従う場合 境界時間 τ 内での生存時間 X i τ の分散は Royston and Parmar (2013) により, Var X i τ = 1 2λτexp λτ exp 2λτ λ 2 シミュレーションにより, Var X i τ Τnとの変化率 Var_Klein Var X i τ Var X i τ Τn Τn Var_SAS Var X i τ, Var X i τ Τn Τn の平均値を求め,2 つの分散のズレの大きさを評価 23
シミュレーション条件 シミュレーション回数 100,000 境界時間 τ = 2 年 2 年生存率 0.9,0.7,0.5,0.3,0.1 の指数分布 被験者数 30,50,100 例 24
シミュレーション結果 ( 被験者数 30 例の場合 ) 2 年生存率 τ までの期待イベント数 Var X i τ /n Var_Klein の変化率 Var_SAS の変化率 0.9 3 0.004127-0.047423 (0.002316) [4319] 0.625805 (0.002877) [18628] 0.7 9 0.011167-0.036021 (0.001002) [ 3] 0.090282 (0.001061) [ 34] 0.5 15 0.015778-0.034887 (0.000580) [ 0] 0.035939 (0.000610) [ 0] 0.3 21 0.017257-0.034298 (0.000408) [ 0] 0.015037 (0.000435) [ 0] 0.1 27 0.013316-0.033068 (0.000639) [ 0] 0.004680 (0.000670) [ 0] Mean (SE) [ 計算不可回数 ](Var_Klein はイベント 0, Var_SAS は 0 及び 1 の回数 ) 25
シミュレーション結果 ( 被験者数 50 例の場合 ) 2 年生存率 τ までの期待イベント数 Var X i τ /n Var_Klein の変化率 Var_SAS の変化率 0.9 5 0.002530-0.026240 (0.001720) [501] 0.268747 (0.001870) [3456] 0.7 15 0.006700-0.022728 (0.000783) [ 0] 0.048542 (0.000810) [ 0] 0.5 25 0.009467-0.021683 (0.000449) [ 0] 0.019680 (0.000462) [ 0] 0.3 35 0.010354-0.020878 (0.000311) [ 0] 0.008282 (0.000323) [ 0] 0.1 45 0.007989-0.019464 (0.000496) [ 0] 0.003021(0.000510) [ 0] Mean (SE) [ 計算不可回数 ](Var_Klein はイベント 0, Var_SAS は 0 及び 1 の回数 ) 26
シミュレーション結果 ( 被験者数 100 例の場合 ) 2 年生存率 τ までの期待イベント数 Var X i τ /n Var_Klein の変化率 Var_SAS の変化率 0.9 10 0.001265-0.013414 (0.001210) [3] 0.099393 (0.001263) [26] 0.7 30 0.003350-0.011406 (0.000556) [0] 0.022994 (0.000566) [0] 0.5 50 0.004733-0.010854 (0.000317) [0] 0.009474 (0.000321) [0] 0.3 70 0.005177-0.010532 (0.000218) [0] 0.003894 (0.000222) [0] 0.1 90 0.003995-0.009718 (0.000353) [0] 0.001458 (0.000358) [0] Mean (SE) [ 計算不可回数 ](Var_Klein はイベント 0, Var_SAS は 0 及び 1 の回数 ) 27
考察 Var_Klein は,Var X i τ /n より小さくなる傾向 Var_SASは, イベント数が少ない場合,Var X i τ /nより大きくなり, イベント数が多い場合,Var X i τ /nに近くなる傾向 28
分散まとめ Klein (2003),Collett (2015),R の survfit 関数では, Var_Klein が示されている SAS は,Kaplan (1958) 及び Lee (1992) を参考に Var_SAS の式を用いている どちらの分散式を用いるべきかのコンセンサスは得られていない 本報告書では,RMST の推定量に対する分散式として Var_Klein を用いている 29
4. まとめ 30
まとめ RMST 定義 : 境界時間 τ 内でのイベント発現までの時間に対する平均値 境界時間 τ 内における生存関数の曲線下面積 Kaplan-Meier 法による生存関数を積分し, 推定 lifetest プロシジャ timelim オプションを用いて計算可能 プログラミング時の留意点 以下の SAS プログラムを報告書に記載 境界時間 τ より後のイベントを打ち切りに変換 2 群の RMST の差および比の信頼区間,P 値 31
参考文献 Royston P, Parmar MKB. Restricted mean survival time: an alternative to the hazard ratio for the design and analysis of randomized trials with a time-to-event outcome. BMC Med ical Research Methodology 2013; 13:152. Klein JP, Moeschberger ML. Surival Analysis: Techniques for Censored and Truncated Data second edition. Springer- Verlag: New York: 2003. Collett D. Modelling survival data in medical reseach, third edition. CRC Press: 2015. Kaplan EL, Meier P. Nonparametric Estimation From Incomplete Observations. Journal of the American Statistical Association. 1958: 53(282): 457-481. Lee ET, Wang JW. Statistical Methods for Survival Data Analysis. Second edition. John Wiley & Sons: New York: 1992. 32