日 本 製 薬 工 業 協 会 シンポジウム 臨 床 試 験 の 欠 測 データの 取 り 扱 いに 関 する 最 近 の 展 開 と 今 後 の 課 題 について - 統 計 手 法 estimandと 架 空 の 事 例 に 対 する 流 れの 整 理 - (7) 架 空 の 事 例 2 ( 主 解 析 の 選 択 例 数 設 計 データの 発 生 方 法 ) 医 薬 品 評 価 委 員 会 データサイエンス 部 会 タスクフォース4 欠 測 のあるデータに 対 する 解 析 方 法 論 SASプログラム 検 討 チーム 持 田 製 薬 株 式 会 社 横 山 雄 一 大 正 製 薬 株 式 会 社 横 溝 孝 明 日 本 イーライリリー 株 式 会 社 大 浦 智 紀 株 式 会 社 大 塚 製 薬 工 場 大 江 基 貴 1
発 表 構 成 1. 主 解 析 の 選 択 のシミュレーション 2. MMRMに 基 づく 例 数 設 計 3. シミュレーションデータの 発 生 方 法 4. シミュレーションにおける 留 意 点 2
1. 主 解 析 の 選 択 のシミュレーション 3
想 定 した 試 験 慢 性 疼 痛 データ 平 均 慢 性 疼 痛 の 第 Ⅲ 相 試 験 応 答 変 数 : 疼 痛 スコア(0~10) 群 :2 群 ( 実 薬 群,プラセボ 群 ) 主 要 評 価 時 点 は 時 点 4 測 定 値 の 平 均 (SD) ベースライン 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 7.00 (1.40) 6.00 (1.60) 5.00 (1.80) 5.00 (2.00) 5.00 (2.00) プラセボ 群 7.00 (1.40) 6.75 (1.60) 6.50 (1.80) 6.25 (2.00) 6.00 (2.00) 時 点 毎 の 累 積 欠 測 確 率 群 ベースライン 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 0 % 20 % 26 % 30 % 34 % プラセボ 群 0 % 18 % 30 % 40 % 48 % 4
主 解 析 の 選 択 想 定 した 試 験 に 対 して Estimand : Estimand 3(Efficacy) 欠 測 メカニズム : MAR ( 共 変 量 : Restrictive) を 仮 定 図 はMallinckrodt (2013)におけるAnalytic Road Mapを 加 工 したもの 上 図 に 従 い,MMRM,MI,wGEEを 主 解 析 の 候 補 として 考 えた. これら3 手 法 のうち,いずれを 主 解 析 に 用 いるか 検 討 するため, 3 手 法 の 性 能 比 較 をシミュレーションに 基 づき 行 う(αエラー, 検 出 力 等 の 比 較 ). 参 考 として,LOCF ANCOVAとOC ANCOVAの 性 能 も 合 わせて 検 討 する. 5
シミュレーションの 設 定 (1/4) 完 全 データ 平 均 慢 性 疼 痛 の 第 Ⅲ 相 試 験 応 答 変 数 : 疼 痛 スコア(0~10) 群 :2 群 ( 実 薬 群,プラセボ 群 ) 主 要 評 価 時 点 は 時 点 4 被 験 者 数 :100 例 / 群 完 全 データの 平 均 構 造 各 時 点 の 測 定 値 の 平 均 (SD) 測 定 値 の 平 均 (SD) ベースライン 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 7.00 (1.40) 6.00 (1.60) 5.00 (1.80) 5.00 (2.00) 5.00 (2.00) プラセボ 群 7.00 (1.40) 6.75 (1.60) 6.50 (1.80) 6.25 (2.00) 6.00 (2.00) 6
シミュレーションの 設 定 (2/4) ベースラインと 各 時 点 の 測 定 値 の 相 関 ベース ライン ベース ライン 時 点 1 時 点 2 時 点 3 時 点 4 1.00 0.60 0.50 0.40 0.30 時 点 1-1.00 0.60 0.50 0.40 時 点 2 - - 1.00 0.60 0.50 時 点 3 - - - 1.00 0.60 時 点 4 - - - - 1.00 7
シミュレーションの 設 定 (3/4) 欠 測 のあるデータ 時 点 毎 の 累 積 欠 測 確 率 の 目 標 値 群 ベースライン 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 0 % 20 % 26 % 30 % 34 % プラセボ 群 0 % 18 % 30 % 40 % 48 % 欠 測 は 単 調 な 欠 測 を 仮 定 した 完 全 データと 上 記 の 目 標 値 より, 以 下 に 示 す2 通 りの 欠 測 メカニズム に 基 づくデータをそれぞれ10,000 組 ずつ 作 成 した. 1MCARとMARの 欠 測 メカニズムを 混 合 (MCAR+MAR) 2MCARとMNARの 欠 測 メカニズムを 混 合 (MCAR+MNAR) なお, 欠 測 メカニズムを 混 合 する 際 の 割 合 は1:1とした. 欠 測 メカニズムを 混 合 した 理 由 は, 欠 測 理 由 が 複 数 あることを 考 慮 したためである. 8
シミュレーションの 設 定 (4/4) αエラー 算 出 の 際 の 平 均 構 造 平 均 平 均 検 出 力 算 出 の 際 の 平 均 構 造 αエラー 算 出 の 際 の 平 均 構 造 αエラー 算 出 の 際 の 測 定 値 の 平 均 測 定 値 の 平 均 ベースライン 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 7.00 6.00 5.00 5.00 5.00 プラセボ 群 7.00 6.50 6.00 5.50 5.00 αエラー 算 出 の 際 は,SD, 相 関, 欠 測 確 率 の 目 標 値 は 不 変 とし, 平 均 構 造 のみ 上 記 の 通 り 変 更 した. 9
解 析 方 法 とその 詳 細 (1/2) 前 述 の2 通 りのデータ(1MCAR+MAR と2MCAR+MNAR それぞれ 10,000 組 )に 対 して, 以 下 の 表 に 示 す 手 法 を 適 用 し, 時 点 4におけるαエラー, 検 出 力 等 の 算 出 を 行 った. なお, 応 答 変 数 はベースラインからの 変 化 量, 有 意 水 準 は 両 側 5%とした. 解 析 手 法 MMRM MI wgee 解 析 方 法 解 析 モデル 説 明 変 数 :ベースライン, 投 与 群, 時 点, 投 与 群 と 時 点 の 交 互 作 用 変 量 効 果 : 被 験 者 の 影 響 を 誤 差 と 合 わせてモデル 化 するため, 明 示 的 には 特 定 せず 相 関 構 造 :Unstructured 推 定 方 法 :REML 自 由 度 調 整 方 法 :Kenward Roger 補 完 モデル( 投 与 群 ごとの 単 調 回 帰 モデル) 説 明 変 数 :ベースライン, 各 時 点 の 変 化 量 補 完 回 数 :100 回 解 析 モデル( 時 点 4に 対 するANCOVA) 説 明 変 数 : 投 与 群,ベースライン 発 表 時 にあった 誤 植 を 修 正 しております 赤 字 部 分 脱 落 モデル(logisticモデル) 説 明 変 数 : 各 時 点 の 変 化 量,ベースライン, 投 与 群, 投 与 群 と 各 時 点 の 変 化 量 の 交 互 作 用 解 析 モデル 説 明 変 数 :ベースライン, 投 与 群, 時 点, 投 与 群 と 時 点 の 交 互 作 用 相 関 構 造 :EXCH 10
解 析 方 法 とその 詳 細 (2/2) 前 述 の2 通 りのデータ(1MCAR+MAR と2MCAR+MNAR それぞれ 10,000 組 )に 対 して, 以 下 の 表 に 示 す 手 法 を 適 用 し, 時 点 4におけるαエラー, 検 出 力 等 の 算 出 を 行 った. なお, 応 答 変 数 はベースラインからの 変 化 量, 有 意 水 準 は 両 側 5%とした. 解 析 手 法 LOCF ANCOVA OC ANCOVA 解 析 方 法 解 析 モデル(LOCFにより 補 完 した 時 点 4に 対 するANCOVA) 説 明 変 数 : 投 与 群,ベースライン 解 析 モデル( 時 点 4のデータが 観 測 された 症 例 に 対 する 時 点 4に 対 するANCOVA) 説 明 変 数 : 投 与 群,ベースライン 11
結 果 (1MCAR+MAR) 推 定 値 は, 時 点 4における 群 間 差 の 推 定 値 を 意 味 する 解 析 手 法 αエラー(%) 検 出 力 (%) 1~5: 検 出 力 の 高 い 順 ()はαエラーが5% 以 上 のもの 10,000 個 の 推 定 値 の 平 均 ( 真 値 :-1.00) 10,000 個 の 推 定 値 のSD MMRM 4.98 281.99-1.0168 0.3526 0.1246 MI 4.36 377.67-1.0032 0.3580 0.1282 wgee 7.29 5(69.61) -1.0159 0.4474 0.2004 LOCF ANCOVA 17.86 1(97.08) -1.1634 0.3010 0.1173 OC ANCOVA 4.90 474.00-0.9314 0.3532 0.1295 MSE 12
結 果 (2MCAR+MNAR) 推 定 値 は, 時 点 4における 群 間 差 の 推 定 値 を 意 味 する 解 析 手 法 αエラー(%) 検 出 力 (%) 1~5: 検 出 力 の 高 い 順 ()はαエラーが5% 以 上 のもの 10,000 個 の 推 定 値 の 平 均 ( 真 値 :-1.00) 10,000 個 の 推 定 値 のSD MMRM 4.96 279.37-0.9696 0.3488 0.1226 MI 4.31 374.88-0.9536 0.3537 0.1273 wgee 6.76 5(69.19) -0.9601 0.4120 0.1713 LOCF ANCOVA 16.97 1(96.87) -1.1294 0.2929 0.1025 OC ANCOVA 5.25 4(71.92) -0.9031 0.3526 0.1337 MSE 13
結 論 αエラー: MMRMとMIのみ5% 未 満 に 制 御 できた.LOCF ANCOVAは 高 度 に 増 大 した. 検 出 力 : LOCF ANCOVA > MMRM > MI > OC ANCOVA > wgee の 順 で 高 かった. 推 定 精 度 : MMRM,MI,wGEEの 推 定 値 は 真 値 周 りに 分 布 したが,LOCF ANCOVAは 真 値 から 偏 って 分 布 し, 過 大 評 価 する 傾 向 がみられた. また, 推 定 値 のSDについても, 他 の 手 法 と 比 較 して LOCF ANCOVAは 小 さく,wGEEは 大 きくなった. 以 上 より, 想 定 した 試 験 の 設 定 において, 各 手 法 の 性 能 を 総 合 的 に 判 断 すると, 検 討 した5つの 手 法 の 中 で MMRMが 最 も 優 れた 手 法 であり, 主 解 析 として 選 択 されるべき と 考 えられた. 14
注 意 として 本 発 表 で 提 示 した 結 果 は,1つのシミュレーションに 基 づくもので あり, 結 果 を 一 般 化 し 過 ぎないことに 注 意 が 必 要 である. 個 別 の 試 験 ごとに 設 定 を 変 更 し, 最 適 な 主 解 析 の 選 択 を 行 うことが 重 要 である. 結 果 に 影 響 を 与 える 項 目 としては, 平 均 構 造 分 散 共 分 散 構 造 MIの 補 完 回 数 欠 測 メカニズム, 脱 落 確 率 の 関 数 ( 欠 測 確 率 含 む) 来 院 間 隔, 来 院 回 数 などが 考 えられる. 15
2. MMRMに 基 づく 例 数 設 計 16
MMRMに 基 づく 例 数 設 計 (Lu et al., 2008) エンドポイント 最 終 時 点 ( 時 点 4)の 疼 痛 スコア 各 種 パラメータ( 疼 痛 データのシミュレーション 設 定 ) 平 均 の 差 : 1.0 標 準 偏 差 ( 各 群 共 通 ) : 2.0 誤 差 相 関 構 造 シミュレーションの 設 定 と,それに 類 似 させた 構 造 (ARMA(1,1))を 検 討 被 験 者 の 残 存 率 累 積 欠 測 確 率 の 目 標 値 から 計 算 時 点 0 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 100% 80% 74% 70% 66% プラセボ 群 100% 82% 70% 60% 52% 17
結 果 ( 有 意 水 準 0.05, 検 出 力 0.8) 方 法 相 関 構 造 Inflation Factor 試 験 薬 群 プラセボ 群 最 適 割 付 比 率 等 例 数 必 要 被 験 者 数 最 適 比 率 試 験 薬 群 プラセボ 群 MMRM 1.421 1.705 0.913 100 95 104 1.416 1.700 0.913 99 95 104 (t 検 定 ) 64(109) MMRM Inflation Factorを 計 算 し, 通 常 の2 標 本 t 検 定 で 例 数 設 計 自 由 度 は2 次 ステップt 検 定 (Lu et al., 2008)に 基 づき 計 算 (t 検 定 : 参 考 ) 欠 測 を 考 慮 せず, 最 終 時 点 のパラメータのみを 用 いて 例 数 設 計 括 弧 内 の 数 値 は, 最 終 時 点 での 残 存 率 (2 群 の 平 均 )の 逆 数 を 乗 じることで, 脱 落 を 考 慮 した 例 数 設 計 18
3. シミュレーションデータの 発 生 方 法 19
シミュレーションデータの 発 生 の 流 れ 評 価 時 点 の 設 定 完 全 データ の 発 生 欠 測 データ の 特 定 欠 測 のある データの 作 成 20
評 価 時 点 の 設 定 試 験 及 び 薬 剤 の 特 徴 を 捉 えた 必 要 最 低 限 の 時 点 を 設 定 する ことが 好 ましい. シミュレーションデータの 特 徴 実 薬 群 : 前 半 での 薬 効 発 揮, 有 害 事 象 での 早 期 中 止 プラセボ 群 : 緩 やかなスコアの 減 少, 効 果 不 十 分 での 中 止 慢 性 疼 痛 の 第 Ⅲ 相 試 験 を 想 定 応 答 変 数 : 疼 痛 スコア(0~10) 群 :2 群 ( 実 薬 群,プラセボ 群 ) 被 験 者 数 :100 例 / 群 完 全 データの 平 均 構 造 21
完 全 データの 発 生 (1/3) 1. 群 時 点 毎 に 平 均 及 びSDを 設 定 する. 2. 被 験 者 の 影 響 を 考 慮 する(2 種 類 の 方 法 ). (1) 変 量 効 果 ( 変 量 切 片 )を 指 定 する. (2) 時 点 間 の 相 関 を 指 定 する., 変 量 効 果 は1 変 量 ( 被 験 者 )のみ 誤 差 は 時 点 間 で 独 立 と 想 定 してデータを 発 生 Σ は, 誤 差 の 分 散 共 分 散 行 列 変 量 効 果 なし 誤 差 の 相 関 構 造 ( 相 関 行 列 )を 指 定 してデータを 発 生 22
完 全 データの 発 生 (2/3) SDと 相 関 行 列 から 分 散 共 分 散 行 列 を 算 出 する. 各 時 点 の 測 定 値 の 平 均 (SD) 測 定 値 の 平 均 (SD) ベースライン 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 7.00 (1.40) 6.00 (1.60) 5.00 (1.80) 5.00 (2.00) 5.00 (2.00) プラセボ 群 7.00 (1.40) 6.75 (1.60) 6.50 (1.80) 6.25 (2.00) 6.00 (2.00) r ij i ij j 誤 差 の 相 関 構 造 ( 相 関 行 列 ) 分 散 共 分 散 行 列 R 1.00 0.60 0.50 0.40 0.30 0.60 1.00 0.60 0.50 0.40 0.50 0.60 1.00 0.60 0.50 0.40 0.50 0.60 1.00 0.60 0.30 0.40 0.50 0.60 1.00 1.96 1.34 1.26 1.12 0.84 1.34 2.56 1.73 1.60 1.28 1.26 1.73 3.24 2.16 1.80 1.12 1.60 2.16 4.00 2.40 0.84 1.28 1.80 2.40 4.00 23
完 全 データの 発 生 (3/3) 設 定 した 平 均 ベクトル 及 び 分 散 共 分 散 行 列 をもとに, 多 変 量 正 規 乱 数 を 発 生 させる. PROC IML; mean1={7.0 6.0 5.0 5.0 5.0}; mean2={7.0 7.5 7.0 6.5 6.0}; 平 均 ベクトル Sample SAS code quit; cov={ 1.96 1.34 1.26 1.12 0.84, 1.34 2.56 1.73 1.60 1.28, 1.26 1.73 3.24 2.16 1.80, 1.12 1.60 2.16 4.00 2.40, 0.84 1.28 1.80 2.40 4.00 }; CALL RANDSEED(12345); rv1=randnormal(100, mean1, cov); rv2=randnormal(100, mean2, cov); 分 散 共 分 散 行 列 CREATE d1 FROM rv1[colname={ y0' y1' y2' y3' y4'}]; APPEND FROM rv1; APPEND FROM rv2; 多 変 量 正 規 乱 数 の 発 生 SASデータセットの 作 成 24
欠 測 データの 特 定 (1/3) 1. 群 時 点 毎 に 欠 測 確 率 の 目 標 値 を 設 定 する. 2. 欠 測 メカニズムを 設 定 する(2 種 類 の 方 法 ). (1) 1つの 欠 測 メカニズムを 仮 定 する. (2) 複 数 の 欠 測 メカニズムの 混 合 を 仮 定 する. 1 MCARとMARの 欠 測 メカニズムを 混 合 (MCAR+MAR) 2 MCARとMNARの 欠 測 メカニズムを 混 合 (MCAR+MNAR) なお, 欠 測 メカニズムを 混 合 する 際 の 割 合 は1:1とした. 臨 床 試 験 における 代 表 的 な 中 止 理 由 有 害 事 象 効 果 不 十 分 被 験 者 都 合 群 被 験 者 毎 に 欠 測 メカニズムが 異 なるかもしれない. 25
欠 測 データの 特 定 (2/3) 欠 測 メカニズム 毎 に 対 応 する 欠 測 確 率 の 関 数 を 設 定 する. MCAR 時 点 毎 の 欠 測 確 率 の 目 標 値 群 時 点 1 時 点 2 時 点 3 時 点 4 実 薬 群 20% 5% 5% 5% プラセボ 群 15% 15% 15% 15% MAR MNAR logit( p t ) 7.6 0.8Y t1 1 時 点 前 の 測 定 値 が 大 きいほど 欠 測 しやすい 状 況 logit( pt ) 7.6 0.42Yt 1 0. 42Y 1 時 点 前 の 測 定 値 とその 時 点 の 測 定 値 が 大 きいほど 欠 測 しやすい 状 況 Y t p t : 時 点 t の 測 定 値 : 時 点 t で 欠 測 する( 条 件 付 き) 確 率 t 26
欠 測 データの 特 定 (3/3) data d2; set d1; call streaminit(123); array y{5} y0-y4; array p{4} p1-p4; array m{4} m1-m4; if TYPE="MCAR" then do; do t=1 to 4; if trt=1 and t eq 1 then p{t}=0.20; if trt=1 and t ne 1 then p{t}=0.05; if trt=2 then p{t}=0.15; m{t}=rand('bernoulli',p{t}); end; end; Sample SAS code y0 : ベースラインの 測 定 値 y1-y4 : 時 点 1~4の 測 定 値 p1-p4 : 時 点 1~4で 欠 測 する( 条 件 付 き) 確 率 m1-m4 : 時 点 1~4の 欠 測 識 別 変 数 (1: 欠 測 ) run; if TYPE="MAR" then do; do t=1 to 4; p{t}=1 / ( 1 + exp( - (-7.60 + 0.8*y{t}))); m{t}=rand('bernoulli',p{t}); end; end; if TYPE="MNAR" then do; do t=1 to 4; p{t}=1 / ( 1 + exp( - (-7.60 + 0.42*y{t} + 0.42*y{t+1}))); m{t}=rand('bernoulli',p{i}); end; end; 27
4. シミュレーションにおける 留 意 点 28
シミュレーションにおける 留 意 点 (1/2) 参 考 データの 結 果 を 一 般 化 し 過 ぎない. 1シナリオのシミュレーション 結 果 が 完 全 に 再 現 されることは 稀. 想 定 される 複 数 のパターンのシミュレーションを 実 施 する. 試 験 及 び 薬 剤 の 特 徴 を 考 慮 し,シンプルな 設 定 とする. 要 約 データの 特 徴 も 考 慮 する.(e.g. LOCFバイアス) The Prevention and Treatment of Missing Data in Clinical Trials:An FDA Perspective on the Importance of Dealing With It(2012)より 抜 粋 29
シミュレーションにおける 留 意 点 (2/2) 以 下 の 点 などを 考 慮 して, 試 験 ごとに 十 分 な 検 討 が 必 要. 欠 測 メカニズム MARを 仮 定 して 本 当 に 大 丈 夫 か? MNARを 仮 定 したシミュレーションも 合 わせて 行 うべき. データの 分 布 外 れ 値 がある 場 合 欠 測 データが 観 測 データと 大 きく 異 なる 分 布 の 場 合 ベースラインと 時 点 の 交 互 作 用 がある 場 合 欠 測 確 率 の 関 数 欠 測 が 増 えるのは, 応 答 変 数 が 大 きいとき? 小 さいとき? 補 助 変 数 があるときは? 30
まとめ 主 解 析 の 選 択 のためのシミュレーション MMRM,MI,wGEE,LOCF ANCOVA,OC ANCOVAの 比 較 αエラー, 検 出 力, 推 定 精 度 MMRMに 基 づく 例 数 設 計 理 論 値,t 検 定 の 例 数 との 比 較 シミュレーションデータの 発 生 方 法 完 全 データの 発 生, 欠 測 データの 特 定 シミュレーションにおける 留 意 点 計 画 段 階 ではシミュレーション 等 を 通 じて, 試 験 及 び 薬 剤 の 特 徴 を 踏 まえた 十 分 な 検 討 をすることが 必 要. ただし, 結 果 の 一 般 化 には 注 意 が 必 要. 31
参 考 文 献 1. 馬 場 裕 子 ほか. (2007). MMRM 解 析 とLOCF 解 析 の 比 較. SASユーザー 会 学 術 総 会. 2. 土 居 正 明 ほか. (2014). 欠 測 のあるデータに 対 する 総 合 的 な 感 度 分 析 と 主 解 析 の 選 択. SASユーザー 総 会 論 文 集. 3. Lu, K., Luo, X., and Chen, P.Y. (2008). Sample size estimation for repeated measures analysis in randomized clinical trials with missing data. International Journal of Biostatistics. 4(1), Article 9. 4. Mallinckrodt, C. H. (2013). Preventing and Treating Missing Data in Longitudinal Clinical Trials. Cambridge Press. 5. O'Neill, R. T., and Temple, R. (2012). The Prevention and Treatment of Missing Data in Clinical Trials: An FDA Perspective on the Importance of Dealing With It. Clinical Pharmacology & Therapeutics. 91(3), 550 554. 6. Siddiqui, O., Hung, H. M., and O'Neill, R. (2009). MMRM vs. LOCF: a comprehensive comparison based on simulation study and 25 NDA datasets. Journal of Biopharmaceutical Statistics. 19, 227 246. 7. Wicklin, R. (2013). Simulating Data with SAS. SAS Press. 8. Wicklin, R. (2010). Statistical Programming with SAS/ IML Software. SAS Press. 32