日本製薬工業協会シンポジウム 臨床試験の estimand に対する最近の議論と, 欠測のあるデータに対する基本的解析手法について 7. 事例紹介 2017 年 2 月 23 日 医薬品評価委員会データサイエンス部会タスクフォース 4 欠測のあるデータの解析検討チーム サノフィ株式会社渡邊大丞 武田薬品工業株式会社黒田晋吾 1
取り上げる事例 1. Brexpiprazole (REXULTI ) OTSUKA PHARM CO LTD, Jul. 10, 2015 2. Nintedanib (OFEV ) BOEHRINGER INGELHEIM, Oct. 15, 2014 3. Riociguat (ADEMPAS ) BAYER HLTHCARE, Oct. 8, 2013 4. Vedolizumab (ENTYVIO ) TAKEDA PHARMS USA, May. 20, 2014 調査担当者 : 棚橋 調査担当者 : 鵜飼 調査担当者 : 渡邊 調査担当者 : 黒田 2015 年計量生物セミナー X. 一般名 ( 商品名 ) 申請者名, 承認日 すべて FDA で審査, 承認されたものです. 本発表では,3 と 4 をご紹介させていただきます. 残り二つの事例につきましては,2015 年の計量生物セミナーの発表資料をご参照ください. 2
はじめに 本発表は, 当局および公開されている論文をもとに作成しております. 公開情報の範囲を超える内容についてはお答えできない事項がございます. 本発表における公開情報とは FDA の審査報告書および論文などを示します. ご理解のほど, よろしくお願いします. 3
Riociguat 調査担当者 : サノフィ株式会社渡邊大丞 4
事例紹介 : Riociguat Riociguat の概要 一般名 :Riociguat 商品名 : Adempas 効能 効果 慢性血栓塞栓性肺高血圧症 (CTEPH) 肺動脈性高血圧症 (PAH) 申請データパッケージにおける第 3 相試験 11348(CHEST-1): [CTEPH]16 週間の並行群間比較試験 12934(PATENT-1):[PAH]12 週間の並行群間比較試験 本資料で扱う試験 米国 :2013 年 10 月に承認 日本 :2014 年 1 月 (CTEPH),2015 年 2 月 (PAH) に承認 5
PATENT-1 試験概要 : 試験デザイン 国際共同プラセボ対照二重盲検比較試験 用量調節期終了時の用量を主治療期に投与する. 試験治療中止後の規定最終来院日までの継続はしていない. PAH 治療薬の併用の有無を層別因子 国 / 地域毎にランダム化を実施 6
試験概要 : 主要評価項目と解析 主要評価項目 : 6 分間歩行距離 (6MWD) のベースラインからの変化量 主解析 : 共分散分析 (ANCOVA) 欠測データの補完ルール 試験治療完了又は試験治療中止をした被験者 : 第 12 週までの最終測定値 Efficacy(LOCF strategy)? 死亡 臨床的悪化で試験治療中止来院がない被験者, 又は試験治療中止来院時の測定値がない被験者 : 最悪値 (0m) 試験治療完了又は試験治療中止をした被験者とは異なる取り扱い 層別 Wilcoxon 検定 正規性検定結果が有意であったため, 事前に規定していた層別 Wilcoxon 検定を正式な有意差検定結果とした. 解析は,NRC(2010) 出版前の 2008 年に計画されていた. 7
感度分析 (1/4) データの取り扱い及び試験治療中止に関する種々の解析 感度分析に対するデータの取り扱い 試験治療中止来院を次の予定来院とする. 予定外の来院は解析から除く. 死亡 臨床的悪化で試験治療中止来院がない被験者, 又は試験治療中止来院時の測定値がない被験者に対する最悪値 (0m) の補完は行わない. 感度分析前に実施した解析 試験治療中止理由別の割合, カプランマイヤープロット 試験治療中止時期別の 6MWD の平均変化量のプロット (Spaghetti plot ) 8
感度分析 (2/4) 欠測メカニズムごとの感度分析の内容 主解析 :ANCOVA 応答変数が治験治療中止後も平均的に一定であることを仮定している. MAR に基づく解析 :MMRM 全ての被験者が試験治療を完了したと仮定した場合 :Efficacy の評価? MNAR に基づく解析 Delta method (Pattern mixture model)[carpenter & Kenward (2008)] 盲検化レビューの結果, 試験治療中止例が試験治療完了例に比べて 6MWD の変化量が低値であった. 特にプラセボ群ではそれが顕著であった. 6MWD が試験治療中止後の来院ごとに一定量低下すると仮定. MAR に基づき Multiple imputation(mi) を用いて欠測データを補完し, シナリオ (Fixed penalty, Decreasing slope) ごとに設定されたペナルティを加える. 補完したデータで共分散分析を実施し, 結果を併合する. 補完回数 :50 回 9
感度分析 (3/4) Delta method [Carpenter & Kenward (2008)] MAR に基づく欠測データに対する条件付き平均の直線 観測データ MAR に基づき MI で発生させたデータ δ 2δ MNAR に基づき欠測データを補完したデータ (MI で発生させたデータにペナルティを加える ) 1 2 3 4 TIME 10
感度分析 (4/4) PATENT-1 試験で仮定したシナリオ Placebo: 観測値 Placebo: 補完値 Riociguat: 観測値 Riociguat: 補完値 11
解析結果 (1/4) 試験治療中止の割合 ( ランダム化された被験者 ) Placebo (n=127) Riociguat 2.5 mg (n=254) Riociguat 1.5 mg (n=64) 試験治療完了例数 111(87.4%) 237(93.3%) 57(89.1%) 試験治療中止例数 16(12.6%) 17(3.1%) 7(10.9%) 試験治療中止理由 有害事象 7(5.5%) 8(3.1%) 1(1.6%) 死亡 2(1.6%) 0 1(1.6%) 有効性欠如 1(0.8%) 0 0 追跡不能 0 1(0.4%) 0 服薬不遵守 0 1(0.4%) 0 プロトコールからの逸脱 3(2.4%) 1(0.4%) 3(4.7%) 同意撤回 3(2.4%) 6(2.4%) 2(3.1%) 12
解析結果 (2/4) 主解析の結果 (ITT 集団 ) Baseline Placebo (n=126) Riociguat 2.5 mg (n=254) Riociguat 1.5 mg (n=63) Mean (SD) 367.8(74.6) 361.4(67.7) 363.2(66.6) Median(Min:Max) 391.0(150 : 450) 374.5(160 : 468) 385.0(158 : 448) Change from baseline to last visit Mean (SD) -5.6(85.5) 29.6(65.8) 31.1(79.3) Median(Min:Max) 8.5(-400 : 204) 30.0(-430 : 279) 32.0(-415 : 190) Treatment comparison: (Riociguat 2.5 mg 群 )-( プラセボ群 ) LS mean difference 35.78 95% CI 20.06 to 51.51 p 値 (ANCOVA) <0.0001 p 値 (stratified Wilcoxon test) <0.0001 13
解析結果 (3/4) 感度分析 : プラセボ群と Riociguat 2.5mg 群との群間差 解析方法群間差 95%CI MMRM 30.02 16.11 to 43.94 Scenario 1 [Fixed penalty:-60m for both groups] Scenario 2 [Decreasing slope:-20m per visit for both groups] Scenario 3 [Fixed penalty:-60m only for Riociguat] Scenario 4 [Decreasing slope:-20m per visit only for Riociguat] 33.10 18.49 to 47.71 35.03 20.49 to 49.57 26.31 12.32 to 40.30 27.16 13.36 to 40.96 14
解析結果 (4/4) 感度分析 : プラセボ群と Riociguat 1.5mg 群との群間差 解析方法群間差 95%CI MMRM 36.27 17.77 to 54.76 Scenario 1 [Fixed penalty:-60m for both groups] Scenario 2 [Decreasing slope:-20m per visit for both groups] Scenario 3 [Fixed penalty:-60m only for Riociguat] Scenario 4 [Decreasing slope:-20m per visit only for Riociguat] 37.62 15.45 to 59.79 39.24 16.82 to 61.67 30.86 10.33 to 51.39 31.51 11.02 to 52.00 15
FDA Comments 肺動脈性高血圧症患者対象の試験は一般的に多くの欠測データを伴う傾向があるが, PATENT-1 試験の欠測データは少数であった. スポンサーは欠測データに対して異なる仮定のもと多くの感度分析を実施した. 感度分析の結果は主要解析の結果と同様に適度に大きな効果を示した. 欠測データに対する問題は特になかった. 16
参考文献 Statistical Review, Drug Approval Package, Adempas (riociguat) tablets. Food and Drug Administration website http://www.accessdata.fda.gov/drugsatfda_docs/nda/2013/204819orig1s000statr.pdf Briefing Information for the August 6, 2013 Meeting of the Cardiovascular and Renal Drugs Advisory Committee. Food and Drug Administration website http://www.fda.gov/downloads/advisorycommittees/committeesmeetingmaterials/drugs/cardiovascularandrenaldrugsa dvisorycommittee/ucm363541.pdf Briefing Information for the August 6, 2013 Meeting of the Cardiovascular and Renal Drugs Advisory Committee. Food and Drug Administration website http://www.fda.gov/downloads/advisorycommittees/committeesmeetingmaterials/drugs/cardiovascularandrenaldrugsa dvisorycommittee/ucm363543.pdf Missing Data Sensitivity Analysis of a Continuous Endpoint - An Example from a Recent Submission. Arno Fritsch. Clinical Statistics Europe, Bayer http://www.amstat.org/chapters/newjersey/documents/events/2011to2015/2014/bayer/2%20nj-asa-bayer-workshop- Fritsch.pdf Arno Fritsch. (2014) Missing Data Sensitivity Analysis of a Continuous Endpoint - An Example from a Recent Submission. November 21, 2014 - ASA NJ Chapter / Bayer Workshop, Whippany http://www.amstat.org/chapters/newjersey/documents/events/2011to2015/2014/bayer/2%20nj-asa-bayer-workshop- Fritsch.pdf Carpenter, J. R., Kenward, M. G. (2008). Missing data in clinical trials - a practical guide. National Health Service Coordinating Centre for Research Methodology: Birmingham. http://missingdata.lshtm.ac.uk/downloads/rm04_jh17_mk.pdf Ghofrani H-A et al. (2013) Riociguat for the treatment of pulmonary arterial hypertension. N Engl J Med. http://www.nejm.org/doi/pdf/10.1056/nejmoa1209655 17
Vedolizumab 調査担当者 : 武田薬品工業株式会社黒田晋吾 18
Vedolizumab の概要 一般名 :Vedolizumab 商品名 :Entyvio 効能 効果 中等症又は重症のクローン病 (CD) 中等症又は重症の潰瘍性大腸炎 (UC) US での申請データパッケージにおける第 3 相試験 C13007:CD の導入療法及び維持療法 C13006:UC の導入療法及び維持療法 C13011:CD の導入療法 C13008:UC 及び CD の長期安全性 本資料で扱う試験 UC: Ulcerative Colitis CD: Crohn's Disease 19
背景 C13007 試験 C13006 試験 導入療法期維持療法期導入療法期維持療法期 主要評価項目の評価時点 試験中止例数の割合 6 週 52 週 6 週 52 週 9% 52% 6% 44% 導入療法期 維持療法期ともにFDAのreviewerから主解析とは異なる補完方法を用いた感度分析を求められ 申請者が追加解析を実施 本事例紹介では FDAのstatistical reviewにおける 維持療法期の欠測データの取扱いに関する議論を紹介 20
C13007 試験 (CD) C13006 試験 (UC) 21
C13007(CD 維持療法期 ) 試験デザイン 目的 : 中等症又は重症の CD 患者に対する Vedolizumab の維持療法における有効性及び安全性を検討する 対象 : 中等症又は重症の CD 患者で Vedolizumab を投与され導入療法期の 6 週時点において改善が見られた被験者 主要評価項目 : 52 週時点での寛解割合 CDAI スコアが 150 以下のときに寛解と定義 投与群 : プラセボ群 Vedolizumab Q4W 群 Q8W 群 主解析 :CMH カイ 2 乗検定 (Vedolizumab Q4W vs placebo, Vedolizumab Q8W vs placebo) 試験中止例は 寛解なし として取扱った 22
C13007(CD) フローチャート 導入療法期 維持療法期 23
C13007(CD) フローチャート 維持療法期における主解析の対象集団 24
C13007(CD 維持療法期 ) 被験者の内訳 プラセボ群 Vedolizumab Q8W 群 Vedolizumab Q4W 群 無作為化例数 153 154 154 試験中止例数 (%) 89 (58) 81 (53) 72 (47) 有害事象 15 (10) 12 (8) 9 (6) 試験実施計画書からの逸脱 1 (<1) 2 (1) 3 (2) 有効性の欠如 64 (42) 58 (38) 48 (31) 依頼者による試験の中止 0 0 0 同意撤回 7 (5) 6 (4) 9 (6) 追跡不能 1 (<1) 3 (2) 2 (1) その他 1 (<1) 0 1 (<1) 25
C13007(CD 維持療法期 ) 主解析 プラセボ群 (N=153) Vedolizumab Q8W 群 (N=154) Vedolizumab Q4W 群 (N=154) 寛解した被験者数 (%) 33 (21.6) 60 (39.0) 56 (36.4) 両側 95% 信頼区間 [15.1, 28.1] [31.3, 46.7] [28.8, 44.0] プラセボ群との寛解割合の差 17.4 14.7 両側 95% 信頼区間 [7.3, 27.5] [4.6, 24.7] p 値 * 0.0007 0.0042 * 経口コルチコステロイドの併用の有無 抗 TNFα 抗体による治療歴及び / 又は免疫調節薬の併用の有無 及び導入療法期におけるコホート ( コホート 1: 二重盲検下でプラセボ又は Vedolizumab を投与 コホート 2: 非盲検下で Vedolizumab を投与 ) を層別因子とした CMH カイ 2 乗検定 26
C13007(CD 維持療法期 ) 感度分析 欠測データに対処するため FDA からの要求に従って以下の感度分析を実施した Observed case( この試験では complete case と一致 ) 主要評価項目が欠測の場合は解析から当該被験者を除外 Worst case( statistical review で ➁ の結果の記載はない ) 1 主要評価項目が欠測の場合は 寛解なし として取扱う ( 主解析と同様の補完方法 ) 2 主要評価項目が欠測の場合は プラセボ群では 寛解あり Vedolizumab 群では 寛解なし として取扱う LOCF analysis Multiple imputation PROC MI を用いて補完回数を 10 回として実施 27
C13007(CD 維持療法期 ) 感度分析 28
C13007(CD 維持療法期 ) 感度分析 Reviewer による結果の解釈 52 週時点における欠測データの数が投与群間で異なっており missing at random の仮定は適切でない可能性が考えられることから multiple imputation による解析結果は過大推定している傾向があるかもしれない 52 週時点においてプラセボ群では58% Vedolizumab Q8W 群では53% Vedolizumab Q4W 群では47% のデータが欠測であり 得られた群間差は信頼できる結果ではないかもしれない 欠測データの割合はCDを対象とした同様のデザインの他試験と同様ではあるが 欠測データが多いことにより試験結果の解釈を困難としている 29
C13007(CD 維持療法期 ) FDA の statistical team leader の見解 申請者の主解析は正当化される 本試験での試験中止割合は他試験から想定される試験中止割合と同程度 試験中止理由のほとんどは有効性の欠如又は有害事象 投与群間で欠測データの割合が同程度の場合 欠測データを 寛解なし として取扱うことによって治療効果を過大推定することはない FDAの要求により主解析とは異なる補完方法を用いて感度分析を実施した結果 すべての解析においてプラセボ群と比較してVedolizumab 群で良好な結果であった 30
C13007(CD 維持療法期 ) 結論 維持療法期の主要評価項目について プラセボと比較して Vedolizumab の統計的に有意なベネフィットが示された 31
C13007 試験 (CD) C13006 試験 (UC) 32
C13006(UC 維持療法期 ) 試験デザイン 青字 :C13007 試験 (CD) と異なる部分 目的 : 中等症又は重症の UC 患者に対する Vedolizumab の維持療法における有効性及び安全性を検討する 対象 : 中等症又は重症の UC 患者で Vedolizumab を投与され導入療法期の 6 週時点において改善が見られた被験者 主要評価項目 : 52 週時点での寛解割合 完全 Mayo スコアが 2 以下でかつすべてのサブスコアが 1 以下のときに寛解と定義 投与群 : プラセボ群 Vedolizumab Q4W 群 Q8W 群 主解析 :CMH カイ 2 乗検定 (Vedolizumab Q4W vs placebo, Vedolizumab Q8W vs placebo) 試験中止例は 寛解なし として取扱った 33
C13006(UC) フローチャート 導入療法期 維持療法期 34
C13006(UC) フローチャート 維持療法期における主解析の対象集団 35
C13006(UC 維持療法期 ) 被験者の内訳 プラセボ群 Vedolizumab Q8W 群 Vedolizumab Q4W 群 無作為化例数 126 122 125 試験中止例数 (%) 78 (62) 45 (37) 41 (33) 有害事象 15 (12) 7 (6) 6 (5) 試験実施計画書からの逸脱 0 0 0 有効性の欠如 61 (48) 31 (25) 33 (26) 依頼者による試験の中止 0 0 0 同意撤回 2 (2) 5 (4) 2 (2) 追跡不能 0 2 (2) 0 その他 0 0 0 36
C13006(UC 維持療法期 ) 主解析 プラセボ群 (N=126) Vedolizumab Q8W 群 (N=122) Vedolizumab Q4W 群 (N=125) 寛解した被験者数 (%) 20 (15.9) 51 (41.8) 56 (44.8) 両側 95% 信頼区間 [9.5, 22.3] [33.1, 50.6] [36.1, 53.5] プラセボ群との寛解割合の差 26.1 29.1 両側 95% 信頼区間 [14.9, 37.2] [17.9, 40.4] p 値 * <0.0001 <0.0001 * 経口コルチコステロイドの併用の有無 抗 TNFα 抗体による治療歴及び / 又は免疫調節薬の併用の有無 及び導入療法期におけるコホート ( コホート 1: 二重盲検下でプラセボ又は Vedolizumab を投与 コホート 2: 非盲検下で Vedolizumab を投与 ) を層別因子とした CMH カイ 2 乗検定 37
C13006(UC 維持療法期 ) 感度分析 欠測データに対処するため FDA からの要求に従って以下の感度分析を実施した Observed case( この試験では complete case と一致 ) 主要評価項目が欠測の場合は解析から当該被験者を除外 Worst case 1 主要評価項目が欠測の場合は 寛解なし として取扱う ( 主解析と同様の補完方法 ) 2 主要評価項目が欠測の場合は プラセボ群では 寛解あり Vedolizumab 群では 寛解なし として取扱う LOCF analysis Multiple imputation PROC MI を用いて補完回数を 10 回として実施 38
C13006(UC 維持療法期 ) 感度分析 a: 日誌データの取扱いに関する感度分析 c:worst case 2 の結果 39
C13006(UC 維持療法期 ) 感度分析 Reviewer による結果の解釈 感度分析の結果 worst case➁ 以外においてはプラセボ群と比較して Vedolizumab 群で良好な結果であった 52 週時点において プラセボ群で 60% 以上 Vedolizumab 群で 30% 以上が欠測しており 主解析では欠測データは 寛解なし として補完しているため 得られた群間差が過大推定されている可能性はあるが 試験中止理由の多くは有効性の欠如又は有害事象であった 40
C13006(UC 維持療法期 ) FDA の statistical team leader の見解 申請者の主解析は擁護可能 Reviewerが指摘する通り 52 週時点において プラセボ群で60% 以上 Vedolizumab 群で30% 以上が欠測しており 欠測データは 寛解なし として補完しているため 得られた群間差が過大推定されている可能性はある しかし 試験中止理由の多くは有効性の欠如又は有害事象 本試験での試験中止割合は他試験から想定される試験中止割合と同程度 FDAの要求により主解析とは異なる補完方法を用いて感度分析を実施した結果 すべての解析においてプラセボ群と比較してVedolizumab 群で良好な結果であった 41
C13006(UC 維持療法期 ) 結論 維持療法期の主要評価項目について プラセボと比較して Vedolizumab の統計的に有意なベネフィットが示された 42
Estimand と感度分析 C13006 試験 C13007 試験の estimand 及び感度分析について ( 第 3 回 DSRT のディスカッション結果より ) Estimandは何か Estimand 3ではない? Estimand 5? or Estimand 6? 各感度分析の位置づけ Observed case analysisやmultiple imputationは supportive analysisに分類されるのでは? 43
参考文献 Label http://www.accessdata.fda.gov/drugsatfda_docs/label/ 2014/125476s000lbl.pdf Statistical Review http://www.accessdata.fda.gov/drugsatfda_docs/nda/2 014/125476Orig1s000StatR.pdf 44