Microsoft PowerPoint - R-survival.ppt

Similar documents
Microsoft PowerPoint - R-stat-intro_13.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

Chapter 1 Epidemiological Terminology

青焼 1章[15-52].indd

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

統計的データ解析

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

講義「○○○○」

様々なミクロ計量モデル†

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

Microsoft Word - Stattext12.doc

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

PowerPoint プレゼンテーション

スライド 1

Microsoft Word - å“Ÿåłžå¸°173.docx

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

解析センターを知っていただく キャンペーン

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

PowerPoint プレゼンテーション

Medical3

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

MedicalStatisticsForAll.indd

スライド 1

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

Microsoft Word - apstattext04.docx

Microsoft PowerPoint 古川杉本SASWEB用プレゼン.ppt

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - 資料04 重回帰分析.ppt

ビジネス統計 統計基礎とエクセル分析 正誤表

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

経済統計分析1 イントロダクション

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

症例報告書の記入における注意点 1 必須ではない項目 データ 斜線を引くこと 未取得 / 未測定の項目 2 血圧平均値 小数点以下は切り捨てとする 3 治験薬服薬状況 前回来院 今回来院までの服薬状況を記載する服薬無しの場合は 1 日投与量を 0 錠 とし 0 錠となった日付を特定すること < 演習

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

<4D F736F F D2091E63489F190B691B68E9E8AD489F090CD2E646F6378>

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

スライド 1

データ科学2.pptx

カイ二乗フィット検定、パラメータの誤差

EBNと疫学

スライド 1

8 A B B B B B B B B B 175

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

ベイズ統計入門

PHREG プロシジャにおける 共変量調整解析に関連したオプション機能 魚住龍史 1 * 矢田真城 2 浜田知久馬 3 1 京都大学大学院医学研究科医学統計生物情報学 2 エイツーヘルスケア株式会社 3 東京理科大学 Investigating fascinating aspects associa

基礎統計

10 年相対生存率 全患者 相対生存率 (%) (Period 法 ) Key Point 1

Microsoft PowerPoint - SASユーザ総会2016_MRCT_送付用.pptx

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

Microsoft Word - 保健医療統計学112817完成版.docx

生存確認調査ツール

因子分析

Medical3

Microsoft Word - 補論3.2

JUSE-StatWorks/V5 活用ガイドブック

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

モジュール1のまとめ

Microsoft PowerPoint - stat-2014-[9] pptx

モニタリング計画書・報告書

OpRisk VaR3.2 Presentation

Microsoft PowerPoint - statistics pptx

10 年相対生存率 全患者 相対生存率 (%) (Period 法 ) Key Point 1 10 年相対生存率に明らかな男女差は見られない わずかではあ

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - åł€æžœæ”¨è«Œã†®å�ºç¤”(çfl°æ€Š)final

Microsoft Word - BMDS_guidance pdf_final

ータについては Table 3 に示した 両製剤とも投与後血漿中ロスバスタチン濃度が上昇し 試験製剤で 4.7±.7 時間 標準製剤で 4.6±1. 時間に Tmaxに達した また Cmaxは試験製剤で 6.3±3.13 標準製剤で 6.8±2.49 であった AUCt は試験製剤で 62.24±2

2. FileZilla のインストール 2.1. ダウンロード 次の URL に接続し 最新版の FileZilla をダウンロードします URL: なお バージョンが異なるとファイル名が

<4D F736F F F696E74202D204D C982E682E892B290AE82B582BD838A E8DB782CC904D978A8BE68AD482C98AD682B782E988EA8D6C8E402E >

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

連載 第 5 回 医学データの統計解析の基本 生存時間データの解析 Fundamentals of statistical analysis in biomedical research:analysis of survival data 朝倉こう子 * * 濱﨑俊光 1 生物学や医学分野において

Microsoft PowerPoint - データ解析基礎2.ppt

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

Transcription:

統計解析フリーソフト R 入門 R による生存時間解析

本日のメニュー R のインストール R による生存時間解析 イントロ 生存関数の推定と群間比較 競合リスクについて その他 2

R のインストール 実行ファイル R-2.6.0pat-win32.exe をダブルクリック http://cran.md.tsukuba.ac.jp/bin/windows/base/r-2.6.0pat-win32.exe 3

R のインストール インストールする場所を指定 ( 普通は何もせずに 次へ ) インストールするファイルを選択 ( 全てチェックして 次へ ) 4

R のインストール カスタマイズしますか? ( 普通は何もせずに 次へ ) スタートメニューへの登録画面 ( 普通は何もせずに 次へ ) 5

R のインストール その他諸々 ( 普通は何もせずに 次へ ) しばらくするとインストール完了! 6

R のインストール Rconsole Rdevga Rprofile.site http://cwoweb2.bai.ne.jp/~jgb11101/files/rconsole http://cwoweb2.bai.ne.jp/~jgb11101/files/rdevga http://cwoweb2.bai.ne.jp/~jgb11101/files/rprofile.site をダウロードして,[C: Program Files R R-2.6.0pat etc] にある同名ファイルに上書き 文字化け防止策!! 以上 7

本日のメニュー R のインストール R による生存時間解析 イントロ 生存関数の推定と群間比較 競合リスクについて その他 8

生存時間解析とは ある時点から注目すべき事象 ( イベント ) が起きるまでの時間を解析する分析手法のこと 注目すべき事象 : イベントと呼ぶ 当初は 治療開始から死亡するまでの時間 を対象としていたのでこの名称 死亡 以外の事象をイベントとしても良い! イベントの例 医学分野 : 死亡までの時間 ( 対象 : ガン患者 ) 肺ガンになるまでの時間 ( 対象 : 喫煙者 ) 副作用が出るまでの時間 ( 対象 : 治験参加者 ) 工学分野 : 故障するまでの時間 ( 対象 : 機械, システムなど ) 9

生存時間解析とは イベントが起こるまでの時間 を解析する ID 群 イベント 期間 ( 日 ) 01-001 非喫煙 あり 800 01-002 非喫煙 なし 1000 02-001 喫煙 あり 400 02-001 喫煙 なし 600 02-002 喫煙 あり 100 02-003 非喫煙 あり 600 イベントが起こったかどうか だけでなく いつ起こったか も考えなきゃいけないのが厄介な点 10

生存時間解析とは イベントが起こるまでの時間 を解析する イベントが起こったかどうか だけでなく いつ起こったか も考えなきゃいけないのが厄介な点 仮想例 喫煙 肺ガンについての研究 非との 2 群比較 肺ガン発症までの期間 を解析する 肺ガン発症例の数 だけを比較してはダメ 肺ガン発症までの期間 だけを比較してはダメ 11

生存時間解析とは ID 群 イベント 01-001 非喫煙 あり あり なし 01-002 02-001 02-001 非喫煙喫煙喫煙 なしありなし 非 50 100 850 800 02-002 喫煙 あり 02-003 03-001 04-001 04-002 非喫煙非喫煙喫煙喫煙 ありなしなしあり χ 2 検定頻度だけで見ると問題がある! 12

生存時間解析とは 開始日 200 日 400 日 600 日 800 日 1000 日 非喫煙非喫煙喫煙喫煙 01-001 01-002 02-001 02-002 発症 中止 脱落 発症 試験終了 800 日目で発症 400 日目で発症 イベントが起こるまでの期間 を無視しているのが問題 非の方が発症を抑える傾向があるかも の方が早めに発症する傾向があるかも でも 発症頻度で見たら同じ イベントが起こるまでの期間 も解析に入れる必要あり! 13

生存時間解析とは ID 群 期間 ( 日 ) 01-001 非喫煙 800 平均期間 ± 標準偏差 01-002 02-001 02-001 非喫煙喫煙喫煙 1000 400 600 非 400 日 ±200 日 200 日 ±100 日 02-002 喫煙 100 02-003 03-001 04-001 04-002 非喫煙非喫煙喫煙喫煙 600 1000 200 600 2 標本 検定期間だけで見ると問題がある! 14

生存時間解析とは 開始日 200 日 400 日 600 日 800 日 1000 日 非喫煙非喫煙 02-003 03-001 発症 試験終了 喫煙喫煙 04-001 04-002 中止 脱落 発症 平均 600 日目で発症 ( 試験終了例を除く ) 平均 600 日目で発症 ( 中止 脱落例を除く ) 試験終了例 中止 脱落例 を無視しているのが問題 のような症例を 打ち切り例 といいますが 非の試験終了例は 体の調子が良かったから最後まで発症しなかった? の中止例は 体調が悪くなったから中止したのかも でも 打ち切り例 を除いて解析をしたら平均発症日数は同じ 打ち切り例 の情報も解析に入れる必要あり! 15

生存時間解析とは イベントが起こるまでの時間 を解析する場合は イベントが起こったかどうか と いつ起こったか の両方を考えなきゃいけない ID 群 イベント 期間 ( 日 ) 01-001 非喫煙 あり 800 01-002 非喫煙 なし 1000 02-001 喫煙 あり 400 02-001 02-002 02-003 03-001 04-001 04-002 喫煙喫煙非喫煙非喫煙喫煙喫煙 なしありありなしなしあり 600 100 600 1000 200 600 16

いくつかの注意点 ID 01-001 群非喫煙 イベントあり 期間 ( 日 ) 800 発現日 - 開始日または打切日 - 開始日 01-002 非喫煙 なし 1000 必要な変数 : イベント/ 打ち切りを表す変数 イベント / 打ち切りまでの日数 の 2 つ 開始日 : ランダム化された日 を持ってくるのが原則( 治験薬投与開始日 ) ランダム化を行わない場合は 1 回目の来院日 とか 手術日 など 工学分野ならば 機械を稼動した日 とか システムを起動した日 など イベント発現日 ( イベント発現例の場合 ): イベントが発現した日 開始日 にイベントが起こった症例は解析対象から除くのが通例 ( 打ち切りも同様 ) 打ち切り日 ( 打ち切り例の場合 ): イベントが起こりうる最後の日 医学分野の場合, 試験途中での中止例ならば 中止した日 医学分野の場合, 試験期間を満了した症例の打ち切り日を 治験薬投与終了日 とすると不適切な場合あり! 例えば 全ての検査日のうち 一番遅い日付 とか イベント発現 と 中止 の両方が起こっている場合は起こった日付が早い方とする Aさん : 100 日目にイベント ( でも治験は継続 ) 200 日目に中止 Aさんはイベント例として取り扱われる イベントに関する検査が一度も行われていない症例は解析対象から落とす 17

注意点に対していただいたコメント ID 01-001 群非喫煙 イベントあり 期間 ( 日 ) 800 発現日 - 開始日または打切日 - 開始日 01-002 非喫煙 なし 1000 開始日 : ランダム化された日 を持ってくるのが原則 ( 治験薬投与開始日 ) 例えば 心臓移植の生存時間に対する影響を調査する場合 ランダム化 された日から 手術日 まで時間が空いている場合 ( ドナーが現れるまで待っている場合等 ) は ランダム化された日 を持ってくるのが適切でないかもしれない こういう場合は 時間依存型共変量 で対処する?( 大橋 浜田 1995 160 頁 ) イベント発現日 ( イベント発現例の場合 ): イベントが発現した日 開始日 にイベントが起こった症例は解析対象から除くのが通例 ( 打ち切りも同様 ) 開始日 にイベントが起こった症例は解析対象から除くとバイアスがかかることもるのでは?? 気になる場合は 除いた場合 と 除かない場合 の 2 通り解析?? イベント発現日 ( イベント発現例の場合 ): イベントが発現した日 肺ガン発症 と診断された日は 実はもっと前に発症している ( タイムラグあり ) 副作用が出た と病院で診断されても 実はもっと前に発症しているかも 区間データとして解析した方が良い場合もある??( 大橋 浜田 1995 ) 18

本日のメニュー R のインストール R による生存時間解析 イントロ 生存関数の推定と群間比較 競合リスクについて その他 19

生存時間解析を行う前提 & 手順 イベントが起こるまでの時間 が正規分布に従わないことが多い 全ての対象について, イベントが起こるまで ( 例えば全症例が死亡するまで ) 待つ時間の余裕はない 打ち切り を考慮に入れて解析する必要がある 生存時間解析を行うひとつの手順 生存関数 / 生存時間曲線を推定する Kaplan-Meire 推定法を用いる 群間比較試験の場合は生存時間曲線を群間比較する 調整解析 / 交互作用の有無の検討などを行う 20

生存関数の推定 累積分布関数 = 累積発現率 21

生存関数の推定 一般的に, 生存関数の推定は安定しているが, ハザード関数の推定は確率的な誤差の影響を受けやすい 以降は生存関数の推定について見てみることにする 22

生存関数の推定 ( ノンパラメトリックな推定 ) n j : 時刻 t j までの at risk d j : 時刻 t j で起こったイベント数 ( イベントと打ち切りが同時刻に起こった場合は イベントが起こった直後に打ち切りが起こったと考える ) : 時刻 t の直前までの生存率の推定値 Kaplan-Meier 推定法による計算 23

喫煙者に関する肺ガン移行データ ( 仮想例 ) 喫煙者は肺ガンへの移行率が高いかどうか を研究する 18 人の被験者を 非 と に分ける それぞれの被験者の最終状態は 肺ガンへの移行 : イベント 試験中止 : 打ち切り ( 転居, 同意撤回, 被験者都合による脱落等 ) 心疾患による死亡 ( 競合リスク ): とりあえず打ち切りとする 高血圧 や 高脂血症 を持っている喫煙者については, 心疾患による死亡のリスクが高いことが知られている 24

25 喫煙者に関する肺ガン移行データ ( 仮想例 ) 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日

生存関数の推定 (Kaplan-Meier 推定法 ) 日 100 200 300 400 500 600 700 800 900 censor イベント中止イベント心疾患イベント心疾患心疾患心疾患中止 群非非非非非非非非非 非 に割り付けられた 9 名のデータを抽出 26

27 生存関数の推定 (Kaplan-Meier 推定法 ) 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日非打ち切り 900 非打ち切り 800 非打ち切り 700 非打ち切り 600 非イベント 500 非打ち切り 400 非イベント 300 非打ち切り 200 非イベント 100 群 censor 日 中止 と 心疾患による死亡 を 打ち切り として解析すると

生存関数の推定 (Kaplan-Meier 推定法 ) ( 心 ) ( 心 ) ( 心 ) ( 心 ) at risk: 直前までに生き残っている人の数 28

生存関数の推定 (Kaplan-Meier 推定法 ) ( 心 ) ( 心 ) ( 心 ) ( 心 ) 打ち切りは生存関数に直接影響するのではなくてリスク数 (at risk) を減らすことで影響を及ぼす 29

生存関数の推定 (Kaplan-Meier 推定法 ) ( 心 ) ( 心 ) ( 心 ) ( 心 ) もし, イベントと打ち切りが同時刻に起こった場合はイベント発現の直後に打ち切りが起こったことにする 30

生存関数の推定 (Kaplan-Meier 推定法 ) ( 心 ) ( 心 ) ( 心 ) ( 心 ) 心疾患による死亡を 打ち切り とする ( 問題!) 31

生存関数の推定 (Kaplan-Meier 推定法 ) ( 心 ) ( 心 ) ( 心 ) ( 心 ) ( 以下同様に続く...) 32

生存時間曲線のプロット 生存率累積発症率 非 非 33

R によるコーディング (1) データの作成 34

R によるコーディング (2) データの作成 35

R によるコーディング (3) 生存関数の推定 36

R によるコーディング ( 参考 ) 37

ログランク検定 (logrank 検定 ; 群間比較の手法 ) 2 本の生存曲線を比較する検定手法 比例ハザード性 ( 任意の時点において群間のハザード比が一定 ) の下で 2 つの効果に差があるかどうかを検定する 帰無仮説 : 生存曲線に差がない 対立仮説 : 生存曲線に差がある ログランク検定は比例ハザード性からの逸脱にかなり頑健 ( ロバスト ) であるが, 多少の注意は必要 Kaplan-Meier 曲線が交差していれば, 明らかに比例ハザード性が成り立っていない 38

ログランク検定 群 1 の時刻 i の期待イベント数 群 1 の合計スコア 分散 検定統計量 ( 自由度 1 の χ 2 分布 ) n i : 時刻 i におけるリスク集合 (at risk 数 ) n i1 : 群 1 の時刻 i におけるリスク集合 (at risk 数 ) d i : 時刻 i におけるイベント数の合計 d i1 : 群 1 の時刻 i におけるイベント数の合計 39

日 censor 100 イベント 200 中止 300 イベント 400 心疾患 500 イベント 600 心疾患 700 心疾患 800 心疾患 900 中止 U1=(1-9/18) 群 非 非 非 非 非 非 非 非 日 100 200 300 400 500 600 700 800 censor 心疾患 イベント イベント 中止 心疾患 イベント 心疾患 イベント 非 900 中止 X 日時点の at risk 数 :X 日に起こったイベント数や打ち切り数を除いてはダメ!!! 群 非の at risk 数 / 全体の at risk 数 非のイベント数 40

日 censor 群 日 censor 群 100 イベント 非 100 心疾患 200 中止 非 200 イベント 300 イベント 非 300 イベント 400 心疾患 非 400 中止 500 イベント 非 500 心疾患 600 心疾患 非 600 イベント 700 心疾患 非 700 心疾患 800 心疾患 非 800 イベント 900 中止 非 900 中止 U1=(1-9/18)+(0-8/16) 非の at risk 数 / 全体の at risk 数 非のイベント数 41

42 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 U1=(1-9/18)+(0-8/16)+(1-2*7/14) 同一時点で 2 回以上イベントが起こっているときは注意

43 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 U1=(1-9/18)+(0-8/16)+(1-2*7/14)+(1-5/10)

44 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 U1=(1-9/18)+(0-8/16)+(1-2*7/14)+(1-5/10)+(0-4/8)

45 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 U1=(1-9/18)+(0-8/16)+(1-2*7/14)+(1-5/10)+(0-4/8)+(0-2/4) =-0.5

日 censor 群 日 censor 群 100 イベント 非 100 心疾患 200 中止 非 200 イベント 300 イベント 非 300 イベント 400 心疾患 非 400 中止 500 イベント 非 500 心疾患 600 心疾患 非 600 イベント 700 心疾患 非 700 心疾患 800 心疾患 非 800 イベント 900 中止 非 900 中止 V= (9*9)/18^2 全体の at risk 数の 2 乗 の at risk 数 非の at risk 数 46

日 censor 群 日 censor 群 100 イベント 非 100 心疾患 200 中止 非 200 イベント 300 イベント 非 300 イベント 400 心疾患 非 400 中止 500 イベント 非 500 心疾患 600 心疾患 非 600 イベント 700 心疾患 非 700 心疾患 800 心疾患 非 800 イベント 900 中止 非 900 中止 V= (9*9)/18^2+(8*8)/16^2 全体の at risk 数の 2 乗 の at risk 数 非の at risk 数 47

48 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 V= (9*9)/18^2+(8*8)/16^2+(7*7*2*(14-2))/(13*14^2) 同一時点で 2 回以上イベントが起こっているときは注意

49 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 V= (9*9)/18^2+(8*8)/16^2+(7*7*2*(14-2))/(13*14^2) +(5*5)/10^2

50 非中止 900 非心疾患 800 非心疾患 700 非心疾患 600 非イベント 500 非心疾患 400 非イベント 300 非中止 200 非イベント 100 群 censor 日中止 900 イベント 800 心疾患 700 イベント 600 心疾患 500 中止 400 イベント 300 イベント 200 心疾患 100 群 censor 日 V= (9*9)/18^2+(8*8)/16^2+(7*7*2*(14-2))/(13*14^2) +(5*5)/10^2+(4*4)/8^2

日 censor 群 日 censor 群 100 イベント 非 100 心疾患 200 中止 非 200 イベント 300 イベント 非 300 イベント 400 心疾患 非 400 中止 500 イベント 非 500 心疾患 600 心疾患 非 600 イベント 700 心疾患 非 700 心疾患 800 心疾患 非 800 イベント 900 中止 非 900 中止 V= (9*9)/18^2+(8*8)/16^2+(7*7*2*(14-2))/(13*14^2) +(5*5)/10^2+(4*4)/8^2+(2*2)/4^2 =1.71 χ 2 = (-0.5) 2 /1.71 = 0.146 p = 0.2976 51

R によるコーディング ( ログランク検定 ) 52

本日のメニュー R のインストール R による生存時間解析 イントロ 生存関数の推定と群間比較 競合リスクについて その他 53

一見すると良いように見えるけど 肺ガンの発症 をイベントとした場合の 肺ガン発症率 ( 日 ) 54

それぞれ別々に発生率を推定すると 肺ガンの発症 心疾患による死亡 をそれぞれイベントとして別々にイベント発生率を推定するとおかしな現象が起きる ( 取りうる状態は 肺ガン 心疾患 打ち切り しかない ) 肺ガンの発症 をイベントとした場合の ガン発症率 心疾患による死亡 をイベントとした場合の 死亡率 肺ガン発症率 + 死亡率 が 1 を超えている 55

前頁のグラフを描く R プログラム 56

競合リスクとは? 複数のイベント ( 現象 ) において ある特定のイベントが 観測されると 他のイベントは観測できない場合がある このようなイベント同士の関係 = 競合リスクイベント 例 喫煙者について 肺ガンの発症 と 心疾患による死亡 は競合リスク 肺ガンを発症 した症例においては 心疾患による死亡 は起こらない 心疾患による死亡 をした症例においては 肺ガンの発症 は起こらない 57

競合リスクとは? 競合リスク間の独立性は データからは確認することが出来ない 競合リスクが存在する場合 Kaplan-Meier 推定量にはバイアスが入ることが知られている 競合リスクを打ち切りと扱うと推定が過大推定になる たとえ独立性を仮定したとしても 解析結果の解釈には問題が生じる 打ち切り : 打ち切りがあったかどうかがその後のイベント の生起に影響を及ぼさない ( 情報を持たない ) のが条件 58

競合リスクとは? 肺ガンの発症 と 心疾患による死亡 との間の独立性は データからは確認することが出来ない 肺ガンの発症 をイベントとした場合で 心疾患による死亡 という競合リスクが存在する場合は 心疾患による死亡 を打ち切りとして扱ってしまうことで Kaplan-Meier 推定量にバイアスが入ってしまう 肺ガン と 心疾患 の例では推定が過大になっていた たとえ 肺ガンの発症 と 心疾患による死亡 との間の独立性を仮定したとしても イベントに関する解析結果の解釈には問題が生じる 59

JCOG( 日本臨床腫瘍研究グループ )Protocol マニュアルより引用 これまでの研究では 以下の概念が用いられてきた Cause-specific survival: 他病死 を死亡日で打ち切りとする生存期間 Progression-free survival: 血液腫瘍の領域で 他病死 を打ちきりとする local control rate: 放射線治療で遠隔転移を打ち切りとする局所制御率 しかし 他病死 であると言っても その死亡が原病であるがんや治療の毒性による影響を完全に否定できる場合はむしろ稀であり 多くの場合 原病または治療の毒性により全身状態が悪化した後に直接死因として他病死が生じることの方が多い 60

JCOG( 日本臨床腫瘍研究グループ )Protocol マニュアルより引用 統計的に 打ち切り と扱ってもバイアスを生じないとされているのは 打ち切りがイベントと無関係に生じた場合のみであり そうでない場合 ( 何らかの関連を持っている場合 ) にはバイアスの原因となるため 打ち切りとすることは望ましくない これを統計的には競合リスク (competing risk) の問題と呼ぶ 競合リスク (competing risk) の問題が起きる例 無再発生存期間 (DFS) で 二次がん を打ち切りとする 再発までの期間 (TTF) で 患者拒否 を打ち切りとする 61

競合リスクを考慮した累積発現率の計算 問題点は 情報を持つ打ち切り である競合リスクを 情報を持たない打ち切り として扱った点 1 つの打開策は イベントごとの累積発生関数 (Cumulative Incidence Function:CIF) を算出し 生存関数を求める方法 62

競合リスクを考慮した累積発現率の計算 イベントごとの累積発現率 ( 累積発生関数 ;Cumulative Incidence Function:CIF) を以下の式で推定する t ij : j 番目の 原因 i のイベント が発現した時刻 d ij : 時刻 t ij で 原因 i のイベント を発現した被験者数 n ij : 時刻 t ij の at risk 数 : 時刻 t ij の直前までの生存率 ( どのイベントも発現しない率 ) の推定値 ;Event Free Survival 63

生存関数の推定 (CIF による推定 ) 肺ガン発症率 心疾患による死亡率 イベントの累積発現率 ( 肺ガンの累積発症率 ) 64

生存関数の推定 (CIF による推定 ) 肺ガン発症率 心疾患による死亡率 イベントの累積発現率 ( 肺ガンの累積発症率 ) 65

生存関数の推定 (CIF による推定 ) 肺ガン発症率 心疾患による死亡率 イベントの累積発現率 ( 肺ガンの累積発症率 ) 66

生存関数の推定 (CIF による推定 ) 肺ガン発症率 心疾患による死亡率 イベントの累積発現率 ( 肺ガンの累積発症率 ) 心疾患による死亡を 競合 risk の発現率 に計上する! 67

生存関数の推定 (CIF による推定 ) 肺ガン発症率 心疾患による死亡率 ここがミソ! ここがミソ! 競合リスクが発現した場合に 1 リスク集合から競合リスク数を減らしている 2 競合リスクの累積発現率にちゃんと計上していることでバイアスを補正している!!! 68

生存関数の推定 (CIF による推定 ) 肺ガン発症率 心疾患による死亡率 イベントの累積発現率 ( 肺ガンの累積発症率 ) ( 以下同様に続く...) 69

上 CIF 下 Kaplan-Meier 競合リスクの扱いで over-estimate が修正されている 70

各 CIF のプロット 肺ガンの発症 をイベントとした場合の ガン発症率 心疾患による死亡 をイベントとした場合の 死亡率 肺ガン発症率 + 死亡率 が 1 を超えない 71

前頁のグラフを描く R プログラム (1) 72

CIF の比較を行う R プログラム (2) Fine and Gray の方法による群間比較 関数 crr の引数 :failcode=1; 興味のあるイベント 関数 crr の引数 :cencode=0; 打ち切り Fine JP and Gray RJ (1999) A proportional hazards model for the subdistribution of a competing risk. JASA 94:496-509. 関数 crr: 共変量は 群 か 群 + 時間依存型共変量 の 2 通りのみ 73

CIF の比較を行う R プログラム ( 結果 ) 興味のあるイベント : 肺ガン移行 74

本日のメニュー R のインストール R による生存時間解析 イントロ 生存関数の推定と群間比較 競合リスクについて その他 75

その他 ( 時間がないのでざっくりと ) Cox 回帰 : 共変量を複数入れて解析 ; 関数 coxph() を使用 比例ハザード性を仮定する 同時刻に複数のイベントが発生したときのパラメータ推定法 : method="exact","efron"," bleslow" ( 左から順に良い方法 ) ある変数の値によってベースラインハザードが異なる場合 : stara( 変数名 ) を共変数に加える ( 例 :strata(sex)) 機能的には時間依存型共変量を入れることも可 ( 解釈困難になる場合も...) 比例ハザード性の検討 :2 重対数プロット 関数 survfit() の結果を使って plot(, fun="cloglog") 視覚的に見て曲線が平行ならば比例ハザード性が成り立っている 76

その他 ( 時間がないのでざっくりと ) 多重イベントのモデリング Anderson and Gill モデル (AG モデル ): イベントが発生してもリスク集合に残る Prentice, Williams and Peterson モデル (PWPモデル): あらかじめ複数のステップを想定し, イベントが発生したら次のステップに移行する 初期状態 1 2 Wei, Lin and Weissfeld モデル (WLWモデル): 競合リスクモデル 上記モデル全て関数 coxph() で実行可能 (The R Book 参照 ) パラメトリックモデル 加速モデル 今までの解析データは全て 生存関数は指数分布を仮定 生存関数に特定の分布を仮定するときは加速モデルを用いる 関数 survreg() で実行可能 (dist="weibull", "exponential", "loglogistic", "lognormal") 77

実行例 (1) 78

実行例 (2) 79

実行例 (2) 比例ハザード性の検討結果 80

本日のメニュー R のインストール R による生存時間解析 イントロ 生存関数の推定と群間比較 競合リスクについて その他 81

参考文献 生存時間解析 ( 大橋, 浜田, 1995, 東京大学出版会 ) はじめて学ぶ医療統計学 ( 折笠秀樹翻訳, 2003, 総合医学社 ) 学会 論文発表のための統計学 ( 浜田知久馬, 1999, 真興交易医書出版部 ) The R Book 第 14 章 ( 外山信夫, 岡田昌史篇, 2004, 九天社 ) R による保健医療データ解析演習 ( 中澤港, 2007) http://phi.med.gunma-u.ac.jp/msb/medstatbook.pdf Rによるデータサイエンス ( 金明哲, 2007, 森北出版 ) JCOG ( 日本臨床腫瘍研究グループ ) Protocol マニュアル Competing Risks: A Practical Perspective (Melania Pintilie, 2006, John Wiley & Sons) Cumulative Incidence in Competing Risks Data and Competing Risks Regression Analysis (Haesook T. Kim, Clin Cancer Res 2007;13(2)) The cmprsk Package manual (Bob Gray, 2006) The survival Package manual (Thomas Lumley, 2007) 82

統計解析フリーソフト R 入門 R による生存時間解析 終