JMP によるオッズ比リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比リスク比それぞれに対する信頼区間を求める算出方法と注意点を述べたものですこの後

JMP によるオッズ比リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比リスク比それぞれに対する信頼区間を求める算出方法と注意点を述べたものですこの後の 2 章では JMP でのオッズ比オッズ比の信頼区間の算出方法についてサンプルデータを用いて解説しております 3 章ではリスク比 ( ハザード比 ) リスク比の信頼区間の算出方法についてサンプルデータを用いて解説しております 4 章では名義尺度を使用して JMP でオッズ比リスク比を算出することについての注意点が記されており 5 章では 4 章に対する理論的な背景を説明しておりますとりあえずオッズ比リスク比それぞれに対する信頼区間を算出したいという目的であれば 2 章 ( オッズ比 ) 3 章 ( リスク比 ) のみご一読いただくことで十分です尚本文書の 2 章以降で示している図は JMP 7 での出力になります 2. オッズ比とその信頼区間の算出方法この章ではサンプルデータを用いて JMP でのオッズ比その信頼区間の算出方法をご説明します使用するサンプルデータデータファイル: odds1.jmp 出典:SAS/STAT LOGISTIC Procedure Example 42.2 のデータから一部の変数を抜粋変数の詳細変数名 ( 列名 ) 尺度詳細 Pain 名義目的変数アウトカム (No, Yes) Treatment 名義治療法 (A, B, P) Age 連続調整因子 Duration 連続調整因子データテーブル( 一部 ) 分析内容データファイル odds1.jmp を用いて疾患 (Pain) の発生 (Yes) に対し Age Duration を調整因子として治療法 P に対する治療法 A( カテゴリ P A に変化 ) のオッズ比治療法 P に対する治療法 B( カテゴリ P B に変化 ) のオッズ比を算出する 1

例えば治療法 P はプラセボを投与治療法 A はアウトカムとなる疾患に効果があると思われる薬剤を 10mg 投与治療法 B は治療法 A と同様の薬剤を 20mg 投与したとしますこのときのプラセボに対する治療薬 A のオッズ比プラセボに対する治療薬 B のオッズ比を求めると考えることができます分析のステップ Step 0: Y( 目的変数 ) のカテゴリの順序を確認 Step 1: カテゴリの説明変数に対しダミー変数の作成 Step 2: モデルのあてはめを実行適切なモデルの指定 Step 3: オプションを指定しオッズ比とその信頼区間を表示以下このステップに沿って JMP の操作をご説明します Step 0: Y( 目的変数 ) のカテゴリの順序を確認名義尺度に指定した変数にはカテゴリに順番があります順番を確認するには該当の列を選択 ( 青く反転 ) しメニューから [ 列 ] > [ 値のチェック ] > [ リストチェック ] を選択します図 2.1 はリストチェックの画面ですがカテゴリの順番は No, Yes の順ですこれでは最初のカテゴリである No すなわち疾患がないという事象のオッズ比を求めることになります目的は疾患があるという事象のオッズ比を求めることなのでリストの順番を変更します図 2.1 リストチェックのウィンドウ : No, Yes の順番になっているリストチェックのウィンドウで No をクリックし [ 下に移動 ] ボタンを押すことによって順番を変更することができます順番を変更するとデータテーブルの列名の後ろの下向きの矢印マークが追加されます ( 図 2.2) 図 2.2 リストチェックのウィンドウ : Yes, No の順番に変更順番を変更すると列名の右側に矢印が表示される 2

Step 1: カテゴリの説明変数に対しダミー変数の作成ロジスティック回帰を行う際説明変数 Treatment は名義尺度のためこれをダミー変数に変換しますここでのダミー変数とは名義尺度の変数を条件ごとに 0 または 1 の 2 値に変換した変数のことで Treatment の各カテゴリに対し 3 つのダミー変数を表 2.1 のルールで作成しますダミー変数ルール Treatment(A) Treatment の値が"A" であれば 1 そうでなければ 0 Treatment(B) Treatment の値が"B" であれば 1 そうでなければ 0 Treatment(P) Treatment の値が"P" であれば 1 そうでなければ 0 表 2.1 ダミー変数の作成ルール JMP では計算式エディタを用いて以下の方法で作成します計算式エディタでの操作方法 ------------------------------------------------------------------------------------------------------- 1. メニューより [ 列 ] > [ 新規作成 ] を選びます列名を Treatment(A) に変更しますその後列プロパティのボタンをクリックし計算式を選択します 2. 計算式パレットが開きますので次の順序で計算式を入力します ( 図 2.3 参照 ) 関数から条件付き > If を選択テーブル列から Treatment を選択関数から比較 > a==b を選択赤い太枠に A と入力 ( も入力する ) then 節の枠をクリックして赤い枠を移動し 1 と入力 else 節の枠をクリックして赤い枠を移動し 0 と入力 [OK] ボタンを押す 3. 列の新規作成ウィンドウを [OK] ボタンを押して閉じますこれよりデータテーブルに新しい列が作成されます ------------------------------------------------------------------------------------------------------- 図 2.3 計算式の入力画面 3

以下ダミー変数 Treatment(B) Treatment(P) も同様に作成します図 2.4 はダミー変数作成後のデータテーブルになります図 2.4 ダミー変数作成後のデータデータテーブル odds2.jmp は Step 0 Step 1 を行った後のデータテーブルになります上記の操作でダミー変数を作成できますが名義尺度のカテゴリ数が多い場合作成には手間がかかります弊社ではダミー変数を自動的に作成する JMP のスクリプトをサンプルとして提供しておりますこのスクリプトを用いるとダミー変数を作成する名義変数を選択するだけで自動的にダミー変数を作成することができます以下の Web ページにある日本語のサンプルスクリプト 1 または日本語のサンプルスクリプト 2 にある 0/1 のダミー変数作成が該当するスクリプトになります https://www3.sas.com/jmp/japan/includes/scripts_lib_sysdep_j.html 注意 : このスクリプトは JMP のユーザ登録をされている方のみがリクエストすることができます Step 2: モデルのあてはめを実行適切なモデルの指定目的変数のカテゴリ順序の確認ダミー変数の作成を行った後メニューより [ 分析 ] > [ モデルのあてはめ ] を選び列を図 2.5 のように指定します図 2.5 モデルの指定 ( 名義ロジスティック ) 4

この分析例では治療法 P を基準にしているのでダミー変数 Treatment(P) をモデルに含めず残りのダミー変数をモデルの効果に追加しますウィンドウ右上の [ モデルの実行 ] ボタンを押すと名義ロジスティックのあてはめの結果レポート画面が表示されますパラメータ推定値のレポートの下に推定値は次の対数オッズに対するものです : Yes/No と表示されますこれは No に対する Yes のオッズ比を対数変換した値が ( パラメータ ) 推定値になることを意味します先ほど Step 0 で行った目的変数のカテゴリ順序の変換で変更したカテゴリ順が反映されていますもし事前にカテゴリ順序を変更しなかった場合は No/Yes と表示されますそのためこの表示からでも正しいカテゴリ順序になっているかどうかをチェックすることができます Step 3: オプションを指定しオッズ比とその信頼区間の表示名義ロジスティック回帰のレポート画面の左上にある赤い三角ボタンから [ オッズ比 ] を選択するとオッズ比が出力されますさらにオッズ比の信頼区間は赤い三角ボタンから [ 信頼区間 ] を選択し信頼水準 ( デフォルトはα=0.05) を入力することにより表示されます ( 図 2.6) レポートには単位オッズ比と範囲オッズ比という 2 通りのオッズ比が出力されますがダミー変数の列に関しては双方のオッズ比その信頼区間は等しくなります図 2.6 オッズ比信頼区間の表示図 2.6 より疾患の発生を事象としたときの治療法 P に対する治療法 A 治療法 B それぞれのオッズ比オッズ比の 95% 信頼区間 ( 信頼限界 ) は表 2.2 のようにまとめられます治療法オッズ比 95% 信頼区間 A 0.069 [0.010, 0.337] B 0.039 [0.004, 0.237] 表 2.2 治療法 P をリファレンスとしたときの治療法 A 治療法 B のオッズ比とその 95% 信頼区間 5

3. リスク比とその信頼区間の算出方法この章ではサンプルデータを用いて JMP でのリスク比その信頼区間の算出方法をご説明します尚文献等ではハザード比という用語も用いられておりますが JMP ではリスク比という用語を用いているため以下ではリスク比を用語として用います使用するサンプルデータデータファイル: risk1.jmp 出典:JMP のサンプルデータラット.jmp に対して一部の変数を抜粋修正データを追加変数の詳細変数名 ( 列名 ) 尺度詳細生存日数連続イベントまでの時間打ち切りの有無連続打ち切りの変数 ( 打ち切りあり =1 打ち切りなし =0) グループ名義グループ (G1, G2, G3, G4) データテーブル( 一部 ) 分析内容データファイル risk1.jmp を用いてグループ間の死亡リスクの比較リスク比を用いて行う比較は G1 を比較の対照 ( リファレンス ) として G2,G3,G4 の死亡リスクがどのぐらい高まるかをみる例えば変数グループの値 G1, G2, G3, G4 を癌のステージ ( ステージ Ⅰ からステージ Ⅳ) と想定するとステージ Ⅰ に対してステージ Ⅱ Ⅲ Ⅳ それぞれの死亡リスクをリスク比で評価すると考えることができます分析のステップ Step 1: カテゴリの説明変数に対しダミー変数の作成 Step 2: 比例ハザードのあてはめを実行適切なモデルの指定 Step 3: オプションを指定しリスク比とその信頼区間を表示以下このステップに沿って操作をご説明します Step 1 : カテゴリの説明変数に対しダミー変数の作成ロジスティック回帰のときと同様に変数グループに対するダミー変数を作成することになりますダミー変数グループ (G1) グループ (G2) グループ (G3) グループ (G4) を追加したテーブルを図 3.1 に示します 6

図 3.1 データテーブルにダミー変数を追加データテーブル risk2.jmp はダミー変数作成後のデータテーブルになります Step 2: 比例ハザードモデルのあてはめを実行適切なモデルの指定ダミー変数の作成を行った後メニューより [ 分析 ] > [ 生存時間もしくは信頼性分析 ] > [ 比例ハザードのあてはめ ] を選び列を次のように指定します ( 図 3.2) 図 3.2 モデルの指定 ( 比例ハザード ) この分析例ではグループ G1 を基準 ( リファレンス ) にしているのでダミー変数グループ (G1) をモデルに含めず残りのダミー変数をモデルの効果に追加しますウィンドウ右上の [ モデルの実行 ] ボタンを押すと比例ハザードのあてはめの結果レポート画面が表示されます Step 3: オプションを指定しオッズ比とその信頼区間の表示左上にある赤い三角ボタンより [ リスク比 ] を選択しますとリスク比の推定値 95% 信頼区間が表示されます ( 図 3.3) ここでもダミー変数に変換した列に関しての単位リスク比範囲リスク比は同じ値になります 7

図 3.3 リスク比 ( 両側 95%) 信頼区間の表示図 3.3 よりグループ G1 に対するグループ G2 G3 G4 それぞれのリスク比リスク比の 95% 信頼区間は表.3.1 のようにまとめることができますグループリスク比 95% 信頼区間 G2 1.875 [0.945, 3.707] G3 1.025 [0.517, 2.029] G4 3.435 [1.690, 7.002] 表 3.1 グループ G1 をリファレンスとしたときのグループ G2 G3 G4 のリスク比とその 95% 信頼区間 8

4. 説明変数に名義変数を指定したときこの章では名義尺度の説明変数をダミー変数に変換せずにそのままモデルの効果として含めたときにどのような出力になるかを考察しますさらに JMP 7 と JMP 6 とでは出力内容が異なりますのでこれらの違いも考察します 4.1 オッズ比サンプルデータ odds1.jmp を用いモデルのあてはめで図 4.1 のようにモデルを指定し 2 章の Step 3 まで ( オッズ比信頼区間の算出 ) 操作を行った結果を図 4.2 に示します図 4.1 モデルの指定図 4.2 分析結果の出力 JMP 7 JMP 6 JMP 7 の出力は連続尺度と名義尺度 ( 順序尺度 ) とで異なります名義尺度の列 Treatment に対しては 3 つの水準 (A, B, P) がありますのですべての組み合わせに対してオッズ比が出力されています表示されるオッズ比の値は水準 1 / 水準 2 の 9

順番に注意する必要があります水準 1/ 水準 2 は水準 2 に対する水準 1 のオッズ比を示しますもし水準 1 に対する水準 2 のオッズ比を知りたいのであれば逆数の欄が該当します 2 章で算出したオッズ比は 2 行目 3 行目の逆数の値が該当しますただし JMP 7 では名義尺度 ( 順序尺度 ) の説明変数に対しオッズ比の信頼区間が表示されませんオッズ比のみであれば上記のように名義尺度をそのままモデルの効果に含めることにより求めることができますがオッズ比に対する信頼区間まで必要であれば 2 章のようにダミー変数を作成して算出する必要があります一方 JMP 6 での出力は 2 章の結果に一致する値が見つかりませんこの理由につきましては 5 章で説明します 4.2 リスク比サンプルデータ risk1.jmp を用い比例ハザードのあてはめで図 4.3 のようにモデルを指定し 2 章の Step 3 まで ( リスク比信頼区間の算出 ) 操作を行った結果を図 4.4 に示します図 4.3 モデルの指定図 4.4 分析結果の出力 JMP 7 JMP 6 JMP 7 でのリスク比の出力もオッズ比と同様です 2 章で算出したリスク比は出力の 1,2 行目 4 行目が該当しますただし JMP 7 では名義尺度 ( 順序尺度 ) の説明変数に対しリスク比の信頼区間が表示されませんリスク比の信頼区間につきましてもダミー変数を用いて算出することになります一方 JMP 6 ではリスク比の値が JMP 7 の出力と一致しませんこの理由につきましても 5 章で説明します 10

5. 理論的な背景 4 章では説明変数に名義変数を指定した際 JMP 7 と JMP 6 ではオッズ比リスク比の値が異なりましたさらに JMP 6 の出力では 2 章でダミー変数を作成して求めたときと値が異なることが分かりましたこの章ではこれらの理由を説明します 5.1 ダミー変数について通常名義尺度を説明変数に含めてロジスティック回帰や重回帰分析を行うとき名義尺度の説明変数はダミー変数に変換しますそしてこのダミー変数を説明変数に加えてパラメータの推定を行います JMP でもモデル効果に名義尺度を指定したときは内部的に名義尺度の変数をダミー変数にしパラメータ推定値を計算しますしかし一般にダミー変数への変換方法は複数あり 2 章で説明したダミー変数への変換方法と JMP で内部的に行っているダミー変数への変換方法は異なりますこの節ではこれらの違いについて説明します 2カテゴリのときまずは簡単のため2カテゴリの場合について説明しますそのためにデータテーブル odds1.jmp で Treatment = B または P のみを抽出したデータを用いて説明します JMP である条件を満たすデータを抽出する方法は文末の付録 A をご参照下さい名義尺度 Treatment のリスト順は B, P ですここでは JMP でモデル効果に指定した名義尺度の変数順序尺度の変数それぞれをダミー変数に変換する際の変換ルール (JMPの内部的な変換法でしてダミー変数の列が作られるわけではありません) 2 章で行ったダミー変数への変換方法を表 4.1 にまとめておきます例えば1では値が B のデータは 1 に値が P のデータは -1 に変換されることを示しますカテゴリ 1JMP 22 章で作成し名義尺度たダミー変数 B 1 1 P -1 0 表 4.1 ダミー変数への変換ルール (2カテゴリ) 図 4.1 は JMP 6 を用いて 1 2 それぞれの方法で求めたパラメータ推定値 ( 範囲 ) オッズ比を JMP のテーブルにまとめたものです図 4.1 それぞれの方法のパラメータ推定値 ( 範囲 ) オッズ比図 4.1 より 1と2では推定値は異なりますがオッズ比は等しくなりますこの違いは表 4.1 のダミー変数の変換ルールの違いによるものです JMP では名義尺度の変数で複数のカテゴリがあるとき最後のカテゴリのパラメータ推定に関する情報は結果のレポートに表示されません最後のカテゴリ (P) のパラメータ推定値は表 4.1 の1のダミー変数の指定方法より最初のカテゴリ (B) のパラメータ推定値を-1 倍したものになります一方 2では最後のカテゴリ (P) のパラメータ推定値は 0 になります表 4.2 にこれらの値をまとめますこれより 1 2 双方でパラメータ推定値は異なりますが値の範囲は双方で等しく (P の推定値 )-(B の推定値 ) = 2.728 となりますそのため説明変数の値が最小値から最大値へ変化したときのオッズ比が何 11

倍になるかを示す範囲オッズ比では 1 と 2 双方でのオッズ比が等しくなります尚範囲オッズ比と単位オッズ比の違いについては文末の付録 B で説明します 1 の範囲オッズ比 : Exp((-1.364)-1.364) = Exp(-2.728) = 0.065 2 の範囲オッズ比 : Exp((-2.728)-0) = Exp(-2.728) = 0.065 カテゴリ 1JMP 22 章で作成し名義尺度たダミー変数 B -1.364-2.728 P 1.364 0 表 4.2 変数 Treatment のパラメータ推定値 3 カテゴリのとき 3 カテゴリの変数のときパラメータ推定に用いるダミー変数は 2 つのダミー変数 D1, D2 を用い表 4.3 のように示されますカテゴリ 1JMP 名義尺度 22 章で作成したダミー変数 D1 D2 D1 D2 A 1 0 1 0 B 0 1 0 1 P -1-1 0 0 表 4.3 ダミー変数への変換方法 (3カテゴリ) 3 の D1, D2 はそれぞれ 2 章で作成したダミー変数 Treatment(A) Treatment(B) に該当します ( 図 2.4 参照 ) 図 4.2 は JMP 6 を用いて 1 2 の方法で求めたパラメータ推定値 ( 範囲 ) オッズ比を JMP のテーブルにまとめたものです図 4.2 それぞれの方法のパラメータ推定値 ( 範囲 ) オッズ比 1について名義ロジスティックのあてはめのレポートの左上の赤い三角ボタンから [ 確率の計算式の保存 ] を選択するとデータテーブルにいくつかの列が追加されますその中の列線形[Yes] の計算式を参照しますと Treatment のカテゴリ A, B, P のパラメータ推定値を確認することができます ( 図 4.3) JMP の名義尺度に対するパラメータ推定値はすべてのカテゴリの推定値を合計すると 0 になるよう設計されています 12

A B P (-0.7066) + (-1.2648) + 1.9714 = 0 図 4.3 線形 [Yes] の計算式 : 列名の + ボタンをクリックすることにより表示できる 1 で求めたパラメータ推定値 ( 図 4.2 参照 ) を用いて P に対する A のオッズ比 P に対する B のオッズ比を求めるには以下のような計算を行いますここで β(a) はカテゴリ A のパラメータ推定値を示します β(a) + β(b) + β(c) = 0 より P に対する A のオッズ比 Exp{β(A)-β(P)} = Exp[β(A)-{-(β(A)+β(B))}] = Exp{2 β(a) + β(b)} = Exp{(2 (-0.7066) + (-1.2648)} = Exp(-2.678) = 0.069 P に対する B のオッズ比 Exp{β(B)-β(P)} = Exp[β(B)-{-(β(A)+β(B))}] = Exp{β(A) + 2 β(b)} = Exp({(-0.7066)+ 2 (-1.2648)} = Exp(-3.2362) = 0.039 これらは 2 で求めたオッズ比の値に一致しますこのようにダミー変数を作成せずに 3 カテゴリの名義尺度を用いてあるカテゴリを基準 ( リファレンス ) としたオッズ比を求める場合は上記のような計算が必要になります 13

付録 A. 部分的にデータを抽出する方法ここでは JMP 7 の新機能であるデータフィルタを用いてある条件を満たすデータを抽出する方法を説明します例としてデータテーブル odds1.jmp で Treatment= B または P のデータのみを新しいデータテーブルに抽出することを考えます操作方法 1. メニューより [ 行 ] > [ データフィルタ ] を選択します 2. データフィルタの設定パネルが表示されますので列 Treatment を選択し [ 追加 ] ボタンを押します ( 図 A 左 ) 3. Treatment に対し B と P を選択します B を選択した後 Ctrl キーを押しながら P をクリックすることにより B と P を同時に選択することができます ( 図 A 中央 ) 4. 3の状態で左上の赤い三角ボタンより [ サブセットの作成 ] を選択します ( 図 A 右 ) 図 A データフィルタによるサブセットの抽出付録 B. 範囲オッズ比と単位オッズ比の違い JMP ではオッズ比の選択項目として範囲オッズ比と単位オッズ比がありますここではこれらのオッズ比の違いについて説明します範囲オッズ比説明変数 (X) の値が最小値 (Xmin) から最大値 (Xmax) へ変化したときにオッズ比が何倍になるかを示した値ですたとえば説明変数 X として年齢という変数を取り上げその変数の値の範囲は 15( 歳 ) から 35( 歳 ) だとしますこのとき範囲オッズ比は年齢が 15 歳から 35 歳に上がったときに Y のオッズ比が何倍になるかということが求まりますパラメータ推定値をβとしたとき連続尺度のオッズ比は Exp{β (Xmax-Xmin)} で計算します本文で説明した通り JMP で名義尺度の場合はパラメータ推定値を求める際に -1 と 1 にコード化されますこのことから名義尺度のオッズ比は Exp{β (1-(-1))} = Exp(2β) で計算されます順序尺度の場合は 0 と 1 にコード化されますので順序尺度のオッズ比は Exp(β) になります単位オッズ比説明変数 (X) が 1 単位変化したときのオッズ比の変化を示します例えば年齢であれば 1 歳年を取ったときの Y のオッズ比が何倍になるかということが求まりますこのため単位オッズ比の場合は連続尺度名義尺度順序尺度ともに Exp(β) で計算されます 14

範囲オッズ比単位オッズ比の計算式をまとめたものが表 B になります尺度 ( 範囲 ) オッズ比単位オッズ比連続 Exp(β(Xmax-Xmin)) Exp(β) 名義 Exp(2β) Exp(β) 順序 Exp(β) Exp(β) 表 B 範囲オッズ単位オッズ比の計算式例 : データ odds1.jmp を用いて次のようにモデルを指定してロジスティック回帰を行います [Y] : Pain [ モデル効果の構成 ]: Age Duration 結果のレポートで [ オッズ比 ] を選択した出力を図 B1 に示します図 B1 範囲オッズ比と単位オッズ比列 Age の最小値は 59 で最大値は 83 です範囲は 24( =83-59) になります同様に列 Duration は 1 から 50 までの値をとり範囲は 49 (=50-1) です範囲オッズ比を単位オッズ比と範囲から算出するには ( 単位オッズ比 ) を ( 範囲 ) 乗することにより求まります Age : (1.1674) ^ (24) = 41.0530 Duration : (0.98104)^(49) = 0.3915 ここで (a)^(b) は a の b 乗を示します 15