第10回生物検定法の故郷、2値データの用量反応に対する逆推定，平行性検定

i 生物検定法の故郷値データの用量反応に対する逆推定, 平行性検定第回高橋セミナー高橋行雄ファイル名 :C: Documents and Settings Owner My Documents anz_seminal_9 Semi9_ 生物検定法の故郷 _ 修復 3.doc 最終保存日 :4// :9 AM 最終印刷日時 :5 年月 3 日 /9 時 4 分

ii 目次表紙裏改訂の記録年月 3 日, 新規作成

iii 目次. はじめに.... プロビット変換, ロジット変換... 3.. プロビット変換... 3.. ロジット変換... 6.3. 値反応に対する解析法... 9.4. 回帰曲線の 95% 信頼区間....5. 逆推定....6. 推定された有効量についての標準誤差の近似... 3.7. フィラーの定理を用いた有効用量の信頼区間... 5.8. ED5 の信頼区間の計算事例... 8 3. 最尤法による計算の例... 3 3.. 吉村の例 JMP の行列計算言語による... 3 3.. SAS の POBIT プロシジャによるプロビット法による計算... 5 3.3. JMP の行列言語によるロジスティック回帰... 7

iv 目次図表目次表. LD 5 を求める数値例... 4 表. プロビット法による解析結果... 4 表.3 ロジスティック回帰モデルの結果... 8 表.4 プロビット法とロジット法の推定値 p の差... 8 表.5 ロジット法による逆推定... 9 表.6 ロジット法による 95% 信頼区間... 図. プロビット曲線の当てはめ... 5 図. プロビット曲線とロジット曲線の比較... 7 図.3 ロジット曲線と 95% 信頼区間の表示... 図.4 ED5 とその信頼区間の近似計算 Excel による計算... 9 図.5 ED5 とその信頼区間のフィラーの公式 Excel による計算... 図.6 ED5 とその信頼区間の近似計算... 図.7 ロジット法のフィラーの公式による 95% 信頼区間... 図.8 回反復のプロビット法のフィラーの公式による 95% 信頼区間...

第回 - 高橋セミナーのご案内年 4 月日, 医薬安全研の午前中にセミナーを行います. 第 9 回のテーマ : 生物検定法の故郷, 値データの用量反応に対する逆推定, 平行性検定をすべて終了することは不可能でした. 第回目は, 第 9 回目で芳賀先生から指摘を受けた改定したロジット曲線とプロビット曲線の比較も含め, 値データの解析に用いられている最尤法, ニュートンラフソン法の復習を行い, 5. 相対力値以後をテーマとします.. プロビット変換, ロジット変換. プロビット法とロジスティック回帰によるシグモイド曲線の推定 3. 逆推定によるLD5の推定 4.LD5の95% 信頼区間 5. 相対力値 6. 自然反応 7. 非線形ロジット回帰モデル 8.complementary log-log 9. ランダム効果を含むつの用量反応データの比較このテーマは, 題回目の課題でも有りました. この時は,JMPで取り扱うことがどこまで可能なのか, 本当にできるのか, に集中した盛りだくさんの内容でした. この内容は,http://www.yukms.com/ biostat/ からダウンロードできます. 今回は, 実験研究者が引用できる文献を紹介しつつ,JMPでの解析の演習を行います. これにより, 実験研究者, プロウラマー, 統計家が実務でJMPあるいは他の統計パッケージの見直しができるようになります. 参加希望の方はJMPがインストールされたノートPCを準備してください. 文献は,D. Collett (99) Modeling Binary Data, Chapman and Hall/CRC の第 4 章生物検定法といくつかの適用ですそして, ピンク本 5.4 節 LD5の推定です. 時間があれば,Overdispersioの問題にもふれたい. この問題は, 次のような実験データの解析に現れる. 6.. Variation between the response probabilities 実験ユニットでバッチの数が, 同じ条件で得られたとき, 応答確率がバッチとバッチの間で, それにもかかわらず異なるかもしれない. 胎児の例, 催奇形性試験として知られている. 母体の遺伝的影響により同じ実験条件でも奇形出現率は異なる. 奇形出現率の分散は, それが定数の場合よりも大きい.

この変動を説明する変数を実験者は知ることができない. 実験条件が十分にコントロールされていない場にも起きる. Example 6. Germination of Orobanche ( 岩波生物学辞典 : シソ花類 ; ハマウツボ ) :ageyp75 :ageyp75 :Bean :Cucumber :Bean :Cucumber y n y n y n y n 39 5 6 8 6 3 3 6 53 74 3 4 3 8 55 7 8 8 5 3 6 5 3 5 3 45 3 5 7 39 46 79 4 3 7 3 インゲン豆ときゅうりの引き抜いた根の中でのつのハマウツボ種種の発芽の割合を考える.

. はじめに生物検定法の故郷, 値データの用量反応に対する逆推定, 平行性検定について基礎にもどって講義と実習を行うこのテーマは, 第回目セミナーの課題であったこの時は,JMP で生物検定法の代表的な課題に対してどこまで対応可能なのか, 本当にできるのか, などについての解析結果を主体にした (http://www.yukms.com/biostat/ からダウンロードできる ) 今回は, 実験研究者が引用できる文献を紹介しつつ,JMP での解析の演習を行う. これにより, 実験研究者, プログラマー, 統計家が実務で JMP あるいは他の統計パッケージを利用した生物検定法の見直しができるように意図した. 今回の講義と実習は D. Collett (99) Modeling Binary Data をベースにするこの本は統計モデルを用いた豊富な薬理試験毒性試験などの生物系の実験データの解析事例を用いつつ値データの解析の理論的な背景が丁寧に解説されている生物検定法は 4 章 Bioassay and some applications で取り上げられている参加者になじみのある吉村編著 (987) 毒性薬効データの統計解析 5.4 節 LD5 の推定法の事例を取り上げるロジスティック回帰については丹後 (996) ロジスティック回帰 SAS を利用した統計解析の実際がロジスティック回帰全般について丁寧に述べられているこの本にも 3.9 節で LD5 ED5 の推定が取り上げられている生物検定法 (Biological Assay) とは生物を用いて未知の化合物の生物活性を既知の化合物の生物活性に対して相対的に比較するために体系化された応用統計学の一つの分野である代表的な生物検定法 : 5 パーセント致死量の推定生物検定法は回帰分析の応用直線の当てはまりの欠如 (Lack of Fit) 非平行性 (Lack of Parallelism) 逆推定とその信頼区間用量反応関係を論ずるために欠かせない他の応用統計の分野では軽視

SAS とJMPによる生物検定法 SAS: proc PROBIT 逆推定を取り扱えるのは群の場合プロビット変換よりむしろロジット変換ロジスティック回帰分析として定式化 SAS: proc LOGISTIC proc CATMOD proc GENMOD JMP: Fit Y by X Fit Model 逆推定 Y となる X は生物検定法で常用される逆推定 95% 信頼区間 SAS では標準的には求められない JMP では Inverse Prediction の問題として対応生物検定法のための統計パッケージとして JMP が適している今回は次の課題を基礎概念も含めて再度取り上げ非線形混合モデルの応用の可能性についても触れてみたい. プロビット変換, ロジット変換. プロビット法とロジスティック回帰によるシグモイド曲線の推定 3. 逆推定による LD5 の推定 4.LD5 の 95% 信頼区間 5. 相対力値 6. 自然反応 7. 非線形ロジット回帰モデル 8. 重対数変換 9. ランダム効果を含むつの用量反応データの比較

プロビット変換, ロジット変換 3. プロビット変換, ロジット変換.. プロビット変換毒性薬効データの統計解析の 5.4 節 LD5 の推定法生物検定法ではプロビット法による LD5 の推定とその 95% 信頼区間の計算法が示されているを毒性の目安とするときには暗黙のうちに用量と反応の関係が単調増加 LD 5 であることを前提にしているその単調増加曲線としてはほとんどの場合プロビット曲線を想定しているプロビット曲線 probit curveとは図. に示すように反応率が用量の対数に対して正規分布の累積確率すなわち正規分布関数の関係をもつ曲線のことである見方を変えれば用量を横軸にとり反応率を縦軸に取ってデータを対数正規確率紙にプロットしたときに関係が正の勾配を持った直線になることである式で書けば用量 d と反応率 p ( 原文では y ) の関係が p = log d ( x μ) exp{ } σ dx πσ (.) となるものであるこのとき μ = log LD5 である probit は probability unit の省略である以下にプロビット曲線を前提にして実験データから LD 5 を推定する手法を紹介するが計算では次の式で定義するプロビット関数を使う y 5 x exp{ } probit( p) p = = dx となるyの値 (.) π y は基準正規分布の累積確率が p となるところの横軸 ( 正規偏差 ) に 5 を加えたものである数値例として表. が示され本的な LD 5 の求め方として重み付き最小乗最の繰返し計算による最尤法が示されている計算手順は煩雑なので JMP の行列計算言語によるプログラミング例と結果を付録に示したここでは得られた結果の解釈を通じてプロビット法の考え方を示す式 (.) のプロビットは標準正規分布の逆関数 Φ ( p) に 5 を加える JMP では Normal Quartile 関数を用いることにより直接計算できる死亡率が % あるいは % はマイナス無限大とプラスの無限大となる

4 プロビット変換, ロジット変換表. を求める数値例 LD 5 群投与量 mg/kg 群の大きさ死亡数死亡率プロビット i ( 公比.35) p i probit( p i ). 36. 4.584 3 83 5.5 5. 4 47 8.8 5.846 5 333 9.9 6.86 6 45. 投与量の常用対数をとり変換されたプロビットに重み付き最小乗法の繰り返しにより尤度を最大化するような次の回帰直線をあてはめる 3. 節に示した JMP の行列計算プログラムにより次の回帰係数が得られる η = probit( ˆ ) =.44 + 6.63 log ( ) i pi dosei 表. にこの式によって計算されたプロビットの推定値を示す死亡率の推定値は標準正規分布 Φ ( η i 5) よって計算される表. プロビット法による解析結果群 log ( dose i ) probit( p ˆ i ) p ˆi.43 3.93.35.335 4.463.7 3.65 4.8975.459 4.397 5.7575.776 5.54 6.64.947 6.653 7.4777.993 死亡率 p が.5 となる投与量は式 (.) の μ とσ は η = ˆ β + ˆ β x i i が x ( ( ˆ β ˆ 5)/ β) ηi = / ˆ β と書き換えられるので ˆ μ = log LD = (( ˆ β 5) / ˆ β ) = (.44 5) / 6.63) =.78 5 となり

プロビット変換, ロジット変換 5.78 LD = = 9. mg/kg 5 が得られる σ は ˆ σ = / ˆ β = / 6.63 =.54 と計算されるこれらの μ =.78 σ =.54 となる正規分布および.4 節で述べる方法でもとめた回帰直線の 95% 信頼区間を逆プロビット変換して当てはめたのが図. のシグモイド曲線である Y..8.6.4....5 3. log(dose) 図. プロビット曲線の当てはめ LD 5 の 95% 信頼区間は図. のY 軸の.5 を通る水平線上の 95% 信頼区間を横切るときの X 軸の目盛りを読むことにより得られる解析的にはフィラーの式により常用対数で (.6,.347) となり投与用量に変換して (6, 3) が得られるフィラーの式は.7 節で詳しく述べるのでここでは結果のみを示したここで示した計算結果は重みつき最小乗法を回繰り返した場合であり数値計算的には収束していないプロビット法で十分に収束した結果を求めるためにSASのproc PROBITを用いた結果 (3. 節に計算プログラムと結果 ) を示すこれは JMPではプロビット法の計算はサポートされていないためであるなお SASでは proc LOGISTIC proc GENMODでもプロビット法での計算は行えるが LD5 の 95% 信頼区間の計算がサポートされていない

6 プロビット変換, ロジット変換 SAS の proc PROBIT の反復計算は初期の回帰係数 β = β = からスタートして 6 回のニュートンラフソン法による反復の結果 β = 5.73 β = 6.65 が得られた切片が回の重み付き最小乗法で得られた -.44 に比べてかなり小さくなっているがこれはプロビット変換時に定数 5 を加えたためであり -5 を加えると -5.44 となりほほ同じである LD5 の 95% 信頼区間はフィラーの式により常用対数で (.4,.348) と計算され投与用量に変換して (6, 3) と JMP の重み付最小乗法の回の反復と計算誤差範囲内で一致している.. ロジット変換シグモイド曲線となる値反応の出現率に正規分布をあてはめることによりさまざまな生物検定法における応用がされてきたシグモイド曲線を得るために正規分布の数値計算は煩雑であることから数値計算が簡単なロジスティック分布をシグモイド曲線に用いる方法が多用されるようになってきた f( x) = x μ exp τ x μ τ + exp τ, < x < (.3) ここで < μ < τ < であり平均と分散はそれぞれ μ とπτ /3である確率密度関数 f ( x) は正規分布に比べ簡潔とはいえないが分布関数は p i x μ log d μ log d i i exp exp τ τ dx (.4) x μ log di μ + exp = = τ + exp τ τ と簡潔な指数関数となるここで β = μ/ τ β = / τ とおけばロジスティック分布関数は ( β + β logdi ) ( β β d ) exp pi = (.5) + exp + log となる簡単な式の変形によりロジット i p i logit( pi) = ln = β + β log pi d i

プロビット変換, ロジット変換 7 が得られる式 (.5) が正規分布を用いた場合とほぼ同様のシグモイド曲線を与えるこのシグモイド曲線を用いて 5% 致死量 LD5 を推定するのがロジスティック回帰モデルであるロジスティック法で推定された回帰係数はプロビット法のそれとは異なるプロビット法では / β が標準偏差となるがロジスティック法での標準偏差は πτ /3でありプロビット法で推定された推定された標準偏差を ˆ σ とすればとなる 3 ˆ σ 3.54 ˆ τ = = =.83 π 3.4 JMPによるLD5 の推定はプロビット法ではなくロジット法による推定となっているプロビット法によって得られた LD 5 =.78 と ˆ σ =.54 から推定されるプロビット曲線 LD 5 =.78 と ˆ τ =.83から推定されるロジスティック曲線を比較した結果を図. に示す違いはロジスティック回帰が裾広がりとなるが図にしてみるとごくわずかである..8.6 Y.4...8...4.6.8 x 図. プロビット曲線とロジット曲線の比較プロビット - - - ロジット

8 プロビット変換, ロジット変換 JMPでロジスティック回帰を行った結果を表.3 に示す回帰係数 β =.59 と勾配が急になり裾広がりを解消している表.3 ロジスティック回帰モデルの結果パラメータ推定値項推定値切片 -6.489 log(dose).5999 標準誤差 6.3543.7847 カイ乗 7.4 7.8 p 値 (Prob>ChiSq) <. <. 5% 致死量は求められた回帰係数から ˆ μ = log LD = ˆ β / ˆ β = ( 6.5) /.59 =.75 5 となり.75 LD = = 88. mg/kg 5 と推定できるプロビット法の 9.mg/kg と比べて約 % の違いである分散は πτ 3.4 (/.5) ˆ σ = = =.57 3 3 とプロビット法の.5 とほぼ同じであるプロビット法とロジット法による推定値 p の差を表.4 に示すその結果でもロジット法の結果は裾広がりとなっているがその差は.5% 程度の違いとわずかである表.4 プロビット法とロジット法の推定値 p の差 log ( dose i ) Probit logit logit-probit.89..5.4.93.7.4.7.8.49.55.6.53.5.97 -.7.78.5.59.9.43.795.84.9.58.95.949 -..653.993.987 -.6.747.999.996 -.3 JMP では逆推定の機能により任意の死亡率について計算できるので 9% 5%

プロビット変換, ロジット変換 9 および % のそれぞれについて推定した結果を表.5 に示す LD 5 はフィラーの式により常用対数で (.96,.35) と推定されるの 95% 信頼区間表.5 ロジット法による逆推定逆推定確率.9.5. 予測値 log(dose).46544.74787.84454 下限.385573.9554355.87888963 上限.66363.35979.764 -Alpha.95 JMP のロジスティック回帰モデルの計算手順はニュートンラフソン法による反復計算による尤度が最大となるような解が求められているどのような計算手順なのかを示すために 3.3 節 JMPの行列計算プログラムと実行結を示す反復計算は初期の回帰係数 β = β = からスタートして 6 回の反復の結果 β = 6. β =.53が得られ結果は一致する.3. 値反応に対する解析法これまでに多くの法を使ってきたのでこれらの関連を整理してみよう値データの変換法の反復プロビット変換 (5 を加える場合も有る ) ロジット変換シグモイド曲線をあてはめて 5% 推定値を求める方法の総称プロビット変換による場合 : プロビット法ロジット変換による場合 : ロジット法またはロジスティック回帰モデル最尤解を求める反復計算の方法どちらの方法でも解は一致する重みつき最小乗法ニュートンラフソン法方法の組合せプロビット変換重み付き最小乗法の反復吉村らの本 SAS/LOGISTIC プロビット変換ニュートンラフソン法

プロビット変換, ロジット変換 SAS/PROBIT( 逆推定 ) SAS/LOGISTIC SAS/GENMOD ロジット変換重み付き最小乗法の反復 SAS/LOGISTIC ロジット変換ニュートンラフソン法 JMP( 逆推定 ) SAS/LOGISTIC SAS/GENMOD.4. 回帰曲線の 95% 信頼区間プロビット曲線またはロジスティック曲線の 95% 信頼区間を求めよう η = x β ˆ の推定値の分散は分散共分散行列を Σ としたときに σ = x Σ x x i i となる単回帰分析の場合は η ˆ ˆ i = β + log ( dosei) β なので ˆ β の分散を v ˆβ の分散を v ˆ β と ˆβ の共分散をで計算される σ = x Σ x = v + log ( dose ) v + log ( dose ) v x i i i i v とすると JMPのロジスティック回帰で求められた回帰係数は ˆ β = 6. ˆ β =.5 JMP の行列計算言語で計算した分散共分散行列は 4.38 7.63 Σ= 7.63 7.73 である η の場合につい計算してみる η = ˆ β + log ( dose ) ˆ β = 6.+ log ().5 = 3.59 i e p = + e i 3.5 ˆ 3.59 σ = x Σ x = v + log ( dose ) v + log ( dose ) v x i i i i = 4.38 + log () ( 7.63) + log () 7.73=.739 η ±.96σ x = 3.59 ±.96.739 = ( 4.8,.43) 4.8.43 e e pˆ ( L95) = =.8, pˆ 4.8 ( U95) = =.93.43 + e + e i i 他の用量についても同様に計算した結果を表.6 に示す

プロビット変換, ロジット変換表.6 ロジット法による 95% 信頼区間 i dose n Y p log (dose) eta p^ Var(eta) s.e.(eta) L95% U95%..43-3.59.4.739.8597.8.93 36..335 -.669.64.38.564.6.375 3 83 5.5.65 -.45.465.554.394.86.658 4 47 8.8.397.3593.796.59.59.598.94 5 333 9.9.54.8544.946.688.783.79.9877 6 45..653 4.36.987.39.99.899.9986 投与量を連続的に変えて推定値とその 95% 信頼区間計算した結果を図.3 に示す図の右は拡大した図であり反応が.5 となるような 95% の投与量が逆推定されている..8.8.7.6 Y.6.4 Y.5.4.3......5 3. log(dose)....3.4 log(dose) 図.3 ロジット曲線と 95% 信頼区間の表示.5. 逆推定応答確率が単一の説明変数 x の関数としてモデル化される場合応答確率に対応する x の値を推定することにしばしば興味がある例えば生物検定法では化学薬品に曝露された個体の 5% に反応すると期待される濃度にしばしば興味がもたれるこの用量はメディアン用量と名付けられ一般に ED5 値と呼ばれる試験の反応が死である場合これはメディアン致死量あるいは LD5 値と言い換えられる他の反応率を期待する濃度は同様の方法出で表される例えば各個体の 9% に反応させる用量は ED9 値などであるこれらの量での要約は分析しようとしている化学薬品の力価およびその後の異なる物質の間の比較の基礎となる生物検定法により応答確率 p および用量 d の関連を記述するために次に示す

プロビット変換, ロジット変換線形ロジスティックスモデルを使用するとしよう p logit( p) = log = β + β d p p =.5 が ED5 値である用量は logit (.5) = log () = であるので ED5 値は式 β + β = ED5 となりその結果 ED5 = β / β となる線形ロジスティックスモデルをあてはめた後に未知のパラメータの推定値 ˆ β ˆ β が得られ ED5 値は ˆ β ED5 = ˆ β によって推定される ED9 値を得るために p =.9 を線形ロジスティックスモデル.9 log = β+ β ED9. で用いその結果 ED9 値は (.97 β) / β であるので ED9 = (.97 ˆ β) / βˆ と推定される用量ではなく log(dose) がモデルの中で説明変数として使用される場合これらの式は修正を少し必要とするモデル logit( p)= β + β log( d) があてはめられる場合 ED5 値は β + β log( ED5) = となるので ED5 = exp( β/ β) となり ED5 = exp( ˆ β ˆ / β) で推定される同様に ED9 値は ED9.97 ˆ β exp ˆ β = によって推定される他の対数の底がモデルの中で使用される場合この底はこの

プロビット変換, ロジット変換 3 式の e を代えなければならないコンピューターによる解析では出力によってさらなる計算を正確に実行するために対数の底 ( または e) を知ることが必要である ED5 と ED9 値の推定はプロビット回帰モデルのでも同様に得ることができる例えば log(dose) が説明変数として使用される場合モデルは - probit( p)= Φ ( p) = β + β log( d) となる P =.5 とした場合 probit (.5) = でありロジスティックスモデルと同様に ED5 値は ED5 = exp( ˆ β ˆ / β) によって推定されるここで ˆ β ˆ β はプロビットモデルでのパラメータ推定値である P =.9 のとき probit (.9) =.86 であり ED9 値は exp[(.86 ˆ β ˆ ) / β] によって推定される ED5 のような推定量を得たときに推定精度を判断することができるように標準誤差あるいは信頼区間を与えることが一般に望まれるパラメータ推定関数の標準誤差対応する信頼区間を得るため用いられる式の展開は重要であり単純ではないのでここで詳しく示す推定されたED5 値の近似の標準誤差は最初にセクション.6 で誘導されこの標準誤差に基づいた真のED5 値の近似の信頼区間が与えられる真の ED5 値のより正確な区間はセクション.7 節で記述されるアプローチフィラーの定理を使用して求められる.6. 推定された有効量についての標準誤差の近似 ED5 が例えばつのパラメータの関数 g = ( ˆ β ˆ, β) であるばあい関数の分散の近似の標準的な解法テイラー級数近似法またはデルタ法により推定値の標準誤差を得るために使用できるこの結果は g = ( ˆ β ˆ, β) の分散がほぼ式 (.6) であることを示している g ˆ Var( ˆ ) g Var( ) g g β β Cov( ˆ, ˆ ) ˆ + β ˆ + ˆ ˆ β β β (.6) β β モデルが説明変数として用量を含んでいる場合 g = ( ˆ β ˆ, β) は ˆ β ˆ / β であることから得られる ˆ ρ = ˆ β ˆ / β v ˆ = Var( β ) v ˆ = Var( β ) および v = Cov( ˆ β ˆ, β ) とおくと式 (.6) は

4 プロビット変換, ロジット変換 v Var( ED5) ˆ ρv + ˆ ρ v ˆ β となる実際にはこの式での分散および共分散は正確にはわからないのであるが ˆv ˆv および ˆv の近似値が式の中で用いられるであろう推定されたED5 値と s.e.( ED5 ) の標準誤差はその後式 (.7) によって与えられる v ˆ ρv + ˆ ρ v s.e.( ED5) ˆ β / (.7) このような方法による推定値の標準誤差は対応するパラメータについての近似的な信頼区間を得ることである例えば ED5 ±.96 s.e.( ED5) を使用して ED5 値の 95% の信頼区間を得ることができるこの方法で計算された信頼区間の低い限界は負になることが起きるかもしれないゼロと単にこれを取り替えることができるかもしれないがこの問題を回避するつの方法はすべて ED5 値の対数を使うことである log( ED5 ) の標準誤差は標準的な計算法により s.e.{log( ED5)} ( ED5) s.e.( ED5) を得る log( ED5 ) 値の近似的な 95% 信頼区間は log( ED5) ±.96 s.e.{log( ED5)} であり ED5 値の信頼区間はこれらのつの範囲の指数をとることにより得られるしかしながらこの方法は信頼区間のより低い限界が負でないことを保証するが一般的には勧められないこれは推定された log (ED5) 値は対称的に ED5 値自体が分布しにくいからであり従って信頼区間を構築するために用いられる正規分布の仮定は合理的とは思われないロジスティックスのモデルの中で用いられたとき説明変数がlog (dose) であるとき ED5 値は exp( ˆ β ˆ / β) によって推定されそして式 (.7) の関係から log( ED5 ) の標準誤差は式 (4.3) によって与えられる vˆ ˆ ρvˆ + ˆ ρ vˆ s.e.{log( ED5)} ˆ β / (.8) ED5 自体の標準誤差は式 (.9) を用いて得られる

プロビット変換, ロジット変換 5 s.e.( ED5) ED5 s.e.{log( ED5)} (.9) log (dose) が説明変数として使用される場合 ED5 値の対数の限界の指数をとって ED5 値の信頼区間を計算するほうがよく式 (.9) に基づいた対称な間隔を使用するのではなく式 (.8) を使用することが望ましい同様の手順は ED9 値のような他の多量の興味がある量の標準誤差および対応する信頼区間を得るために用いられる.7. フィラーの定理を用いた有効用量の信頼区間フィラーの定理はつの正規分布の確率変数の比率の信頼区間によって得ることができる一般的な計算結果であるこの結果は ED5 値の信頼区間の構成を適用する前の一般的な用語で最初に与えられる ρ = β / βを考えようここで β と β は ˆ β と ˆβ によって推定されその平均が β と β 分散が v と v 共分散が v の正規分布となると仮定される関数 ψ = ˆ β ρβˆ を考えようそのとき ˆ β と ˆβ が β と β の不偏推定量であるので E( ψ ) = β ρβ = となり ψ の分散は V = Var( ψ ) = v + ρ v ρv (.) で与えられる ˆ β と ˆβ は正規分布に従うと仮定されるので ψ は同様に正規分布に従い ˆ β ρβˆ V は標準正規分布となる従って z α が標準正規分布の上側 α /点であるとしたときに ρ の (-α ) % / 信頼区間は ˆ β ρβˆ z V α / 値のセットとなる

6 プロビット変換, ロジット変換両辺を乗し等式とし ˆ β + ρ ˆ β ρβˆ ˆ β z V = α / を与える式 (.) により V を代入したのちに式の整理と次のように ρ に関する二次方程式が得られる ˆ ˆ ˆ ˆ ( β z vˆ ) (vˆ z ) ( vˆ / ρ + / ββ ρ + β z ) α α α / = (.) この二次方程式のつの根は ρ のための信頼限界を構成するこれがフィラーの結果であるこの結果を ED5 = β / β の信頼区間を得るために用いるために式 (.) の ρ を ED5 と置き換えるさらにパラメータの推定が線形のロジスティックスモデルで得られたものならば大きなサンプルについてのみの近似であるので分散共分散および ˆv の近似をおよび v の代わりに使用しなければならない v v ˆv ˆv ED5 による二次方程式を書き換えると ( ˆ β z vˆ ) ED5 (vˆ z ˆ β ˆ β ) ED5 + ( ˆ β vˆ z ) α/ α / α / = がえられこの方程式を標準的な手順により解き ED5 値の (-α ) % の信頼限界のために次の式を得る vˆ z / ˆ α v ˆ ρ g vˆ ˆˆ ˆ ˆ ˆ ρv ρ v g v ˆ vˆ ± + ˆ β v ED5 = g / (.) ここで ˆ ˆ ˆ ρ = β/ β g z vˆ / ˆ = α β である / 強い用量反応関係があるとき ˆβ はにたいして高度に有意にとなりまた ˆ / vˆ β はより極めて大きくなるであろうこれらの場合に g は小さくなるすなわち z α / より有意となるような関連の場合 g はより無視できるようになる gが式 (.) でゼロである場合 ED5 値の信頼限界は式 (.7) の中で与えられたE5 値の標準誤差の近似に基づくものと一致する

プロビット変換, ロジット変換 7 log(dose) が説明変数として使用されている場合 ED5 値の信頼区間はフィラーの定理を用い log(ed5)= β / β について信頼限界を最初に得ることにより計算でき次にその値についての間隔の推定限界の結果の指数をとればよい

8 プロビット変換, ロジット変換.8. ED5 の信頼区間の計算事例表. の SAS/PROBIT によるプロビット法の 6 回のニュートンラフソン法の反復の結果 ˆ β = 5.73 ˆ β = 6.65 が得られ 5% 致死量は log( ED5 ) =.784 その 95% 信頼区間は (.4.348) が出力されている.6 節および.7 節で示したデルタ法による近似フィラーの公式による 95% 信頼区間を計算例として示す信頼区間の計算のためには ˆ β および ˆβ の分散と共分散が必要であり SAS/PROBIT の model ステートメントのオプションで covb を指定しておく SASの proc PROBIT の反復計算は初期の回帰係数 β = β = からスタートして回帰係数として分散共分散は β = 5.73 β = 6.65.534 4.5863 Σ= 4.5863. が出力されるデルタ法 ( 近似法 ) による信頼区間の計算をしてみよう ˆ β 5.73 ED5 = = = ˆ β 6.65 log( ).78 ˆ β 5.73 ˆ β 6.65 ˆ = = =.78 ρ vˆ ˆ ˆ ρvˆ ˆ + ρ v s.e.{log( ED5)} ˆ β /.534 (.78) ( 4.5863) + (.78). = 6.65 =.3389 log( ED5) ±.96 s.e.(log( ED5)) =.78±.3389 = (.3,.343) / これらの数値計算を行うためには図.4 に示したように Excel での使用が便利であるこの結果はフィラーの式での結果 (.4.348) に対して小さめに推定されている

プロビット変換, ロジット変換 9 図.4 ED5 とその信頼区間の近似計算 Excel による計算次にフィラーの式での計算をしてみよう対数の ED5 について 95% 信頼区間は次の次式の根を求めることにより得られる ( ˆ β z vˆ )log( ED5) (vˆ z ˆ β ˆ β )log( ED5) + ( ˆ β vˆ z ) = α/ α/ α/ それぞれの係数は a= ˆ β z v ˆ = 6.65.96. = 36.866 α / b= (vˆ z ˆ ˆ α ββ) = ( ( 4.383).96 ( 5.44) 6.63) = 64.85 / c= ˆ β vˆ z α = ( 5.44) 9.674.96 = 86.656 / となるこれを次式の公式に代入すると 95% 信頼区間が得られる b± b 4ac log( ED5) ±.96 s.e.(log( ED5)) = = (.4,.348) a これらの数値計算は煩雑であるので Excel による計算シートを図.5 に示す

プロビット変換, ロジット変換プロビット回帰係数からEDxx% の推定信頼区間の計算 ln(dose) Var^Cov^ 切片 beta^= -5.73.534 傾き beta^= 6.65-4.5863. y% = 5 ln(ed(y%))^=.783 ED(y%)^= 9.758436 Q_a= 36.69 ln_l95%^=.465 L95%^= 59.9798 Q_b= -64.85 ln_u95%^=.347863 U95%^=.7735 Q_c= 86.656 計算はフィラーの式次式の根の公式により計算図.5 ED5 とその信頼区間のフィラーの公式 Excel による計算 ED5 とその信頼区間の計算公式はプロビット法の場合のみならずロジット法の場合もそのまま適用できる JMP のロジスティック回帰係数は ˆ β = 6.5 ˆ β =.59 分散共分散は JMP の行列計算により 4.38 7.63 Σ= 7.63 7.73 が計算されているのでデルタ法 ( 近似法 ) による信頼区間の計算は Excel の計算シートに数値を入れ替えることにより log( ED5) ±.96 s.e.(log( ED5)) =.748 ±.343 = (.75,.34) 求められるロジットの回帰係数からEDxx% の推定信頼区間の計算 ln(dose) Var^Cov^ 切片 beta^= -6. 4.38 傾き beta^=.53-7.63 7.73 y% = 5 ln(ed(y%))^=.74755 s.e.(ln(ed(y%)))^=.349 ED(y%)^= 88.586 ln_l95%^=.7546 L95%^= 6.67 ln_u95%^=.34964 U95%^= 9.7676 図.6 ED5 とその信頼区間の近似計算フィラーの公式も同様にロジスティック回帰の場合に適用できる JMP による信頼区間の計算はフィラーの公式によって計算されている Excel の計算シートに数値を入

プロビット変換, ロジット変換れ替えた結果を図.7 に示すロジットの回帰係数からEDxx% の推定信頼区間の計算 ln(dose) Var^Cov^ 切片 beta^= -6. 4.38 傾き beta^=.53-7.63 7.73 y% = 5 ln(ed(y%))^=.74755 ED(y%)^= 9.75534 Q_a= 3.8 ln_l95%^=.979 L95%^= 8.998785 Q_b= -468.68 ln_u95%^=.34967 U95%^=.483 Q_c= 53.449 図.7 ロジット法のフィラーの公式による 95% 信頼区間注 ) 計算精度が悪いので分散の有効数字を増やす吉村の例では投与量の常用対数をとり変換されたプロビットに重み付き最小乗法を回繰り返しにより次の回帰係数が得られた η probit( ˆ i = pi) =.44 + 6.63 log ( dosei) 死亡率の推定値は ˆ μ = log LD = (( ˆ β 5) / ˆ β ) = (.44 5) / 6.63) =.78 5 と標準正規分布 Φ ( η i 5) によって計算された JMP の行列計算により分散共分散は ˆ 9.67 4.383 Σ= 4.383.7684 と推定されるのでこれらを Excel のフィラーの計算シートから切るときの X 軸の目盛りを読むことにより得られる解析的にはフィラーの式により常用対数で (.6,.347) となり投与用量に変換して (6, 3) が得られるフィラーの式は.7 節で詳しく述べるのでここでは結果のみを示した

プロビット変換, ロジット変換プロビット回帰係数からEDxx% の推定信頼区間の計算 ln(dose) Var^Cov^ 切片 beta^= -5.44 9.674 傾き beta^= 6.63-4.383.7684 y% = 5 ln(ed(y%))^=.77965 ED(y%)^= 9.7568 Q_a= 36.86 ln_l95%^=.89 L95%^= 6.4696 Q_b= -67.6 ln_u95%^=.345758 U95%^=.6959 Q_c= 9.647 計算はフィラーの式次式の根の公式により計算図.8 回反復のプロビット法のフィラーの公式による 95% 信頼区間小数点 4 桁目が吉村のテキストと一致しない計算誤差の問題であろう

3 3. 最尤法による計算の例 3.. 吉村の例 JMP の行列計算言語によるプロビット変換重み付最小乗法の繰り返し回吉村本の表 5-3 の結果に合わせて計算結果を出しているので対応を取ることにより最小乗法の計算原理を学習してもらいたい分散共分散行列の計算は信頼区間の計算のために追加している /* Probit, yoshimura(988), p6, Weighted linear Regression */ d = [,36,83,47,333,45] ; x = log(d) ; y = [,, 5, 8, 9, ] ; n = [,,,,, ] ; p = y :/ n ; X = J(nrow(X),) X; beta = [-7.68, 5.5594] ; show(round(beta,4)) ; eta = X*beta ; show(round(eta,4)) ; A = d x y n p eta ; show(round(a,4)) ; /*** step ***/ pi = Normal Distribution(eta - 5) ; show(round(pi, 4)) ; z = Normal Density(eta - 5) ; show(round(z, 4)) ; w = z^ :/ (pi :* (-pi)) ; show(round(w,4)); nw = n :* w ; show(round(nw,4)); y = eta + (p - pi) :/ z ; show(round(y,4)) ; W = diag(w) ; Beta = Inv(X`*W*X)*X`*W*y ; show(round(beta,4)) ; eta = X*beta ; show(round(eta,4)) ; diff = abs(eta - eta) ; show(round(diff,4)) ; B = X pi z nw y eta diff ; show(round(b,4)) ; eta=eta ; /*** step ***/ pi = Normal Distribution(eta - 5) ; show(round(pi, 4)) ; z = Normal Density(eta - 5) ; show(round(z, 4)) ; w = z^ :/ (pi :* (-pi)) ; show(round(w,4)); nw = n :* w ; show(round(nw,4)); y = eta + (p - pi) :/ z ; show(round(y,4)) ; W = diag(w) ; Beta = Inv(X`*W*X)*X`*W*y ; show(round(beta,4)) ; eta = X*beta ; show(round(eta,4)) ; diff = abs(eta - eta) ; show(round(diff,4)) ; B = X pi z nw y eta diff ; show(round(b,4)) ; res=(y-eta)`*w*(y-eta) ; covb = Inv(X`*W*X)*res ;

4 Round(beta, 4):[-7.68,5.5594] Round(A, 4): /* d x y n p eta */ [.43 3.5, 36.335. 4.44, 83.65 5.5 4.957, 47.397 8.8 5.68, 333.54 9.9 6.45, 45.653 7.95] Round(beta, 4):[-9.5978,6.43] Round(B, 4): /* X pi z nw y() eta() diff() */ [.43.697.338.76 3. 3.5.695,.335.37.99 5.46 4.6 4.44.594,.65.489.3986 6.369 5 4.957.496,.397.75.363 5.3676 5.835 5.68.64,.54.996.49 3.6 6.7 6.45.79,.653.9834.43.457 7.533 7.95.833] Round(beta, 4):[-.44,6.63] < ================ 回帰係数 Round(B, 4): /* X pi() z() nw() y() eta() diff() */ [.43.43.867.947.7877 3.55.594,.335.79.65 4.653 4.6 4.8.347,.65.463.397 6.3464 5.3 4.975.,.397.77.38 5.957 5.8379 5.745.5,.54.943.55.4547 6.8 6.5744.399,.653.99.7.66 7.7773 7.48.649] covb = Inv(X`*W*X)*res < ================ 分散共分散行列 [ 9.6739749964-4.383549738, -4.383549738.7683994939387]

5 3.. SAS の POBIT プロシジャによるプロビット法による計算プロビット変換ニュートンラフソン法 Title 'ANZ9a.sas --5 Y.Takahahsi ' ; data d ; input i dose n y p eta p_hat ; datalines ; 3.93.35 36. 4.463.7 3 83 5.5 4.8975.459 4 47 8.8 5.7575.776 5 333 9.9 6.64.947 6 45 7.4777.993 ; proc probit data=d log inversecl ; model y/n = dose / dist=normal itprint covb ; output out=out p=p std=std xbeta=xbeta ; run ; proc print data=out ; run ; Probit Procedure Iteration History for Parameter Estimates Iter Ridge Loglikelihood Intercept Log(dose) -4.58883 -.98946-9.338543 4.89799764 : 6 -.87686-5.75874 6.656499 Model Information Number of Observations 6 Number of Events 34 Number of Trials 6 Name of Distribution Normal Log Likelihood -.87686 ================ 回帰係数 ================ Analysis of Parameter Estimates Standard 95% Confidence Chi- Parameter DF Estimate Error Limits Square Pr > ChiSq Intercept -5.73 3.454 -.43-8.795.56 <. Log(dose) 6.65.45 3.848 9.3885.86 <. ================ 分散共分散行列 ================ Estimated Covariance Matrix Intercept Log(dose) Intercept.5348-4.5866 Log(dose) -4.5866. Probit Model in Terms of Tolerance Distribution MU SIGMA.7839.56789

6 Probit Analysis on Log(dose) Probability Log(dose) 95% Fiducial Limits..844.9484.67.5.784.46.34788.9.4787.3937.6875 Probit Analysis on dose Probability dose 95% Fiducial Limits..4534 8.945 46.943.5 89.734 59.97966.789.9 96.39348 47.3889 45.35599 OBS i dose n y p eta p_hat p xbeta std. 3.93.35.354 -.835.458 36. 4.463.7.694 -.95655.35 3 3 83 5.5 4.8975.459.45867 -.378.8 4 4 47 8.8 5.7575.776.7757.7578.648 5 5 333 9.9 6.64.947.94697.66.39758 6 6 45. 7.4777.993.99345.487.568

7 3.3. JMP の行列言語によるロジスティック回帰ロジット変換ニュートンラフソン法 /* The linear logistic model, Newton-Raphson --3 Y.Takahashi */ d = [,36,83,47,333,45] ; x = log(d) ; y = [,, 5, 8, 9, ] ; n = [,,,,, ] ; X = J(nrow(x),) x ; p = y :/ n ; pi = (n:/) :/ n ; A = X y n p pi ; show(round(a,3)) ; beta=[, ] ; L = [-E] ; epsilon= ; /*** step << i >> ** */ for (i=, epsilon>e-8, i++, show("iteration"); show(round(i, )) ; u = X`* (y - n :* pi) ; show(round(u,3)) ; v = pi :* (-pi) :* n ; show(round(v,3)) ; V = diag(v) ; Im = X`*V*X ; show(round(im,3)); beta= beta + inv(im)*u ; show(round(beta,3)); inv_im=inv(im) ; show(round(inv_im,3)); eta = X*beta ; pi = exp(eta) :/ ( + exp(eta)) ; B = X eta pi ; show(round(b, 3)) ; L = y`* ln(pi) + (n - y)` * ln (-pi) ; epsilon=abs(( L-L)/L) ; C =L L epsilon ; show(c) ; L=L ; ) ;

8 Round(A, 3): [.4.5,.34..5,.6 5.5.5,.393 8.8.5,.5 9.9.5,.653.5] "iteration" Round(i, ): Round(u, 3):[4,4.] Round(v, 3):[.5,.5,.5,.5,.5,.5] Round(Im, 3): [ 5 34.9, 34.9 8.38] Round(beta, 3):[-4.9,6.55] Round(inv_Im, 3): [ 7.45-3.6, -3.6.358] Round(B, 3): [.4 -.843.37,.34 -..69,.6 -.6.46,.393.687.665,.5.533.8,.653.385.96] C:[-3.383353866953 -.99999999766687] "iteration" Round(i, ): Round(beta, 3):[-.999, 9.653] "iteration" Round(i, ):3 Round(beta, 3):[-5.499,.6] "iteration" Round(i, ):4 Round(beta, 3):[-6.89,.53] "iteration" Round(i, ):5 Round(beta, 3):[-6.,.53] "iteration" Round(i, ):6 Round(u, 3):[,] Round(v, 3):[.47,.373,.488,.66,.55,.4] Round(Im, 3): [ 6.53 4.89, 4.89 34.75] Round(beta, 3):[-6.,.53] < ================= 回帰係数 Round(inv_Im, 3): [ 4.38-7.63, -7.63 7.73] < ================= 分散共分散行列 Round(B, 3): [.4-3.6.4,.34 -.67.64,.6 -.4.465,.393.359.796,.5.854.946,.653 4.36.987] C:[-.98448686 -.98448684 3.3456839e-3]

第10回 生物検定法の故郷、2値データの用量反応に対する逆推定，平行性検定

第10回生物検定法の故郷、2値データの用量反応に対する逆推定，平行性検定