Version8における医薬統計関係の拡張

Similar documents
スライド 1

欠測を含む順序カテゴリカル経時データの解析 -GEE プロシジャの有用性 - 駒嵜弘 1 藤原正和 2 ( 1 マルホ株式会社 2 塩野義製薬株式会社 ) Ordinal longitudinal data analysis with missing data -Usefulness of Proc

Presentation Title Goes Here

解析センターを知っていただく キャンペーン

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

Slide 1

ソフトウェア 必 要 要 件 *MIを 行 なうプロシジャ* *バージョン8.1~ *SAS/STATプロダクト * 評 価 版 (experimental) バージョン6には 存 在 しない 日 本 :バージョン8.1 ( 日 本 語 版 )を Microsoft Windows 版 のみリクエス

Microsoft PowerPoint - e-stat(OLS).pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

<4D F736F F F696E74202D204D C982E682E892B290AE82B582BD838A E8DB782CC904D978A8BE68AD482C98AD682B782E988EA8D6C8E402E >

ビジネス統計 統計基礎とエクセル分析 正誤表

スライド 1

Microsoft PowerPoint - 資料04 重回帰分析.ppt

EBNと疫学

統計的データ解析

改変履歴 初版 2007/05/17 第 2 版 2007/12/25

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

統計学の基礎から学ぶ実験計画法ー1

,, Poisson 3 3. t t y,, y n Nµ, σ 2 y i µ + ɛ i ɛ i N0, σ 2 E[y i ] µ * i y i x i y i α + βx i + ɛ i ɛ i N0, σ 2, α, β *3 y i E[y i ] α + βx i

Medical3

スライド 1

スライド 1

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Chapter 1 Epidemiological Terminology

基礎統計

スライド 1

講義「○○○○」

PowerPoint プレゼンテーション

Medical3

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

PowerPoint プレゼンテーション

TF● :テーマ名

カイ二乗フィット検定、パラメータの誤差

Microsoft Word - 計量研修テキスト_第5版).doc

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

青焼 1章[15-52].indd

PowerPoint プレゼンテーション

Probit , Mixed logit

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Rの基本操作

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - 保健医療統計学112817完成版.docx

Statistical inference for one-sample proportion

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

ベイズ統計入門

Microsoft Word - 補論3.2

OpRisk VaR3.2 Presentation

スライド 1

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

Stata 11 Stata ROC whitepaper mwp anova/oneway 3 mwp-042 kwallis Kruskal Wallis 28 mwp-045 ranksum/median / 31 mwp-047 roctab/roccomp ROC 34 mwp-050 s

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

こんにちは由美子です

Excelにおける回帰分析(最小二乗法)の手順と出力

経済統計分析1 イントロダクション

今回 次回の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ Danger!! (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか これは次回)

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

kubostat2017c p (c) Poisson regression, a generalized linear model (GLM) : :

X X X Y R Y R Y R MCAR MAR MNAR Figure 1: MCAR, MAR, MNAR Y R X 1.2 Missing At Random (MAR) MAR MCAR MCAR Y X X Y MCAR 2 1 R X Y Table 1 3 IQ MCAR Y I

回帰分析 単回帰

こんにちは由美子です

スライド 1

日本語論文タイトル

因子分析

TF● :テーマ名

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

みっちりGLM

201711grade2.pdf

Microsoft PowerPoint - ch04j

MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです ゲージ R&R 分析 ( 交差 ) 概要 測定システ

クロス集計表の作成 2 つのカテゴリ変数をもつデータがあるとする ( 例 )AGE( 年齢 ),EXPOSURE( 曝露の有無 ) と DISEASE( 病気の有無 ) についての 40 人のデータ タブ区切りテキストファイル

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

2 / 39

Transcription:

Version8 における医薬統計関係の拡張 ( 株 )SASインスティチュートジャパンテクニカルサポート小野裕亮作成 :2000 年 6 月 23 日修正 1:2000 年 6 月 28 日 ナッシュビル プロジェクト V8 での様々な機能拡張 例えば... Base SAS: ODS GRAPH: ActiveX, Java AF: SAS Component Language ACCESS: LIBNAME WebAF,WebEIS : Java Integration Tech:COM/DCOM,CORBA CONNECT: 非同期, CPORT 不要 Enterprise Guide: thin -client の GUI 1

Version8, SAS/STAT プロダクトの構成 既存 42 プロシジャ + 新規 13 プロシジャ + 評価 3 プロシジャ ----------------------------- 合計 58 プロシジャ SAS/STAT に新しく追加されたプロシジャ (1) ノンパラメトリックな回帰 / 確率密度推定 LOESS, TPSPLINE(Thin-Palate Spline) GAM( Generalized Additive Model: 評価版 ) KDE (=Kernel Density Estimation) (2 次元の ) 空間統計 VARIOGRAM, KRIDGE,SIM2D 層化 集落抽出などおよびその解析 SURVEYSELECT,SURVEYMEANS SURVEYREG 2

新しく追加されたプロシジャ (2) NLMIXED 非線形 + 一般化混合モデル PLS PLS 回帰 MI + MIANALYZE ( 評価版 ) Multiple Imputation BOXPLOT ( 箱ひげ図 ) STDIZE( 変数の様々な方法による標準化 ) 本発表のトピック NLMIXED 石塚先生が説明 次のプロシジャを中心に説明 LOGISTIC, GENMOD MIXED, FREQ ( 評価版のプロシジャ ) MI 3

LOGISTIC プロシジャ 数多くの拡張が行われました (1) CLASS 質的変数 (2) CONTRAST 対比 (3) EXACT 正確な条件付き LOGISTIC プロシジャ (1) CLASS ステートメントの使用例 PROC LOGISTIC DATA=DATA1; CLASS A / PARAM=GLM ; MODEL Y=A B A*B; RUN; 交互作用も OK 4

LOGISTIC プロシジャ (1) 複数のコーディング方法をサポート 各水準の効果 a)param=effect PROC CATMOD 流 b)param=glm PROC GLM 流 c)param=reference 最後のセルを0 多項式 d)param=polynomial 多項式 e)param=orthpoly 直交多項式 A PARAM=EFFECT ( デフォルト ) α1 α2 α3 ---------------------------- 1 1 0 0 2 0 1 0 3 0 0 1 4-1 -1-1 CATMOD プロシジャで採用されているコーディング方法 パラメータ推定値の和が 0 になるような制約 α1+α2+ α3+α4=0 最後の水準における効果は α4= -(α1+α2+ α3) のようにして求める 5

PARAM=REFERENCE A α1 α2 α3 ---------------------------- 1 1 0 0 2 0 1 0 3 0 0 1 4 0 0 0 最後の水準を 0 とおくコーディング 最後の水準を基準とした時の推定値が算出される PARAM=GLM A α1 α2 α3 α4 -------------------------------- 1 1 0 0 0 2 0 1 0 0 3 0 0 1 0 4 0 0 0 1 PROC GLM の方式 ( 注 ) 交互作用がある時 PARAM=REFERENCE と主効果に対する検定が異なる 6

LOGISTIC プロシジャ (2) CONTRAST で 対比を指定できるように PARMA= オプションに応じて 対比の指定方法は異なるので 注意が必要? exp をとった値も計算することができる オッズ比の計算も可能になりました! LOGISTIC プロシジャ (3) EXACT ステートメント 正確な条件付き分布に基づくロジスティック分析 Version8.1 から 応答 2 水準のみ 十分統計量で条件付けた分布のもとで 2 つの検定の p 値および mid-p 値 exact probability test exact conditional scores test 推定 ( ESTIMATE オプション ) 7

最も単純な例 (2 2 表の解析 ) データ デザイン -------------- ------------------------ Y X y x0 x1 Yes A 群 1 1 1 Yes A 群 1 1 1 No A 群 0 1 1 Yes B 群 1 1 0 No B 群 0 1 0 No B 群 0 1 0 No B 群 0 1 0 No B 群 0 1 0 計画行列 X の各列 x_i に対応した十分統計量 t_i t_i = y` x_i 切片 x1 の十分統計量 t0=y x0 = 3 効果 x1 の十分統計量 t1=y x1 = 2 最も単純な例 (2 2 表の解析 ) 行和 ( 赤色 ) Yes No だけでなく A 2 1 列和 ( 水色 ) も B 1 4 固定した時の (1,1) セルの 3 5 分布 8

EXACT ステートメントを手計算すると T1 何通り? ------------------------- 0 10 3 C 0 5 C 3 1 30 3 C 1 5 C 2 2 15 3 C 2 5 C 1 3 1 3 C 3 5 C 0 2 つの考え方 =2 つの検定方法 (1) フィッシャーの直接確率検定 風 Prob(T1=u T0=3) を計算していって Prob ( T1=2 T0=3) 以下となる確率を足していく (2) コクラン - マンテル - ヘンツェル 風 [ t1 - E(T1 T0=3) ] 2 -------------------------------- Var(T1 T0=3) (* 単変量の場合 ) よりも大きくなるものが生じる確率を足していく 9

Obs xa Count Score Prob 1 0 10 2.52000 0.17857 2 1 30 0.03111 0.53571 3 2 15 1.52444 0.26786 4 3 1 7.00000 0.01786 0.26786 以下の確率を足すと 0.17857+ 0.26786 + 0.01786 1.52444 以上になる確率を求めると 0.17857+ 0.26786 + 0.01786 (*2 つの検定は 少なくとも 2 2 表の時は同じ結果 ) Mid-p value 条件付き正確検定 p 値の分布は離散 保守的になる傾向がある Mid -p 保守的な傾向 を 薄める ために考え出された方法 0.17857+ 0.26786 / 2 + 0.01786 10

Test Statistic Exact PValue Mid PValue Score 1.5244 0.4643 0.3304 Prob 0.2679 0.4643 0.3304 ESTIMATE オプション 条件付き尤度に基づく推定値 信頼区間 ESTIMATE= BOTH, ODDS, PARM (1-α)% の信頼区間 帰無仮説を α で棄却するような β0 の値を H0: β=β0 - H1: β>β0 - および H0: β=β0 + H1: β<β0 + ( 両側の場合は それぞれ α/2 で ) 11

Exact Odds Ratios (2-tail) 95% Confidence Est Limits p-value x A 5.784 0.158 586.994 0.5714 Exact Odds Ratios (1-tail) One-sided 95% Est Confidence Limits One-sided p-value x A 5.784 0.245 Infinity 0.2857 Cf. 推定値 PHREG, 信頼区間 FREQ /EXACT OR One-sided p-value Fisher の正確検定 GENMOD プロシジャ 相関がある 二値応答データの解析 2 次のモーメントまでを考慮したGEE 推定の他に Alternating Logistic Reg( 交互ロジスティック回帰 ) が行えるように Type3 検定が行えるように 相関構造 ではなく ( 対数 ) オッズ比 の構造を指定する 基本は全被験者に対して共通のオッズ比構造 12

LOGOR= オプション PROC GENMOD.; CLASS ; MODEL.. / DIST=BIN LINK=LOGIT; REPEATED SUBJECT=id(drug) / WITHIN = time LOGOR = EXCH ; RUN; LOGOR= オプション LOGOR = EXCH すべての時点間で等しいオッズ比 ( パラメータ数 : 1 個 ) LOGOR = FULLCLUS すべての時点間でばらばらのオッズ比 ( パラメータ数 : t(t-1)/2 個 ) LOGOR= ユーザ指定など... 13

Parameter E xchanga ble E stima te Empirical Standar d Error 95% Confidence Lim its Z Pr > Z Inter cept 1.3 863 0.790 6-0.1632 2.9 358 1.75 0.0795 time 1-0.0000 1.250 0-2.4500 2.4 500-0.00 1.0000... drug 1 0.8 109 1.317 6-1.7715 3.3 934 0.62 0.5383 drug 2 0.0 000 0.000 0 0.0000 0.0 000.. drug*time 1 1-1.7918 1.860 3-5.4378 1.8 543-0.96 0.3355 drug*time 1 2-2.1609 1.691 3-5.4757 1.1 540-1.28 0.2014 drug*time 1 3-0.2719 1.696 2-3.5964 3.0 525-0.16 0.8726........... Alpha1-1.1206 0.361 7-1.8296-0.4116-3.10 0.0019 Score Statistics For Type 3 GEE Analysis Source DF Chi- Square Pr > ChiSq time 4 1.76 0.7800 drug 1 0.01 0.9327 drug*time 4 2.28 0.6842 FREQ プロシジャ EXACT ステートメント MC オプションによる乱数シミュレーション 処理時間の上限を決定する MAXTIME= オプション NPAR1WAY プロシジャも同様 二項分布 Bin(n,p) の確率 p に対する信頼区間が一元表の時にも計算できるように ( 方法自体は RISKDIFF オプションと同じ ) 14

FREQ プロシジャの変更点 共通オッズ比と共通相対リスクのマンテル - ヘンツェル流の推定値 Version6 までは 帰無仮説のもとでの分散推定値 によって信頼区間を計算していた Version8 で ようやく改良 MIXED プロシジャ 小標本時の標準誤差 検定 DDFM=KENWARDROGER Kenward & Roger (1997) の論文に基づく方法によって 標準誤差 検定統計量 (F 値, t 値 ) p 値を計算 注 ) 自由度の計算だけでなく 固定パラメータ間の標準誤差なども調整される 15

Kenward & Roger(1997) REML 推定における標準誤差の求め方 σ の推定値 をプラグインして 応答変数 Y の分散共分散構造 Σ(σ) の推定値 = Σ(σ の L 推定値 ) (GLS 推定の枠組みに添って )Σ の推定値を既知のものとして β の分散共分散行列 V を推定する 欠点 A) σ の推定に伴う変動を考慮していない 欠点 B) V における小標本に伴うバイアスを考慮していない Kenward & Roger(1997) これらの欠点を補うために 近似を高める方法を提案 そして F 分布の近似も良くなるような方法も 既存の検定と対応させて 自由度 1の時 : サタースウェイト近似 正確な検定の時 :Hotteling T^2 統計量 になるような計算を提案 シミュレーションではカイ 2 乗近似と比較 16

MI & MIANALYZE (V8.1~ ただし 評価版 ) 3 種の Multiple Imputation をサポート PROC MI 乱数によって欠損値を補ったデータセット (complete dataset) を複数作成 Impute する方法としては 3 種類 PROC MIANALYZE 様々なプロシジャによる推定結果から標準誤差などを計算 MI における 3 種類の方法 monotone な欠測パタン 1) 通常の回帰に基づく方法 regression method 2) ロジスティック回帰に基づく方法 propensity score method 多変量正規に基づく 3)MCMC 法 17

Monotone な欠測値パタン ID Y0 Y1 Y2 Y3 Y4 ---------------------------------- 001 002 003 004 の後ろは 必ず MAR どの手法も Missing At Random でないと駄目 欠測するかどうかが その欠測部分の値によっては左右されない 例えば トービットモデルに従っているようなデータは駄目 ある以上のものが欠測するようなデータなどは駄目 18

方法 1: 回帰法 次のモデルで Y(1), Y(2), Y(3) の順番に代入していく Y(t) の欠測値部分 =b0 + b1 Y(1) + + b(t-1) Y(t-1) + s 乱数 b0,b1,,b(t-1) および s は Y(t) の非欠測部分から推定 方法 2:propensity score method 欠測 or 非欠測 を応答変数として ロジスティックモデルを推定 ロジスティックモデルの予測値が近いもの同士で 幾つかのグループに分ける グループ化されたもののなかで 非欠測値を無作為抽出して それを欠測値に代入 19

方法 3: 多変量正規に基づく MCMC 法 何らかの方法で Σ の初期値を与える デフォルトは EM アルゴリズムによる推定値 非欠測部分 および Σの推定値 に基づき 欠測部分に値を代入 Σを 代入された部分を含めて推定する B) に戻る B),C) の処理は事前に何回か行われる MIANALYZE complete datasets からの推定 各データ毎に推定値 Q(i) およびその分散推定値 U(i) を求める 点推定値 = Q(i) の平均 within-imputation variance = U(i) の平均 between-imputation variance = Q(i) の分散 点推定値の分散 (total variance) = within + (1+1/m) between 20

Multiple-Imputation Variance Information Variance Variable Between Within Total DF Relative Increase in Variance Fraction Missing Information x1 0.031937 0.065363 0.098897 165 0.513030 0.346931 x2 0.030456 0.031908 0.063887 76 1.002241 0.513231 GLM,REG,TTEST,UNIVARIATE でも... 信頼区間を出力する機能が追加 GLM: 線形従属の関係を表示できるように TTEST: 1 標本, 対応のある t 検定など 21

Base SAS でも... UNIVARIATE トリム平均 ウィンザー化平均 MADなどによる標準偏差の推定 信頼区間 ( 平均 分散 パーセント点 ) ヒストグラム QQプロット (SAS/QCから移植) MEANS CLASSDATA= オプション パーセント点も計算できるようになった その他の統計関連における拡張 (GUI) Enterprise Guide ( クライアント - サーハ ー環境 ) SAS/STAT プロダクト Analyst Application ( 英語 ) 記述統計 グラフ 1 標本 2 標本の平均 REG PRINCOMP GLM MIXED LIFETEST PHREG 1 標本や2 標本問題における検定 信頼区間 同等性などの検出力計算 22

補足 :ODS に伴う変更点 (1) ODS の導入により output ウィンドウへの出力形式が一部変更されています PRINTTO プロシジャ を利用した V6 時代のプログラムが うまく動かなくなる可能性があります 対処方法 : ODS を使えば 直接データセットに出力できるようになります 補足 :ODS に伴う変更点 (2) GENMOD,MIXED における変更 Version8 との互換性があるステートメント MAKE ステートメント しかし 変数名が変更されています V8で廃止されたステートメントやプロシジャ %LET PRINT_=OFF; %LET_DISK_=ON; PROC OUTPUT 将来のバージョンでは これに相当した機能が正式サポートされる予定 23

情報 米国 SUGI での V8 に関する論文 http://www.sas.com/service/techsup/news/ からダウンロード可能 (PDF 形式 ) What s New in Version8... What s New in Version7 SUGI-Japan *********** 以上です 24