Microsoft PowerPoint - 栄養疫学デザインと解析1.ppt

第 3 回日本栄養改善学会実践栄養学研究集中セミナー 2008.1.12. 名古屋最終版資料世の中にあふれる健康情報栄養疫学の基礎 1 デザインと解析国立保健医療科学院技術評価部横山徹爾世の中にあふれる健康情報どれがどのくらい信用できるの??? 血清総コレステロ - ルが高いと虚血性心疾患に罹患する危険が高い抗酸化ビタミンをたくさん摂るとがんに罹患する危険が下がる赤ワインに多く含まれるポリフェノールは動脈硬化を予防する辛いものを食べると食道がんに罹患しやすい減塩して血圧が下がると脳卒中に罹患する危険が下がるコーヒーを飲む人は肝がんに罹患しにくい世の中にあふれる健康情報どれがどのくらい信用できるの??? 信用できるとは? 偉い人が言った新聞テレビで報道されたではなくて証拠 ( 科学的根拠 ) が十分にあることでは証拠とは何? 例 : 血清総コレステロールが高いと虚血性心疾患に罹患する危険が高いということは誰でも知っているではその証拠は何だか知っていますか? 証拠 ( 科学的根拠 ) メカニズムを追求しようとするものコレステロ - ルが高いとなぜ虚血性心疾患に罹患しやすいのだろう? 緑黄色野菜を多く食べるとなぜがんに罹患しにくいのだろう? 動物実験試験管の中での ( ヒトの細胞を使った ) 実験ある現象が本当にヒトにおいて生じているかどうかを調べるものコレステロ - ルが高いと虚血性心疾患になりやすいという現象が本当に人間集団の中でおきているのだろうか? 緑黄色野菜を多く食べるとがんに罹患しにくいという現象が本当に人間集団の中でおきているのだろうか? 疫学研究 ( 観察研究 ) じゃあコレステロ - ルを下げたら虚血性心疾患になりにくくなるのだろうか? ビタミン剤を摂取したらがんが予防できるだろうか? 疫学研究 ( 介入研究 ) 1

疫学的な研究論文の読み方疫学研究の主な結果は原著論文 ( 主に英語 ) として発表される英語が苦手だと読めない? はいでも疫学の原理と方法疫学の原理と方法を知っていれば辞書を引きながら ( 時間をかければ ) 読むことは可能日本語論文ならば ( 誰でも ) 読める? いいえ疫学の原理と方法疫学の原理と方法を知らない人が 100 回読んでも正しく理解することは不可能つまり疫学的な研究論文を読むためには疫学の原理と方法を学ぶことが必須! 疫学は人間集団を対象とし, 病態すなわち疾病の結果をみるのではなく, 疾病の原因を追究する学問である人間集団原因? 脳卒中心筋梗塞がん高血圧高脂血症喫煙運動不足肥満過剰飲酒食習慣脳卒中心筋梗塞がん原因追及の過程 - 疫学のサイクル - 第 1 段階 ( 記述疫学 ) 生態学的研究横断研究第 2 段階 ( 分析疫学 ) 症例対照研究コホート研究第 3 段階 ( 実験疫学 ) 介入研究仮説設定の糸口を得る仮説を検証する因果関係を決定する証拠能力低い高いこれらの証拠は? 多くは疫学研究の結果に基づく講義の目標 : 各研究デザインの原理と解析方法を理解する 2

第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究第 2 段階 ( 分析疫学 ) 症例対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力低い高い第 1 段階 ( 記述疫学 ) 人場所時の変数について疾病頻度を記述するどんな人がどんな場所でどんな時に疾病になるのか克明に記述することは疫学的方法を用いて疾病の原因に接近するための第 1 歩といえるある要因と疾病との因果に関する仮説を設定するための糸口を得る食塩摂取量が多い地域ほど高血圧者の有病率が高い食塩多量摂取が血圧上昇の原因なのかもしれない野菜果物摂取量が多い地域ほど循環器疾患がん罹患率が低い野菜果物 ( に含まれる何らかの成分 ) が循環器疾患がんを予防するかもしれない送電線の近くでは小児白血病の罹患率が高い電磁波が白血病に罹患する危険を高めるかもしれない ( 次のスライドで用語チェック ) 疾病頻度の表し方有病率 (prevalence) ある一時点で疾病 A である者の割合 ( 点有病率 ) 例 : 今年の国民健康栄養調査では高血圧者が 40% でした罹患率 (incidence rate) ある期間中 (1 年間など ) に疾病 A に罹患する人の割合例 : 地域がん登録によると今年の肺がん罹患率は人口 10 万対 30 でした死亡率 (mortality rate, death rate) ある期間中 (1 年間など ) に疾病 A で死亡する人の割合例 : 人口動態統計によると今年の脳卒中死亡率は人口 10 万人対 100 でした Morbidity rate という言葉が登場することがあり罹患率を指すことが多いが使い方があいまいなので本来は使うべきではない用語第 1 段階 ( 記述疫学 ) 概念図 (1) 横断研究 ( 生態学的研究を含む ) 現在時間軸比較個人の血圧 ( 地域の高血圧有病率 ) など食塩摂取量どちらが原因か分からない ( 地域間で異なる要因は他にもいろいろある ) 3

フレンチパラドックスは生態学的研究から出てきた話 1 人あたり乳脂肪摂取が多い肉消費も多いしかし虚血性心疾患死亡率は低い田中平三著疫学入門演習南山堂 S.Renaud et al.:the Lancet,339,1523(1992) ( 人口動態統計 ) 横断研究による血圧と肥満度食塩摂取量の関係 (40 歳以上女性 1347 名 ) 因果関係の逆転に注意! 個人レベルの横断研究の例収縮期血圧 (mmhg) 140 135 130 125 120 115 110 P<0.001 for trend Q1 Q2 Q3 Q4 肥満度 (BMI) の四分位値は年齢調整最小二乗平均と標準誤差収縮期血圧 (mmhg) 140 135 130 125 120 115 110 P=0.005 for trend Q1 Q2 Q3 Q4 食塩摂取量の四分位飲酒量が多い人ほど血圧が高い肥満度が高い人ほど中性脂肪が高い相関回帰分析運動習慣がある人は HDL コレステロールが高い喫煙者は血中ビタミン C 濃度が低い脳卒中患者は血圧が高い平均値の差の検定肺がん患者は喫煙率が低い割合の差の検定 4

統計横断研究でよく使われる解析方法 1 平均値を群間で比較する平均値と標準誤差 ( や標準偏差 ) を群毎に計算して t 検定 (2 群の差正規分布 ) Mann-Whitney U 検定 ( 非正規分布 ) 分散分析 (3 群以上の差 ) Kruskall-Wallis 検定 ( 非正規分布 ) 共分散分析 ( 交絡変数で調整して 2 群以上の差 ) 割合を群間で比較する割合 (%) を群毎に計算して χ 2 検定 (2 3 3 以上のクロス表 ) Fisher の正確な検定 (2 2 2 表小標本 ) Mantel-Haenszel 検定 ( 交絡変数で調整したクロス表 ) 拡張 Mantel 検定 (2 3 3 以上のクロス表で順序尺度の場合 ) 多重ロジスティックモデル ( 多変量解析 ) 統計基本医学データの種類計量データ : 量的に測定できる連続的な測定値連続データ ( 例 ) 身長体重血圧血清総コレステロール栄養素摂取量離散データ ( 例 ) う歯の本数計数データ : カテゴリー型のもの 2 値 ( 例 ) 性別の男と女既往歴の有りとなしカテゴリーが 3 つ以上順序尺度 ordinal scale: : 順序関係はあるが絶対量としての意味はない測定値 ( 例 ) 濃い味付けが好きですか : とても好き好きふつう嫌いとても嫌い名義尺度 nominal scale: : 順序関係がない分類のための変数 ( 例 ) 喫煙の現喫煙, 非喫煙, やめた, など. ポイント : 一見同じ質的データに見えても順序尺度で量反応関係に注目する場合は用いる統計手法が違う統計データを整理するいきなり平均標準偏差を計算しない! まずヒストグラムヒストグラム等を描いて分布を視覚的に確認その後適切な要約統計量要約統計量を決めて分布の特徴を表現するいきなり検定しない! まず図や要約統計量で比較図や要約統計量で比較して特徴を確認その後適切な方法で検定統計分布型を確認統計学的方法のうちよく使うのうちよく使うパラメトリックな方法 (t 検定など ) では左で右対称な分布 ( 正規分布 ) を前提としているものが多い従って可能ならば何らかの変換変換によって正規分布に近似させてから処理すべきである対数変換平方根変換 Box-Cox Cox( ( べき ) 変換など正規分布に近似できない場合ノンパラメトリックな方法ノンパラメトリックな方法を考慮 ( 後述 ) 度数図 2 正規分布左右対称でベル形 ( 正規分布 ) 度数図 3 対数正規分布右に歪んでいる ( 対数正規分布 ) 測定値測定値を対数変換 ( 横軸を log[ 測定値 ] に ) すると左右対称になる測定値 5

統計 50 log 中性脂肪 (log mg/dl) 120 中性脂肪 (mg/dl) 統計代表値 ( 中心位置の指標 ) 45 40 100 図 4 分布型と代表値度数 ( 人 ) 35 30 25 20 15 10 対数変換度数 ( 人 ) 80 60 40 20 左右対称の分布 ( 正規分布など ) 中央値歪んだ分布 ( 対数正規分布など ) 5 0 34.0-68.3-102.6-136.9-171.3-205.6-239.9-274.2-308.5-342.8-377.2-411.5-445.8-480.1-514.4-548.7-583.1-617.4-651.7-686.0-3.5-3.7-3.8-4.0-4.2-4.3-4.5-4.6-4.8-4.9-5.1-5.3-5.4-5.6-5.7-5.9-6.1-6.2-6.4-6.5-0 対数正規分布の典型例中性脂肪ビタミン A 摂取量など正規分布の典型例身長体重総エネルギー主栄養素摂取量など医学データは少し右裾が長いことが多い最中平頻央均値値値最幾頻何値平均平均値左右対称な場合に有用中央値非対称等歪んだ分布の場合平均値統計度数図 5 標準偏差はバラツキの指標平均 ±1 標準偏差 ( 全体の 68%) 平均 ±2 標準偏差 ( 全体の 95%) 平均 =100 標準偏差 =20 平均 =100 標準偏差 =40 0 20 40 60 80 100 120 140 160 180 200 測定値上側隣接値 75% 点中央値 25% 点下側隣接値箱ヒゲ図代表値 ( 中心位置の指標 ) と散布度 ( バラツキの指標 ) として平均と標準偏差平均と標準偏差中央値と四分偏差中央値と四分偏差の組合せがよく用いられる統計標準偏差と標準誤差を混同しない度数 ( 人 ) 60 50 40 30 20 10 0 血清総コレステロール平均 (mg/dl) 193, 標準偏差 20 (mg/dl) 平均 193, 標準誤差 3 (mg/dl) 標準偏差はデータのばらつき標準誤差は標本平均の確からしさ 113.0-124.6-136.3-147.9-159.5-171.2-182.8-194.4-206.1-217.7-229.3-240.9-252.6-264.2-275.8-287.5-299.1-310.7-322.4-334.0- 血清総コレステロール (mg/dl) どちらを使うかは何を言いたいかによるどちらを示したか必ず明記する 6

統計ところで検定って何? 検定とは観測された差 ( や関連 ) が偶然によるものか否かがを判断する方法検定の論法真実 ( 母集団 ) は差 ( や関連 ) がないと仮定する (= 帰無仮説 H 0 ) 帰無仮説が正しい場合に標本において観測された差 ( や関連 ) が生じる確率 (P( P 値 ) を計算するその確率が十分に小さければ ( 例えば P<0.05) ) 帰無仮説が正しい場合に偶然では起こりにくいことが起きたということなので帰無仮説を棄却して真実は差 ( や関連 ) がある (= 対立仮説 H 1 ) と判断する ( 一般に有意差があるという ) 統計肥満者母集団血圧未知標本 20 例平均 =130mmHg 正常体重者母集団血圧未知標本 30 例平均 =120mmHg 帰無仮説 ( 肥満と正常体重で母集団の血圧の平均は同じ ) が正しい場合に標本平均に 10mmHg の差が生じる確率は? t 検定で 1%(P=0.01) と計算された帰無仮説が正しければめったに生じない現象がおきたといえる従ってたぶん帰無仮説は正しくないのだろう対立仮説 ( 肥満と正常体重で母集団の血圧の平均は異なる ) を採用統計真実検定における 2 種類の判断ミス検定は万能ではなくしばしばしばしば誤った判断に陥ることがある差がある差がない判断 ( 検定結果 ) 差がある第 1 種の過誤 (α エラー ) 差がない ( あるとはいえない ) 第 2 種の過誤 (βエラー) P 値は第 1 種の過誤が生じる確率判断の基準とする確率を有意水準という第 2 種の過誤が生じない確率のことを検出力 ( パワー ) という一般に標本数が小さいほど検出力も小さい = 第 2 種の過誤が生じやすい例数設計の必要性統計有意差なしは差がないことを積極的に示したわけではない! 例 1 肥満者と正常体重者 10 人ずつの血圧を測った平均値の差は 10mmHg で有意差はなかった有意差はなかった肥満者と正常体重者 100 人ずつの血圧を測った平均値の差は 10mmHg で有意差があった有意差があった差がないことを証明するためにはケチって小標本にすればいい???( そんな馬鹿な!) 7

統計横断研究でよく使われる解析方法 2 統計相関と回帰 ( 続き ) 相関と回帰図 8 回帰直線測定値 B 図 7 正相関と負相関 3-3 正相関 -3 3 測定値 A 測定値 B 3-3 負相関 -3 3 測定値 A 無相関相関係数 -1~+1 の値をとり 2 変数の直線的な関連の強さを表す検定も行う ( 帰無仮説 : 母相関係数 =0) 測定値 B 3-3 -3 3 測定値 A 3 (従測属定変値 Y 数)α -3 この距離 2 の合計が最小になるように直線を決める ( 最小二乗法 ) y=βx+α -3 3 測定値 X ( 独立変数 ) 相関係数の検定 ( 帰無仮説 : 母相関係数 =0) 回帰係数の検定 ( 帰無仮説 : 母回帰係数 =0) 両者の結果は一致する回帰直線 2 つの連続量の関係を y=βx+ x+αの形の 1 次式で表したもの回帰係数 β 相関係数と違い単位があるので様々な値をとる独立変数が 1 増加した時の従属変数の増加量の期待値を表す第 1 段階 ( 記述疫学 ) のポイント生態学的研究とと個人レベルの横断研究個人レベルの横断研究比較的容易にできる原因と結果の時間的順序関係を考慮していない因果関係を証明する証拠能力は乏しい証拠能力は乏しい ( 最も低い ) ある要因と疾病との因果に関する仮説を設定するための糸口を得る因果関係があると結論してはいけない第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究第 2 段階 ( 分析疫学 ) 症例対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力低い高い 8

第 2 段階 ( 分析疫学 ) 原則的にはコホート研究 ( 前向き研究 ) によってまずある事象 ( 要因 ) が起こりこれに続いて他の事象 ( 疾病 ) が起こることを記述する疫学的仮説を統計学的に検定してある要因と疾病との因果関係を推理因果関係を推理するコホート研究が不可能な疾患 ( 困難な場合 ) に関しては症例対照研究 ( 後向き研究 ) も行われる (2) 症例対照研究過去 ( 患者は発病前 ) 喫煙習慣喫煙習慣比較現在肺がん患者 (case) 非患者 ( 対照 =control) 肺がん患者 100 名と健康な非患者 ( 対照 ) の発病前 ( 過去 ) の喫煙習慣を調べた肺がん患者では 8 割が喫煙者だった対照では 4 割が喫煙者だった喫煙が肺がんの原因である可能性がある (3) コホート研究現在将来 ( 例 10 年後 ) 喫煙群 ( コホート ) 非喫煙群比較肺がん罹患率肺がん罹患率健康な人々 1 万人の現在の喫煙状況を健診で調べたその後 10 年間追跡調査したところ喫煙群からの肺がん罹患率は非喫煙群からの肺がん罹患率の 10 倍だった喫煙が肺がんの原因である可能性がある関連の強さの指標 ( 相対危険 : relative risk) 喫煙していると肺癌になりやすくなるこの意味をよく考えてみたことがありますか? 喫煙していると 5 倍肺癌になりやすくなるというのと倍喫煙していると 10 倍肺癌になりやすくなるというのでは倍後者の方がより喫煙と肺癌の関連が強いと考えられる (2) 症例対照研究過去 ( 患者は発病前 ) 食物繊維摂取量比較食物繊維摂取量現在大腸がん患者非患者 (3) コホート研究現在将来 ( 例 10 年後 ) 食物繊維多量摂取群 ( コホート ) 食物繊維少量摂取群比較大腸がん罹患率大腸がん罹患率この倍の部分を倍の部分を相対危険相対危険と呼ぶある要因 Y による疾病 X の発生の相対危険度が 5 であるというのは要因 Y に暴露されると疾病 X になる確率が 5 倍に増加することを意味する相対危険 = 曝露群の罹患率非曝露群の罹患率喫煙しなくても肺癌になる人がいるのも事実であるしかしもしあなたが喫煙していなければ将来肺癌になる確率はかなり小さい一方喫煙していれば将来肺癌になる確率は喫煙しなかった場合に比べて 5~10 倍程度に大きなものとなる ( 相対危険が 5~10 程度 ) であろう症例対照研究コホート研究方向後向き前向き人数 100~ 数百症例 + 対照数千 ~ 数十万人費用労力比較的少ない多大要因曝露情報信頼性やや低い信頼性高い疾病の診断正確やや不正確 ( 診断基準が必要 ) 対照群の偏り生じやすい - 稀な疾病調査可能調査不可能相対危険オッズ比で近似可能直接計算可能 9

第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究第 2 段階 ( 分析疫学 ) 症例対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力低い高い (2) 症例対照研究過去 ( 患者は発病前 ) 食物繊維摂取量比較食物繊維摂取量現在大腸がん患者非患者患者と非患者 ( 対照 ) の過去の要因曝露状況を比較対照を集める際に偏りが生じやすい要因曝露は記憶に頼るので偏る可能性あり性年齢構成を合わせるためにマッチドペア法も用いられる症例対照研究で必ず使う解析方法答え (2) 症例対照研究過去 ( 患者は発病前 ) 食物繊維摂取量比較食物繊維摂取量現在大腸がん患者非患者 70 30 40 60 胃がん症例対照喫煙はい 70 40 いいえ 30 60 計 100 100 自分で計算してみようオッズ比 =(70/30)/(40/60)=3.5 田中平三著疫学入門演習南山堂症例対照研究では相対危険の近似値としてオッズ比を計算論文では主な結果を示す場面で必ずオッズ比 ( とその信頼区間 ) が出てくる 10

統計オッズ比の検定と信頼区間オッズ比を計算するだけでなくその信頼区間も同時に計算して示す例 : オッズ比 (95% 信頼区間 )=0.29 (0.16-0.51) 0.51) 研究結果は少数標本に基づくものなので偶然によって関連が見られただけかもしれないそこで信頼区間を計算する真の値が 0.16-0.51 0.51の範囲にある可能性がとても高いと解釈すると解釈する関連の強さはこの範囲のどこかだろうこれが例えば 0.1-1.2 1.2だとすると真の値は 1かも知れないので関連があるとは判断できない検定することもある例 : オッズ比 =0.29, P=0.01 本当は関連がない ( 母オッズ比 =1) ) なのに偶然によってこのオッズ比が得られる確率が P 値 P=0.01 ならば偶然によってこのように小さなオッズ比 0.29 が得られる確率は 1% である従って偶然とは考えにくいので関連があると判断するこれが例えば P=0.2 だとすると 5 回に 1 回は偶然で見られる関連ということを意味するだから偶然かも知れないので関連があるとは判断できない (2) 症例対照研究過去 ( 患者は発病前 ) 食物繊維摂取量食物繊維摂取量比較交絡因子の調整現在大腸がん患者非患者若年者非喫煙者は食物繊維摂取量が多いとすると高齢者が多い喫煙者が多い高齢者が少ない喫煙者が少ないこういう状況では比較しても解釈不能この場合年齢と喫煙のことを大腸癌と食物繊維との関連における交絡因子という交絡因子の影響を取り除くことを調整するという例えば年齢と喫煙で調整した (adjusted for age and smoking) などという何で調整しているか要注意調整してオッズ比を計算するためにマッチングやロジスティック回帰 (logistic regression) がよく用いられる交絡変数 ( 交絡因子 ) 注目している 2 変数間の関連に影響を及ぼしてその関連を見えにくくしたり見えにくくしたり誤って見かけ上関連があるように見せてしまう第 3 の変数食塩摂取量直接的な関係血圧正相関見かけの関連年齢正相関 = 交絡変数 11

第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究第 2 段階 ( 分析疫学 ) 症例対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力低い高い健康な大勢の人々について現在の要因曝露状況を比較 ( 健診等 ) その後長年追跡して要因曝露状況別の罹患率や死亡率を比較する (3) コホート研究現在将来 ( 例 10 年後 ) 食物繊維多量摂取群 ( コホート ) 食物繊維少量摂取群大腸がん罹患率大腸がん罹患率途中で脱落する人の情報も含めるために人年法を用いることが多い性年齢等の交絡因子の調整交絡因子の調整を行って相対危険を推定するために直接法間接法 Cox 比例ハザードモデルなどが用いられる比較 (3) コホート研究現在将来 ( 例 10 年後 ) 食物繊維多量摂取群 ( コホート ) 食物繊維少量摂取群コホート研究で必ず使う解析方法比較大腸がん罹患率大腸がん罹患率 30 20 1000 2000 疾病の罹患率は多くの場合 1 年間に人口 1000 人あたり 2 人というような表現をするコホート研究で 1000 人の集団を 10 年間追跡したところ 20 人の患者が発生したとするとこれは 10 年間に人口 1000 人あたり 20 人と考えてよいのだろうか?( 実は必ずしも正しくない!) 一般住民を 10 年も観察していれば転居等によって追跡不能となることもあるし注目している疾病にはならなかったものの他の理由で死亡してしまう者もいるだろうつまり集団の人口が 10 年の間に大きく変化する可能性がある罹患率を計算するためには分母である集団の人口が変わってしまっては困るので前述の 10 年間に人口 1000 人あたり 20 人は必ずしも適切な表現ではないそこで以下のように罹患率を計算することがよく行われるこれを人時法 ( 人年法 ) というコホート研究では相対危険を直接計算論文中で主な結果を示すために必ず相対危険 ( ハザード比など ) が出てくる田中平三著疫学入門演習南山堂 12

統計粗死亡率で比較非喫煙群喫煙群年齢階級人年死亡数死亡率人年死亡数死亡率統計粗死亡率で比較非喫煙群喫煙群年齢階級人年死亡数死亡率人年死亡数死亡率 40 歳代 200 10 0.05 500 50 0.10 50 歳代 600 60 0.10 200 40 0.20 60 歳以上 400 200 0.50 100 70 0.70 40 歳代 200 10 0.05 500 50 0.10 50 歳代 600 60 0.10 200 40 0.20 60 歳以上 400 200 0.50 100 70 0.70 全年齢計 1200 270 0.23 800 160 0.20 全年齢計 1200 270 0.23 800 160 0.20 相対危険基準 (=1) 0.20 0.23=0.89 相対危険基準 (=1) 0.20 0.23=0.89 直接法による年齢調整死亡率で比較基準集団非喫煙群喫煙群年齢階級人年死亡率期待死亡数死亡率期待死亡数 40 歳代 700 5.0% 35 10.0% 70 50 歳代 800 10.0% 80 20.0% 160 60 歳以上 500 50.0% 250 70.0% 350 全年齢計 2000 365 580 年齢調整死亡率 ( 直接法 ) 365 2000=0.18 580 2000=0.29 年齢調整相対危険基準群 (=1) 0.29 0.18=1.59 非喫煙群 + 喫煙群の人年計とした間接法標準化死亡比 (SMR) 基準集団非喫煙群喫煙群年齢階級死亡率人年期待死亡数観測死亡数人年期待死亡数観測死亡数 40 歳代 0.086 200 17 10 500 43 50 50 歳代 0.125 600 75 60 200 25 40 60 歳以上 0.540 400 216 200 100 54 70 全年齢計 0.215 1200 308 270 800 122 160 標準化死亡比 (SMR) 270 308=0.877 (87.7) 160 122=1.311 (131.1) 年齢調整相対危険基準群 (=1) 1.311 0.877=1.50 非喫煙群 + 喫煙群計の死亡率としたコホート研究の例血清ビタミン C 濃度と脳卒中罹患リスク追跡 1977 年 2000 年血中 VC 低値新潟県新発田市某地域血中 VC 高値発症率を比較する脳卒中脳卒中追跡期間中 (20 年間 :1977-1997 年 ) のイベント発生数人数男性女性男女計全コホート対象者 880 1241 2121 脳卒中罹患全脳卒中 91 105 196 脳梗塞 58 51 109 出血性脳卒中 18 36 54 脳出血 14 24 38 くも膜下出血 4 12 16 鑑別不能 15 18 33 死亡による観察打ち切り 295 285 580 市外転出による観察打ち切り 40 97 137 13

相対危険 1.2 1 0.8 0.6 0.4 0.2 0 ベースライン時の血清ビタミン C 濃度と追跡期間中の全脳卒中全脳卒中罹患リスク性年齢調整男女計 ( トレント P=0.002) 男性 ( トレント P=0.051) 女性 ( トレント P=0.014) Q1 Q2 Q3 Q4 血清ビタミン C 濃度 ( 四分位 ) 相対危険多変量調整多変量調整 : 性年齢平均血圧血清総コレステロール BMI 心房細動の有無降圧剤服用の有無虚血性心疾患既往歴の有無身体活動度喫煙の有無飲酒量で調整 1.2 1 0.8 0.6 0.4 0.2 0 男女計 ( トレント P=0.017) 男性 ( トレント P=0.22) 女性 ( トレント P=0.021) Q1 Q2 Q3 Q4 血清ビタミン C 濃度 ( 四分位 ) 第 2 段階 ( 分析疫学 ) のポイント症例対照研究とコホート研究原因と結果の時間的順序関係を考慮している因果関係を証明する証拠能力はやや高い証拠能力はやや高い ( 介入研究よりは低い ) ある要因と疾病との因果に関する仮説を検定する相対危険が大きいほど因果関係である可能性が高いまだ因果関係があると結論することはできない第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究第 2 段階 ( 分析疫学 ) 症例対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力低い高い第 3 段階 ( 実験疫学 ) 対象集団に積極的に干渉し例えばビタミン剤を投与し続けてみるプラセボを投与した集団で肺癌の発生率が変わらずビタミン剤を投与した集団で肺癌の発生率が低下すれば因果関係が確固たるものになる ( 実際には複数の介入研究で確認される必要あり ) 特に無作為化比較試験 : randomized controlled trial の証拠能力は最も高い 14

要因を保有している人たちを無作為に 2 群に分ける ( 無作為配置 ) 一方に介入し他方に介入せず一定期間後の疾病罹患率を比較する交絡要因の影響はほとんど受けない ( 偶然のバラツキ程度の小さな影響が残る ) (4) 介入研究現在将来 ( 例 5 年後 ) 疾病の累積罹患率強力な降圧治療通常の血圧管理比較脳卒中罹患率脳卒中罹患率図 2 介入研究による疾病罹患率の変化の比較対照群観察期間処理群比較罹患率ではなく危険因子等の量的な変数の変化を追う場合もある収縮期血圧 (mmhg) 155 150 145 140 135 130 125 120 介入研究による危険因子の変化の比較処理群対照群比較 1 2 3 4 5 6 7 観察期間 ( 年 ) 並行法介入 A 群非介入 B 群交叉法介入 A 群非介入 B 群血圧測定比較 (t 検定など ) 血圧測定血圧測定血圧測定ウォッシュアウト期間交叉法の方が同じサンプルサイズで検出力が高いただし前半の影響が後半に残る介入では不可能非介入比較 ( 対応のある t 検定など ) ウォッシュアウト期間介入血圧測定血圧測定 Multiple Risk Factor Intervention Trial (MRFIT) 冠動脈心疾患の 3 大危険因子である高血圧喫煙高脂血症への介入効果を評価するために米国で行われた大規模介入研究研究参加者 : 私企業や政府の従業員でスクリーニング検診を受けた約 36 万人の中から血圧喫煙本数血清総コレステロール値がいずれも上位 10% に入る 35~57 57 歳の男性 ( 拡張期血圧 90mmHg 喫煙 30 本 / 日血清総コレステロ - ル 295mg/dl 295mg/dl) ) ただし心疾患の既往がある者心電図異常を示した者糖尿病の者体重が標準体重の 150% 以上の者血清総コレステロール 350mg/dl または拡張期血圧 115mmHg の者 ( 直ちに治療を開始する必要があるため ) 定住傾向のない者 ( 追跡困難なため ) は除外した最終的にはインフォームドコンセントを得られた 12,866 名が研究に参加した無作為割り付け : 研究参加者は介入群 (special( intervention: SI 群 ) と対照群 (usual( care: UC 群 ) に無作為に割り付けられた SI 群は 4 カ月に 1 度降圧治療禁煙カウンセリング高脂血症改善のための食事指導からなる強力な是正プログラムを受けた UC 群は年に 1 度の面接と検査を受けた結果 : 平均 7 年の追跡期間中 SI 群と UC 群の両方で 3 つの危険因子の改善が認められたがその改善の程度は SI 群の方が大きかった冠動脈疾患による死亡率は SI 群の方が少し低かったが統計学的に有意ではなかった文献 :Multiple: Risk Factor Intervention Trial Research Group. Multiple risk factor intervention trial. Risk factor changes and mortality y results. JAMA 1982: 248:1465-77. 15

βカロチン神話の崩壊中国河南省林県 (3 万人 )1986) 1986-9191 βカロチンビタミン E セレン投与群で全がんがん死亡率 13% 低下胃がん 21% 低下フィンランド男性喫煙者 (3 万人 )1985) 1985-9393 βカロチン投与群の肺がんがん罹患率が 18% 増加米国男性医師 (2 万 2 千人 )1982) 1982-9595 βカロチンにがんがんの予防効果も害もなし米国喫煙アスヘスト作業者 (1 万 8 千人 )1988) 1988-98 βカロチン投与群の肺がんがん罹患率が 28% 増加介入研究でよく使う解析方法死亡罹患等のイベント発生をエンドポイント相対危険度の推定 Cox 比例ハザードモデルなど平均値の差の検定 t 検定分散分析共分散分析など割合の差の検定 χ 2 検定 Fisher の正確な検定多重ロジスティックモデルなど検証的な無作為化比較試験の統計解析試験実施計画書 ( プロトコール ) 背景目的治療法の概要対象患者 ( 選択除外基準 ) 同意取得法試験の方法評価項目観察検査項目中止基準有害事象発生時の取扱実施計画書からの逸脱の報告試験の終了中止中断実施計画書の変更実施期間統計解析症例数と設定根拠プロトコールが確定したら対象を集め始める前に臨床試験登録システム (UMIN-CTR 等 ) に必ず登録する! 未登録だと主要国際誌では受け付けてもらえない検証的な無作為化比較試験の統計解析事前に以下の評価項目を明示しておく主要評価項目 (Primary endpoint) 最も重要な結果変数を具体的に通常は 1 つ評価時点も明記統計解析方法も明記一般に有効性の評価に関するもの副次的評価項目 (Secondary endpoints) 次に重要な結果変数を具体的に評価時点も明記統計解析方法も明記有効性安全性に関するもの上記以外に細かい検討を加えることもある ( オプション ) 16

第 3 段階 ( 実験疫学 ) のポイント積極的に介入する交絡要因の影響が入らない因果関係を証明する証拠能力は高い証拠能力は高い ( 特に無作為化比較試験 ) ある要因と疾病との因果関係を決定する因果関係があると結論する ( ただし複数の研究で支持されること ) 第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 生態学的研究 (ecological study) 個人レベルの横断研究第 2 段階 ( 分析疫学 ) 症例対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力低い高い複数の研究で支持されればより証拠は確固たるものになる考えてみよう健康栄養食品アドバイザリースタッフテキストブック ( 第一出版 ) ココアにはがんや動脈硬化を予防する効果があるという動物実験結果が示されましたどんな研究を行ったら人間でもそれを確かめられますか? あるコホート研究でリコピンの摂取量が多い人ではがんの罹患率が低いことが報告されましたこの結果から一般の人にお勧めできることは何? タバコを毎日 20 本吸いながら野菜はあまり食べずに βカロチンを錠剤で摂取している人がいますどんなアドバイスをしますか? タバコを吸っていても肺癌にならない人がいるのは事実ですだからタバコは肺癌の原因じゃないと主張する人に対して何と説明しますか? 17

交絡の調整と多変量解析栄養疫学の基礎 2 評価方法とバイアスの取り扱い国立保健医療科学院技術評価部横山徹爾総エネルギー調整栄養疫学における食事調査と誤差集団の摂取量分布を推定する交絡変数注目している 2 変数間の関連に影響を及ぼしてその関連を見えにくくしたり見えにくくしたり誤って見かけ上関連があるように見せてしまう第 3 の変数食塩摂取量直接的な関係血圧偏相関と重回帰他の要因の影響を補正したうえで 2 変数間の直線的な関連を表す方法食塩摂取量年齢の影響を除いたより直接的な関連 ( 偏相関係数 =0.2) ( 偏回帰係数 =2.0) 血圧正相関見かけの関連正相関正相関見かけの関連 ( 相関係数 =0.3) ( 回帰係数 =3.0) 正相関年齢 = 交絡変数年齢 = 交絡変数 1

重回帰分析注目している連続量 Yと複数の要因 X 1,X 2,..., X n との関係を 1 次式の形で表したもの Y=β 1 X 1 +β 2 X 2 +......β n X n + 切片 + 誤差 β 1 ~β n を偏回帰係数偏回帰係数という Yは正規分布 ( 正確には誤差が正規分布 ) 重回帰分析では偏回帰係数と切片を最小二乗法で推定して解釈するどの程度よく説明できているかを表す指標として決定係数 R 2 を参考にする多重ロジスティック回帰では Yが疾病有無の logit 多変量 Cox 回帰では Yがハザードの形になっている従って解釈のしかたは似ているまずは重回帰から ( 単 ) 回帰分析と重回帰分析の解釈の違い ( 多重ロジスティック回帰多変量 Cox 回帰も同じ ) 収縮期血圧 ( 単 ) 回帰分析重回帰分析回帰係数標準誤差 P 値偏回帰係数標準誤差 P 値飲酒量 ( 合 ) 4.0 0.5 <0.001 4.1 0.5 <0.001 喫煙量 ( 箱 ) 2.0 0.9 0.02 0.5 0.8 0.90 ( 単 ) 回帰分析の解釈重回帰分析の解釈飲酒量が 1 合多いと血圧は喫煙の影響を除いても ( 調整して 4mmHg 高いがこれに含まれるも ) 飲酒量が 1 合多いと血圧は喫煙の影響はわからないわからない 4.1 mmhg 高い喫煙量が 1 箱多いと血圧は 2mmHg 高いがこれに含まれる飲酒の影響はわからないわからない飲酒の影響を除くと ( 調整すると ) 喫煙量と血圧の関係は明らかでない他の変数の影響を調整したうえで 2 変数間の関連を調べるのが重回帰分析同時に用いた説明変数によって解釈が少し変わる重回帰分析の説明変数に関する注意 ( 多重ロジスティック回帰多変量 Cox 回帰も同じ ) 全く同じ意味を持つ 2 変数を同時に使ってはいけない例 )2 回測定した血圧を 2 つとも同時に説明変数に入れるのはナンセンス! 類似の理由で相関が非常に強い 2 変数を同時に使うのは望ましくないことが多い変数のもつ医学的な意味医学的な意味が変わることがあるので注意例 ) 身長と体重を同時に入れると身長で調整した体重って肥満度みたいなもの多重ロジスティックモデルによる飲酒喫煙習慣と食道がんとの関連説明変数オッズ比 (95% 信頼区間 ) 飲酒量なし 1.0 基準少量 4.4 (1.6-12.6) 中等量 18.6 (6.9-50.0) 多量 39.4 (14.4-107) やめた 26.4 (7.7-90.9) 喫煙 30pack 年未満 1.0 基準 30pack 年以上 3.0 (2.04-4.40) 年齢もモデルに含めて調整してある正しい解釈はどれか? 1 2 合以上の飲酒者は喫煙本数も多いので食道がんリスクが高い 2 年齢と喫煙の影響を調整しても 2 合以上の飲酒者はそうでない者よりも食道がんリスクが高い 3 20 本以上の喫煙者が食道がんリスクが高いのは喫煙者は飲酒することが多いからである 4 年齢と飲酒の影響を調整しても 20 本以上の喫煙者はそうでない者よりも食道がんリスクが高い 2

交絡の調整と多変量解析総エネルギー調整栄養疫学における食事調査と誤差集団の摂取量分布を推定する総エネルギー調整総エネルギー摂取量が多い人はエネルギー源である糖質糖質たん白たん白質総脂肪の摂取量も多いエネルギー源でないビタミン A ビタミン C カルシウム食物繊維などとも正相関を示すとする報告が多いこれは身体の大きさが大きく身体活動が多く代謝効率の低い人は一般に多くの量の食物を摂取するため総エネルギー摂取量が多いのみならずエネルギー源でない栄養素の摂取量もまた多くなる傾向があるため総エネルギーのことを考慮せずに例えば食塩摂取量が多い人は心疾患リスク他高かったという結果が得られてもそれは食塩ではなくて総エネルギー摂取量が多かったからかもしれない総エネルギー摂取量を調整する必要性エネルギー調整栄養素摂取量と疾病罹患のリスク分析 ( コホート研究症例対照研究など ) を行う場合エネルギー調整はほぼ必ず行われている (Willett の ) 残差法重回帰分析栄養素密度法これらのうち栄養素密度法はエネルギーの影響を完全には補正できない糖質たん白質脂質のエネルギー比は総エネルギー摂取量と中等度の正相関を示すことが多いビタミン C など総エネルギー摂取量と相関の弱い栄養素の栄養素密度は総エネルギー摂取量と負相関を示すことがある (Willett の ) 残差法総エネルギー調整栄養素摂取量 = a+b 総エネルギーとは無相関になるよく使う重回帰モデル疾病 Y のリスク =β1 総エネルギー調整栄養素摂取量 +β2 総エネルギー摂取量 +β3 性別 +β4 年齢 + + 切片 + 誤差 3

交絡の調整と多変量解析総エネルギー調整栄養疫学における食事調査と誤差集団の摂取量分布を推定する食事調査と誤差食習慣と疾病罹患との関連を調べるために食事調査を行うとする調査法は? 習慣的摂取量食物摂取頻度調査法食事歴法数日間の摂取量食事記録法 24 時間思い出し法こちらが推奨されることが多いがなぜだろう? 測定誤差誤差とは? 測定の段階で生じる誤差性質によって系統的誤差測定値が真の値から測定値が真の値から特定の方向にずれて ( 偏って ) いるランダム誤差ずれが特定の方向にずれない ( 偏らない = ずれの平均がゼロ ) 系統的誤差 ( とランダム誤差 ) 真の値目盛り測定値平均と真の値はずれたまま一定方向にずれている測定を繰り返しても測定の系統的誤差の例被験者の測定条件食事記録調査を週末だけ行った夏だけ行った被検者のくせ肥満者の過少申告測定者のくせ未熟なインタビューアによる 24 時間思い出し法コード付けの不統一測定機器のくせ食品成分表絶対量の評価を想定していない FFQ 伸びたメジャー 4

ランダム誤差測定値真の値目盛り測定のランダム誤差の例食事内容は毎日大きく変わるので 1 日の食事調査では習慣的な摂取量を把握しているとはいえない複数日調査すればその平均が真の値 ( 長期間の習慣的な摂取量 ) に近づくランダム誤差が大きいと真実の関連が見えにくくなる ( 薄まって見える ) 真実の相対危険度 =2.0= なのに 1.5 とか 1.2 とかのように関連が弱く見える食事記録による測定値は何を見ているのか? 測定値 = 真の ( 長期間の習慣的な ) 摂取量 + 日間変動 ( 調査日数を増やして平均をとると減少 ) 0 調査日数を増やすと真の値からのバラツキが小さくなる平均値のバラツキ ( 標準誤差 ) は日数に反比例 ( 仮想データ例 : 個人内変動係数 25%) 真の ( 長期間の習慣的な ) 摂取量 30 日 14 日 7 日 3 日 2 日 1 日摂取量の平均値 (g/ 日 ) (+ その他の誤差 ) 食事調査法と疫学研究習慣的摂取量 ( 食物摂取頻度調査法など ) 長期間の平均的な値を推定しているのでランダム誤差が小さい真実の関連が薄まりにくいだからリスク分析で推奨されるただし系統的誤差は入る可能性があるので (FFQ は ) 絶対量の評価には向かない集団の摂取量の平均値を推定したい場合は不向き個人の順序づけはできる数日間の摂取量 ( 食事記録法など ) 個人内変動 ( 日々の摂取量の変動 ) が大きいため個人の習慣的摂取量からのぶれ ( ランダム誤差 ) が非常に大きい真実の関連が薄まって見えるつまり相対危険度が 1 に近い ( 関連がない ) ように見えるだからリスク分析で推奨されない薄まった関連を統計学的に補正して相対危険度の真実の ( 薄まっていない ) 値を推定する方法もあるただし誤差も一緒に拡大される交絡の調整と多変量解析総エネルギー調整栄養疫学における食事調査と誤差集団の摂取量分布を推定する 5

小数日の食事記録調査から集団の摂取量分布を推定する測定値 = 真の ( 長期間の習慣的な ) 摂取量 + 日間変動 ( 調査日数を増やして平均をとると減少 ) 0 調査日数を増やすと真の値からのバラツキが小さくなる平均値のバラツキ ( 標準誤差 ) は日数に反比例 ( 仮想データ例 : 個人内変動係数 25%) 真の ( 長期間の習慣的な ) 摂取量 30 日 14 日 7 日 3 日 2 日 1 日摂取量の平均値 (g/ 日 ) (+ その他の誤差 ) 1 日の食事記録では個人の摂取量および集団レベルでの摂取量の分布を把握困難真の ( 長期間の平均的な ) 摂取量 ( 分散 σ 2 b ) + = 日々のばらつき ( 分散 σ w 2 ) 1 日の食事記録で把握される摂取量 ( 分散 σ b 2 +σ w 2 ) 真の摂取量の分布ある個人の摂取量の日々のばらつき個人内変動 ( 日間差 ) 1 日の測定値の分布集団の評価において EAR 以下の人の割合は 1 日調査ではこんなに過大評価 ( 先ほどの図 ) EAR 長期間の平均的な摂取量の分布 1 日の測定値の分布集団において 1 日調査のデータから習慣的な摂取量の分布を推定するには? いろいろ試行錯誤されている以下の 2 つが有名 National Research Council : Nutrient Adequacy; Assessment Using Food Consumption Surveys. National Academy Press, Washington DC, 1986 分散分析を用いた比較的簡単基本的比較的簡単基本的な方法 Nusser SM, Carriquiry AL, Dodd KW, Fuller WA : A semiparametric transformation approach to estimating usual daily intake distributions. J Am Stat Assoc 91: 1440-1449, 1449, 1996 かなり複雑だが方法的にはだが方法的にはより望ましいと思われる専用ソフトが有料で提供されているこれの簡易版である Best-Power 法は日本語ソフトが無料で提供されている ( 国立保健医療科学院 ) 必要な情報 1 日の食事調査データ個人内変動を推定するための複数日の食事調査データ ( 全員でなくてもよい ) 6

基本的な考え方個人間変動個人内変動が正規分布の場合分散分析 ANOVA により σ b 2 と σ w 2 を推定真の ( 長期間の平均的な ) 摂取量 ( 分散 σ b 2 ) 長期間の平均的な摂取量の分布 ( 調整摂取量の分布 ) SD( 個人間 ) 真の分布を推定日々のばらつき ( 分散 σ w 2 ) 真の摂取量の分布ある個人の摂取量の日々のばらつき個人内変動 ( 日間差 ) SD( 粗摂取量 ) 1 日調査の分布と平均値は変えずに横幅を (σ b2 /(σ b2 + σ w2 )) 倍に圧縮する 1 日の食事記録で把握される摂取量 ( 分散 σ b 2 +σ w 2 ) 1 日の測定値の分布 1 日の測定値の分布 ( 粗摂取量 ) 調整摂取量 = 粗摂取量の平均 + ( 粗摂取量 - 粗摂取量の平均 ) (SD( 個人間 ) SD( 粗摂取量 )) 1 元配置分散分析による個人間変動 σ 2 b 個人内変動 σ 2 w の推定分散分析 (Analysis of Variance: ANOVA) データのバラツキ ( 分散 ) をある要因で説明できる成分とそれ以外の成分に分解する方法 ( 要因が 1 個の場合を 1 元配置 ~) 例 ) 複数日の食事調査を複数の人びとに行った場合の栄養素摂取量のバラツキ個人差 ( 個人間変動 ) それ以外 ( 日間差 = 個人内変動 ) 最低 2 日以上の調査が必要 ID 番号調査日たんぱく質 1 1 64.9 1 2 118.8 1 3 102.1 2 1 85.9 2 2 94.3 2 3 53.4 3 1 57.7 3 2 40.8 3 3 37.1 4 1 16.1 4 2 36.8 4 3 13.0 200 3 88.8 200 1 86.8 200 2 89.4 例 )200 人を対象に 3 日間食事記録調査個体を効果とした 1 元配置分散分析個人間分散 σ 2 b 個人内分散 σ 2 w を推定平均 =76.2g/ 日標準偏差 =24.6g/ 日 7

ID 番号調査日たんぱく質調整値 1 1 64.9 68.5 1 2 118.8 105.1 1 3 102.1 93.8 2 1 85.9 82.8 2 2 94.3 88.5 2 3 53.4 60.7 3 1 57.7 63.7 3 2 40.8 52.2 3 3 37.1 49.7 4 1 16.1 35.4 4 2 36.8 49.4 4 3 13.0 33.3 調整摂取量 200 1 86.8 83.4 200 2 89.4 85.2 200 3 88.8 84.8 =76.2+( 粗摂取量 -76.2) (16.7 24.6) 76.2 g/ 日長期間の平均的なたんぱく質摂取量の分布 SD=16.7 g/ 日 SD=24.6 g/ 日 1 日の測定値の分布専用ソフトのデモ下記よりダウンロード可能 ( 無料 ) http://www.niph.go.jp/soshiki/gijutsu www.niph.go.jp/soshiki/gijutsu/ download/habitdist/index_j.html このハンドアウトの pdf が欲しい方は http://www.niph.go.jp/soshiki/gijutsu/staffs www.niph.go.jp/soshiki/gijutsu/staffs/ yokoyama/etc/kaizen2008jan.pdf 全分散 - 個人内分散 = 個人間分散としてもよい 8