第 3 回日本栄養改善学会 実践栄養学研究集中セミナー 2008.1.12. 名古屋最終版資料世の中にあふれる健康情報 栄養疫学の基礎 1 デザインと解析 国立保健医療科学院技術評価部横山徹爾 世の中にあふれる健康情報どれがどのくらい信用できるの??? 血清総コレステロ - ルが高いと虚血性心疾患に罹患する危険が高い抗酸化ビタミンをたくさん摂ると がんに罹患する危険が下がる赤ワインに多く含まれるポリフェノールは動脈硬化を予防する辛いものを食べると食道がんに罹患しやすい減塩して血圧が下がると脳卒中に罹患する危険が下がるコーヒーを飲む人は肝がんに罹患しにくい 世の中にあふれる健康情報 どれがどのくらい信用できるの??? 信用できる とは? 偉い人が言った 新聞 テレビで報道された ではなくて 証拠 ( 科学的根拠 ) が十分にあることでは 証拠とは何? 例 : 血清総コレステロールが高いと虚血性心疾患に罹患する危険が高いということは誰でも知っているでは その証拠は何だか知っていますか? 証拠 ( 科学的根拠 ) メカニズムを追求しようとするもの コレステロ - ルが高いとなぜ虚血性心疾患に罹患しやすいのだろう? 緑黄色野菜を多く食べるとなぜがんに罹患しにくいのだろう? 動物実験試験管の中での ( ヒトの細胞を使った ) 実験 ある現象が本当にヒトにおいて生じているかどうかを調べるもの コレステロ - ルが高いと虚血性心疾患になりやすいという現象が本当に人間集団の中でおきているのだろうか? 緑黄色野菜を多く食べるとがんに罹患しにくいという現象が本当に人間集団の中でおきているのだろうか? 疫学研究 ( 観察研究 ) じゃあ コレステロ - ルを下げたら虚血性心疾患になりにくくなるのだろうか? ビタミン剤を摂取したらがんが予防できるだろうか? 疫学研究 ( 介入研究 ) 1
疫学的な研究論文の読み方 疫学研究の主な結果は原著論文 ( 主に英語 ) として発表される 英語が苦手だと読めない? はい でも 疫学の原理と方法疫学の原理と方法を知っていれば辞書を引きながら ( 時間をかければ ) 読むことは可能 日本語論文ならば ( 誰でも ) 読める? いいえ 疫学の原理と方法疫学の原理と方法を知らない人が 100 回読んでも 正しく理解することは不可能 つまり 疫学的な研究論文を読む ためには 疫学の原理と方法を学ぶことが必須! 疫学は人間集団を対象とし, 病態すなわち疾病の結果をみるのではなく, 疾病の原因を追究する学問である 人間集団 原因? 脳卒中 心筋梗塞 がん 高血圧高脂血症喫煙運動不足肥満過剰飲酒 食習慣 脳卒中 心筋梗塞 がん 原因追及の過程 - 疫学のサイクル - 第 1 段階 ( 記述疫学 ) 生態学的研究 横断研究第 2 段階 ( 分析疫学 ) 症例 対照研究 コホート研究第 3 段階 ( 実験疫学 ) 介入研究 仮説設定の糸口を得る 仮説を検証する 因果関係を決定する 証拠能力 低い 高い これらの証拠は? 多くは疫学研究の結果に基づく 講義の目標 : 各研究デザインの原理と解析方法を理解する 2
第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究 第 2 段階 ( 分析疫学 ) 症例 対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力 低い 高い 第 1 段階 ( 記述疫学 ) 人 場所 時 の変数について 疾病頻度を記述する どんな人が どんな場所で どんな時に疾病になるのか 克明に記述することは 疫学的方法を用いて疾病の原因に接近するための第 1 歩といえる ある要因と疾病との因果に関する仮説を設定するための糸口を得る 食塩摂取量が多い地域ほど 高血圧者の有病率が高い 食塩多量摂取が血圧上昇の原因なのかもしれない 野菜 果物摂取量が多い地域ほど 循環器疾患 がん罹患率が低い野菜 果物 ( に含まれる何らかの成分 ) が循環器疾患 がんを予防するかもしれない 送電線の近くでは小児白血病の罹患率が高い電磁波が 白血病に罹患する危険を高めるかもしれない ( 次のスライドで用語チェック ) 疾病頻度の表し方 有病率 (prevalence) ある一時点で疾病 A である者の割合 ( 点有病率 ) 例 : 今年の国民健康 栄養調査では高血圧者が 40% でした 罹患率 (incidence rate) ある期間中 (1 年間など ) に疾病 A に罹患する人の割合 例 : 地域がん登録によると 今年の肺がん罹患率は人口 10 万対 30 でした 死亡率 (mortality rate, death rate) ある期間中 (1 年間など ) に疾病 A で死亡する人の割合 例 : 人口動態統計によると 今年の脳卒中死亡率は人口 10 万人対 100 でした Morbidity rate という言葉が登場することがあり 罹患率を指すことが多いが 使い方があいまいなので 本来は使うべきではない用語 第 1 段階 ( 記述疫学 ) 概念図 (1) 横断研究 ( 生態学的研究を含む ) 現在時間軸 比較 個人の血圧 ( 地域の高血圧有病率 ) など 食塩摂取量 どちらが原因か分からない ( 地域間で異なる要因は他にもいろいろある ) 3
フレンチ パラドックスは生態学的研究から出てきた話 1 人あたり乳脂肪摂取が多い 肉消費も多い しかし虚血性心疾患死亡率は低い 田中平三著疫学入門演習南山堂 S.Renaud et al.:the Lancet,339,1523(1992) ( 人口動態統計 ) 横断研究による血圧と肥満度 食塩摂取量の関係 (40 歳以上女性 1347 名 ) 因果関係の逆転に注意! 個人レベルの横断研究の例 収縮期血圧 (mmhg) 140 135 130 125 120 115 110 P<0.001 for trend Q1 Q2 Q3 Q4 肥満度 (BMI) の四分位 値は年齢調整最小二乗平均と標準誤差 収縮期血圧 (mmhg) 140 135 130 125 120 115 110 P=0.005 for trend Q1 Q2 Q3 Q4 食塩摂取量の四分位 飲酒量が多い人ほど血圧が高い肥満度が高い人ほど中性脂肪が高い 相関 回帰分析運動習慣がある人は HDL コレステロールが高い喫煙者は血中ビタミン C 濃度が低い脳卒中患者は血圧が高い 平均値の差の検定肺がん患者は喫煙率が低い 割合の差の検定 4
統計 横断研究でよく使われる解析方法 1 平均値を群間で比較する 平均値と標準誤差 ( や標準偏差 ) を群毎に計算して t 検定 (2 群の差 正規分布 ) Mann-Whitney U 検定 ( 非正規分布 ) 分散分析 (3 群以上の差 ) Kruskall-Wallis 検定 ( 非正規分布 ) 共分散分析 ( 交絡変数で調整して 2 群以上の差 ) 割合を群間で比較する 割合 (%) を群毎に計算して χ 2 検定 (2 3 3 以上のクロス表 ) Fisher の正確な検定 (2 2 2 表 小標本 ) Mantel-Haenszel 検定 ( 交絡変数で調整したクロス表 ) 拡張 Mantel 検定 (2 3 3 以上のクロス表で順序尺度の場合 ) 多重ロジスティックモデル ( 多変量解析 ) 統計 基本 医学データの種類 計量データ : 量的に測定できる連続的な測定値 連続データ ( 例 ) 身長 体重 血圧 血清総コレステロール 栄養素摂取量 離散データ ( 例 ) う歯の本数 計数データ : カテゴリー型のもの 2 値 ( 例 ) 性別の 男 と 女 既往歴の 有り と なし カテゴリーが 3 つ以上 順序尺度 ordinal scale: : 順序関係はあるが絶対量としての意味はない測定値 ( 例 ) 濃い味付けが好きですか : とても好き 好き ふつう 嫌い とても嫌い名義尺度 nominal scale: : 順序関係がない分類のための変数 ( 例 ) 喫煙の 現喫煙, 非喫煙, やめた, など. ポイント : 一見同じ質的データに見えても 順序尺度で量反応関係に注目する場合は 用いる統計手法が違う 統計 データを整理する いきなり平均 標準偏差を計算しない! まず ヒストグラムヒストグラム等を描いて分布を視覚的に確認 その後 適切な要約統計量要約統計量を決めて分布の特徴を表現するいきなり検定しない! まず 図や要約統計量で比較図や要約統計量で比較して特徴を確認 その後 適切な方法で検定 統計 分布型を確認 統計学的方法のうち よく使うのうち よく使うパラメトリックな方法 (t 検定など ) では 左で右対称な分布 ( 正規分布 ) を前提としているものが多い 従って 可能ならば 何らかの変換変換によって正規分布に近似させてから処理すべきである 対数変換 平方根変換 Box-Cox Cox( ( べき ) 変換など正規分布に近似できない場合 ノンパラメトリックな方法ノンパラメトリックな方法を考慮 ( 後述 ) 度数 図 2 正規分布 左右対称でベル形 ( 正規分布 ) 度数 図 3 対数正規分布 右に歪んでいる ( 対数正規分布 ) 測定値 測定値を対数変換 ( 横軸を log[ 測定値 ] に ) すると 左右対称になる 測定値 5
統計 50 log 中性脂肪 (log mg/dl) 120 中性脂肪 (mg/dl) 統計 代表値 ( 中心位置の指標 ) 45 40 100 図 4 分布型と代表値 度数 ( 人 ) 35 30 25 20 15 10 対数変換 度数 ( 人 ) 80 60 40 20 左右対称の分布 ( 正規分布など ) 中央値 歪んだ分布 ( 対数正規分布など ) 5 0 34.0-68.3-102.6-136.9-171.3-205.6-239.9-274.2-308.5-342.8-377.2-411.5-445.8-480.1-514.4-548.7-583.1-617.4-651.7-686.0-3.5-3.7-3.8-4.0-4.2-4.3-4.5-4.6-4.8-4.9-5.1-5.3-5.4-5.6-5.7-5.9-6.1-6.2-6.4-6.5-0 対数正規分布の典型例 中性脂肪 ビタミン A 摂取量など正規分布の典型例 身長 体重 総エネルギー 主栄養素摂取量など医学データは 少し右裾が長いことが多い 最中平頻央均値値値 最幾頻何値平均 平均値 左右対称な場合に有用中央値 非対称等 歪んだ分布の場合 平均値 統計 度数 図 5 標準偏差はバラツキの指標 平均 ±1 標準偏差 ( 全体の 68%) 平均 ±2 標準偏差 ( 全体の 95%) 平均 =100 標準偏差 =20 平均 =100 標準偏差 =40 0 20 40 60 80 100 120 140 160 180 200 測定値 上側隣接値 75% 点中央値 25% 点下側隣接値 箱ヒゲ図 代表値 ( 中心位置の指標 ) と散布度 ( バラツキの指標 ) として 平均と標準偏差平均と標準偏差 中央値と四分偏差中央値と四分偏差 の組合せがよく用いられる 統計 標準偏差と標準誤差を混同しない 度数 ( 人 ) 60 50 40 30 20 10 0 血清総コレステロール平均 (mg/dl) 193, 標準偏差 20 (mg/dl) 平均 193, 標準誤差 3 (mg/dl) 標準偏差は データのばらつき標準誤差は 標本平均の確からしさ 113.0-124.6-136.3-147.9-159.5-171.2-182.8-194.4-206.1-217.7-229.3-240.9-252.6-264.2-275.8-287.5-299.1-310.7-322.4-334.0- 血清総コレステロール (mg/dl) どちらを使うかは 何を言いたいかによるどちらを示したか 必ず明記する 6
統計 ところで 検定って何? 検定とは 観測された差 ( や関連 ) が偶然によるものか否かがを判断する方法検定の論法 真実 ( 母集団 ) は差 ( や関連 ) がない と仮定する (= 帰無仮説 H 0 ) 帰無仮説が正しい場合に 標本において観測された差 ( や関連 ) が生じる確率 (P( P 値 ) を計算する その確率が十分に小さければ ( 例えば P<0.05) ) 帰無仮説が正しい場合に偶然では起こりにくいことが起きたということなので 帰無仮説を棄却して 真実は差 ( や関連 ) がある (= 対立仮説 H 1 ) と判断する ( 一般に 有意差がある という ) 統計 肥満者 母集団血圧未知 標本 20 例平均 =130mmHg 正常体重者 母集団血圧未知 標本 30 例平均 =120mmHg 帰無仮説 ( 肥満と正常体重で母集団の血圧の平均は同じ ) が正しい場合に標本平均に 10mmHg の差が生じる確率は? t 検定で 1%(P=0.01) と計算された 帰無仮説が正しければめったに生じない現象がおきたといえる 従って たぶん帰無仮説は正しくないのだろう 対立仮説 ( 肥満と正常体重で母集団の血圧の平均は異なる ) を採用 統計 真実 検定における 2 種類の判断ミス 検定は万能ではなく しばしばしばしば誤った判断に陥ることがある 差がある 差がない 判断 ( 検定結果 ) 差がある 第 1 種の過誤 (α エラー ) 差がない ( あるとはいえない ) 第 2 種の過誤 (βエラー) P 値は 第 1 種の過誤が生じる確率 判断の基準とする確率を有意水準という 第 2 種の過誤が生じない確率のことを検出力 ( パワー ) という 一般に 標本数が小さいほど検出力も小さい = 第 2 種の過誤が生じやすい 例数設計の必要性 統計 有意差なし は 差がない ことを積極的に示したわけではない! 例 1 肥満者と正常体重者 10 人ずつの血圧を測った 平均値の差は 10mmHg で 有意差はなかった有意差はなかった 肥満者と正常体重者 100 人ずつの血圧を測った 平均値の差は 10mmHg で 有意差があった有意差があった 差がない ことを証明するためには ケチって小標本にすればいい???( そんな馬鹿な!) 7
統計横断研究でよく使われる解析方法 2 統計相関と回帰 ( 続き ) 相関と回帰図 8 回帰直線 測定値 B 図 7 正相関と負相関 3-3 正相関 -3 3 測定値 A 測定値 B 3-3 負相関 -3 3 測定値 A 無相関 相関係数 -1~+1 の値をとり 2 変数の直線的な関連の強さを表す 検定も行う ( 帰無仮説 : 母相関係数 =0) 測定値 B 3-3 -3 3 測定値 A 3 (従測属定変値 Y 数)α -3 この距離 2 の合計が最小になるように直線を決める ( 最小二乗法 ) y=βx+α -3 3 測定値 X ( 独立変数 ) 相関係数の検定 ( 帰無仮説 : 母相関係数 =0) 回帰係数の検定 ( 帰無仮説 : 母回帰係数 =0) 両者の結果は一致する 回帰直線 2 つの連続量の関係を y=βx+ x+αの形の 1 次式で表したもの 回帰係数 β 相関係数と違い 単位があるので 様々な値をとる 独立変数が 1 増加した時の 従属変数の増加量の期待値を表す 第 1 段階 ( 記述疫学 ) のポイント 生態学的研究と と 個人レベルの横断研究個人レベルの横断研究 比較的容易にできる 原因と結果の時間的順序関係を考慮していない 因果関係を証明する証拠能力は乏しい証拠能力は乏しい ( 最も低い ) ある要因と疾病との因果に関する仮説を設定するための糸口を得る 因果関係があると結論してはいけない 第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究 第 2 段階 ( 分析疫学 ) 症例 対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力 低い 高い 8
第 2 段階 ( 分析疫学 ) 原則的にはコホート研究 ( 前向き研究 ) によって まずある事象 ( 要因 ) が起こり これに続いて他の事象 ( 疾病 ) が起こることを記述する 疫学的仮説を統計学的に検定して ある要因と疾病との因果関係を推理因果関係を推理する コホート研究が不可能な疾患 ( 困難な場合 ) に関しては 症例 対照研究 ( 後向き研究 ) も行われる (2) 症例 対照研究過去 ( 患者は発病前 ) 喫煙習慣 喫煙習慣 比較 現在 肺がん患者 (case) 非患者 ( 対照 =control) 肺がん患者 100 名と健康な非患者 ( 対照 ) の発病前 ( 過去 ) の喫煙習慣を調べた 肺がん患者では 8 割が喫煙者だった 対照では 4 割が喫煙者だった 喫煙が肺がんの原因である可能性がある (3) コホート研究 現在将来 ( 例 10 年後 ) 喫煙群 ( コホート ) 非喫煙群 比較 肺がん罹患率 肺がん罹患率 健康な人々 1 万人の現在の喫煙状況を健診で調べた その後 10 年間追跡調査したところ 喫煙群からの肺がん罹患率は非喫煙群からの肺がん罹患率の 10 倍だった 喫煙が肺がんの原因である可能性がある 関連の強さの指標 ( 相対危険 : relative risk) 喫煙していると肺癌になりやすくなる この意味をよく考えてみたことがありますか? 喫煙していると 5 倍 肺癌になりやすくなる というのと 倍 喫煙していると 10 倍 肺癌になりやすくなる というのでは 倍 後者の方が より喫煙と肺癌の関連が強いと考えられる (2) 症例 対照研究過去 ( 患者は発病前 ) 食物繊維摂取量比較食物繊維摂取量 現在 大腸がん患者 非患者 (3) コホート研究現在将来 ( 例 10 年後 ) 食物繊維多量摂取群 ( コホート ) 食物繊維少量摂取群 比較 大腸がん罹患率 大腸がん罹患率 この 倍 の部分を 倍 の部分を 相対危険相対危険 と呼ぶ ある要因 Y による疾病 X の発生の相対危険度が 5 である というのは 要因 Y に暴露されると 疾病 X になる確率が 5 倍に増加することを意味する 相対危険 = 曝露群の罹患率 非曝露群の罹患率 喫煙しなくても肺癌になる人がいるのも事実である しかし もし あなたが喫煙していなければ 将来 肺癌になる確率はかなり小さい 一方 喫煙していれば 将来 肺癌になる確率は 喫煙しなかった場合に比べて 5~10 倍程度に大きなものとなる ( 相対危険が 5~10 程度 ) であろう 症例 対照研究 コホート研究 方向 後向き 前向き 人数 100~ 数百症例 + 対照数千 ~ 数十万人 費用 労力 比較的少ない 多大 要因曝露情報 信頼性やや低い 信頼性高い 疾病の診断 正確 やや不正確 ( 診断基準が必要 ) 対照群の偏り 生じやすい - 稀な疾病 調査可能 調査不可能 相対危険 オッズ比で近似可能 直接計算可能 9
第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究 第 2 段階 ( 分析疫学 ) 症例 対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力 低い 高い (2) 症例 対照研究過去 ( 患者は発病前 ) 食物繊維摂取量比較食物繊維摂取量 現在 大腸がん患者 非患者 患者と非患者 ( 対照 ) の過去の要因曝露状況を比較 対照を集める際に偏りが生じやすい 要因曝露は記憶に頼るので偏る可能性あり 性年齢構成を合わせるために マッチド ペア法も用いられる 症例対照研究で必ず使う解析方法 答え (2) 症例 対照研究過去 ( 患者は発病前 ) 食物繊維摂取量比較食物繊維摂取量 現在 大腸がん患者 非患者 70 30 40 60 胃がん症例 対照 喫煙 はい 70 40 いいえ 30 60 計 100 100 自分で計算してみよう オッズ比 =(70/30)/(40/60)=3.5 田中平三著疫学入門演習南山堂 症例 対照研究では 相対危険の近似値としてオッズ比を計算 論文では主な結果を示す場面で 必ずオッズ比 ( とその信頼区間 ) が出てくる 10
統計 オッズ比の検定と信頼区間 オッズ比を計算するだけでなく その信頼区間も同時に計算して示す 例 : オッズ比 (95% 信頼区間 )=0.29 (0.16-0.51) 0.51) 研究結果は少数標本に基づくものなので 偶然によって関連が見られただけかもしれない そこで信頼区間を計算する 真の値が 0.16-0.51 0.51の範囲にある可能性がとても高いと解釈する と解釈する 関連の強さはこの範囲のどこかだろう これが例えば 0.1-1.2 1.2だとすると 真の値は 1かも知れないので 関連があるとは判断できない 検定することもある 例 : オッズ比 =0.29, P=0.01 本当は関連がない ( 母オッズ比 =1) ) なのに 偶然によってこのオッズ比が得られる確率が P 値 P=0.01 ならば 偶然によってこのように小さなオッズ比 0.29 が得られる確率は 1% である 従って偶然とは考えにくいので 関連があると判断する これが例えば P=0.2 だとすると 5 回に 1 回は偶然で見られる関連ということを意味する だから偶然かも知れないので 関連があるとは判断できない (2) 症例 対照研究 過去 ( 患者は発病前 ) 食物繊維摂取量 食物繊維摂取量 比較 交絡因子の調整 現在 大腸がん患者 非患者 若年者 非喫煙者は食物繊維摂取量が多いとすると 高齢者が多い喫煙者が多い 高齢者が少ない喫煙者が少ない こういう状況では比較しても解釈不能 この場合 年齢と喫煙のことを 大腸癌と食物繊維との関連における交絡因子という 交絡因子の影響を取り除くことを 調整する という 例えば 年齢と喫煙で調整した (adjusted for age and smoking) などという 何で調整しているか要注意 調整してオッズ比を計算するために マッチングや ロジスティック回帰 (logistic regression) がよく用いられる 交絡変数 ( 交絡因子 ) 注目している 2 変数間の関連に影響を及ぼして その関連を見えにくくしたり見えにくくしたり 誤って見かけ上関連があるように見せてしまう 第 3 の変数 食塩摂取量 直接的な関係 血圧 正相関 見かけの関連 年齢 正相関 = 交絡変数 11
第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究 第 2 段階 ( 分析疫学 ) 症例 対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力 低い 高い 健康な大勢の人々について 現在の要因曝露状況を比較 ( 健診等 ) その後 長年追跡して 要因曝露状況別の罹患率や死亡率を比較する (3) コホート研究現在将来 ( 例 10 年後 ) 食物繊維多量摂取群 ( コホート ) 食物繊維少量摂取群 大腸がん罹患率 大腸がん罹患率 途中で脱落する人の情報も含めるために 人年法を用いることが多い 性 年齢等の交絡因子の調整交絡因子の調整を行って相対危険を推定するために 直接法 間接法 Cox 比例ハザードモデルなどが用いられる 比較 (3) コホート研究現在将来 ( 例 10 年後 ) 食物繊維多量摂取群 ( コホート ) 食物繊維少量摂取群 コホート研究で必ず使う解析方法 比較 大腸がん罹患率 大腸がん罹患率 30 20 1000 2000 疾病の罹患率は 多くの場合 1 年間に 人口 1000 人あたり 2 人 というような表現をする コホート研究で 1000 人の集団を 10 年間追跡したところ 20 人の患者が発生したとすると これは 10 年間に 人口 1000 人あたり 20 人 と考えてよいのだろうか?( 実は必ずしも正しくない!) 一般住民を 10 年も観察していれば 転居等によって 追跡不能となることもあるし 注目している疾病にはならなかったものの 他の理由で死亡してしまう者もいるだろう つまり 集団の人口が 10 年の間に大きく変化する可能性がある 罹患率を計算するためには 分母である集団の人口が変わってしまっては困るので 前述の 10 年間に 人口 1000 人あたり 20 人 は 必ずしも適切な表現ではない そこで 以下のように罹患率を計算することがよく行われる これを人時法 ( 人年法 ) という コホート研究では 相対危険を直接計算 論文中で主な結果を示すために必ず相対危険 ( ハザード比など ) が出てくる 田中平三著疫学入門演習南山堂 12
統計 粗死亡率で比較 非喫煙群 喫煙群 年齢階級 人年 死亡数 死亡率 人年 死亡数 死亡率 統計 粗死亡率で比較 非喫煙群 喫煙群 年齢階級 人年 死亡数 死亡率 人年 死亡数 死亡率 40 歳代 200 10 0.05 500 50 0.10 50 歳代 600 60 0.10 200 40 0.20 60 歳以上 400 200 0.50 100 70 0.70 40 歳代 200 10 0.05 500 50 0.10 50 歳代 600 60 0.10 200 40 0.20 60 歳以上 400 200 0.50 100 70 0.70 全年齢計 1200 270 0.23 800 160 0.20 全年齢計 1200 270 0.23 800 160 0.20 相対危険基準 (=1) 0.20 0.23=0.89 相対危険基準 (=1) 0.20 0.23=0.89 直接法による年齢調整死亡率で比較 基準集団 非喫煙群 喫煙群 年齢階級 人年 死亡率 期待死亡数 死亡率 期待死亡数 40 歳代 700 5.0% 35 10.0% 70 50 歳代 800 10.0% 80 20.0% 160 60 歳以上 500 50.0% 250 70.0% 350 全年齢計 2000 365 580 年齢調整死亡率 ( 直接法 ) 365 2000=0.18 580 2000=0.29 年齢調整相対危険 基準群 (=1) 0.29 0.18=1.59 非喫煙群 + 喫煙群の人年計とした 間接法 標準化死亡比 (SMR) 基準集団 非喫煙群 喫煙群 年齢階級死亡率 人年 期待死亡数 観測死亡数 人年 期待死亡数 観測死亡数 40 歳代 0.086 200 17 10 500 43 50 50 歳代 0.125 600 75 60 200 25 40 60 歳以上 0.540 400 216 200 100 54 70 全年齢計 0.215 1200 308 270 800 122 160 標準化死亡比 (SMR) 270 308=0.877 (87.7) 160 122=1.311 (131.1) 年齢調整相対危険 基準群 (=1) 1.311 0.877=1.50 非喫煙群 + 喫煙群計の死亡率とした コホート研究の例血清ビタミン C 濃度と脳卒中罹患リスク 追跡 1977 年 2000 年 血中 VC 低値新潟県新発田市 某地域 血中 VC 高値 発症率を比較する 脳卒中 脳卒中 追跡期間中 (20 年間 :1977-1997 年 ) のイベント発生数 人数 男性 女性 男女計 全コホート対象者 880 1241 2121 脳卒中罹患全脳卒中 91 105 196 脳梗塞 58 51 109 出血性脳卒中 18 36 54 脳出血 14 24 38 くも膜下出血 4 12 16 鑑別不能 15 18 33 死亡による観察打ち切り 295 285 580 市外転出による観察打ち切り 40 97 137 13
相対危険 1.2 1 0.8 0.6 0.4 0.2 0 ベースライン時の血清ビタミン C 濃度と追跡期間中の全脳卒中全脳卒中罹患リスク 性年齢調整 男女計 ( トレント P=0.002) 男性 ( トレント P=0.051) 女性 ( トレント P=0.014) Q1 Q2 Q3 Q4 血清ビタミン C 濃度 ( 四分位 ) 相対危険 多変量調整 多変量調整 : 性 年齢 平均血圧 血清総コレステロール BMI 心房細動の有無 降圧剤服用の有無 虚血性心疾患既往歴の有無 身体活動度 喫煙の有無 飲酒量で調整 1.2 1 0.8 0.6 0.4 0.2 0 男女計 ( トレント P=0.017) 男性 ( トレント P=0.22) 女性 ( トレント P=0.021) Q1 Q2 Q3 Q4 血清ビタミン C 濃度 ( 四分位 ) 第 2 段階 ( 分析疫学 ) のポイント 症例 対照研究とコホート研究 原因と結果の時間的順序関係を考慮している 因果関係を証明する証拠能力はやや高い証拠能力はやや高い ( 介入研究よりは低い ) ある要因と疾病との因果に関する仮説を検定する 相対危険が大きいほど因果関係である可能性が高い まだ 因果関係があると結論することはできない 第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 地域レベルの横断研究 = 生態学的研究 (ecological study) 個人レベルの横断研究 第 2 段階 ( 分析疫学 ) 症例 対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力 低い 高い 第 3 段階 ( 実験疫学 ) 対象集団に積極的に干渉し 例えばビタミン剤を投与し続けてみる プラセボを投与した集団で肺癌の発生率が変わらず ビタミン剤を投与した集団で肺癌の発生率が低下すれば 因果関係が確固たるものになる ( 実際には複数の介入研究で確認される必要あり ) 特に 無作為化比較試験 : randomized controlled trial の証拠能力は最も高い 14
要因を保有している人たちを無作為に 2 群に分ける ( 無作為配置 ) 一方に介入し 他方に介入せず 一定期間後の疾病罹患率を比較する 交絡要因の影響はほとんど受けない ( 偶然のバラツキ程度の小さな影響が残る ) (4) 介入研究現在将来 ( 例 5 年後 ) 疾病の累積罹患率 強力な降圧治療 通常の血圧管理 比較 脳卒中罹患率 脳卒中罹患率 図 2 介入研究による疾病罹患率の変化の比較 対照群 観察期間 処理群 比較 罹患率ではなく 危険因子等の量的な変数の変化を追う場合もある 収縮期血圧 (mmhg) 155 150 145 140 135 130 125 120 介入研究による危険因子の変化の比較 処理群 対照群 比較 1 2 3 4 5 6 7 観察期間 ( 年 ) 並行法介入 A 群非介入 B 群交叉法介入 A 群非介入 B 群 血圧測定 比較 (t 検定など ) 血圧測定 血圧測定 血圧測定 ウォッシュアウト期間 交叉法の方が 同じサンプルサイズで検出力が高い ただし 前半の影響が後半に残る介入では不可能 非介入 比較 ( 対応のある t 検定など ) ウォッシュアウト期間 介入 血圧測定 血圧測定 Multiple Risk Factor Intervention Trial (MRFIT) 冠動脈心疾患の 3 大危険因子である高血圧 喫煙 高脂血症への介入効果を評価するために米国で行われた大規模介入研究 研究参加者 : 私企業や政府の従業員でスクリーニング検診を受けた約 36 万人の中から 血圧 喫煙本数 血清総コレステロール値がいずれも上位 10% に入る 35~57 57 歳の男性 ( 拡張期血圧 90mmHg 喫煙 30 本 / 日 血清総コレステロ - ル 295mg/dl 295mg/dl) ) ただし 心疾患の既往がある者 心電図異常を示した者 糖尿病の者 体重が標準体重の 150% 以上の者 血清総コレステロール 350mg/dl または拡張期血圧 115mmHg の者 ( 直ちに治療を開始する必要があるため ) 定住傾向のない者 ( 追跡困難なため ) は除外した 最終的には インフォームドコンセントを得られた 12,866 名が研究に参加した 無作為割り付け : 研究参加者は介入群 (special( intervention: SI 群 ) と対照群 (usual( care: UC 群 ) に 無作為に割り付けられた SI 群は 4 カ月に 1 度 降圧治療 禁煙カウンセリング 高脂血症改善のための食事指導からなる強力な是正プログラムを受けた UC 群は 年に 1 度の面接と検査を受けた 結果 : 平均 7 年の追跡期間中 SI 群と UC 群の両方で 3 つの危険因子の改善が認められたが その改善の程度は SI 群の方が大きかった 冠動脈疾患による死亡率は SI 群の方が少し低かったが 統計学的に有意ではなかった 文献 :Multiple: Risk Factor Intervention Trial Research Group. Multiple risk factor intervention trial. Risk factor changes and mortality y results. JAMA 1982: 248:1465-77. 15
βカロチン神話の崩壊 中国河南省林県 (3 万人 )1986) 1986-9191 βカロチン ビタミン E セレン投与群で全がんがん死亡率 13% 低下 胃がん 21% 低下フィンランド男性喫煙者 (3 万人 )1985) 1985-9393 βカロチン投与群の肺がんがん罹患率が 18% 増加米国男性医師 (2 万 2 千人 )1982) 1982-9595 βカロチンにがんがんの予防効果も害もなし米国喫煙 アスヘ スト作業者 (1 万 8 千人 )1988) 1988-98 βカロチン投与群の肺がんがん罹患率が 28% 増加 介入研究でよく使う解析方法 死亡 罹患等のイベント発生をエンドポイント 相対危険度の推定 Cox 比例ハザードモデルなど 平均値の差の検定 t 検定 分散分析 共分散分析など 割合の差の検定 χ 2 検定 Fisher の正確な検定 多重ロジスティックモデルなど 検証的な無作為化比較試験の統計解析試験実施計画書 ( プロトコール ) 背景目的治療法の概要対象患者 ( 選択 除外基準 ) 同意取得法試験の方法評価項目観察 検査項目 中止基準有害事象発生時の取扱実施計画書からの逸脱の報告試験の終了 中止 中断実施計画書の変更実施期間統計解析症例数と設定根拠 プロトコールが確定したら 対象を集め始める前に 臨床試験登録システム (UMIN-CTR 等 ) に必ず登録する! 未登録だと 主要国際誌では受け付けてもらえない 検証的な無作為化比較試験の統計解析 事前に以下の評価項目を明示しておく 主要評価項目 (Primary endpoint) 最も重要な結果変数を具体的に 通常は 1 つ 評価時点も明記 統計解析方法も明記 一般に 有効性の評価に関するもの 副次的評価項目 (Secondary endpoints) 次に重要な結果変数を具体的に 評価時点も明記 統計解析方法も明記 有効性 安全性に関するもの 上記以外に 細かい検討を加えることもある ( オプション ) 16
第 3 段階 ( 実験疫学 ) のポイント 積極的に介入する 交絡要因の影響が入らない 因果関係を証明する証拠能力は高い証拠能力は高い ( 特に無作為化比較試験 ) ある要因と疾病との因果関係を決定する 因果関係があると結論する ( ただし複数の研究で支持されること ) 第 1 段階 ( 記述疫学 ) 横断研究 (cross-sectional sectional study) 生態学的研究 (ecological study) 個人レベルの横断研究 第 2 段階 ( 分析疫学 ) 症例 対照研究 (case-control control study) コホート研究 (cohort study) 第 3 段階 ( 実験疫学 ) 介入研究 (intervention study) 証拠能力 低い 高い 複数の研究で支持されれば より証拠は確固たるものになる 考えてみよう 健康 栄養食品アドバイザリースタッフ テキストブック ( 第一出版 ) ココアには がんや動脈硬化を予防する効果があるという動物実験結果が示されました どんな研究を行ったら人間でもそれを確かめられますか? あるコホート研究で リコピンの摂取量が多い人では がんの罹患率が低いことが報告されました この結果から 一般の人にお勧めできることは何? タバコを毎日 20 本吸いながら 野菜はあまり食べずに βカロチンを錠剤で摂取している人がいます どんなアドバイスをしますか? タバコを吸っていても 肺癌にならない人がいるのは事実です だからタバコは肺癌の原因じゃない と主張する人に対して 何と説明しますか? 17
交絡の調整と多変量解析 栄養疫学の基礎 2 評価方法とバイアスの取り扱い 国立保健医療科学院技術評価部横山徹爾 総エネルギー調整 栄養疫学における食事調査と誤差 集団の摂取量分布を推定する 交絡変数 注目している 2 変数間の関連に影響を及ぼして その関連を見えにくくしたり見えにくくしたり 誤って見かけ上関連があるように見せてしまう 第 3 の変数 食塩摂取量 直接的な関係 血圧 偏相関と重回帰 他の要因の影響を補正したうえで 2 変数間の直線的な関連を表す方法 食塩摂取量 年齢の影響を除いたより直接的な関連 ( 偏相関係数 =0.2) ( 偏回帰係数 =2.0) 血圧 正相関 見かけの関連 正相関 正相関 見かけの関連 ( 相関係数 =0.3) ( 回帰係数 =3.0) 正相関 年齢 = 交絡変数 年齢 = 交絡変数 1
重回帰分析 注目している連続量 Yと 複数の要因 X 1,X 2,..., X n との関係を 1 次式の形で表したもの Y=β 1 X 1 +β 2 X 2 +......β n X n + 切片 + 誤差 β 1 ~β n を偏回帰係数偏回帰係数という Yは正規分布 ( 正確には誤差が正規分布 ) 重回帰分析では 偏回帰係数と切片を最小二乗法で推定して解釈する どの程度よく説明できているかを表す指標として 決定係数 R 2 を参考にする 多重ロジスティック回帰では Yが疾病有無の logit 多変量 Cox 回帰では Yがハザードの形になっている 従って 解釈のしかたは似ている まずは重回帰から ( 単 ) 回帰分析と重回帰分析の解釈の違い ( 多重ロジスティック回帰 多変量 Cox 回帰も同じ ) 収縮期血圧 ( 単 ) 回帰分析 重回帰分析 回帰係数標準誤差 P 値 偏回帰係数標準誤差 P 値 飲酒量 ( 合 ) 4.0 0.5 <0.001 4.1 0.5 <0.001 喫煙量 ( 箱 ) 2.0 0.9 0.02 0.5 0.8 0.90 ( 単 ) 回帰分析の解釈 重回帰分析の解釈 飲酒量が 1 合多いと 血圧は 喫煙の影響を除いても ( 調整して 4mmHg 高いが これに含まれるも ) 飲酒量が 1 合多いと 血圧は喫煙の影響はわからないわからない 4.1 mmhg 高い 喫煙量が 1 箱多いと 血圧は 2mmHg 高いが これに含まれる飲酒の影響はわからないわからない 飲酒の影響を除くと ( 調整すると ) 喫煙量と血圧の関係は明らかでない 他の変数の影響を調整したうえで 2 変数間の関連を調べるのが重回帰分析 同時に用いた説明変数によって 解釈が少し変わる 重回帰分析の説明変数に関する注意 ( 多重ロジスティック回帰 多変量 Cox 回帰も同じ ) 全く同じ意味を持つ 2 変数を同時に使ってはいけない 例 )2 回測定した血圧を 2 つとも同時に説明変数に入れるのはナンセンス! 類似の理由で 相関が非常に強い 2 変数を同時に使うのは 望ましくないことが多い 変数のもつ医学的な意味医学的な意味が変わることがあるので注意 例 ) 身長と体重を同時に入れると 身長で調整した体重って 肥満度みたいなもの 多重ロジスティックモデルによる飲酒 喫煙習慣と食道がんとの関連 説明変数 オッズ比 (95% 信頼区間 ) 飲酒量なし 1.0 基準 少量 4.4 (1.6-12.6) 中等量 18.6 (6.9-50.0) 多量 39.4 (14.4-107) やめた 26.4 (7.7-90.9) 喫煙 30pack 年未満 1.0 基準 30pack 年以上 3.0 (2.04-4.40) 年齢もモデルに含めて調整してある 正しい解釈はどれか? 1 2 合以上の飲酒者は 喫煙本数も多いので食道がんリスクが高い 2 年齢と喫煙の影響を調整しても 2 合以上の飲酒者はそうでない者よりも食道がんリスクが高い 3 20 本以上の喫煙者が食道がんリスクが高いのは 喫煙者は飲酒することが多いからである 4 年齢と飲酒の影響を調整しても 20 本以上の喫煙者はそうでない者よりも食道がんリスクが高い 2
交絡の調整と多変量解析 総エネルギー調整 栄養疫学における食事調査と誤差 集団の摂取量分布を推定する 総エネルギー調整 総エネルギー摂取量が多い人は エネルギー源である糖質 糖質 たん白たん白質 総脂肪の摂取量も多い エネルギー源でないビタミン A ビタミン C カルシウム 食物繊維などとも正相関を示すとする報告が多い これは 身体の大きさが大きく 身体活動が多く 代謝効率の低い人は 一般に多くの量の食物を摂取するため 総エネルギー摂取量が多いのみならず エネルギー源でない栄養素の摂取量もまた多くなる傾向があるため 総エネルギーのことを考慮せずに 例えば 食塩摂取量が多い人は心疾患リスク他高かった という結果が得られても それは食塩ではなくて 総エネルギー 摂取量が多かったからかもしれない 総エネルギー摂取量を調整する必要性 エネルギー調整 栄養素摂取量と疾病罹患のリスク分析 ( コホート研究 症例対照研究など ) を行う場合 エネルギー調整 はほぼ必ず行われている (Willett の ) 残差法 重回帰分析 栄養素密度法これらのうち 栄養素密度法は エネルギーの影響を完全には補正できない 糖質 たん白質 脂質のエネルギー比は 総エネルギー摂取量と中等度の正相関を示すことが多い ビタミン C など 総エネルギー摂取量と相関の弱い栄養素の栄養素密度は 総エネルギー摂取量と負相関を示すことがある (Willett の ) 残差法 総エネルギー調整栄養素摂取量 = a+b 総エネルギーとは無相関になる よく使う重回帰モデル 疾病 Y のリスク =β1 総エネルギー調整栄養素摂取量 +β2 総エネルギー摂取量 +β3 性別 +β4 年齢 + + 切片 + 誤差 3
交絡の調整と多変量解析 総エネルギー調整 栄養疫学における食事調査と誤差 集団の摂取量分布を推定する 食事調査と誤差 食習慣と疾病罹患との関連を調べるために 食事調査を行うとする 調査法は? 習慣的摂取量 食物摂取頻度調査法食事歴法 数日間の摂取量食事記録法 24 時間思い出し法 こちらが推奨されることが多いが なぜだろう? 測定誤差誤差とは? 測定の段階で生じる誤差性質によって系統的誤差 測定値が真の値から測定値が真の値から特定の方向にずれて ( 偏って ) いるランダム誤差 ずれ が 特定の方向にずれない ( 偏らない = ずれの平均がゼロ ) 系統的誤差 ( とランダム誤差 ) 真の値 目盛り 測定値 平均と真の値はずれたまま 一定方向にずれている測定を繰り返しても 測定の系統的誤差の例被験者の測定条件 食事記録調査を週末だけ行った 夏だけ行った被検者の くせ 肥満者の過少申告測定者の くせ 未熟なインタビューアによる 24 時間思い出し法 コード付けの不統一測定機器の くせ 食品成分表 絶対量の評価を想定していない FFQ 伸びたメジャー 4
ランダム誤差 測定値真の値目盛り 測定のランダム誤差の例食事内容は毎日大きく変わるので 1 日の食事調査では習慣的な摂取量を把握しているとはいえない 複数日調査すれば その平均が真の値 ( 長期間の習慣的な摂取量 ) に近づく ランダム誤差が大きいと 真実の関連が見えにくくなる ( 薄まって見える ) 真実の相対危険度 =2.0= なのに 1.5 とか 1.2 とかのように 関連が弱く見える 食事記録による測定値は何を見ているのか? 測定値 = 真の ( 長期間の習慣的な ) 摂取量 + 日間変動 ( 調査日数を増やして平均をとると減少 ) 0 調査日数を増やすと 真の値からのバラツキが小さくなる 平均値のバラツキ ( 標準誤差 ) は 日数に反比例 ( 仮想データ例 : 個人内変動係数 25%) 真の ( 長期間の習慣的な ) 摂取量 30 日 14 日 7 日 3 日 2 日 1 日 摂取量の平均値 (g/ 日 ) (+ その他の誤差 ) 食事調査法と疫学研究 習慣的摂取量 ( 食物摂取頻度調査法など ) 長期間の平均的な値を推定しているので ランダム誤差が小さい 真実の関連が薄まりにくい だからリスク分析で推奨される ただし 系統的誤差は入る可能性があるので (FFQ は ) 絶対量の評価には向かない 集団の摂取量の平均値を推定したい場合は不向き 個人の順序づけはできる 数日間の摂取量 ( 食事記録法など ) 個人内変動 ( 日々の摂取量の変動 ) が大きいため 個人の習慣的摂取量からのぶれ ( ランダム誤差 ) が非常に大きい 真実の関連が薄まって見える つまり 相対危険度が 1 に近い ( 関連がない ) ように見える だからリスク分析で推奨されない 薄まった関連を統計学的に補正して 相対危険度の真実の ( 薄まっていない ) 値を推定する方法もある ただし 誤差も一緒に拡大される 交絡の調整と多変量解析 総エネルギー調整 栄養疫学における食事調査と誤差 集団の摂取量分布を推定する 5
小数日の食事記録調査から 集団の摂取量分布を推定する 測定値 = 真の ( 長期間の習慣的な ) 摂取量 + 日間変動 ( 調査日数を増やして平均をとると減少 ) 0 調査日数を増やすと 真の値からのバラツキが小さくなる 平均値のバラツキ ( 標準誤差 ) は 日数に反比例 ( 仮想データ例 : 個人内変動係数 25%) 真の ( 長期間の習慣的な ) 摂取量 30 日 14 日 7 日 3 日 2 日 1 日 摂取量の平均値 (g/ 日 ) (+ その他の誤差 ) 1 日の食事記録では 個人の摂取量 および集団レベルでの摂取量の分布を把握困難真の ( 長期間の平均的な ) 摂取量 ( 分散 σ 2 b ) + = 日々のばらつき ( 分散 σ w 2 ) 1 日の食事記録で把握される摂取量 ( 分散 σ b 2 +σ w 2 ) 真の摂取量の分布 ある個人 の摂取量の日々のばらつき 個人内変動 ( 日間差 ) 1 日の測定値の分布 集団の評価において EAR 以下の人の割合は 1 日調査ではこんなに過大評価 ( 先ほどの図 ) EAR 長期間の平均的な摂取量の分布 1 日の測定値の分布 集団において 1 日調査のデータから習慣的な摂取量の分布を推定するには? いろいろ試行錯誤されている 以下の 2 つが有名 National Research Council : Nutrient Adequacy; Assessment Using Food Consumption Surveys. National Academy Press, Washington DC, 1986 分散分析を用いた比較的簡単 基本的比較的簡単 基本的な方法 Nusser SM, Carriquiry AL, Dodd KW, Fuller WA : A semiparametric transformation approach to estimating usual daily intake distributions. J Am Stat Assoc 91: 1440-1449, 1449, 1996 かなり複雑だが 方法的にはだが 方法的にはより望ましいと思われる 専用ソフトが有料で提供されている これの簡易版である Best-Power 法は 日本語ソフトが無料で提供されている ( 国立保健医療科学院 ) 必要な情報 1 日の食事調査データ 個人内変動を推定するための複数日の食事調査データ ( 全員でなくてもよい ) 6
基本的な考え方 個人間変動 個人内変動が正規分布の場合 分散分析 ANOVA により σ b 2 と σ w 2 を推定 真の ( 長期間の平均的な ) 摂取量 ( 分散 σ b 2 ) 長期間の平均的な摂取量の分布 ( 調整摂取量の分布 ) SD( 個人間 ) 真の分布を推定 日々のばらつき ( 分散 σ w 2 ) 真の摂取量の分布ある個人 の摂取量の日々のばらつき個人内変動 ( 日間差 ) SD( 粗摂取量 ) 1 日調査の分布と平均値は変えずに 横幅を (σ b2 /(σ b2 + σ w2 )) 倍に圧縮する 1 日の食事記録で把握される摂取量 ( 分散 σ b 2 +σ w 2 ) 1 日の測定値の分布 1 日の測定値の分布 ( 粗摂取量 ) 調整摂取量 = 粗摂取量の平均 + ( 粗摂取量 - 粗摂取量の平均 ) (SD( 個人間 ) SD( 粗摂取量 )) 1 元配置分散分析による 個人間変動 σ 2 b 個人内変動 σ 2 w の推定 分散分析 (Analysis of Variance: ANOVA) データのバラツキ ( 分散 ) を ある要因で説明できる成分と それ以外の成分に分解する方法 ( 要因が 1 個の場合を 1 元配置 ~) 例 ) 複数日の食事調査を複数の人びとに行った場合の栄養素摂取量のバラツキ個人差 ( 個人間変動 ) それ以外 ( 日間差 = 個人内変動 ) 最低 2 日以上の調査が必要 ID 番号 調査日たんぱく質 1 1 64.9 1 2 118.8 1 3 102.1 2 1 85.9 2 2 94.3 2 3 53.4 3 1 57.7 3 2 40.8 3 3 37.1 4 1 16.1 4 2 36.8 4 3 13.0 200 3 88.8 200 1 86.8 200 2 89.4 例 )200 人を対象に 3 日間食事記録調査 個体 を効果とした 1 元配置分散分析 個人間分散 σ 2 b 個人内分散 σ 2 w を推定 平均 =76.2g/ 日標準偏差 =24.6g/ 日 7
ID 番号 調査日たんぱく質 調整値 1 1 64.9 68.5 1 2 118.8 105.1 1 3 102.1 93.8 2 1 85.9 82.8 2 2 94.3 88.5 2 3 53.4 60.7 3 1 57.7 63.7 3 2 40.8 52.2 3 3 37.1 49.7 4 1 16.1 35.4 4 2 36.8 49.4 4 3 13.0 33.3 調整摂取量 200 1 86.8 83.4 200 2 89.4 85.2 200 3 88.8 84.8 =76.2+( 粗摂取量 -76.2) (16.7 24.6) 76.2 g/ 日 長期間の平均的なたんぱく質摂取量の分布 SD=16.7 g/ 日 SD=24.6 g/ 日 1 日の測定値の分布 専用ソフトのデモ 下記よりダウンロード可能 ( 無料 ) http://www.niph.go.jp/soshiki/gijutsu www.niph.go.jp/soshiki/gijutsu/ download/habitdist/index_j.html このハンドアウトの pdf が欲しい方は http://www.niph.go.jp/soshiki/gijutsu/staffs www.niph.go.jp/soshiki/gijutsu/staffs/ yokoyama/etc/kaizen2008jan.pdf 全分散 - 個人内分散 = 個人間分散としてもよい 8