刺激 反応マトリクスから求まる指標 入力 : 刺激実際のクラス negative positive 出力 : 反応観察者が判断したクラス positive negative TP ( ) FP ( ) FN ( ) TN ( ) ü Sensitivity( 感度 ) ü Specificity(

Similar documents
線形システム応答 Linear System response

その人工知能は本当に信頼できるのか? 人工知能の性能を正確に評価する方法を開発 概要人工知能 (AI) によるビッグデータ解析は 医療現場や市場分析など社会のさまざまな分野での活用が進み 今後さらなる普及が予想されています また 創薬研究などで分子モデルの有効性を予測する場合にも AI は主要な検証

線形システム応答 Linear System response

正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 正常 220

スライド 1

Microsoft PowerPoint 古川杉本SASWEB用プレゼン.ppt

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

統計的データ解析

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

基礎統計

Medical3

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - apstattext04.docx

青焼 1章[15-52].indd

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313691E63589F194E497A682C695AA8A84955C2E >

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Medical3

情報工学概論

Microsoft Word - Stattext12.doc

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

EBNと疫学

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313791E63589F194E497A682C695AA8A84955C2E >

Microsoft PowerPoint - e-stat(OLS).pptx

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - Stattext13.doc

解析センターを知っていただく キャンペーン

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

<4D F736F F D204E AB38ED2976C90E096BE A8C9F8DB88A B7982D1928D88D38E968D >

MedicalStatisticsForAll.indd

untitled

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

経済統計分析1 イントロダクション

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

=

第7章

データ科学2.pptx

33 NCCN Guidelines Version NCCN Clinical Practice Guidelines in Oncology (NCCN Guidelines ) (NCCN 腫瘍学臨床診療ガイドライン ) 非ホジキンリンパ腫 2015 年第 2 版 NCCN.or

データ解析

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

X 線 CT における らせん穴あきファントム を用いたスライス厚測定 鹿山清太郎 (1) 伊藤雄也 (1) 山際寿彦 (1) 丹羽正厳 (1), (2) 富田羊一 (1), (3) 辻岡勝美 (4) 加藤良一 (4) 1) 藤田保健衛生大学大学院保健学研究科医用放射線科学領域 2) 市立四日市病院

スライド 1

Probit , Mixed logit

JUSE-StatWorks/V5 活用ガイドブック

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

スライド 1

Microsoft PowerPoint - sc7.ppt [互換モード]

カイ二乗フィット検定、パラメータの誤差

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

PowerPoint プレゼンテーション

EPSON LP-8900ユーザーズガイド

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

生活設計レジメ

44 4 I (1) ( ) (10 15 ) ( 17 ) ( 3 1 ) (2)

I II III 28 29


異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

PowerPoint プレゼンテーション

Microsoft PowerPoint - WAK Flow H20 [互換モード]

ゴシック_ページ番号

ANOVA

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft Word - appendix_b

Microsoft Word - apstattext05.docx

北海道医療大学歯学部シラバス

cm H.11.3 P

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

ChIP-seq

Microsoft Word - 第14回定例会_平田様_final .doc

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

スライド 1

Ⅰ~Ⅴ章 平成22年度地域生物多様性保全実証事業報告書(群馬県ニホンジカ個体数調整)3

コンピューター診断支援装置の性能評価開発ガイドライン

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - ★総合判定基準JABTS 25ver2ppt.ppt

01.PDF

<4D F736F F D DC58F4994C5817A F C A838A815B83588CB48D FC189BB8AED93E089C8816A2E646F63>

untitled

PowerPoint プレゼンテーション

する距離を一定に保ち温度を変化させた場合のセンサーのカウント ( センサーが計測した距離 ) の変化を調べた ( 図 4) 実験で得られたセンサーの温度変化とカウント変化の一例をグラフ 1 に載せる グラフにおいて赤いデータ点がセンサーのカウント値である 計測距離一定で実験を行ったので理想的にはカウ

Microsoft Word - Stattext11.doc

Microsoft Word - mstattext02.docx

統計学の基本 3

Microsoft Word _前立腺がん統計解析資料.docx

シプロフロキサシン錠 100mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにシプロフロキサシン塩酸塩は グラム陽性菌 ( ブドウ球菌 レンサ球菌など ) や緑膿菌を含むグラム陰性菌 ( 大腸菌 肺炎球菌など ) に強い抗菌力を示すように広い抗菌スペクトルを

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

スライド 1

PrimerArray® Analysis Tool Ver.2.2

2017 年 8 月 9 日放送 結核診療における QFT-3G と T-SPOT 日本赤十字社長崎原爆諫早病院副院長福島喜代康はじめに 2015 年の本邦の新登録結核患者は 18,820 人で 前年より 1,335 人減少しました 新登録結核患者数も人口 10 万対 14.4 と減少傾向にあります

memo

経験ベイズ検定による 偽陽性制御の方法 大羽成征 (( おおばしげゆき 京大数理デザイン道場 年 0077 月 2244 日 1155:: :: u.ac.jp

スライド タイトルなし

QuickPrimer 結果判定用エクセルシート は QuickPrimer (Real Time) シリーズ病原因子遺伝子検出用 ( 製品コード MR101 ~ MR107 MR109 ~ MR113) および細菌遺伝子 (16S rdna) 検出用 ( 製品コード MR201 ~ MR205 M

MHC 2013; 20 ( 2 QC QC DNA-QC 3. QCWS 集会参加および参加証明書発行 QCWS QCWS QCWS 解析方法 DNA-QC Luminex SSO SSO SSP SBT QC FlowPRA Lab Screen WAK Flow ICFA 4 HL

Transcription:

刺激 反応マトリクスから求まる指標 入力 : 刺激実際のクラス negative positive 出力 : 反応観察者が判断したクラス positive negative TP ( ) FP ( ) FN ( ) TN ( ) ü Sensitivity( 感度 ) ü Specificity( 特異度 ) ü Positive predictive value( 陽性的中率 :PPV) ü Negative predictive value( 陰性的中率 :NPV) u 感度は u 陽性的中率は ü Accuracy( 正診率, 正解率 ) ü F score(f 値 ) とも呼ばれる とも呼ばれる Accuracy = F score = =

各指標を求めてみよう!(1) 入力 : 刺激実際のクラス negative positive 出力 : 反応観察者が判断したクラス positive negative 20 80 20 10,000 Accuracy= 20+10,000/20+20+10,000+80 =0.990 Sensitivity= 20/20+80 =0.200 Specificity= 10,000/20+10,000 =0.998 PPV= 20/20+20 =0.500 例えば, positive: 肺がんを含む画像 negative: 正常画像と考えると... NPV= 10,000/80+10,000 =0.992 F score= 2 20/2 20+80+20 =0.286

各指標を求めてみよう!(2) 入力 : 刺激実際のクラス negative positive 出力 : 反応観察者が判断したクラス positive negative 1,000 80 20 10,000 Accuracy= 1,000+10,000/1,000+20+10,000+80 = Sensitivity= 1,000/1,000+80 =0.926 Specificity= 10,000/20+10,000 =0.998 PPV= 1,000/1,000+20 =0.926 例えば, positive: 肺がんを含む画像 negative: 正常画像と考えると... NPV= 10,000/80+10,000 =0.992 F score= 2 1,000/2 1,000+80+20 =0.952

2018 国家試験問題 ある癌診断の画像検査で, 真陽性率が 98%, 偽陽性率が 5% であった. この癌の一般的な罹患率は 1% である. ある人がこの画像検査を受けて陽性と判断されたとき, 実際に癌に罹患している確率に最も近いのはどれか. 1. 10% 2. 17% 3. 25% 4. 67% 5. 95% 入力 : 被検者 positive negative 出力 : 検査結果 positive negative

ROC 実験の手順 評価目的の決定信号像, 雑音像の決定試料の作成評定実験データ収集 なにを評価するかが大事! 例えば : 検出器の違いによる信号検出能 撮影条件設定による信号検出能 単純 X 線撮影と CT の病変検出能 熟練医と研修医の読影能力 (computeraided diagnosis: CAD) システムの評価 without CAD vs. with CAD ROC カーブフィッティング データの評価

ROC 曲線の作成 1 (A) 実験方法 (1) 画像受光系 : 測定の対象となる撮像系を用意する (2) 微小信号 : 微小信号として, アクリル樹脂製の 2 mm 直径のビーズ玉を数個用意する (3) サンプル作成 : CR, DR 例えば,1つの撮像系に対して, ( 微小信号 + 雑音の画面 )100 枚, ( 信号を含まない画面 )100 枚, の合計 200 枚を撮影する.

単純なディスク信号を仮定したときの雑音像 (negative 像 ) と信号 + 雑音像 (positive 像 ) + = + = 雑音 (Negative) 信号 雑音 + 信号 (positive)

ROC 曲線の作成 2 * 画面上, 信号影の判読がを作成する * はっきりとが読み取れる画面は不適当 (4) 撮影 & 表示条件 : 例えば, 画面の写真濃度は 0.65±0.03 になるように設定表示条件 ( ウィンドウ条件 ) は一定に保つこと (B) 実験方法 (1) サンプルの提示 : 全サンプル (200 枚 ) の中から, に 1 枚ずつを取り出し, モニタに提示する (2) 観測距離 : 40~50 cm (3) 観測時間 : 10~18 sec

ROC 曲線の作成 3 (C) 評定実験 I. 信号 ( 病変 ) は絶対ある II. 信号 ( 病変 ) は多分ある III. わからない IV. 信号 ( 病変 ) は多分ない V. 信号 ( 病変 ) は絶対ない 観察者は各観察試料を判断基準ごとにカテゴリ ( ) にそれぞれ分類する 観察者は各観察試料に対して, 判断基準に応じたスコアをつける ( ) 5 cm 主流 信号 ( 病変 ) なし 信号 ( 病変 ) あり

50 信号あり 50 信号なし JPN 100 枚 A:50 枚 C:50 枚 100 枚 (1~100 の順 ) (100~1 の順 ) 50 信号あり 50 信号なし USA 100 枚 B:50 枚 D:50 枚 100 枚 (101~200 の順 ) (200~101 の順 ) を排除するための観察資料の分割例 (8 通り ) Independent rating Sequential rating 2 つのシステム評定実験を, 十分な時間的間隔をあけて個々に行う 2 つのシステム評定実験を, 時間的間隔をあけずに連続に行う 公開されている software を用いて解析 ROC 曲線の作成を行う 学習 実験開始 データ収集解析 ROC 曲線の作成

ROC カーブフィッティング 全試料のスコアからを推定し, そこから ROC 曲線を算出する一連の計算手順 資料 ID 観察者 score class 1 2 3 4 : : : 198 199 200 23 9 11 75 : : : 54 39 93 negative negative positive positive : : : positive positive negative µ と σ を推定 ( 最尤度比推定法 ) 確率密度 FP TP FP(x) - ( x) ( x) σ n σ s µ n µ s = = 両正規分布 TP(x) ( x µ ) 2 s 1 2 2σ s 2πσ s e + 2 ( x µ ) n 1 2 2σ n 2πσ n e

FP 確率密度 ( x) = 両正規分布 FP(x) - 判断基準 x ( x µ ) 2 n 1 2 2σ n 2πσ n e, TP ( x) = TP(x) + ( x µ ) 2 s 1 2 2σ s 2πσ s e True Positive Fraction(TPF) 1.0 0.5 0 3 1 2 4 0 0.5 1.0 False Positive Fraction(FPF) 1 TPF= + 3 TPF= 1 FPF= + FPF= 1 - + - + 2 TPF= + 4 TPF= 0 FPF= FPF= 0 - + - +

感度 : 1.0 A P(S s)+ P(N s)=1 B TPF 特異度 : FNF TPF P(S s) 0.5 C P(N n)+ P(S n)=1 TNF FPF ROC 曲線下の面積 Area Under ROC Curve ( ) 0 0 0.5 1.0 FPF P(S n) 比較評価に使用最大値は

あ statistical significance TPF 1.0 B (Az=0.893) 0.5 A (Az=0.886) 0 0 0.5 1.0 FPF ROC 曲線間の比較では Az を用いる両側 t 検定 各観察者の各試料の score を用いて三元配置分散分析を行う Jackknife 法 帰無仮説 H 0 : 2 つのシステム間に統計的な有意差はない 対立仮説 H 1 : 2 つのシステム間に統計的な有意差はある 仮説 H 0 が棄却されれば, 対立仮説 H 1 が成り立つ

していて, 実験に用いた試料間の変動 ( 母集団の分散 ) を考慮していない. 両側 t 検定で仮に統計的な有意差が生じたとしても, それはあくまで実験に使用した試料群についてのみ有効なデータであって, その実験結果を一般論としてすぐに適用することはできない. あし, その母集団の分散を統計的検定の要因の中に加味している. Jackknife 法で統計的に有意差があると判定されれば, その結果はだいたいの場合, 一般論として他の施設においても通用すると見なすことができる. Jackknife 法から得られた検定結果のほうが統計的に a をもつ. ただし,Jackknife 法はまったくで行われた場合のみ適応が可能である. 異なった観察者群間の統計的検定には ( 不等分散 2 標本 ) を用いる.

その他の注意事項 Ø 観察者には が必ず必要 実験の目的と実験方法を観察者に十分に理解してもらう 回答の方法, 実験中に注意事項 ( 読影時間, 再読影の禁止, など ), 試料の構成 ( 総枚数, 信号 + 雑音 と 雑音 の画像のだいたいの割合, など ) を説明したうえで, 学習用に用意された試料数枚を提示する Ø 観察者の数は多いほどよい 実験の目的に応じて, 十分な知識と経験をもった観察者を選ぶ 観察者間の変動が少なくなるようにする Ø 実験データの意図的な排除はダメ いったん選択した観察者のデータを, その観察者の実験データが悪かったという理由で削除してはいけない

ROC Receiver Operating Characteristic 位置 場所を同定する LROC Localization ROC (ROC-type curve for task of detection and localization) FROC 1.0 Free-response ROC 1.0 1 枚の写真の中に信号 ( 異常 ) が存在していても 1 つ 臨床では複数の異常陰影 ( 信号 ) が存在する TPF 0.5 ROC & LROC FROC 0 0 0 0.5 1.0 FP/image FPF TPF 0.5 or FP/case

医用画像系に導入されている視覚評価 ( バーガーファントム法 ) Contrast-Detail 高コントラスト低 小 サイズ大 バーガーファントムの X 線写真

ハウレットチャート法 ランドル環法 の方法 二点比較法 A と B の 2 種類の試料を比較して, 質問事項に当てはまるものを選択させる方法 二点識別法, 二点嗜好法 順位法 試料 A,B,C,... を同時に表示して, ある特性または嗜好について順位を付けさせる方法 ウィルコクソンの順位和検定, スピアマンの順位相関係数 あ 試料 A,B,C,... を 2 個ずつ組み合わせて比較する方法 シェッフェの一対比較の原法, シェッフェの一対比較の変法 ( 芳賀, 浦, 中屋 )

2005 国家試験問題 ROC 解析について誤っているはどれか. 1. 資料の難易度に応じて ROC 曲線は変動する 2. 臨床画像試料では病変が信号に対応する 3. ROC 曲線下の面積の最大値は 1 である 4. 偽陽性率が 1 のとき真陽性率は 0 になる 5. 画像処理が診断能に与える効果を評価できる

2004 国家試験問題 ROC 解析について正しいのはどれか. 1. 解析結果は物理的評価に一致する 2. 真陰性の確率をグラフの横軸にとる 3. 試料枚数が少ないほど統計的な変動は小さい 4. MR 画像と CT 画像との病変検出能を比較できる 5. 雑音画像試料のみの観察でも ROC 曲線を描ける

ROC 解析で誤っているはどれか.2 つ選べ. 1. ROC 曲線の縦軸は真陰性である 2. ROC 曲線の横軸は偽陽性である 3. 特異度は有病正診率と呼ばれている 4. 真陽性は true positive である 5. 偽陰性は false negative である

1.0 右に示す 2 本の ROC 曲線 A,B について正しいはど TPF 0.5 A B れか. 0 0 0.5 1.0 FPF 1. 診断の正確さはBよりAの方が高い 2. 2つの検診システムの診断能を評価したROC 曲線である場合,BよりもAの方が評価が高い 3. 感度が50% の時はAよりもBの方が特異度が高い 4. 信号像に対する反応の条件付確率密度関数の広がりはBよりもAの方が小さい 5. 特異度が90% の時はBよりもAの方が感度が高い

ROC 解析の実験目的として不適当なのは どれか. 1. ビーズ玉 (2 mm φ) を用いた増感紙の鮮鋭度の比較 2. 特定の疾患について CR と MRI による診断能の比較 3. ボケマスク処理の診断能に対する効果 4. マンモグラフィにおけるコンピュータ支援診断 (CAD) システムの利用効果 5. 造影剤検査などの付加的因子の効果

2013 国家試験問題 X 線画像特性を調べる ファントム画像を示す. 評価結果として得られ るのはどれか 1. MTF 2. 特性曲線 3. ROC 曲線 4. C-D ダイアグラム 5. ウィーナースペクトル