Drive-by-Download攻撃における通信の定性的特徴とその遷移を捉えた検知方式

Drive-by-Download 攻撃における通信の定性的特徴とその遷移を捉えた検知方式 2013/10/23 MWS2013 NTT データ北野美紗, 大谷尚通, 宮本久仁男

目次 1. 背景 2. 本研究で提案する検知方式 3. 定性的な特徴の遷移 4. 検証 5. まとめ 2

目次 1. 背景 2. 本研究で提案する検知方式 3. 定性的な特徴の遷移 4. 検証 5. まとめ 3

1-1. 背景 ~DBD 攻撃の増加 ~ Drive by Download 攻撃 ( 以下 DBD 攻撃 ) により, 改ざんされた web ページから, 強制的にマルウェアをダウンロードさせる攻撃が増加バックグラウンドで感染が進行感染に気づきにくい Exploit Kit の多用複数の exploit コードをパッケージ化したツール攻撃の簡易化感染件数が大幅に増加 IT サービスのことならお任せ改ざんされた輝く未来へGO! webページサービス事業案内会社案内求人情報お問合せインターネット不正 web ページログクライアント側の検知では限界通信ログ (proxy サーバなどの通信機器に蓄積されるログ ) を利用し, Exploit Kit を利用した攻撃を検知する. 組織ネットワーク 4

1-2 通信ログから DBD 攻撃を検知する既存手法 1.URL BlackListを利用する手法攻撃者サーバのURLは短期間で動的に変化消失 2. URLの文字列上の特徴に着目する手法 Exploit Kitごとに現れる特徴的な文字列を利用例 : Ver 2.0 http://[domain]/ed350d2de32a1fcc/q.php 16 文字のパス 1 文字のファイル名新しい Exploit Kit の登場バージョンアップ設定ファイルの操作特徴パターンを変化させる例 :16 文字のパス 32 文字のパス特徴を持たせなくすることも可能例 : http://[domain]/forum/info.php URL 項目を利用する既存手法には限界がある 5

1-3. 本研究の目標目標 URL 以外の項目も利用して感染時のふるまいを捉える汎用的なログ検知ルールの作成検証検知ルール検証の観点検知 - DBD 攻撃全体のうち今回の検知方式で検知できるものはどの程度かまたその原因調査誤検知 - 発生しやすいルールその原因の調査 6

目次 1. 背景 2. 本研究で提案する検知方式 3. 定性的な特徴の遷移 4. 検証 5. まとめ 7

2-1. 検知方式の概観目標 : ログ中の URL 以外の項目も利用して, 感染時のふるまいを捉える汎用的なログ検知手法 DBD 攻撃が共通の感染ステップを踏んで, 段階的に進行することに着目 redirect exploit preexploit pre- DL malware DL 感染ステップの進行に伴って, 定性的な特徴が遷移していくことを利用し, 検知方式を考案 8

2-2. DBD 攻撃の感染ステップ通信ログに現れる特徴に着目し,5 段階の感染ステップに分類 redirect pre-exploit exploit pre-dl malware DL 踏み台 page サーバ pre-exploit page exploit page pre-dl page malware DL page iframe JavaScript ITサービスのことならお任せサービス事業案内会社案内求人情報お問合せ改ざんされた輝く未来へGO! web サイト端末の持つ脆弱性に応じて exploit page を振り分ける不正コードの実行ダウンローダ型マルウェア情報詐取型マルウェア 9

2-3. 本研究の特徴 1~ 定性的な特徴 ~ 定性的な特徴 =DBD 攻撃のメカニズムに依存した特徴 Exploit Kit の利用者側では, 容易に変更できない複数の Exploit Kit に共通している日付日時メソッド 18/Sep/2013:12:46:44 GET 受信バイト数 325 URL status 200 UserAgent 例 : 感染時の通信ログ (1 件 ) 赤字 : 今回利用する定性的な特徴 http://[domain]/forum/info.php ファイルの suffix Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0) 問題点通信ログ 1 件の特徴のみでは, 誤検知が発生する 10

2-3. 本研究の特徴 2~ 遷移の利用 ~ step1 step2 step3 step1 step2 step3 通信感染ステップを経て通信が発生するログ中の特徴が遷移する特徴ログ単独の特徴の利用では誤検知する正常な通信によるログ遷移を利用し, 感染ログと正常な web 通信ログを判別 11

目次 1. 背景 2. 本研究で提案する検知方式 3. 定性的な特徴の遷移 4. 検証 5. まとめ 12

3. 定性的な特徴の遷移今回利用する遷移は 2 種類 3-1. DBD 攻撃に共通する特徴の遷移 3-2. Exploit Kit に固有の特徴の遷移 13

3. 定性的な特徴の遷移今回利用する遷移は 2 種類 3-1. DBD 攻撃に共通する特徴の遷移 3-2. Exploit Kit に固有の特徴の遷移 14

3-1. DBD 攻撃に共通する特徴の遷移 DBD 攻撃事例,100 件以上を分析共通する特徴の遷移遷移の進行順序特徴 Exploit Kit A Exploit Kit B Exploit Kit C...... DBD 攻撃の基本メカニズムによって発生し, Exploit Kit の種類に依存しない 15

3-1. 今回利用した定性的遷移 redirect preexploit exploit pre-dl malware DL ドメイン redirect 用サーバ exploit kit 用サーバマルウェア配布用サーバ UserAgent ブラウザ Java アプリケーション (Java の脆弱性を利用時 ) ダウンローダ受信バイト数数 100~ 数 1000B 数 10~ 数 1000KB Exploit 時に利用する脆弱性によって異なった遷移が発生依然正常 web アクセスとの誤検知が多い 16

3. 定性的な特徴の遷移今回利用する遷移は 2 種類 3-1. DBD 攻撃に共通する定性的な特徴の遷移 3-2. Exploit Kit に固有の特徴の遷移 17

3-2. Exploit Kit 固有の定性的な特徴の遷移複数種類の Exploit Kit で, 同一の特徴の遷移がみられた遷移の進行順序特徴 Exploit Kit A Exploit Kit B...... 検知! Exploit Kit? 仮説 : ある Exploit Kit に固有の特徴の遷移を捉えることで, 他の Kit も検知することができる 18

3-2. Exploit Kit 固有の定性的な特徴の遷移実際に利用した定性的な特徴ファイルの suffix web アプリケーションに渡す引数の有無例 :BlackHole Exploit Kit ver 2.0 redirect preexploit exploit pre-dl malware DL ファイル suffix php php jar 引数の有無引数なし引数あり引数なし 8 種類の Exploit Kit(2013 年 8 月時点のバージョン ) を調査 19

3-3. 検知ルールの作成 3 要素をパラメータとして検知ルールを作成 ( 要素 1: DBD 攻撃に共通する特徴遷移 ) ( 要素 2: Exploit Kit ごとに固有の特徴遷移 ) ( 要素 3: 遷移の進行度 ) = 計 32 件の検知ルール主に利用する脆弱性に依存主に Kit の種類に依存 redirect exploit preexploit pre- DL malware DL ルール例要素 1: Java の脆弱性を利用する要素 2: BlackHole Exploit Kit に対応要素 3: exploit ステップまで進行 20

目次 1. 背景 2. 本研究で提案する検知方式 3. 定性的な特徴の遷移 4. 検証 5. まとめ 21

4. 今回実施した検証今までに作成した, 検知ルールの有用性を評価するため検知誤検知の観点から 2 種類の検証を実施 4-1. D3M Dataset を利用した検知の評価 4-2. 通信ログを利用した誤検知の評価 22

4. 今回実施した検証今までに作成した, 検知ルールの有用性を評価するため検知誤検知の観点から 2 種類の検証を実施 4-1. D3M Dataset を利用した検知の評価 4-2. 通信ログを利用した誤検知の評価 23

4.1 評価用データと前処理評価に利用したデータ D3M Dataset 2012, 2013 不正 URL との攻撃通信データ前処理 1. HTTP パケットデータを通信ログ形式に整形 2. 1 回あたりの感染によって, 発生する一連のログを感染ログ群として集約 3. 本研究のスコープ外であるものを除外ふるまい不明感染ステップを経ない単純な手法による感染ログ群例 :exe,pdf などを直接ダウンロード感染ログ群 157 件を生成検知できたもの, できなかったものについて考察 24

4-1. 検知した感染ログ群の考察 3 種類の Exploit Kit に対応したルールで検知 BlackHole 用検知ルール Ver 2.0 以降の感染ログ群はすべて検知検知 127 件 /157 件 = 検知率 80.8% SweetOrange 用検知ルール BlackHole の旧バージョン (ver1.x) による感染ログ群を検知例 : http://[domain]/showthread.php?t=d7ad916d1c0396ff Sakura 用検知ルール実際には Phoenix Exploit Kit による感染ログ群例 : http://[domain]/navigator/jueoaritjuir.php http://[domain]/navigator/dvjwbzawcojqjtx7.jar 想定していない Exploit Kit による感染ログ群も検知できた 25

4-1. 未検知感染ログ群の考察検知できなかった感染ログ群 30 件 Bleeding Life, Elenore Exploit Kit など当初意図していなかった Exploit Kit によるログ群未検知 30 件例 : 検知できなかった Elenore Exploit Kit による感染ログ群 http://[domain]/docs/.q/ http://[domain]/docs/.q/432.js http://[domain]/docs/.q/load.php?spl=mdac http://[domain]/docs/.q/?spl=2&br=msie&vers=6.0&s= http://[domain]/docs/.q/pdf.php Exploit Kit に固有の特徴の遷移 ( ファイル suffix web アプリケーションに渡す引数の有無 ) が想定していた範囲ではカバーできていなかったため検知できなかった 26

4. 今回実施した検証今までに作成した, 検知ルールの有用性を評価するため検知誤検知の観点から 2 種類の検証を実施 1. D3M Dataset を利用した検知の評価 2. 通信ログを利用した誤検知の評価 27

4-2. 誤検知評価利用したログ約 89,000 ドメインへのアクセスログ (proxy ログ約 1200 万行 ) 誤検知が多かったルール 9 ルール Java 以外 (Adobe Reader など ) の脆弱性を利用し, SweetOrange, Sakura, Styx による感染を捉える検知ルール誤検知数 : 平均 10 ドメイン正常な web アクセスと類似しているため, 誤検知が発生誤検知が少ないルール 23 ルール Java の脆弱性を突く感染を検知するルールでは, Kit によらず誤検知は少ない誤検知数 : 平均 3 ドメイン exploit 発生時の UserAgent の遷移が特徴的であるため 28

目次 1. 背景 2. 本研究で提案する検知方式 3. 定性的な特徴の遷移 4. 検証 5. まとめ 29

5. まとめ DBD 攻撃において定性的な特徴が遷移していくことを利用通信ログからふるまいを捉える検知ルールを作成検知誤検知の観点から検証考察課題 Exploit Kit に固有の特徴が想定と異なっていると, 検知できない攻撃がある. より多くの Exploit Kit の特徴を捉えるようキャッチアップしていく通信ログ以外のデータに現れる共通的な特徴も利用して汎用性の高いルールを作成 Java 以外の脆弱性を利用した exploit は, 特徴が捉えづらく誤検知が多いより多くの事例を収集分析する 30

Drive-by-Download攻撃における通信の 定性的特徴とその遷移を捉えた検知方式

Drive-by-Download攻撃における通信の定性的特徴とその遷移を捉えた検知方式