スライド 1

Similar documents
スライド 1

スライド 1

スライド 1

マルウェア対策のための研究用データセット ~ MWS Datasets 2013 ~.pptx

InfoTrace Mark II for Cyber

マルウェア対策のための研究用データセット MWS Datasets 2019 荒木粧子, 笠間貴弘, 押場博光, 千葉大紀, 畑田充弘, 寺田真敏 (MWS 2019 実行 / 企画委員 ) 1

Soliton Dataset 2018

MWS CUP 2018 課題 2: 静的解析 中津留勇 石丸傑 石淵一三 2018/12/20

サンドボックス解析結果に基づく URL ブラックリスト生成についての一検討 畑田充弘 田中恭之 稲積孝紀 先端 IP アーキテクチャセンタセキュリティ TU NTT コミュニケーションズ株式会社 Copyright NTT Communications Corporation. All right

Computer Security Symposium October ,a) API API API Alkanet IDA MWS API Proposal of static analysis assistance method utilizi

目次 実習 1 ネットワーク接続状況の確認... 2 実習 2 不審プロセスの確認... 5

LAPLINK ヘルプデスク 操作ガイド

untitled

FileMaker Pro 9 Advanced Development Guide

自己紹介 指崎則夫 ( さしざきのりお ) SCUGJ 運営スタッフ Microsoft MVP

フローチャート自動生成ツール yflowgen の使い方 目次 1 はじめに 本ツールの機能 yflowgen.exe の使い方 yflowgen.exe の実行方法 制限事項 生成したファイル (gml ファイル形式 ) の開

Soliton Dataset 2018 目的 エンタープライズ向けセキュリティログ取得製品を利用し様々なマルウェア動作ログを提供することで マルウェア対策の研究 開発の促進に寄与することを目指します 特長 Windows 上でのマルウェア動作ログ 横展開や MBR 書き換え系マルウェアも可能な範囲

McAfee Application Control ご紹介

付加情報をもったファイル共有システム

HPB16_表1-表4.ai

作業環境カスタマイズ 機能ガイド(応用編)

24th Embarcadero Developer Camp

「RAD Studio XE5によるマルチ言語/マルチデバイス開発の進め方」

共通 障害調査依頼の際には ログの他に分かる範囲で以下の情報の提供をお願いします 障害の概要 ( 障害の具体的な内容どの様な現象が発生したか等の情報 ) 障害の発生日時 障害の発生手順 ( 障害発生時に どの様な操作 運用を行ったかの情報 ) 画面上に表示されているエラーメッセージ ネットワーク構成

保存を行いたい場所 ( デスクトップ 等 ) を選択し 保存 (S) ボタンを押してください ファイル名 ファイル名は Jsas_TKNPrint.exe という初期値になっていますが 変更することができます 2 データのダウンロード ボタンを押すと 指導面接用紙の一括印刷用ソフトに取り込む指導対象

PowerPoint プレゼンテーション

農業・農村基盤図の大字小字コードXML作成 説明書

ESMPRO/DeliveryManager

Delphi/400開発ノウハウお教えします 情報を守ろう!安全性を高めたWebシステムの構築

大月勇人, 若林大晃, 瀧本栄二, 齋藤彰一, 毛利公一 立命館大学 名古屋工業大学

JACi400のご紹介~RPGとHTMLで簡単Web化~

Red Hat Enterprise Linux 6 Portable SUSE Linux Enterprise Server 9 Portable SUSE Linux Enterprise Server 10 Portable SUSE Linux Enterprise Server 11 P

Kullback-Leibler 情報量を用いた亜種マルウェアの同定 電気通信大学 中村燎太 松宮遼 高橋一志 大山恵弘 1

exe ファイルをダブ ルクリックすると何 が起こるか C88 版 木村屋 南関東開発機構

Microsoft PowerPoint - ã…Šã…¬ã…fiㅥㅼ盋_MVISONCloud製åfi†ç´¹ä»‰.pptx

保存を行いたい場所 ( デスクトップ 等 ) を選択し 保存 (S) ボタンを押してください ファイル名 ファイル名は Jsas_TSKPrint.exe という初期値になっていますが 変更することができます 2 データのダウンロード ボタンを押すと 一括印刷用ソフトに取り込む停止及び警告認定者 (

PowerPoint プレゼンテーション

CashDrawer ライブラリ API 仕様書 2014/07/09 CashDrawer ライブラリ API 仕様書 Rev / 10

Windows Like 5250への道のり ~さまざまな場面で使えるDelphi及びDelphi/400~

1 1.1 PC PC PC PC PC workstation PC hardsoft PC PC CPU 1 Gustavb, Wikimedia Commons.

Microsoft Word - L08_Backup_Lab.docx

03 Podium Walkerのインストール方法およびアンインストール .docx

管理者マニュアル

[Unifinity]運用マニュアル

MWSデータセット2016

安全な Web サイトの作り方 7 版 と Android アプリの脆弱性対策 独立行政法人情報処理推進機構 (IPA) 技術本部セキュリティセンター Copyright 2015 独立行政法人情報処理推進機構

CLUSTERPRO MC StorageSaver for BootDisk 1.2 (for Windows) インストールガイド 2014(Mar) NEC Corporation はじめに 製品導入の事前準備 本製品のインストール 本製品の初期設定 本製品のアンインストール

4. 半角文字コード変換表 ここでは 半角文字のコード変換についての詳細な表を記載します の文字と文字コード (16 進数 ) には 表内で灰色の網掛けを設定しています 4.1 IBMカナ文字拡張からへの変換 16 進数 16 進数 16 進数 16 進数 16 進数 16 進数 SP 0x40 S

<4D F736F F F696E74202D F56504E90DA91B1835C CC834E838A B838B837D836A B2E >

他の章は下記をクリックして PDF 一覧からお入り下さい IT ライブラリー (pdf 100 冊 ) 目次番号 270 番 Windows Server Enterprise 2008 R2 完全解説 ( 再入門 )

スライド 1

1 BitVisor [3] Alkanet[1] Alkanet (DLL) DLL 2 Alkanet Alkanet Alkanet VMM VMM Alkanet Windows [2] マルウェア 観 測 用 VM SystemCall Windows System

29 jjencode JavaScript

1007  ステルスデバッガを利用したマルウェア解析手法の提案

Delphi/400 テクニック公開 Windows7に最適化した アプリ開発・運用テクニック

Visual Studio with Cordova クロスプラットフォーム開発の全貌

03 Podium Walkerのインストール方法およびアンインストール .docx

JIIAセミナー

Moodleアンケートの質問一括変換ツール

報道関係者各位 プレスリリース 2019 年 01 月 15 日 株式会社ネオジャパン グループウェア desknet's NEO バージョン 5.2 を 1 月 15 日に提供開始 ~ 業務アプリ作成ツール AppSuite との連携を強化 他にも AppSuite 連携 API 公開など多数の機

Cisco Unified Communications Manager サーバ アドレスとユーザ名の自動的な入力

侵入挙動の反復性によるボット検知方式

実習資料 2 仙台 CTF セキュリティ技術勉強会実習 plaso/log2timeline によるタイムライン解析 平成 29 年 11 月 12 日 仙台 CTF 実行委員会

Android Layout SDK プログラミング マニュアル

Android アプリを作るための環境設定 Android アプリを作るのに必要なものは Android SDK と Java 開発環境の Eclipse です 環境設定作業の概要はまず Android SDK と Eclipse をそれぞれインストールします その後 Eclipse を起動し An

KARTE セキュリティホワイトペーパー KARTE セキュリティホワイトペーパー 2.1 版 株式会社プレイド 1

Moldplus_Server_4.12

仙台 CTF2018 セキュリティ技術競技会 (CTF) 問題解説復習問題 平成 30 年 11 月 10 日 仙台 CTF 推進プロジェクト 五十嵐良一 Copyright (C) 2018 Sendai CTF. All Rights Reserved.

dicutil1_5_2.book

インテル(R) Visual Fortran Composer XE

FastReportへの効率的な帳票レイアウトコンバート

Transcription:

FFRI Dataset 2018 の紹介

1 アジェンダ データセット提供の目的と現状 FFRI Dataset 2013~2017 ( 動的解析ログ ) データセットに関するアンケート結果 FFRI Dataset 2018 意見募集

2 データセット提供の目的と現状 目的 研究分野における FFRI の知名度向上と人材交流 共同研究 現状 人材交流 共同研究への発展は少ない FFRI Dataset を使用した研究論文が減少傾向 ここ数年 マルウェアの挙動に着目した研究が下火 機械学習を用いた研究が盛ん ToDo ニーズに応えるデータセットの提供 (MWS Cup 2017 課題 3アンケート ) 自らデータセットを使って研究する

FFRI Dataset 2013~2017 ( 動的解析ログ ) FFRI が収集したマルウェアの動的解析ログ Cuckoo Sandbox マルウェア 動的解析 解析ログ (json) 2013 年 : 約 2,600 検体分 2014 年 : 約 3,000 検体分 2015 年 : 約 3,000 検体分 2016 年 : 約 8,000 検体分 2017 年 : 約 6,200 検体分 3

4 具体的なデータ項目 項目 ( 大見出し ) 内容 info 解析の開始 終了時刻 id 等 (id は 1 から順に採番 ) signatures ユーザー定義シグニチャとの照合結果 ( 今回は使用無 ) static 検体のファイル情報 ( インポート API セクション構造等 ) dropped behavior 検体が実行時に生成したファイル 検体実行時の API ログ (PID TID API 名 引数 返り値 動作概要等 ) target 解析対象検体のファイル情報 ( ハッシュ値等 ) debug strings network 検体解析時の Cuckoo Sandbox のデバッグログ 検体中に含まれる文字列情報 検体が実行時に行った通信の概要情報

5 具体的なデータ項目 (behavior) "processtree": [ { "children": [], "process_name": "lsass.exe", "command_line": "C: Windows system32 lsass.exe", "track": false, "pid": 492, "ppid": 376, "first_seen": 1493811724.752586 }, { "children": [ { "children": [ { "children": [], "process_name": "mshta.exe",

6 具体的なデータ項目 (behavior) "summary": { "regkey_deleted": [ "HKEY_CURRENT_USER Software Microsoft Windows C "HKEY_LOCAL_MACHINE SOFTWARE Microsoft Windows "HKEY_LOCAL_MACHINE SOFTWARE Microsoft Windows "HKEY_CURRENT_USER Software Microsoft Windows C ], "file_opened": [ "C: Users Smith AppData Local Microsoft Windo "c: tmp8t2cjf lib core ", "c: Users Public documents ", "c: tmp8t2cjf modules packages pub.py", "C: Users Smith AppData Roaming Microsoft Win "C: ", "C: Users Smith AppData Roaming Microsoft Win "c: PerfLogs ", "c: Users Smith Desktop gndikchadqgjpza.ppt",

7 具体的なデータ項目 (behavior) "calls": [ { "tid": 3544, "status": 1, "time": 1493811728.057385, "return_value": 32775, "category": "system", "stacktrace": [], "arguments": { "mode": 32769 }, "flags": { "mode": "SEM_FAILCRITICALERRORS SEM_NOOPENFILEE }, "api": "SetErrorMode" }, {

データセットに関するアンケート結果 MWS Cup 2017 の問題として マルウェア対策研究用データセットに関するアンケートを実施 主な回答 ( 太字は複数のチームから挙がった意見 ) 良性 ( 非マルウェア ) のデータセット 人間に優しい 容易性のあるデータセット 訓練用データセット 機械学習のツールに適用しやすいデータセット 仮想環境ではなく実機環境で取得した動的解析ログ 実際のインシデントレスポンスやフォレンジックで見られるマルウェアのログに近いもの 非 PE マルウェア ( ファイルレス Android, IoT 関連 ) 通信データ (pcap) 8

9 参考意見 ( 人海戦術 White チーム ) 必要なのは新規性, 明瞭性, 容易性の 3 つ 新規性 : 新鮮なデータであること 課題 日々刻刻と変化するセキュリティの状況に対応するには,1 年前,2 年前のデータセットだけでなく, 常に最新のデータが望ましい 解決策 データ収集基盤の構築 研究者 企業へのデータ提供の呼びかけ 明瞭性 : 取り扱い方が明らかなデータであること 課題 データセットによっては提供の意義( どのようにして使ってほしいか ) や適用例などが不明瞭である場合がある 解決策 具体的な適用例を提示する( 資料にしてデータセットと一緒に配布 ) データセットの使い方講座 ( 解説編, 実践編, 応用編 ) を開く 容易性 : 利用者がデータを研究に活かすための つなぎ が用意されていること 課題 データセットの量や質が高い場合でも, 実際に研究する際にそのデータセットのフォーマットに適したツールを開発しなくてはならない場合がある 解決策 データ加工ツールの提供例 : データセットを機械学習 (weka etc...) に投げる前の1 次加工用プログラム pcapデータからjsやhtml, セッション情報を取得するプログラムを提供 "

10 FFRI Dataset 2018 の変更点 データを動的解析ログから表層解析ログへ 動的解析ログよりわかりやすいため より新しい大量のデータを提供できるため 良性データ ( 非マルウェア ) のデータも提供できるため 良性データも提供 研究成果を検知率だけでなく誤検知率も評価可能にするため

FFRI Dataset 2018 の概要 マルウェアおよび良性ファイルのハッシュ値 表層解析データ データ量 : マルウェアデータ約 29 万件 良性データ約 21 万件 ( 予定 ) データ形式 :CSV, text データソース情報 マルウェア 2017 年に収集した新しい検体 良性ファイル 2008~2017 年に収集 Windows や Microsoft アプリに含まれるファイル プリインストールされている 3rd パーティソフトウェア Vector で公開されているフリーウェアなど 11

FFRI Dataset 2018 のデータ項目 収集日 ( マルウェアのみ ) 各種ハッシュ値 MD5, SHA-1, SHA-256 ssdeep, imphash, impfuzzy, pehash 表層情報 アーキテクチャ (32bit/64bit) DLL か否か パッキング有無 Anti-Debug 有無 プログラム種別 (GUI/CUI) PEiD シグネチャ名 ファイル種別 ヘッダのダンプ 12

データ取得ツール ssdeep ssdeep 2.7 https://ssdeep-project.github.io/ssdeep/ imphash, ヘッダのダンプ pefile https://github.com/erocarrera/pefile impfuzzy impfuzzy https://github.com/jpcertcc/impfuzzy pehash https://github.com/knowmalware/pehash アーキテクチャ (32bit/64bit) DLL か否か パッキング有無 Anti- Debug 有無 プログラム種別 (GUI/CUI) PEiD シグネチャ https://github.com/k-atc/peid ファイル種別 TrID http://mark0.net/soft-trid-e.html 13

データの例 ( 表層解析データ ) "md5", "sha1", "sha256", "ssdeep", "imphash", "impfuzzy", "Totalhash", "AnyMaster", "AnyMaster_v1.0.1", "EndGame", "Crits", "pehashng", "PE", "GUI Program", "Console Program", "DLL", "Packed", "Anti-Debug", "mutex, contains base64, "AntiDebug, PEiD, "TrID dbf246f600c39dd725bf85aca3c25936,d2a4e71ad4820cd85f296ed4b59a30e b8a2d24b8,000011415202841c1eaf64759762a33511461b353f3fd33bc73f0e 46fb80c7f7,48:6++Z5YVOeJVkrm1pwbEX7PFUE7aaO0yB+BDq9J5S1XU:6 ejvkrmgbcbfuaaayb+fqx5s1k,0ed11c14a2759c69bfa93dd64e1f1654,6:o Z/OWdiVgAaTRLEmDzoVguWqnVWXuRcgtC+5CEp:oZGZGRLhAOteSg75 V,8e69e971b3b7895bb9c2e48ee30bae5f9fecb678,4b965799afa33f0d9807d 94312e6fe78d0d46f12,a144cb5ad7ec88a8a56f1b55a301e39219083e54,80f 7567a918200327b711d92c0b86242,292a243d80b1b1efb89e66d9e555586f8 8d759e3,62d739591e6aeeecb561c17ee3fec744ebe8de70de6347fc55913c2 aa377fe75,32 bit,yes,no,yes,no,no,no,yes,"","",58.9% (.EXE) Win64 Executable (generic) (27625/18/4) n14.0% (.DLL) Win32 Dynamic Link Library (generic) (6578/25/2) n9.6% (.EXE) Win32 Executable (generic) (4508/7/1) n4.4% (.EXE) Win16/32 Executable Delphi generic (2072/23) n4.3% (.EXE) OS/2 Executable (generic) (2029/13) 14

15 データの例 ( ヘッダのダンプ ) ----------Parsing Warnings---------- Byte 0x00 makes up 68.9341% of the file's contents. This may indicate truncation / malformation. ----------DOS_HEADER---------- [IMAGE_DOS_HEADER] 0x0 0x0 e_magic: 0x5A4D 0x2 0x2 e_cblp: 0x90 0x4 0x4 e_cp: 0x3 0x6 0x6 e_crlc: 0x0 0x8 0x8 e_cparhdr: 0x4 0xA 0xA e_minalloc: 0x0 0xC 0xC e_maxalloc: 0xFFFF 0xE 0xE e_ss: 0x0 0x10 0x10 e_sp: 0xB8 0x12 0x12 e_csum: 0x0 0x14 0x14 e_ip: 0x0 0x16 0x16 e_cs: 0x0 0x18 0x18 e_lfarlc: 0x40 0x1A 0x1A e_ovno: 0x0 0x1C 0x1C e_res: 0x24 0x24 e_oemid: 0x0 0x26 0x26 e_oeminfo: 0x0 0x28 0x28 e_res2: 0x3C 0x3C e_lfanew: 0x80 ----------NT_HEADERS---------- [IMAGE_NT_HEADERS] 0x80 0x0 Signature: 0x4550 ----------FILE_HEADER---------- [IMAGE_FILE_HEADER] 0x84 0x0 Machine: 0x14C 0x86 0x2 NumberOfSections: 0x6 0x88 0x4 TimeDateStamp: 0x40BDE4FE [Wed Jun 2 14:32:30 2004 UTC] 0x8C 0x8 PointerToSymbolTable: 0x0 0x90 0xC NumberOfSymbols: 0x0 0x94 0x10 SizeOfOptionalHeader: 0xE0 0x96 0x12 Characteristics: 0x210E Flags: IMAGE_FILE_32BIT_MACHINE, IMAGE_FILE_DLL, IMAGE_FILE_EXECUTABLE_IMAGE, IMAGE_FILE_LINE_NUMS_STRIPPED, IMAGE_FILE_LOCAL_SYMS_STRIPPED ----------OPTIONAL_HEADER---------- [IMAGE_OPTIONAL_HEADER] 0x98 0x0 Magic: 0x10B 0x9A 0x2 MajorLinkerVersion: 0x2 0x9B 0x3 MinorLinkerVersion: 0x37 0x9C 0x4 SizeOfCode: 0x600 0xA0 0x8 SizeOfInitializedData: 0xC00 0xA4 0xC SizeOfUninitializedData: 0x0 0xA8 0x10 AddressOfEntryPoint: 0x1190 0xAC 0x14 BaseOfCode: 0x1000 0xB0 0x18 BaseOfData: 0x3000 0xB4 0x1C ImageBase: 0x10000000 0xB8 0x20 SectionAlignment: 0x1000 0xBC 0x24 FileAlignment: 0x200 0xC0 0x28 MajorOperatingSystemVersion: 0x1 0xC2 0x2A MinorOperatingSystemVersion: 0x0 0xC4 0x2C MajorImageVersion: 0x0 0xC6 0x2E MinorImageVersion: 0x0 0xC8 0x30 MajorSubsystemVersion: 0x4

募集 ( データセットへの意見 要望 共同研究 ) FFRI Dataset に関するご意見 要望 データを取得したい検体のハッシュや種類 取得したいデータ項目とデータ取得ツールの共有 (GitHubなど) その他 どのようにしたら研究に使いやすいか 共同研究 最新の検体データを利用可能 ( 詳細応相談 ) マルウェア対策技術の研究開発に興味のあるリサーチエンジニア データサイエンティスト MWS の Slack にてお気軽にご連絡ください 16

17 ありがとうございました