Microsoft PowerPoint _Hadoop.pptx

Size: px
Start display at page:

Download "Microsoft PowerPoint _Hadoop.pptx"

Transcription

1 Hadoop で行う大規模データ処理 kzk Hadoop とは? Google の基盤ソフトウェアのクローン Google File System Yahoo Research の Doug Cutting 氏が開発 元々は Nutch Crawler のサブプロジェクト Doug の子供の持っているぬいぐるみの名前 Java で記述 Amazon S3 との親和性 1

2 Google 関連参考論文 & スライド The Google File System SanjayGhemawat Ghemawat, Howard Gobioff, andshu Tak Leong, SOSP 2003 : Simplified Processing on Large Clusters Jeffrey Dean and Sanjay Ghemawat, SOSP 2004 Parallel Architectures and Compilation Techniques (PACT) 2006, KeyNote educe pact06 keynote.pdf Hadoop 参考文献 Hadoop 公式サイト Wiki: インストール方法 チュートリアル プレゼン資料など Hadoop 解析資料 Hadoop, hbase で構築する大規模データ処理システム on Codezine 2

3 Hadoop 解析資料 with NTT R さん OSS 分散システムHadoopの検証 プロダクションに投入できるレベルか? Googleの実装との比較 機能単位で検証 ソースコードの解析 ソフトウェアの大体の構造 重要な部分を詳しく検証 ベンチマーク スケーラビリティを確認 結果はオープンに公開 調査結果概要 Google インフラの機能は大体実装済み アトミックな追記, エラーレコードスキップも v で実装される svnにはcommit 済みで RCがMLに流れている しかし大幅に変更が入ったため ( たぶん ) しばらくは不安定 あと1 年程度で成熟期か? スケーラビリティ 12 台程度まではスケール 安定性にはまだ疑問 レプリケーション数 3 の時にジョブが失敗する, etc. 3

4 Hadoop 周りのニュース Scaling Hadoop to 4000 nodes 9/scaling_hadoop_to_4000_nodes_a.html いくつかのバグを潰すことによって 500 nodes の 4 ~7 倍の性能を発揮 ping のタイミングが引き起こすバグなど Hadoop 使用事例 4

5 Yahoo ~2000 ノード 国外の使用事例 検索 広告 ログ処理 データ解析 etc SIGIR などでも Y!R の論文には Hadoop が出てくる Amazon, Facebook ~400 ノード ログ処理 データ解析 その他 行動ターゲティング 検索インデクシング等 国内の採用事例 はてな ログ解析 はてなブックマーク2のバックエンドで使用 全文検索まわり 楽天 大規模レコメンデーションエンジン メールで何件か相談 検索系 (Lucene) ログ処理系が多い ~100 台 Cellクラスター, EC2 (blogeye) 等も 5

6 Motivation 問題 インターネットの爆発的普及により 非常に大規模なデータが蓄積されている 例えばWebページを考えて見る 200 億ページ * 20KB = 400 TB Disk 読み込み性能は50MB/sec (SATA) 1 台では読み込むだけでも約 100 日 保存するだけでも 1000 個程度の Disk が必要 このデータを効率的に処理したい 6

7 解決方法 お金 とにかく大量のマシンを用意 1000 台マシンがあれば1 台で400G 処理すればok 読み込むのに8000 秒程度で済む お金だけでは解決しない プログラミングが非常に困難になる プロセス起動 プロセス監視 プロセス間通信 デバッグ 最適化 故障時への対応 しかも 新しいプログラムを作る度にこれらの問題をいちいち実装する必要がある 7

8 既存の分散 / 並列プログラミング環境 MPI (Message Passing Interface) 並列プログラミングのためのライブラリ スパコンの世界では主流 プログラマは各プロセスの挙動を記述 通信プリミティブ (Send, Recv, All to All) が提供されており それを用いてデータ通信を実現 利点 通信パターンなどをプログラマがコントロールでき 問題に対して最適なプログラムを記述する事ができる 問題点 MPI の問題点 耐障害性への考慮が少ない アプリケーションが独自にチェックポイント機能を実装 1 万台以上の環境で計算するには耐えられない 1 台が1000 日程度で壊れるとすると 1 日で10 台程度壊れる 壊れる度にチェックポイントから戻すとかやってらんない RAID 組んでもそのうち壊れるので一緒 通信パターンなどを記述する作業が多くなり 実際のアルゴリズムを記述するのにたどり着くまで時間がかかる 8

9 Google での使用率 Model 9

10 の実行フロー Shuffle の実行フロー 入力読み込み <key, value>* map: <key, value> <key, value >* Shuffle shuffle: <key, reducers> destination reducer Rd reduce: <key, <value > * > <key, value >* 出力書き出し <key, value >* 10

11 の実行フロー <k, v>* <k, v >* <k, v>* <k, <v >*>* <k, v >* <k, v>* <k, v >* <k, v>* Shuffle <k, v>* <k, v >* <k, v>* <k, <v >*>* <k, v >* 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buzz Shuffle 11

12 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz doc1: foo doc1: foo doc1: foo doc1: bar Shuffle doc1: bar doc1: buz 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz doc1: foo doc1: foo doc1: foo doc1: bar Shuffle doc1: bar doc1: buz 12

13 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz doc1: foo doc1: foo foo: 1 foo: 1 doc1: foo doc1: bar bar: 1 foo: 1 doc1: bar doc1: buz bar: 1 buz: 1 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz foo: 1 foo: 1 bar: <1, 1> buz: <1> bar: 1 foo: 1 foo: <1, 1, 1> bar: 1 buz: 1 13

14 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz bar: <1, 1> buz: <1> foo: <1, 1, 1> 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz bar: <1, 1> buz: <1> bar: 2 buz: 1 foo: <1, 1, 1> foo: 3 14

15 入力文書 : doc1 例 : ワードカウント foo foo foo bar bar buz bar: 2 buz: 1 foo: 3 擬似コード 例 : ワードカウント map(string key, string value) { foreach word in value: emit(word, 1); } reduce(string key, vector<int> values) { reduce(string key, vector<int> values) { int result = 0; for (int i = 0; I < values.size(); i++) result += values[i]; emit(key, result); } 15

16 Grep 型の処理 Sort ( 適切なPartition 関数を選択する必要 ) Log Analysis Web Graph Generation Inverted Index Construction Machine Learning NaiveBayes, K means, Expectation Maximization, SVM, etc. Hadoop の実装 16

17 Hadoop の中身 Hadoop Distributed File System GFSのクローン プログラムの入力や出力に使用 を実現するためのサーバー ライブラリ等 Hadoop Distributed File System Master/Slave アーキテクチャ ファイルはブロックという単位に分割して保存 NameNode Master ファイルのメタデータ ( パス 権限など ) を管理 Node Slave 実際のデータ ( ブロックを管理 ) 17

18 From: Hadoop Master/Slave アーキテクチャ JobTracker Master Job を Task に分割し Task を各 TaskTracker に分配 Job: プログラムの実行単位 Task: Task, Task 全ての Task の進行状況を監視し 死んだり遅れたりした Task は別の TaskTracker で実行させる TaskTracker Slave JobTracker にアサインされた Task を実行 実際の計算処理を行う 18

19 TaskTracker Architecture JobTracker HadopStreamng Ruby によるワードカウント $./bin/hadoop jar contrib/hadoop streaming.jar input wcinput output wcoutput mapper /home/hadoop/kzk/map.rb reducer /home/hadoop/kzk/reduce.rb inputformat TextInputFormat outputformat TextOutputFormat map.rb #!/usr/bin/env ruby while!stdin.eof? line = STDIN.readline.strip ws = line.split ws.each { w puts "#{w} t1 } end reduce.rb #!/usr/bin/env ruby h = {} while!stdin.eof? line = STDIN.readline.strip word = line.split(" t")[0] unless h.has_key? word h[word] = 1 else h[word] += 1 end end h.each { w, c puts "#{w} t#{c} } 19

20 Facebook のログ処理事例 Scribe + Hive Facebook Architecture Web Servers Scribe Servers Network Storage Oracle RAC Hive on Hadoop Cluster MySQL 20

21 Scribe Facebookの分散ログ収集ソフト 10/27にOSS 化 各サーバーはログを単に中継する役割 設定ファイルベースでトポロジーを設定 中継先が落ちている場合はディスクに書き込み ただし 毎回の sync はしない 多少は失われるけど 大丈夫だよね Thrift を使用 様々な言語のプログラムから利用可能 Facebook Hive Hadoop 上に構築されたデータ処理基盤 struct, list, map 等の構造化されたデータをSQLライクな言語 (HiveQL) で処理可能 HDFS, Hadoop を大いに活用 Hadoop の contribにコミット済み FBでは320 台 2560 core 1.3PBで運用 レポーティング 機械学習に使用 21

22 HiveQL Example: Join Operation page_view pageid userid time :08: :08: :08:14 user userid Age gender X female = male pv_users pagei d age SQL: INSERT INTO TABLE pv_users SELECT pv.pageid, u.age FROM page_view pv JOIN user u ON (pv.userid = u.userid); HiveQL Join by page_view pageid userid time key value key value :08: :08: :08:14 map 111 <1,1> 111 <1,1> 111 <1,2> 111 <1,2> 222 <1,1> 111 <2,25> pv_uses pageid age Shuffle user userid age gender key value 111 <2,25> female male map 222 <2,32> key value 222 <1,1> 222 <2,32> pageid age 1 32 INSERT INTO TABLE pv_users SELECT pv.pageid, u.age FROM page_view pv JOIN user u ON (pv.userid = u.userid); 22

23 HiveQL: 他の操作 GROUPBY, DISTINCT JOIN で実装可能 任意の MR 用スクリプトを簡単に使用可能 FROM ( FROM pv_users SELECT TRANSFORM(pv _ users.userid, pv _ users.date) USING 'map_script' AS (dt, uid) CLUSTER BY dt) map Enjoy Playing Around Hadoop Thank you! kzk < kzk@preferred.jp> 23

Hadoopの全て

Hadoopの全て Kazuki Ohta ( ) Preferred Infrastructure 1 l l l l l ( ) Preferred Infrastructure, CTO Sedue Hadoop Hadoop l l l http://kzk9.net/ @kzk_mover l l l Hadoop Hadoop-Gfarm with I/O Project:

More information

Hadoop Introduction

Hadoop Introduction Hadoop Introduction はじめに Agenda Hadoopおさらい 1 HadoopStreaming 2 Hive 3 Demo (Apacheログ解析) 4 5 まとめ Hadoop の概要 Hadoop の特徴 Hadoop クラスタ構成 マスターサーバ バッチの進捗状況管理 Map/Reduce タスク割振り NameNode JobTracker HDFS 管理 DataNode

More information

DEIM Forum 2012 C2-6 Hadoop Web Hadoop Distributed File System Hadoop I/O I/O Hadoo

DEIM Forum 2012 C2-6 Hadoop Web Hadoop Distributed File System Hadoop I/O I/O Hadoo DEIM Forum 12 C2-6 Hadoop 112-86 2-1-1 E-mail: momo@ogl.is.ocha.ac.jp, oguchi@computer.org Web Hadoop Distributed File System Hadoop I/O I/O Hadoop A Study about the Remote Data Access Control for Hadoop

More information

無料セミナー資料:ビッグデータ管理基盤ソフトウェアHadoop入門

無料セミナー資料:ビッグデータ管理基盤ソフトウェアHadoop入門 ビッグデータ管理基盤ソフトウェア Hadoop 入門 NEC ラーニングテクノロジー研修事業部 土井正宏 アジェンダ Hadoopとは? HDFSの概要 Map/Reduceのしくみ Hadoopのエコシステム ( 関連製品 ) Hadoop 0.23について Page 2 NEC Corporation 2010 Hadoop の概要 高スケーラブルな分散管理基盤 グリッドコンピューティング 2つのコア機能

More information

スライド 1

スライド 1 Hadoop とは Hadoop の二本柱 分散ファイルシステム HDFS(Hadoop Distributed File System) 分散プログラミングモデル MapReduce Hadoop の目的 大規模ファイル処理 格納, 加工 ペタバイト規模 複数計算機の協調動作 スケーラブルシステム 数百 ~ 数千台規模 Key-Value store MapReduce HDFS Node Node

More information

yamamoto_hadoop.pptx

yamamoto_hadoop.pptx Hadoop Streaming 2011/2/16 H22 ? SaaS (So5ware as a Service) (,etc.) PaaS (Pla?orm as a Service) (Google App Engine,, Mixi Appli etc.) IaaS (Infrastructure as a Service) (Amazon EC2) VMWare ESX, Hyper-

More information

(Microsoft PowerPoint - Hadoop\225\224\211\357.ppt)

(Microsoft PowerPoint - Hadoop\225\224\211\357.ppt) Hadoop 部会 株式会社エイビス株式会社富士通九州システムズ九州東芝エンジニアリング株式会社九州東芝エンジニアリング株式会社株式会社オーイーシー株式会社オーイーシー大分大学大学院工学研究科 1 ( 部長 ) 小池翼 ( 副部長 ) 小畑智博小原辰徳郷原慎之介高熊大将玉井達也大場紀彦 2 テーマ 実業務への Hadoop の適用 ~ 気象データを用いた分散処理の実装 ~ Hadoop とは Hadoop

More information

Introduction

Introduction Introduction R&D More Than Web - - 3 R&D Vision Fusion Interaction Collaboration 3 6 Client Server Platform Client Server Platform Client Client Server Platform Server Client Server Platform Platform

More information

OSS Mtg

OSS Mtg Hadoop ~Yahoo! JAPAN の活用について ~ 2011/01/15 ヤフー株式会社 R&D 統括本部 角田直行 吉田一星 自己紹介 角田直行 ( かくだなおゆき ) R&D 統括本部プラットフォーム開発本部検索開発部開発 3 2005 年ヤフー株式会社入社 ヤフー地図 ヤフー路線 ヤフー検索 2010 年現在 検索プラットフォームを開発中 1 自己紹介 吉田一星 ( よしだいっせい

More information

Microsoft PowerPoint - SWoPP2010_Shirahata

Microsoft PowerPoint - SWoPP2010_Shirahata GPU を考慮した MapReduce の タスクスケジューリング 白幡晃一 1 佐藤仁 1 松岡聡 1 2 3 1 東京工業大学 2 科学技術振興機構 3 国立情報学研究所 大規模データ処理 情報爆発時代における 大規模データ処理 気象 生物学 天文学 物理学など様々な科学技術計算での利用 MapReduce 大規模データ処理のためのプログラミングモデルデ スケーラブルな並列データ処理 GPGPU

More information

Python Perl JavaScript および PHP などの ランザクション ID を利用することで 重複する処理 な Tuple が流れるかはグルーピングより決定されま 多くの言語をサポートしています を判別することができます す 6 簡単なデプロイと運用 は簡単にデプロイし 動作させるこ

Python Perl JavaScript および PHP などの ランザクション ID を利用することで 重複する処理 な Tuple が流れるかはグルーピングより決定されま 多くの言語をサポートしています を判別することができます す 6 簡単なデプロイと運用 は簡単にデプロイし 動作させるこ 春の嵐吹く Twitter 社が公開したオープンソース リアルタイム分散処理 日々発生する大量なデータをリアルタイムに処理し続ける ストリームデータ処理 に対するニーズが高まっています 同じビッグデータでもバッチ処理の Hadoop とはまた違った解決方法が求められる分野です 本記事ではそのストリームデータ処理を実現するプロダクトとして 今 注目を集めている について解説します ビッグデータ リアルタイム

More information

IPSJ-HPC

IPSJ-HPC can effectively exploit the I/O performance of clusters with Gbit/sec-class flash memories. In this paper, we first outline our prototype MapReduce system which utilizes distributed key-value store. And

More information

先進的計算基盤システムシンポジウム Shuffle KVP KVP MapReduce KVP 7) Jimmy PageRank MapReduce.69 Jimmy KVP Jimmy key KVP value KVP MapReduce 3 PageRank 4 Jimmy M

先進的計算基盤システムシンポジウム Shuffle KVP KVP MapReduce KVP 7) Jimmy PageRank MapReduce.69 Jimmy KVP Jimmy key KVP value KVP MapReduce 3 PageRank 4 Jimmy M 先進的計算基盤システムシンポジウム MapReduce MapReduce MapReduce Map Reduce MapReduce MapReduce PageRank in-mapper combining.57 Acceleration for Graph Application in MapReduce with Eliminating Redundant Messages Nobuyuki

More information

スライド 1

スライド 1 SAS Loves Big Data via Hadoop ~Big Data Driven Innovation~ 惟高裕一, 北西由武, 都地昭夫 塩野義製薬株式会社 SAS Loves Big Data via Hadoop ~Big Data Driven Innovation~ Yuichi Koretaka, Yoshitake Kitanishi, Akio Tsuji SHIONOGI

More information

OSS 体験セミナー Hadoop の概要 高スケーラブルな分散管理基盤 2 つのコア機能 分散ファイルシステム (HDFS) 分散処理フレームワーク (Map/Reduce) BigData の管理基盤として注目 分散処理基盤 (Map/Reduce) Hadoop 分散ファイルシステム (HDF

OSS 体験セミナー Hadoop の概要 高スケーラブルな分散管理基盤 2 つのコア機能 分散ファイルシステム (HDFS) 分散処理フレームワーク (Map/Reduce) BigData の管理基盤として注目 分散処理基盤 (Map/Reduce) Hadoop 分散ファイルシステム (HDF Hadoop スタートアップセミナー Hadoop スタートアップセミナー NEC ラーニングテクノロジー研修事業部土井正宏 OSS 体験セミナー Hadoop の概要 高スケーラブルな分散管理基盤 2 つのコア機能 分散ファイルシステム (HDFS) 分散処理フレームワーク (Map/Reduce) BigData の管理基盤として注目 分散処理基盤 (Map/Reduce) Hadoop 分散ファイルシステム

More information

Hadoop とは 大規模なデータを並列分散処理を行うフレームワークを提供 Google による MapReduce および Google File System(GFS) の論文をベースに開発された Apache プロジェクトの OSS MapReduce MapReduce 分散処理フレームワー

Hadoop とは 大規模なデータを並列分散処理を行うフレームワークを提供 Google による MapReduce および Google File System(GFS) の論文をベースに開発された Apache プロジェクトの OSS MapReduce MapReduce 分散処理フレームワー 超入門大規模分散処理フレームワーク Hadoop SRA OSS, Inc. 日本支社技術開発部エンジニア長田悠吾 Cloudera Certified Developer for Apache Hadoop Cloudera Certified Administrator for Apache Hadoop Copyright SRA OSS, Inc. Japan All rights reserved.

More information

1. 緒論 Web 全体の全文検索エンジンは重要な技術である しかし,Web 上に存在する文書全体が構成する空間は非常に広大で, そのデータ全体を扱う処理は厖大な計算量を必要とする そのような情報処理を要求される時間内に行うには, 単位時間当たりに処理可能な計算量を増やすというハードウェア的な解決案

1. 緒論 Web 全体の全文検索エンジンは重要な技術である しかし,Web 上に存在する文書全体が構成する空間は非常に広大で, そのデータ全体を扱う処理は厖大な計算量を必要とする そのような情報処理を要求される時間内に行うには, 単位時間当たりに処理可能な計算量を増やすというハードウェア的な解決案 計算機構成論レポート課題 Google Cluster Architecture 2006-12-15 M06-A04 井上謙次 大阪工業大学大学院情報科学研究科 1. 緒論 Web 全体の全文検索エンジンは重要な技術である しかし,Web 上に存在する文書全体が構成する空間は非常に広大で, そのデータ全体を扱う処理は厖大な計算量を必要とする そのような情報処理を要求される時間内に行うには, 単位時間当たりに処理可能な計算量を増やすというハードウェア的な解決案と,

More information

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 yamamoto@sraoss.co.jp Sylph-Searcher とは Sylpheed 向け電子メール全文検索アプリケーション PostgreSQL 8.2の全文検索機能を利用 Linux/Unix Windows 2000

More information

…l…b…g…‘†[…N…v…“…O…›…~…fi…OfiÁŸ_

…l…b…g…‘†[…N…v…“…O…›…~…fi…OfiÁŸ_ 13 : Web : RDB (MySQL ) DB (memcached ) 1: MySQL ( ) 2: : /, 3: : Google, 1 / 23 testmysql.rb: mysql ruby testmem.rb: memcached ruby 2 / 23 ? Web / 3 ( ) Web s ( ) MySQL PostgreSQL SQLite MariaDB (MySQL

More information

Title

Title K-means w/ Hadoop ~ 運用パート~ 2013/1/28 田浦研究室 M1 中谷翔 1 Outline Hadoop の基本 実験結果 Hadoop 愛憎 2 基礎の基礎 by 田浦先生スライド P.8 をサラリと Map 関数, Reduce 関数を登録すれば勝手に分散処理 3 Hadoop の Good なところ 慣れればそこそこ楽にスケーラビリティ出せる Map 処理, Reduce

More information

Elastic MapReduce bootcamp

Elastic MapReduce bootcamp EMR Controls, Debugging, Monitoring アマゾンデータサービスジャパン株式会社 このセッションの目的 EMR 環境の運用方法を講義とハンズオンを通して理解する デバッグ 調査の方法 モニタリングの方法 Copyright 2012 Amazon Web Services アジェンダ デバッグ 調査 ログの仕様 ログ確認方法モニタリング Management Console

More information

IPSJ SIG Technical Report Vol.2011-ARC-195 No.23 Vol.2011-OS-117 No /4/14 1. Cassandra CMS CMS 100 PC Cassandra Cassandra CMS Design of S

IPSJ SIG Technical Report Vol.2011-ARC-195 No.23 Vol.2011-OS-117 No /4/14 1. Cassandra CMS CMS 100 PC Cassandra Cassandra CMS Design of S 1. CMS 1 2 3 CMS 100 PC CMS Design of Scalable CMS using Shoshi TAMAKI, 1 Yu TANINARI 2 and Shinji KONO 3 To develop scalable CMS, We built scalability verification environment with 100 PC Clusters to

More information

データセンターの効率的な資源活用のためのデータ収集・照会システムの設計

データセンターの効率的な資源活用のためのデータ収集・照会システムの設計 データセンターの効率的な 資源活用のためのデータ収集 照会システムの設計 株式会社ネットワーク応用通信研究所前田修吾 2014 年 11 月 20 日 本日のテーマ データセンターの効率的な資源活用のためのデータ収集 照会システムの設計 時系列データを効率的に扱うための設計 1 システムの目的 データセンター内の機器のセンサーなどからデータを取集し その情報を元に機器の制御を行うことで 電力消費量を抑制する

More information

2 JSON., 2. JSON,, JSON Jaql [9] Spark Streaming [8], Spark [7].,, 2, 3 4, JSON [3], Jaql [9], Spark [7] Spark Streaming [8] JSON JSON [

2 JSON., 2. JSON,, JSON Jaql [9] Spark Streaming [8], Spark [7].,, 2, 3 4, JSON [3], Jaql [9], Spark [7] Spark Streaming [8] JSON JSON [ DEIM Forum 2016 G1-4,, 305 8573 1-1-1 305 8573 1-1-1 305 8573 1-1-1 E-mail: denam96@kde.cs.tsukuba.ac.jp, {shiokawa,kitagawa}@cs.tsukuba.ac.jp,,.,,,.,, (1), (2),.,, 1.,.,,.,,,,, Storm [2] STREAM [5], S4

More information

HBase Phoenix API Mars GPU MapReduce GPU Hadoop Hadoop Hadoop MapReduce : (1) MapReduce (2)JobTracker 1 Hadoop CPU GPU Fig. 1 The overview of CPU-GPU

HBase Phoenix API Mars GPU MapReduce GPU Hadoop Hadoop Hadoop MapReduce : (1) MapReduce (2)JobTracker 1 Hadoop CPU GPU Fig. 1 The overview of CPU-GPU GPU MapReduce 1 1 1, 2, 3 MapReduce GPGPU GPU GPU MapReduce CPU GPU GPU CPU GPU CPU GPU Map K-Means CPU 2GPU CPU 1.02-1.93 Improving MapReduce Task Scheduling for CPU-GPU Heterogeneous Environments Koichi

More information

AWSSummitTokyo2018

AWSSummitTokyo2018 AWS Gunosy AWS Summit Tokyo 2018/06/01 自己紹介 - 米田 武 / Takeshi Yoneda / マスタケ - Github/Twitter: @mathetake - 2017/03/31: - MSc. in Mathematics at Osaka University - 2017/04/01~ - Machine learning engineer

More information

本チュートリアルについて 14 部構成 比較的簡単なトピックから 各回 プログラミング言語 任意 チュートリアルで 新しい内容 宿題 プログラミング演習 次の週 結果について発表 もしくは話し合いをする スライドは Python で Python, C++, Java, Perl についての質問い答

本チュートリアルについて 14 部構成 比較的簡単なトピックから 各回 プログラミング言語 任意 チュートリアルで 新しい内容 宿題 プログラミング演習 次の週 結果について発表 もしくは話し合いをする スライドは Python で Python, C++, Java, Perl についての質問い答 自然言語処理プログラミング勉強会 0 プログラミング入門 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 本チュートリアルについて 14 部構成 比較的簡単なトピックから 各回 プログラミング言語 任意 チュートリアルで 新しい内容 宿題 プログラミング演習 次の週 結果について発表 もしくは話し合いをする スライドは Python で Python, C++, Java,

More information

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社 概要 NEC は ビッグデータの分析を高速化する分散処理技術を開発しました 本技術により レコメンド 価格予測 需要予測などに必要な機械学習処理を従来の 10 倍以上高速に行い 分析結果の迅速な活用に貢献します ビッグデータの分散処理で一般的なオープンソース Hadoop を利用 これにより レコメンド 価格予測 需要予測などの分析において

More information

Joint Content Development Proposal Tech Docs and Curriculum

Joint Content Development Proposal Tech Docs and Curriculum 徹底解説!Hortonworks が提供する次世代データプラットフォーム 蒋逸峰 & 河村康爾 Hortonworks October 10, 2017 1 Hortonworks Inc. 2011 2016. All Rights Reserved 総合的な管理 セキュリティやガバナンス ON-PREMISES CLOUD EDGE MULTI-WORKLOADS MULTI-TYPE MULTI-TIER

More information

本セミナーに関して スケーラブルな処理に焦点を当てます MapReduce の デザインパターン を学びます 基本的な直観を話します 数学はありません Hadoop プログラミングのチュートリアルではありません GPGPU とも関係ありません 右の本の入門版 (PDF が GitHub で無料 公開

本セミナーに関して スケーラブルな処理に焦点を当てます MapReduce の デザインパターン を学びます 基本的な直観を話します 数学はありません Hadoop プログラミングのチュートリアルではありません GPGPU とも関係ありません 右の本の入門版 (PDF が GitHub で無料 公開 分散処理実践セミナー Apache Spark による MapReduce の基礎 小町守首都大学東京システムデザイン学部情報通信システムコース 204 年 2 月 2 日 ( 金 ) http://cl.sd.tmu.ac.jp/~komachi/ でスライドを公開します このスライドは Creative Commons Attribution-Noncommercial-Share Alike

More information

今さら聞けない!? Oracle入門 ~後編~

今さら聞けない!? Oracle入門 ~後編~ Oracle Direct Seminar 今さら聞けない!? Oracle 入門 ~ 後編 ~ 日本オラクル株式会社 Agenda 1. Oracle の基本動作 2. Oracle のファイル群 3. Oracle のプロセス群と専用メモリ領域. データベース内部動作 今さら聞けない!? オラクル入門 ~ 後編 ~. データベース内部動作 検索時の動作更新時の動作バックアップについて

More information

PowerPoint Presentation

PowerPoint Presentation AWS ビッグデータサービス Deep Dive アマゾンデータサービスジャパンソリューションアーキテクト蒋逸峰 July 17, 2014 Session #TA-01 2014 Amazon.com, Inc. and its affiliates. All rights reserved. May not be copied, modified, or distributed in whole

More information

PostgreSQL による クラスタ構成の可能性 SRA OSS, Inc. 日本支社 取締役支社長 石井達夫

PostgreSQL による クラスタ構成の可能性 SRA OSS, Inc. 日本支社 取締役支社長 石井達夫 PostgreSQL による クラスタ構成の可能性 SRA OSS, Inc. 日本支社 取締役支社長 石井達夫 SRA OSS, Inc. のご紹介 PostgreSQLを中心とした OSSへの様々なサービスを提供 サポートサービス コンサルティング パッケージ製品 PowerGres, libtextconv, Sylpheed Pro 教育サービス トレーニング 技術者認定制度 (PostgreSQL

More information

並列計算導入.pptx

並列計算導入.pptx 並列計算の基礎 MPI を用いた並列計算 並列計算の環境 並列計算 複数の計算ユニット(PU, ore, Pなど を使用して 一つの問題 計算 を行わせる 近年 並列計算を手軽に使用できる環境が急速に整いつつある >通常のP PU(entral Processing Unit)上に計算装置であるoreが 複数含まれている Intel ore i7 シリーズ: 4つの計算装置(ore) 通常のプログラム

More information

Agenda Hadoop Sahara Kilo Q&A Copyright 2015 Mirantis, Inc. All rights reserved Page 2

Agenda Hadoop Sahara Kilo Q&A Copyright 2015 Mirantis, Inc. All rights reserved Page 2 OpenStack Sahara Road to Kilo www.miran(s.com/jp Copyright 2015 Mirantis, Inc. All rights reserved Agenda Hadoop Sahara Kilo Q&A Copyright 2015 Mirantis, Inc. All rights reserved Page 2 Hadoop Open-source

More information

2 Hadoop MapReduce Hadoop, MapReduce Apache Hadoop Project Open Source Software Hadoop common MapReduce Hadoop Distributed File System( HDFS)

2 Hadoop MapReduce Hadoop, MapReduce Apache Hadoop Project Open Source Software Hadoop common MapReduce Hadoop Distributed File System( HDFS) DEIM Forum 2014 D1-6 Hadoop 780-8520 2-5-1 780-8520 2-5-1 780-8520 2-5-1 E-mail: {nishimae,b103k299,honda}@is.kochi-u.ac.jp Hadoop MapReduce Map-Reduce Hadoop,MapReduce,,,, 1. e- Apache Hadoop ( Hadoop)

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2016.06.06 2016.06.06 1 / 60 2016.06.06 2 / 60 Windows, Mac Unix 0444-J 2016.06.06 3 / 60 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 0444-J 2016.06.06 4 / 60 ( : ) 6 6 ( ) 6 10 6 16 SX-ACE 6 17

More information

WEBシステムのセキュリティ技術

WEBシステムのセキュリティ技術 WEB システムの セキュリティ技術 棚橋沙弥香 目次 今回は 開発者が気をつけるべきセキュリティ対策として 以下の内容について まとめました SQLインジェクション クロスサイトスクリプティング OSコマンドインジェクション ディレクトリ トラバーサル HTTPヘッダ インジェクション メールヘッダ インジェクション SQL インジェクションとは 1 データベースと連動した Web サイトで データベースへの問い合わせや操作を行うプログラムにパラメータとして

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Computer simulations create the future 2015 年度第 1 回 AICS 公開ソフト講習会 K MapReduce ハンズオン 滝澤真一朗松田元彦丸山直也 理化学研究所計算科学研究機構プログラム構成モデル研究チーム 1 RIKEN ADVANCED INSTITUTE FOR COMPUTATIONAL SCIENCE KMR の導入方法を学ぶ 目的 KMRRUN

More information

IBM クラウド事例から考える OSS による企業向けクラウドの可能性 日本アイ ビー エム株式会社 Linux/OSS エバンジェリスト中井悦司 Feb. 27, IBM Corporation

IBM クラウド事例から考える OSS による企業向けクラウドの可能性 日本アイ ビー エム株式会社 Linux/OSS エバンジェリスト中井悦司 Feb. 27, IBM Corporation IBM クラウド事例から考える OSS による企業向けクラウドの可能性 日本アイ ビー エム株式会社 Linux/OSS エバンジェリスト中井悦司 Feb. 27, 2010 目次 クラウドとは? IBM クラウド事例に見るクラウド構成技術 クラウドを作る / 使う技術としての OSS 参考資料 2 クラウドとは? 3 仮想化された IT リソースのライフサイクル管理を自動化するのが IBM のクラウド技術です

More information

PowerPoint Presentation

PowerPoint Presentation Webデザイン特別プログラムデータベース実習編 3 MySQL 演習, phpmyadmin 静岡理工科大学総合情報学部幸谷智紀 http://na-inet.jp/ RDB の基礎の基礎 RDB(Relational DataBase) はデータを集合として扱う データの取り扱いはテーブル (= 集合 ) の演算 ( 和集合, 積集合 ) と同じ データベースには複数のテーブルを作ることができる

More information

PowerPoint Presentation

PowerPoint Presentation 1 Oracle Big Data Connectors Hadoop と Oracle Database の世界をつなぐ架け橋 日本オラクル株式会社製品事業統括テクノロジー製品事業統括本部ソリューション本部基盤技術部能仁信亮 以下の事項は 弊社の一般的な製品の方向性に関する概要を説明するものです また 情報提供を唯一の目的とするものであり いかなる契約にも組み込むことはできません 以下の事項は マテリアルやコード

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.09.10 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 1 / 59 furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 2 / 59 Windows, Mac Unix 0444-J furihata@cmc.osaka-u.ac.jp ( ) 2018.09.10 3 / 59 Part I Unix GUI CUI:

More information

2011年11月10日 クラウドサービスのためのSINET 学認説明会 九州地区説明会 九州大学キャンパス クラウドシステムの導入 伊東栄典 情報基盤研究開発センター 1

2011年11月10日 クラウドサービスのためのSINET 学認説明会 九州地区説明会 九州大学キャンパス クラウドシステムの導入 伊東栄典 情報基盤研究開発センター 1 2011年11月10日 クラウドサービスのためのSINET 学認説明会 九州地区説明会 九州大学キャンパス クラウドシステムの導入 伊東栄典 情報基盤研究開発センター ito.eisuke.523@m.kyushu-u.ac.jp 1 用 方 } } } } } 用 (Public Cloud) } Amazon EC2/S3/ElasticMapReduce } (Community Cloud)

More information

スライド 1

スライド 1 PostgreSQL レプリケーション ~pgpool/slony-i の運用性とその評価 ~ SRA OSS, Inc. 日本支社 http://www.sraoss.co.jp/ 佐藤友章 sato@sraoss.co.jp Copyright 2007 SRA OSS, Inc. Japan All rights reserved. 1 アジェンダ はじめに レプリケーションとは? pgpool/slony-i

More information

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015 ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ 本セッションの目的 本セッションでは ERDAS IMAGINEにおける処理速度向上を目的として機器 (SSD 等 ) 及び並列処理の比較 検討を行った 1.SSD 及び RAMDISK を利用した処理速度の検証 2.Condorによる複数 PCを用いた並列処理 2.1 分散並列処理による高速化試験 (ERDAS IMAGINEのCondorを使用した試験

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.06.04 2018.06.04 1 / 62 2018.06.04 2 / 62 Windows, Mac Unix 0444-J 2018.06.04 3 / 62 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 2018.06.04 4 / 62 0444-J ( : ) 6 4 ( ) 6 5 * 6 19 SX-ACE * 6

More information

Microsoft Word ●MPI性能検証_志田_ _更新__ doc

Microsoft Word ●MPI性能検証_志田_ _更新__ doc 2.2.2. MPI 性能検証 富士通株式会社 志田直之 ここでは,Open MPI および富士通 MPI を用いて,MPI 性能の評価結果について報告する 1. 性能評価のポイント MPI の性能評価は, 大きく 3 つに分けて評価を行った プロセス数増加に向けた検証 ノード内通信とノード間通信の検証 性能検証 - 連続データ転送 - ストライド転送 2. プロセス数増加に向けた検証 評価に用いたシステムを以下に示す

More information

tokyo_t3.pdf

tokyo_t3.pdf 既存アプリを気軽にインテリジェント化 intra-mart の AI 基盤 IM-AI 新登場! IM-AI 基盤のご紹介 NTT データイントラマート デジタルビジネス事業推進室 高松大輔 2 アジェンダ 1 2 3 4 5 intra-martのai 基盤ご紹介 KNIMEについて活用例のご紹介今後の取り組みまとめ 3 1 intra-mart の AI 基盤ご紹介 4 intra-mart の

More information

Spark と大規模データ処理 - NAISTビッグデータアナリティクス 第2回

Spark と大規模データ処理 - NAISTビッグデータアナリティクス 第2回 Spark NAIST 2 2015 10 16 Hadoop Spark Apache Spark 2 / 39 (three V) (Volume) 2011 1.8ZB 2020 35ZB 1ZB 1 = 10 21 B = 1, 000 EB = 1, 000, 000 PB = 1, 000, 000, 000 TB = 1, 000, 000, 000, 000 GB (Variety)

More information

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~ MATLAB における並列 分散コンピューティング ~ Parallel Computing Toolbox & MATLAB Distributed Computing Server ~ MathWorks Japan Application Engineering Group Takashi Yoshida 2016 The MathWorks, Inc. 1 System Configuration

More information

PowerPoint Presentation

PowerPoint Presentation MATLAB による 大規模フリートデータ解析 アプリケーションエンジニアリング部齊藤甲次朗 2015 The MathWorks, Inc. 1 アジェンダ はじめに ビッグデータ解析の課題 MATLAB を活用したフリートデータ解析事例 フリートデータ解析実践 デスクトップでの解析 クラスターへのスケールアウト MATLAB 解析のシステムへの統合 まとめ 2 25 GB / 1hour 4 フリートデータ解析を含むビッグデータ解析の課題

More information

…l…b…g…‘†[…N…v…“…O…›…~…fi…OfiÁŸ_

…l…b…g…‘†[…N…v…“…O…›…~…fi…OfiÁŸ_ 14 : RDB, Memcached : 1: : /, 2: : Google, 3: : Google BP 1 / 28 The 5 Stages of Scale (by. C. Smith) 1 Session partitioning (load balancer, multi-xx) 2 Read caching (reverse-proxy, memcached, CDN) 3 Get

More information

Visual Studio と.NET Framework 概要 Runtime Libraries Languag es Tool.NET Visual Studio 概要 http://download.microsoft.com/download/c/7/1/c710b336-1979-4522-921b-590edf63426b/vs2010_guidebook_pdf.zip 1.

More information

Rmenuフレームワーク

Rmenuフレームワーク ジェネレーティブプログラミングの世界 データマッピングフレームワーク Rmenu 特徴プログラムから データとプロセスを完全分離 疑問本当にデータとプロセスが完全分離できるのか? どんな仕組みで業務システムが動くのか? 日本オフィスクリエイション株式会社下地忠史 2014 年 2 月 15 日 Agenda 1. アプリケーションの基本 2.Json の特徴を利用した項目移送 3. アプリケーションのデータフロー

More information

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並 XcalableMPによる NAS Parallel Benchmarksの実装と評価 中尾 昌広 李 珍泌 朴 泰祐 佐藤 三久 筑波大学 計算科学研究センター 筑波大学大学院 システム情報工学研究科 研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI,

More information

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 品詞推定 文 X が与えられた時の品詞列 Y を予測する Natural language processing ( NLP ) is a field of computer science JJ -LRB- -RRB- VBZ DT IN 予測をどうやって行うか

More information

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-DBS-158 No /11/26 データ共有型マルチデータベースシステムにおけるクエリ効率化手法 齋藤和広 渡辺泰之 小林亜令 近年, データの大規模化やデータ利用の多様化に対応するために, 単

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2013-DBS-158 No /11/26 データ共有型マルチデータベースシステムにおけるクエリ効率化手法 齋藤和広 渡辺泰之 小林亜令 近年, データの大規模化やデータ利用の多様化に対応するために, 単 データ共有型マルチデータベースシステムにおけるクエリ効率化手法 齋藤和広 渡辺泰之 小林亜令 近年, データの大規模化やデータ利用の多様化に対応するために, 単一のデータソースに対して特徴の異なる複数のクエリ処理エンジンを選択し利用可能となってきている. これらのクエリ処理エンジンは, それぞれデータの種類や規模に応じた最適化が施されているため, ユーザが各エンジンの特性を理解し, 使い分けることでクエリ処理性能を最大限活用することができる.

More information

Hphi実行環境導入マニュアル_v1.1.1

Hphi実行環境導入マニュアル_v1.1.1 HΦ の計算環境構築方法マニュアル 2016 年 7 月 25 日 東大物性研ソフトウェア高度化推進チーム 目次 VirtualBox を利用した HΦ の導入... 2 VirtualBox を利用した MateriAppsLive! の導入... 3 MateriAppsLive! への HΦ のインストール... 6 ISSP スパコンシステム B での HΦ の利用方法... 8 各種ファイルの置き場所...

More information

https://www.facebook.com/dahatake/ https://twitter.com/dahatake/ https://github.com/dahatake/ https://daiyuhatakeyama.wordpress.com/ HDInsight は 本セッションでは扱いません 1. エンドユーザーの求めるレポートと分析内容を特定 2. 関連するデータベースのスキーマとクエリを定義

More information

リレーショナルデータベース入門 SRA OSS, Inc. 日本支社 Copyright 2008 SRA OSS, Inc. Japan All rights reserved. 1

リレーショナルデータベース入門 SRA OSS, Inc. 日本支社 Copyright 2008 SRA OSS, Inc. Japan All rights reserved. 1 リレーショナルデータベース入門 SRA OSS, Inc. 日本支社 Copyright 2008 SRA OSS, Inc. Japan All rights reserved. 1 データベース とは? データ (Data) の基地 (Base) 実世界のデータを管理するいれもの 例えば 電話帳辞書メーラー検索エンジン もデータベースである Copyright 2008 SRA OSS, Inc.

More information

ビッグデータアナリティクス - 第3回: 分散処理とApache Spark

ビッグデータアナリティクス - 第3回: 分散処理とApache Spark 3 : Apache Spark 2017 10 20 2017 10 20 1 / 32 2011 1.8ZB 2020 35ZB 1ZB = 10 21 = 1,000,000,000,000 GB Word Excel XML CSV JSON text... 2017 10 20 2 / 32 CPU SPECfp Pentium G3420 77.6 8,946 Xeon Gold 6128

More information

目次 Hadoop とは? IBM InfoSphere BigInsights BigSheets デモ 2

目次 Hadoop とは? IBM InfoSphere BigInsights BigSheets デモ 2 企業システムにおける大規模データの活用と Hadoop の動向 日本アイ ビー エム株式会社 Linux/OSS&Cloud サポートセンター中井悦司 目次 Hadoop とは? IBM InfoSphere BigInsights BigSheets デモ 2 Hadoop とは? 3 Hadoop とは? Hadoop は Google が提唱した分散データ処理を行うためのフレームワークをオープンソースとして再実装したものです

More information

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ Oracle Un お問合せ : 0120- Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよびSOA 対応データ サービスへ ) を網羅する総合的なデータ統合プラットフォームです Oracle

More information

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果

Pervasive PSQL v11 のベンチマーク パフォーマンスの結果 Pervasive PSQL v11 のベンチマークパフォーマンスの結果 Pervasive PSQL ホワイトペーパー 2010 年 9 月 目次 実施の概要... 3 新しいハードウェアアーキテクチャがアプリケーションに及ぼす影響... 3 Pervasive PSQL v11 の設計... 4 構成... 5 メモリキャッシュ... 6 ベンチマークテスト... 6 アトミックテスト... 7

More information

An introduction and future of Ruby coverage library

An introduction and future of Ruby coverage library Ruby の テストカバレッジ 測定機能の 改良と展望 クックパッド株式会社遠藤侑介 yusuke-oh@cookpad.com RubyWorld Conference 2017 (2017/11/01) 発表概要 発表内容 カバレッジとは カバレッジとの付き合い方 Ruby でのカバレッジ測定方法 クックパッドでのカバレッジ利用事例 発表者について フルタイム Ruby コミッタ (2017/09~)

More information

IceWall Remote Configuration Managerのご紹介

IceWall Remote Configuration Managerのご紹介 2018 年 3 月更新 ver.1.0 IceWall SSO 環境および周辺サーバーの容易な管理 設定 変更を実現 IceWall Remote Configuration Manager のご紹介 日本ヒューレット パッカード株式会社 IceWall ソフトウェア本部 目次 1. 概要 2. 機能 3. ユースケース 4. お問い合わせ 2 概要 IceWall Remote Configuration

More information

スライド 1

スライド 1 Zabbix で PostgreSQL の監視を行おう ~pg_monz のご紹介 ~ SRA OSS,Inc. 日本支社盛宣陽 Copyright 2014 SRA OSS,Inc.Japan All rights reserved. 1 PostgreSQL の課題 DB としての基本機能 性能は商用 DB と比べても引けをとらない 運用面には課題あり どのようにして運用するのか? 効果的な監視方法は?

More information

PowerPoint Presentation

PowerPoint Presentation Mahout を使った レコメンデーションのプロトタイプ 2011/10/21 アドソル日進株式会社 荒本道隆 ゴールイメージ 蓄積されたデータを使って Mahout で解析 まずは お医者さんが利用することを想定 患者側が利用することはできないだろうか? Hadoop によるフィルタリングスクリプトによる簡易な記述 Mahout による解析処理 MML レセプトデータ CSV CSV S3( 大量データ

More information

XML Consortium 2009/5/8 XML Consortium Enterprise2.0 アプリを支えるクラウド基盤としての Windows Azure XML コンソーシアム Web 2.0 部会 日立ソフト宮崎昭世 Microsoft MVP for Development Pl

XML Consortium 2009/5/8 XML Consortium Enterprise2.0 アプリを支えるクラウド基盤としての Windows Azure XML コンソーシアム Web 2.0 部会 日立ソフト宮崎昭世 Microsoft MVP for Development Pl Enterprise2.0 アプリを支えるクラウド基盤としての Windows Azure XML コンソーシアム Web 2.0 部会 日立ソフト宮崎昭世 Microsoft MVP for Development Platforms - ASP/ASP.NET Agenda クラウドとは Windows Azure とは Windows Azure 開発環境 Windows Azure の開発

More information

並列分散ワークフロー処理システムの研究開発

並列分散ワークフロー処理システムの研究開発 並列分散ワークフロー処理 システムの研究開発 田中昌宏 ( 筑波大 ) 1 発表内容 並列分散処理の必要性 ワークフローの記述について 並列分散ワークフロー実行システムPwrake 分散ファイルシステム Gfarm 天文データ処理ワークフローの記述 Montage SDFRED1 2 並列処理の必要性 データ量の増加 観測装置の進化 アーカイブの蓄積 並列処理の必要性 1コアあたりの性能が限界 計算機の進化は

More information

今さら聞けない!? Oracle入門 ~前編~

今さら聞けない!? Oracle入門 ~前編~ Oracle Direct Seminar 今さら聞けない!? Oracle 入門 ~ 前編 ~ 日本オラクル株式会社 Agenda 1. Oracle の基本動作 2. Oracle のファイル群 3. Oracle のプロセス群と専用メモリ領域 4. データベース内部動作 今さら聞けない!? オラクル入門 ~ 後編 ~ 4. データベース内部動作

More information

XMLとXSLT

XMLとXSLT XML と XSLT 棚橋沙弥香 目次 現場のシステム構成とXML/XSLの位置づけ XMLとは XSL/XSLTとは Xalanのインストール いろいろなXSL XMLマスター試験の紹介 現場のシステム構成 HTML 画面上のデータ 電文 電文 外部 WEB サーバー (Java) CORBA 通信 認証サーバー (C 言語 ) DB XML 電文 HTML XSL XSLT 変換今回の説明範囲

More information

Agenda 1. 今回のバージョンアップについて a. バージョンアップ概要 b. バージョンアップ目的 c. 新バージョンのシステム要件に関する注意事項 d. 現行バージョンのサポート期間 2. 対応プラットフォームの追加 3. 新機能の追加および機能強化 2

Agenda 1. 今回のバージョンアップについて a. バージョンアップ概要 b. バージョンアップ目的 c. 新バージョンのシステム要件に関する注意事項 d. 現行バージョンのサポート期間 2. 対応プラットフォームの追加 3. 新機能の追加および機能強化 2 サーバセキュリティ (SS) あんしんプラス バージョンアップのご案内 DeepSecurity Ver9.6SP1 から Ver10.0 へ 2018/9/7 Agenda 1. 今回のバージョンアップについて a. バージョンアップ概要 b. バージョンアップ目的 c. 新バージョンのシステム要件に関する注意事項 d. 現行バージョンのサポート期間 2. 対応プラットフォームの追加 3. 新機能の追加および機能強化

More information

Microsoft Word - nvsi_050090jp_oracle10g_vlm.doc

Microsoft Word - nvsi_050090jp_oracle10g_vlm.doc Article ID: NVSI-050090JP Created: 2005/04/20 Revised: Oracle Database10g VLM 環境での NetVault 動作検証 1. 検証目的 Linux 上で稼動する Oracle Database10g を大容量メモリ搭載環境で動作させる場合 VLM に対応したシステム設定を行います その環境において NetVault を使用し

More information

KSforWindowsServerのご紹介

KSforWindowsServerのご紹介 Kaspersky Security for Windows Server のご紹介 ランサムウェアに対抗する アンチクリプター を搭載 株式会社カスペルスキー 製品本部 目次 1. サーバーセキュリティがなぜ重要か? 2. Kaspesky Security for Windows Server の概要 Kaspersky Security for Windows Server の特長 導入の効果

More information

サンプル株式会社 御中 システム導入のご提案

サンプル株式会社 御中 システム導入のご提案 Hadoop Recommendation Machine Learning 本文中の会社名 製品名 サービスネームについて Amazon Web Services は Amazon.com, Inc. の商標または登録商標です Apache Hadoop は Apache Software Foundation の商標または登録商標です hybris は hybris AG の商標または登録商標です

More information

スライド 1

スライド 1 Hadoop と SAS との連携テクニック 小林泉 SAS Institute Japan 株式会社 ビジネス推進本部アナリティクスプラットフォーム推進 Techniques in SAS on Hadoop Izumi Kobayashi Analytics Platform Practice, SAS Institute Japan 1 要旨 : ビッグデータ分析の基盤としての Hadoop

More information

EMC-greenplum-SG s-1p

EMC-greenplum-SG s-1p Greenplum DB / Greenplum MR Greenplum MR (Greenplum HD ITpro EXPO AWARD Contents Greenplum DB 2 Hadoop Greenplum MR 18 1 EMC 2-1-1 151-0053 http://japan.emc.com http://japan.emc.com/contact/ EMC2EMCGreenplumGreenplum

More information

改版履歴 Ver. 日付履歴 1.0 版 2014/5/30 目次 0 はじめに 本文中の記号について Windows Server Failover Cluster をインストールするための準備 Windows Server Failover

改版履歴 Ver. 日付履歴 1.0 版 2014/5/30 目次 0 はじめに 本文中の記号について Windows Server Failover Cluster をインストールするための準備 Windows Server Failover NX7700x シリーズ Windows Server 2008 R2 Enterprise/ Windows Server 2008 R2 Datacenter Windows Server Failover Cluster インストール手順書 1.0 版 2014/5/30 Microsoft Windows Windows Server は 米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です

More information

SOC Report

SOC Report PostgreSQL と OS Command Injection N T T コ ミ ュ ニ ケ ー シ ョ ン ズ株式会社 ソ リ ュ ー シ ョ ン サ ー ビ ス 部 第四エンジニアリング部門 セキュリティオペレーション担当 2011 年 10 月 14 日 Ver. 1.0 1. 調査概要... 3 2. POSTGRESQL を使った WEB アプリケーションでの OS COMMAND

More information

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc

Microsoft Word - nvsi_050110jp_netvault_vtl_on_dothill_sannetII.doc Article ID: NVSI-050110JP Created: 2005/10/19 Revised: - NetVault 仮想テープ ライブラリのパフォーマンス検証 : dothill SANnetⅡSATA 編 1. 検証の目的 ドットヒルシステムズ株式会社の SANnetll SATA は 安価な SATA ドライブを使用した大容量ストレージで ディスクへのバックアップを行う際の対象デバイスとして最適と言えます

More information

第 1 回ディープラーニング分散学習ハッカソン <ChainerMN 紹介 + スパコンでの実 法 > チューター福 圭祐 (PFN) 鈴 脩司 (PFN)

第 1 回ディープラーニング分散学習ハッカソン <ChainerMN 紹介 + スパコンでの実 法 > チューター福 圭祐 (PFN) 鈴 脩司 (PFN) 第 1 回ディープラーニング分散学習ハッカソン チューター福 圭祐 (PFN) 鈴 脩司 (PFN) https://chainer.org/ 2 Chainer: A Flexible Deep Learning Framework Define-and-Run Define-by-Run Define Define by Run Model

More information

スライド 0

スライド 0 ビギナーだから使いたい O/R マッパー ~Teng を使った開発 ~ Hirobanex(Akabane Hiroyuki) 2012-06-29@Perl Beginners #3 コンテンツ Teng を使いたい 3 つの理由 ビギナーにオススメの Teng の導入方法 本来の O/R マッパーの効用 1 Teng を使いたい 3 つの理由 DBI はよくわからん O/R マッパーだと開発が抜群に早くなる

More information

スライド 1

スライド 1 Zabbix のデータベース ベンチマークレポート PostgreSQL vs MySQL Yoshiharu Mori SRA OSS Inc. Japan Agenda はじめに Simple test 大量のアイテムを設定 Partitioning test パーティションイングを利用して計測 Copyright 2013 SRA OSS, Inc. Japan All rights reserved.

More information

PowerPoint Presentation

PowerPoint Presentation ProjectLA バックエンドの技術解説 RDF を使った三つ組みデータの格納 2013/03/14 クラウド テクノロジー研究部会リーダー荒本道隆 ( アドソル日進株式会社 ) 何故 RDF か? 断片的なデータを相互につなぎたい RDFは主語 述語 目的語の三つ組構造で表現 目的語と主語に同じ値を設定して それぞれをつなぐ 属性を事前に決定できない RDFはスキーマレスなので 柔軟に対応できる

More information

Oracle SOA Suite 11gコンポジットに対するSOASchedulerの構成

Oracle SOA Suite 11gコンポジットに対するSOASchedulerの構成 Oracle SOA Suite 11g コンポジットに対する SOAScheduler の構成 オラクル Senior Solution Architect Robert Baumgartner 2010 年 11 月 Oracle SOA Suite 11g コンポジットに対する SOAScheduler の構成 1 前提条件 https://soasamples.samplecode.oracle.com/

More information

(Microsoft PowerPoint - Hadoop\225\224\211\357\224\255\225\\\211\357\216\221\227\277_ ppt)

(Microsoft PowerPoint - Hadoop\225\224\211\357\224\255\225\\\211\357\216\221\227\277_ ppt) Hadoop を使って分散処理を実践してみよう 部会員 ( 部長 ) 桂清太郎 モバイルクリエイト ( 株 ) ( 副部長 ) 今津久満 大分シーイーシー ( 株 ) 野口徹 三井造船システム技研 ( 株 ) 高橋麻衣子 ( 株 ) 富士通九州システムズ 早木建史 モバイルクリエイト ( 株 ) 森龍也 大分大学大学院 坂本親一郎 大分大学大学院 平成 23 年度 技術研究会 Hadoop 部会研究成果発表

More information

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co 072 DB Magazine 2007 September ~~~~~~~~~~~~~~~~~~ wait Call CPU time 1,055 34.7 latch: library cache 7,278 750 103 24.7 latch: library cache lock 4,194 465 111 15.3 job scheduler coordinator slave wait

More information

Microsoft PowerPoint - MySQL-backup.ppt

Microsoft PowerPoint - MySQL-backup.ppt MySQL バックアップ リカバリ概要 オープンソース コンピテンシコンピテンシ センター日本ヒューレットパッカードヒューレットパッカード株式会社 2006 年 12 月 6 日 2006 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice

More information

Microsoft PowerPoint - shudo-NoSQL-data-model ppt

Microsoft PowerPoint - shudo-NoSQL-data-model ppt 28 2009 12 17 NoSQL 1 NoSQL, key-value store, documentoriented DB, graph DB, memcached, Bigtable, Dynamo, Amazon SimpleDB, Cassandra, Voldemort, Ringo, VPork, MongoDB, CouchDB, Tokyo Cabinet/Tokyo Tyrant,

More information

Gfarm/MPI-IOの 概要と使い方

Gfarm/MPI-IOの 概要と使い方 MPI-IO/Gfarm のご紹介と現在の開発状況 鷹津冬将 2018/3/2 Gfarm ワークショップ 2018 1 目次 MPI-IO/Gfarm 概要 MPI-IO/Gfarm の開発状況 MVAPICH2 向け MPI-IO/Gfarm MPI-IO/Gfarm の使い方 かんたんなサンプルプログラムと動作確認の方法 既知の不具合 まとめと今後の展望 2018/3/2 Gfarm ワークショップ

More information

IIJ Technical WEEK Cloudbusting Machine(CBM)

IIJ Technical WEEK Cloudbusting Machine(CBM) Cloudbusting Machine CBM IIJ Project Gryfon PaaS Cloudbusting Machine CBM Project Gryfon PaaS http://www.gryfon.iij-ii.co.jp/ Key-Value Store KVS C GQL PHP-C MySQL 5.0.77 Cassandra 0.7.2 MongoDB 1.8.2

More information

ユーザーズマニュアル 有線ネットワークシステム 発行日 2016 年 3 月 30 日

ユーザーズマニュアル 有線ネットワークシステム 発行日 2016 年 3 月 30 日 ユーザーズマニュアル 有線ネットワークシステム 発行日 2016 年 3 月 30 日 目次 1 2 3 はじめに...1 1.1 前提知識...1 1.2 システム概要...1 1.3 動作環境...4 1.3.1 IP 経路情報監視 RTC...4 1.3.2 IP 経路情報ビューア RTC...6 インストール...7 2.1 RTC の入手方法...7 2.2 IP 経路情報監視 RTC...7

More information

第 5 章 結合 結合のパフォーマンスに影響を与える結合の種類と 表の結合順序について内部動作を交えて 説明します 1. 結合処理のチューニング概要 2. 結合の種類 3. 結合順序 4. 結合処理のチューニングポイント 5. 結合関連のヒント

第 5 章 結合 結合のパフォーマンスに影響を与える結合の種類と 表の結合順序について内部動作を交えて 説明します 1. 結合処理のチューニング概要 2. 結合の種類 3. 結合順序 4. 結合処理のチューニングポイント 5. 結合関連のヒント はじめに コース概要と目的 Oracle をより効率的に使用するための SQL チューニング方法を説明します また 索引の有無 SQL の記述方 法がパフォーマンスにどのように影響するのかを実習を通して習得します 受講対象者 アプリケーション開発者 / データベース管理者の方 前提条件 SQL トレーニング データベース アーキテクチャ コースを受講された方 もしくは同等の知識をお持 ちの方 テキスト内の記述について

More information

Microsoft Word - nvsi_080177jp_trendmicro_bakbone.doc

Microsoft Word - nvsi_080177jp_trendmicro_bakbone.doc Article ID: NVSI-080177JP Created: 2008/06/10 Revised: - 1. 検証目的 トレンドマイクロウイルス対策ソフト ServerProtect for Linux 3.0 とウイルスバスターコーポレートエディション 8.0 を組み合わせた NetVault Backup バックアップ動作検証 各クライアントが様々なファイルを書き込む中で ファイル サーバ自身とそのバックアップ

More information

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版 独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版 目次 1. はじめに... 3 2. インストール方法... 4 3. プログラムの実行... 5 4. プログラムの終了... 5 5. 操作方法... 6 6. 画面の説明... 8 付録 A:Java のインストール方法について... 11

More information

Wiki Wiki Wiki...

Wiki Wiki Wiki... 21 RDB Wiki 0830016 : : 2010 1 29 1 1 5 1.1........................................... 5 1.2 Wiki...................................... 7 1.2.1 Wiki.................... 7 1.2.2 Wiki.................. 8

More information

Microsoft Word - PSM51 and ontap83_config_831jp.doc

Microsoft Word - PSM51 and ontap83_config_831jp.doc PoINT NetApp FPolicy Server for Cluster Mode の設定と動作検証 (2015/8/31) 有限会社オプティカルエキスパート PoINT NetApp FPolicy Server for Cluster Mode は Data ONTAP の FPolicy 機能を活用し アーカイブされたファイルへの透過的なアクセスを提供します NetApp の FAS システム上のアーカイブされているファイルへのアクセスは常に

More information