ビッグデータ時代に求められるデータアーキテクチャ DWH からビッグデータ さらにビジネスインテリジェンス (BI) というように データ活用のステージが変化してきている この流れの中で求められているデータアーキテクチャの方向性として Syncsort の日本法人であるシンクソート ジャパン 代表の

Similar documents
ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

Oracle Business Intelligence Suite

IBM Rational Software Delivery Platform v7.0 What's

最終版 _IBMストレージ_講演_西村様

【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus

スキル領域 職種 : ソフトウェアデベロップメント スキル領域と SWD 経済産業省, 独立行政法人情報処理推進機構

Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行

Oracle Warehouse Builder: 製品ロードマップ

統合運用管理ソフトウェア Systemwalker 総合カタログ

ORACLE Data Integrator

第 2 回中部放射線医療技術学術大会 RIS 導入時の時の病院側作業に関して 2009 年 11 月 横河電機株式会社 医療ソリューション本部 1 横河電機株式会社医療ソリューション本部 2006Yokogawa Electric Corporation

OTデータとITデータの双方を統合的に分析可能な社会・産業インフラ分野向けのデータ分析基盤を提供開始

不具合情報受付管理 DB 不具合情報対応情報要因 履歴登録 設備情報 不具合情報 対応情報 不具合 ( 履歴 ) 情報 機器仕様 納入情報 機器部品情報 関連資料 機器情報 交換部品情報 交換履歴 交換部品情報 保有部材管理 DB 保有部材管理 不具合情報 不具合先情報 不具合復旧情報 受付情報 対

3. 回路図面の作図 回路図の作成では 部品など回路要素の図記号を配置し 要素どうしを配線するが それぞれの配線には 線番 などの電気的な情報が存在する 配線も単なる線ではなく 信号の入力や出力など部品どうしを結び付ける接続情報をもたせることで回路としての意味をもつ このように回路図を構成する図面は

目次 概要 S/4HANAの導入方式 NECがご提供するサービス S/4HANA 導入ロードマップ策定支援サービス

PowerPoint Presentation

DocAve Lotus Notes Migrator v5_0 - Product Sheet

<837D F838C815B DA8D738CB B838095CA8E9697E C D C838A B >

スライド 1

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

Microsoft PowerPoint 資料.ppt

Joint Content Development Proposal Tech Docs and Curriculum

Microsoft PowerPoint 年度IT投資動向実態調査リリース最終版.ppt

PowerPoint プレゼンテーション

日立とアシストが情報システム運用のレポーティングソフトウェアを共同開発

1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します 一般に OSS は営利企業ではない特定のグループが開発するソフトウェアで ソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが 大規模な

Microsoft PowerPoint - AS400オープン化概説(要約).ppt

マニュアル作成ツール「epiplex Documentor」発売開始のお知らせ

McAfee Application Control ご紹介

MotionBoard総合カタログ Ver.5.5

Infor 10 ERP Enterprise Overview

PowerPoint プレゼンテーション

PRESS RELEASE 報道関係者各位 連結会計システムのリーディングカンパニー ディーバ全く新しい セルフ型 CPM アプリケーション DivaSystem SMD SAS Edition 3.0 を提供開始 2016 年 11 月 1 日株式会社アバント株式会社ディーバ 企業マネジメントの生

3/7 マイグレーション開発方針 顧客名 0 作成者 根岸正 < プログラム移行方針 > システム名称 A-VX システムマイグレーション作成日 2015/09/01 < COBOL 資産のプログラム移行 > COBOLソース ( メインとCOPYLIB) を入力としてSCC 言語変換ツールにてVB

データベースの近代化:シンプルなクロスプラットフォーム、最小のダウンタイムで実現するクラウド移行

次に Exce ファイルを 意します DB2 for i にインポートするデータですので 以下の条件 で Exce ファイルを 意ください 1 がヘッダー 2 以降がデータ ヘッダー ( カラム名 ) は英数字ファイル形式は.xsx もしくは.xs ファイル名は英数字推奨 今回のご紹介では Navi

ミガロ.製品 最新情報

ベースのソフトウェア情報と突合するかといった点が重要になるが 実際には資産管理ツールだけでは解決できず 最終的に専門的な知識を有した人の判断が必要とされる この点の解決策としては 2012 年 5 月にマイクロソフトも対応を表明した ISO/IEC のソフトウェアタグに期待が集まって

FUJITSU Cloud Service for OSS 「コンテナサービス」 ご紹介資料

FUJITSU Software Systemwalker for ERPパッケージ ジョブ連携 V16.0 紹介資料

tokyo_t3.pdf

生産ライン・設備機器メーカー双方の課題をIoTで解決!

データ変換 How to セミナー 第1章

IT活用力セミナーカリキュラムモデル訓練分野別コース一覧・コース体系

ITdumpsFree Get free valid exam dumps and pass your exam test with confidence

ライフサイクル管理 Systemwalker Centric Manager カタログ

PowerPoint Presentation

PowerPoint Presentation

目次 1. ログイン 報告 ユーザ 病院 使用場所 通知先 材料データベース... 7 ご注意ください...12 JAN コードから材料データを返します マネージャーの情報変更 報告 CS

RICOH Device Manager Pro バックアップ/バージョンアップ作業手順書

Oracle SQL Developer Data Modeler

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

iNFUSE インフューズ

新製品 Arcserve Backup r17.5 のご紹介 (SP1 対応版 ) Arcserve Japan Rev. 1.4

Microsoft PowerPoint - ã…Šã…¬ã…fiㅥㅼ盋_MVISONCloud製åfi†ç´¹ä»‰.pptx

機能紹介:コンテキスト分析エンジン

CubePDF ユーザーズマニュアル

テストの自動化を見極める

CDM Studio

Fujitsu Standard Tool

使用する前に

UNIRITAマガジン 42号

PowerPoint Presentation

スライド 1

Sol-017 BPMSとの連携 _ppt [互換モード]

PowerPoint Presentation

FUJITSU Software Systemwalker for Oracle V15 (15.1) 紹介資料

Presentation Title

Microsoft 365 Business 中小企業のお客様に最適な 統合ソリューション 日本マイクロソフト株式会社

Microsoft PowerPoint - 【最終提出版】 MATLAB_EXPO2014講演資料_ルネサス菅原.pptx

スライド 1

市場概要とデジタルツインの促進要因 複雑性 製品 サプライチェーン データ および市場の求めるものが複雑化している エコシステムとビジネスネットワーク 外部企業とのネットワークの拡大 グローバルとローカル 競争の激しいグローバル市場でも ローカル市場と同様 丁寧な対応が必要 顧客エクスペリエンスと

CodeRecorderでカバレッジ

2 NTT データビズインテグラル会社概要 会社名 本社所在地 株式会社 NTT データビズインテグラル NTTDATA BIZINTEGRAL CORPORATION 住所 東京都港区六本木三丁目 5 番 27 号六本木山田ビル 2 階 電話 設立年月日

1 はじめに 前準備 MICROSOFT 製品のプログラムを最新の状態にする NET FRAMEWORK 4.0 ( と日本語 LANGUAGE PACK) のインストール NET FRAMEWORK 4.0 のインストール... 4

TFTP serverの実装

Transcription:

単なる ETL では限界 ビッグデータ活用の最初の難関 データ統合 をどうする? ビッグデータ活用の最初の難関 データ統合 をどうする? 真のデータドリブン経営の実現には レガシーシステムを含めたデータ統合が必要になる だが品質を確保するには従来の ETL ツールでは限界がある どうするか ビッグデータ活用が叫ばれて久しいが データウェアハウス ( 以下 DWH) 構築やデータ統合を考えるとき 置き去りにされがちなのが レガシーシステムやメインフレームが管理しているデータだ データ統合を支える技術にはETL(Extract Transform Load) がある ETLは企業内にある複数のシステムからデータを抽出し 変換 加工といった処理を加えてDWHやビジネスインテリジェンス (BI) ツールに受け渡す役割を担う しかしETLツールでデータを統合するとなった場合 出力するファイル数に応じてバッチ処理が必要になり その都度開発が必要になる またバッチ処理をするための時間がかかり スピードが求められるケースでは実用性が下がってしまう 企業が保有する全てのデータから有用な情報を得て 迅速な意思決定を実現するための基盤作りが求められる今日 最初にして最大級の課題となる データ統合 について考える レガシーな技術と最新技術の融合を実現する会社 Syncsortの創業は1968 年 ほぼ半世紀前 ソフトウェアといえばデータベースと運用管理系のソフトが中心で パッケージソフト という言葉が一般的に使われるようになる以前の時代である IBMが本格的な商用データベースとして Information Management System(IMS) を送り出したのが1960 年代後半であるから Syncsortはほぼ同時期に創業したことになる 以来 一貫してメインフレームをターゲットとしたビジネスを展開してきた スタートは データの並べ替え技術の開発であった 1971 年に発表した並べ替えのアルゴリズムを SyncSort と呼んでいたが 後日これが社名となったのである 同社が主力製品ともいえるETLツールである Syncsort DMExpress を発売したのは2004 年 このころからデータ統合の世界へと業務領域を拡大することになる Syncsortゼネラルマネージャーのジェフ クック氏は 企業にオープンシステムが導入され始めたころから ソート ( データの並べ替え ) 技術に加えてビッグデータ領域へとターゲットを拡大してきた と語る 同社がソート技術に求めたものは 速く安く だった データ統合に関してもテーマは変 わらないとクック氏は語る ジェフ クック氏 1

ビッグデータ時代に求められるデータアーキテクチャ DWH からビッグデータ さらにビジネスインテリジェンス (BI) というように データ活用のステージが変化してきている この流れの中で求められているデータアーキテクチャの方向性として Syncsort の日本法人であるシンクソート ジャパン 代表の北川晋 ( すすむ ) 氏は以下の 4 項目を挙げる データを集中したい 保有データを意思決定力に変えたい ガバナンス コンプライアンス セキュリティ標準を維持したい ITという複雑さを取り除きたい 北川晋氏 最適化と効率を追求する Syncsort 長い歴史の中でSyncsortは 買収や協業といった手法でマーケットの拡大を図ってきた 中でも近年 同社の方向性に大きな影響を与えたのが2016 年のTrillium Software 買収だ Trillium Softwareはデータクレンジングや名寄せツールとして高い評価を得ている製品 Trillium を提供している メインフレームのデータをオープン系システムに移行するとき 単純にデータを移し替えるだけでなく Trilliumを利用して移行時にデータプロファイリング ( 可視化 ) とデータクレンジングを実施することで 移行後のデータ活用までのリードタイムを大幅に短縮できる Trilliumは日本語対応が完了しているので 漢字 かななど2バイト文字と欧文用文字が混在したデータであっても 住所 姓名 法人名キーワードなど各種辞書を用いたデータクレンジング機能により 名寄せの際に問題となる表記違いを効果的に解消し 顧客情報整備を短時間で実現できる Syncsort シニアバイスプレジデントのブライアン アシュレー氏は Syncsortが提供する価値は 最適化 (Optimization) と 効率(Efficiency) の2 語に集約できる と語る この2つの特徴を生かすことで 企業がコスト削減を実現する環境を提供する役割を担うのだ ブライアン アシュレー氏 2

データ統合 Hadoop 連携 データオフロードの 3 分野でビジネス展開 これまで登場しているETLツールでは データ移行のプロセスで 場合によっては利用者がプログラムを記述し バッチ処理でDWHにデータを送り込むといった方法を採用してきた しかしトランザクションが膨大なシステムでは 前日のデータのバッチ処理をして翌朝までに分析系のシステムに受け渡すことが難しくなっている 極端な場合 翌朝のシステム稼働までにバッチ処理が終わらないといったことも発生し得る 最近のBIではスピードが求められる しかし従来の方法ではデータ加工 移行 分析といったプロセスに時間がかかり どうしてもリアルタイム性が犠牲になる側面がある その点 Syncsortが提供するツール群は データ統合からデータ加工 データ移行までのプロセスをスピーディーに しかもリソースに掛かる負荷が最低になるよう最適化した環境を提供できる 北川氏は同社製品群の優位性をこう強調する 同社の主要製品群を見ていこう 1. DMExpress を代表とするデータ統合 DMExpress( 以下 DMX) は高速データ処理を実現するツールであり GUI( グラフィカルユーザーインタフェース ) ベースでジョブの設定が簡単に完了する 一般的にはBIツールを利用する際 DWH 内に 分析用に加工したデータを用意しておく必要がある しかし この作業には多大な工数がかかり また高度な技術レベルが要求される DMXを活用することで 多少 ITリテラシーが高いエンドユーザーであれば 自分でジョブを設定し 必要な未加工データを自由に入手できるようになる このユーザーフレンドリーな設計思想は 他のETLツールにはない特徴だとクック氏は言う DMX の処理フロー 3

2. DMX-h による Hadoop 連携 Syncsort DMX-h はDMXの Apache Hadoop 版ということになる Hadoop 上のデータ処理のジョブ作成は DMX-hを利用することで DMX 同様にGUI 環境で作成することが可能だ これにより Hadoop 上でも高度な技術レベルを必要とすることなく簡単に最適な分散処理環境を実装できる しかもWindows 版のDMXで作成し実行したジョブは そのままDMX-h 上で動作が可能だという つまり Windows 環境の最小構成からHadoop 上のエンタープライズ構成に簡単にスケールアウトすることを可能にしたのだ Syncsort DMX-h 3. DMX Change Data Capture がメインフレームデータと Hadoop のデータ同期を実現 このたび新たにリリースした DMX Change Data Capture( 以下 CDC) は メインフレーム OS IBM z/os 用のデータベース管理システム IBM DB2 とHadoopのデータ同期を実現した CDCは全データを DB2からHadoopに転送後 データの変更 追加 削除などの情報をキャプチャーし 変更のあったデータのみを定期的に Hadoopに転送する仕組みだ これにより 既存のメインフレームのデータとオープンシステムのデータをHadoop 上に集結させることを可能にする 特に大手金融機関では FinTechやInsTech( 注 ) などの新たな取り組みにおいて メインフレームとオープンシステムのデータ融合が大きな課題となっている CDCはこの課題を解決する上で 非常に有望なソリューションの1つといえるだろう 注 : 保険 (Insurance) と情報技術 (Technology) をかけ合わせた概念 4

無駄のない形でメインフレームとオープン系のデータ統合を実現 データソースからのデータをBIシステムで使えるものにするまでの間には 現状では幾つものステップが必要だ それぞれのプロセスにはコストも時間もかかっているのは言うまでもない 日本のユーザー企業は ここでリソースが無駄に使われていることに意外と無頓着なことが多い Syncsortの製品群を活用することでその無駄を解消し 最適なシステムを作り上げることができるだろう DWH の最適なシナリオ ビッグデータ時代 意思決定の迅速化に向けて 機械学習などの人工知能 (AI) 技術が着々と地歩を固めている 一方でそれらの最新技術をビジネスに生かすためには 基本となるデータが使えるものになっていなければならない 地味な領域の見過ごされがちな課題だが ここが解決されなければ データドリブン経営 など望むべくもないことを まずわれわれは知るべきなのである 提供 : シンクソート ジャパン株式会社 アイティメディア営業企画 / 制作 :TechTarget ジャパン編集部 2017 年 6 月 30 日 TechTarget ジャパン ビッグデータ活用の最初の難関 データ統合 をどうする? (http://techtarget.itmedia.co.jp/tt/news/1707/05/news01.html) より転載 5