無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

Similar documents
Proself利用方法

ご存知ですか? データ転送

大阪ガス株式会社 情報通信部 御中

<4D F736F F F696E74202D F56504E90DA91B1835C CC834E838A B838B837D836A B2E >

認証システムのパスワード変更方法

試作ツールは MIT ライセンスによって提供いたします その他 内包された オープンソース ソフトウェアについてはそれぞれのライセンスに従ってご利用ください

カルテダウンロード 操作マニュアル

メールサーバ仕様変更に伴うメール設定変更方法

本文中の記号の意味 本文中で使用している記号の意味について以下に示します システムの操作上または処理の手続き上において 特に注意していただきたい事項を記載しています 記載内容を必ずお読みください システムの操作上または処理の手続き上において 参考にしていただきたい事項を記載しています 必要に応じてお

基礎からの MySQL 改訂版 は Windows10 や Windows8.1 にも対応しています Windows10 および Windows8.1 をお使いの読者が 基礎からの MySQL 改訂版 を読み進めると きの補足説明 1. 基礎からの MySQL 改訂版 の Windows10 および

目次 No. 内容 メニュー名 ページ番号 事前準備 IEバージョン情報確認 互換表示設定 (IE9 IE0 IEの場合 ) 信頼済みサイトへの登録 (IE0 IEの場合 ) 4 受注データを (IE0 IEの場合 ) 6 5 リストを出力する為の設定 (IE0 IEの場合 ) 7 6 ( その)(

鳥取県物品電子入札システムセキュリティ ポリシー設定マニュアル IC カードを利用しない応札者向け 第 1.7 版 平成 31 年 2 月鳥取県物品契約課 鳥取県物品電子入札システムセキュリティ ポリシー設定マニュアル Ver.01-07

目 次 1. はじめに ソフトの起動と終了 環境設定 発助 SMS ファイルの操作 電話番号設定 運用条件 回線情報 SMS 送信の開始と停止 ファイル出力... 16

チェックを外す 以上で マクロの有効と保護ビューの解除は完了です < 保護ビューの解除について > 保護ビューの解除については 特に設定しなくても EX はインストールできると思いますが 保護ビューのエラーメッセージが出た時に慌てないように念のため解除しておきます セキュリティが心配な方は EX が

第 1 節 スクリーンショット スクリーンショットとは コンピューターで開いているウィンドウの全体や その一部を 画像として取り込むことができる機能です ここでは 地図の挿入を行います 232

PowerPoint プレゼンテーション

事前準備マニュアル

POWER EGG2.0 Ver2.8 スタートアップガイド ~Webデータベース 応用編~

動作環境設定

目次 No. 内容 メニュー名 ページ番号 事前準備 IEバージョン情報確認 互換表示設定 (IE9 IE0 IEの場合 ) (IE0 IEの場合 ) 4 受注データを (IE0 IEの場合 ) 6 5 ( その)(IE0 IEの場合 ) 7 6 ( その)(IE0 IEの場合 ) 8 7 (IE9

PowerPoint プレゼンテーション

(3) 図 ファイルの展開先 ( 保存場所 ) 指定画面 が表示されます 参照ボタンを押下すると 図 フォルダ指定画面 が表示されるので 保存先を指定し OK ボタン を押下します 図 ファイルの展開先 ( 保存場所 ) 指定画面 の 展開 ボタンを押下します 図

カルテダウンロード 操作マニュアル

目 次 1 はじめに ユーザーズサイトから定義データベースをダウンロード オフライン更新手順 オフライン更新設定の削除手順 /14

このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

環境確認方法 (Windows の場合 ) OS 動作環境日本語版 Windows 7, 8, 8.1, 10 であること 確認方法 Windows キーを押しながら R キーを押します または [ スタート ] メニューから [ ファイル名を指定して実行 ] ( または [ プログラムとファイルの

ICLT 操作マニュアル (2011 年 05 月版 ) Copyright 2011NE 東京株式会社 All Rights Reserved

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

Microsoft Edge の場合 (1) Mizdori 無料体験版ダウンロード画面の [ 体験版ダウンロード ] ボタンをクリックします (2) Edge の下部に mizdori_taiken_setup.zip について行う操作を選んでください と表示され ますので [ 開く ] をクリッ

帳票ツールインストール手順 帳票ツールダウンロードの手順を実行しても正常に帳票が出力されない 場合のみ 以下の手順を実行してください 株式会社テラソフトデザインの公式サイトへアクセスします URL 左側メニューより ダウンロード をクリックしま

SHOFU SureFile for DentalX Manual

000

スクールCOBOL2002

新規コンポーネントの作成方法

Microsoft Word - プリンター登録_Windows XP Professional.doc

PALNETSC0184_操作編(1-基本)

Taro-QGIS 3.2

ランタイム版 Pro 版共通 症例登録システム 2018/12/11 Q & A 目次 1. 起動時のエラー... 2 Q11. " ファイル jsgoe_data3.fmp12 を開くことができません" と表示されます (Windows) 2 Q12. ショートカットから起動できません (Wind

パソコンをご利用中に Windows のシステム警告 ドライバの更新 システムの破損 等の見慣れない 不審なメッセージが表示された場合の対処法についてドキュメント ID: TS 環境 Windows 10 Windows 8.1 Windows 7 概要 このページでは インターネットを

目次 1. テンプレートの準備 1.1 エクセルファイルの準備 1.2 タグを作成する 1.3 エクセルファイルの表示調整 2.PC へテンプレートを追加 3.iPad での ICLT の操作 3.1 入力者の操作 入力者のログイン テンプレートを更新する チェッ

給管鳥 : 請求入金額管理ツール Ver4 のインストール方法 1. 給管鳥請求入金額管理ツール Ver4 セットアップウィザードへようこそ の画面が表示されたら 次へ (N) をクリックします 2. インストールフォルダーの選択 画面が表示されます 特に変更の必要がなければ 次へ (N) をクリッ

スライド 1

目次 1. はじめに 準備 機器構成 やさしく名刺ファイリング Pro v.14.0 セットアップと動作確認 やさしく名刺ファイリング Pro v.14.0 セットアップ... 5 Windows Windows 8.

譲渡人複数証明データコンバータ操作説明書 平成 26 年 6 月

第1部参考資料

LCV-Net ファイルコンテナ ユーザーマニュアル

1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します 一般に OSS は営利企業ではない特定のグループが開発するソフトウェアで ソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが 大規模な

活用効果調査入力システム Ver3 システム操作説明書 平成 27 年 2 月

第 12 講データ管理 1 2 / 14 ページ 12-1 データベースソフトの概要 データベースとは集められた様々なデータをテーマや目的に沿って分類 整理したものです データベースソフトでは データベースを作成し その管理を行います 何種類ものファイルや帳簿で管理していたデータをコンピュータ上で互

< 住所録の作成 > 宛名印刷には 差し込む住所録ファイルが必要です Excel を使って住所録を作成しましょう Excel の起動 エクセルを起動しましょう ( スタートボタン ) をクリック すべてのプログラム をポイント Microsoft Office をクリック Microsoft Off

Microsoft PowerPoint ï½žéł»å�’å–¥æœ�ㇷㇹㅃㅀ㇤ㅳㇹㅋㅼㅫ曉逃.ppt [äº™æ‘łã…¢ã…¼ã…›]

3. メールソフト設定情報の取得 メールソフト Thunderbird Portable の設定に必要な IMAP/SMTP 設定情報を Office365 から入手します (1) メール画面の右上の 歯車マーク をクリックし 表示されたメニューの オプション をクリックし ます (2) 左側のオプ

目次 Adobe PDF でチェック & コメントのススメ チェック & コメントをはじめる前に チェック & コメントでよく使うツール ( その ) 6 チェック & コメントでよく使うツール ( その ) 8 コメントの確認と返信 0 共有レビュー機能で効率をさらにアップ 共有レビュー機能を使う

Microsoft Word - メールでの送受信(添付方法).doc

内容 1 はじめに インストールの手順 起動の手順 Enterprise Architect のプロジェクトファイルを開く 内容を参照する プロジェクトブラウザを利用する ダイアグラムを開く 便利な機能.

MF mypresto インストールガイド 目次 新規インストールの手順 (Windows 版 )... 2 MF mypresto の起動 (Windows 版 )... 7 新規インストールの手順 (Mac 版 )... 8 MF mypresto の起動 (Mac 版 ) 新規イン

新規インストールガイド Microsoft Office Professional Plus 2016 本書は Download Station から Microsoft Office Professional Plus 2016( 以下 Office) をダウンロ ドし 新規インストールを行う手順

目次 第 1 章概要....1 第 2 章インストールの前に... 2 第 3 章 Windows OS でのインストール...2 第 4 章 Windows OS でのアプリケーション設定 TP-LINK USB プリンターコントローラーを起動 / 終了するには

平成 31 年 2 月 22 日 岐阜県電子入札システムクライアント PC の Internet Explorer 11 設定手順 ( 受注者用 ) 岐阜県電子入札システムを利用するには インターネットエクスプローラーの設定を行う必要があります 設定項目の一覧 ( クリックすると説明箇所へジャンプし

保存を行いたい場所 ( デスクトップ 等 ) を選択し 保存 (S) ボタンを押してください ファイル名 ファイル名は Jsas_TSKPrint.exe という初期値になっていますが 変更することができます 2 データのダウンロード ボタンを押すと 一括印刷用ソフトに取り込む停止及び警告認定者 (

V-Client for Mac ユーザーズガイド

FTP ウェブコンテンツダウンロード手順書 ver1.0 作成 :KDDI 株式会社 作成日 :2018 年 10 月 31 日

1. WebShare 編 1.1. ログイン / ログアウト ログイン 1 WebShare の URL にアクセスします xxxxx 部分は会社様によって異なります xxxxx. 2 ログイン名 パスワードを入力し

【バーコード作成】マニュアル 第1版

20180308森の日県南支部 林

エクセルシート自動分解システムPDFインストール操作マニュアル

Microsoft Word - 01_CommonMPインストール解説書.doc

Microsoft Word - tutorial3-dbreverse.docx

ライセンス認証ガイド Windows 10 Pro 本書は Download Station から Windows10 のライセンス情報をダウンロ ドし インストール済みの Windows 10 に適用する手順を記載しています 本手順は学内ネットワークに接続した状態で行う必要があります 認証プログラ

Windows10 の設定

本文中の記号の意味 本文中で使用している記号の意味について以下に示します システムの操作上または処理の手続き上において 特に注意していただきたい事項を記載しています 記載内容を必ずお読みください システムの操作上または処理の手続き上において 参考にしていただきたい事項を記載しています 必要に応じてお

<4D F736F F D20955C8E8695CF8D5894C55F8F9197DE8DEC90AC BA697CD89EF8ED08BA4974C816A91808DEC837D836A B81698BA697CD89EF8ED08CFC82AF816A2E646F6378>

<発注書作成>

もくじ 1. 設定前のご注意 2 2. Windows7の場合の設定方法 4 3. Windows8.1の場合の設定方法 8 4. Windows10の場合の設定方法 台帳 MENU 画面を開いても 各ボタンが機能しない場合 ネットワークドライブの割り当て方法について 17

1 Word2007 を立ち上げて 表を作って内容を入力し 体裁を整える 1 時間の関係で あらかじめ下記のような簡単な文書を作成して デスクトップにファイル 旅行案内操作前 1 を置いてありますからこのファイルをダブルクリックして開いて下さい (* 時間のある方は末尾に表の挿入方法などを参考に書い

Oracle Business Intelligence Standard Edition One のインストール

(1)IE6 の設定手順 (1)IE6 の設定手順 1) 信頼済みサイトの追加手順 1: ブラウザ (Internet Explorer) を起動します 手順 2: ツール / インターネットオプション / セキュリティ メニューを選択します 手順 3: セキュリティ タブの 信頼済みサイト を選択

Transcription:

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS とは Open Source Software の略で ソースコードが公開されているソフトウェアのことです OSS 製品は無料で使用できるものが多いのが特徴です OSS で有名なものとして Web ソフトウェア Apache アプリケーションサーバソフトウェア Tomcat などがあります 2.2 ETL ツールとは? ETL とは データベースや Web サービスなどのデータソースからデータを取得し 適切な形にデータ変換し データベース等にデータを挿入するツールです なお ETL は Extract/Transform/Load の頭文字をとった略称です 各々の単語の意味は次の通りです Extract データ抽出 Transform 変換 Load データ挿入図 1 データ源の種類 2.2.1 Extract( データ抽出 ) ファイルや DB ベース Web サービスといった各種データ源からデータを取得する工程です Kettle の場合 図 1 のようなデータ源を使用できます -65-

2.2.2 Transform( 変換 ) 抽出したデータを目的の形に変換 加工する工程です 図 2, 3 は Kettle で使用できる変換および参照の一例です 図 3 参照 2.2.3 Load( データ挿入 ) データをデータベースや XML LDAP 等に出力する工程です Kettle の場合 図 4 のような形に出力できます 図 2 変換 -66-

3.1 Kettle のインストール 最初に kettle をインストールする必要があります 手順は以下の通りです 1. java のインストール 2. path の設定 3. Kettle のダウンロードし 解凍 4. 解凍フォルダを C ドライブ直下に保存 java のインストール や path の設定 がわからない人は google 等で検索してみてください また Kettle のダウンロードサイトについても google 等で検索するとヒットすると思います 3.2 CSV データを Excel に変換してみよう試しに CSV ファイルを Excel に変換してみましょう 通常であれば CSV ファイルを Excel で開いて Excel で保存すればできますが その場合 CSV データに改行が入ってたり 00054 といった文字の場合 うまくいかないことがあります こういった場合でも Kettle を用いればうまく変換できます 図 4 出力 2.3 Kettle とは? Kettle は BI スイーツ Pentaho の一部です CE 版は OSS で提供されており 無料で使用できます 3. 使ってみよう! さっそく Kettle を使ってみましょう 本稿では以下のやり方を説明します CSV データを Excel に変換する Excel ファイルを連結する 1. CSV ファイルを作る以下のような内容が書かれている CSV ファイルを作ってデスクトップ等に保存してください a,011 b,022 c,033 2. C: data-integration Spoon.bat をダブルクリックします 3. メニューより [ ファイル ] [ 新規 ] [ データ変換 ] を実行します 図 5-67-

4. [ 入力 ] [CSV 入力 ] を右エリヤにドラック & ド ロップし 図 6 のようにします 入力後 OK ボタンをクリックし画面を閉じます [1] フィールド名 :Field_000 データ タイプ :String [2] フィールド名 :Field_001 データ タイプ :String 図 6 5. [ 出力 ] [Excel 出力 ] を右エリヤにドラック & ドロップし 図 7 のようにします 図 9 図 7 6. Shift キーを押しながら CSV 入力 アイコン上で左クリックしながらを Excel 出力 アイコン上で離すと図 8 のように矢印が作成されます 8. Excel 出力 のアイコンをダブルクリックして ファイル名欄に Excel ファイルの出力先を入力してください 図 8 図 10 7. CSV 入力 のアイコンをダブルクリックして 参照ボタンをクリックし 手順 1 で作成した CSV ファイルを選択してください また ヘッダー レコードを含む チェックボックスのチェックを外し 下の表に [1][2] のように入力します また フィールド タブを選択し フィールドを取得 ボタンをクリックしてください すると フィールド名 と データタイプ が入力されます そして OK ボタンをクリックして画面を閉じます -68-

3.3 Excel データを連結してみよう 図 15, 16 のような 学生ファイル と 成績ファイル を連結してみます [ 学生ファイル ] ファイル名 : 学生マスタ.xlsx 図 11 9. 実行ボタン ( 図 12 参照 ) をクリックしてください 図 15 図 12 以下の画面が表示されるので 実行 ボタンをクリックしてください [ 成績ファイル ] ファイル名 : 成績トランザクション.xlsx 図 16 図 13 すると Excel 出力先に Excel ファイルが出来ています 開くと下記のようになっています 1. C: data-integration Spoon.bat をダブルクリックします 2. メニューより [ ファイル ] [ 新規 ] [ データ変換 ] を実行します 3. 画面左より [ 入力 ] [Excel 入力 ] を右エリヤにドラック & ドロップし 図 17 のようにします 図 14-69-

図 17 4. [Excel 入力 ] アイコンをダブルクリックし スプレッドシートタイプ ( エンジン ) を Excel 2007 XLSX (Apache POI) を選択 ファイル名のリスト 欄に 学生マスタ.xlsx ファイルのフルパスを入力してください 図 20 7. 同様に手順 3~6 を 成績ファイル に対しても行ってください ( 下図は フィールド タブの入力内容 ) 図 18 図 21 5. シート タブをクリックし シート名 欄に Sheet1 と入力してください 8. 画面左より [ 結合 ] [ マージ結合 ] を右エリヤにドラック & ドロップし Shift キーを押しながら Excel 入力 および Excel 入力 2 アイコン上で左クリックしながら マージ結合 アイコン上で離し 図 22 のような矢印を作成します 図 19 6. フィールド タブをクリックし フィールドの取得 ボタンをクリックするとフィールド名等が入力されますので OK ボタンをクリックしてください 図 22-70-

9. マージ結合 アイコンをクリックし 以下の ように入力し OK ボタンをクリックしてくだ さい 図 25 図 23 なお OK ボタンクリック後 警告のポップアップが表示されますが 了解ボタンをクリックしてください また フィールド タブをクリックし フィールドを取得 ボタンをクリックし OK ボタンをクリックします 10. 画面左より [ 出力 ] [Excel 出力 ] を右エリヤにドラック & ドロップし Shift キーを押しながら マージ結合 アイコン上で左クリックしながら Excel 出力 アイコン上で離し 図 24 のような矢印を作成します 図 26 図 24 12. 実行 ボタン( 図 27 参照 ) をクリックしてください 11. Excel 出力 アイコンをダブルクリックしファイル名欄に Excel ファイルの出力先を入力してください 図 27 すると図 28 のような Excel ファイルが作成されます -71-

図 28 なお手順 [9] の結合タイプ入力欄にて INNER を選択した場合 図 29 のような Excel になります 図 29 なお 学籍番号および点数が小数点第 2 位まで表示されていますが Excel 入力時のデータタイプが Number となっているためです データタイプを String にすると小数点表示は無くなります 4. 最後に以上で簡単に説明を終えますが 本来はもっと複雑な変換をします 興味がある方は data-integration samples フォルダ配下にサンプルファイルが多数ありますので 参考にしてください -72-