Contents 1. システムを取り巻く環境における文字の課題 2. システム環境における COBOL の現状 3. 政府が推進する Society5.0 デジタル ガバメント実行計画 4.IMI( 共通語彙基盤と文字情報基盤 ) 5.COBOL 資産を国際標準の文字情報基盤に対応させるための課題

Similar documents
文字コード略歴 よこやままさふみ社内勉強会 2012/05/18 文字コード略歴 Powered by Rabbit 2.0.6

行政の情報化と文字情報基盤

iNFUSE インフューズ


iNFUSE インフューズ

4 Mule(Emacs)

スライド 1

はいたっく2012-7

ンロード可能であり 今後の運用 保守も情報処理推進機構が実施していく予定です 運用 保守にあたっては 行政現場の実務や国際標準との整合性をとり 文字情報の更なる正確性を期していく予定です 文字情報基盤の普及を図るために 説明会を札幌 仙台 東京 大阪 福岡で 11 月から実施予定です 詳細は情報処理

データ変換 How to セミナー 第1章

2. 実験シナリオ 対象が一般国民であるため 以下のことを前提とした実験環境を構築する (1) 内容氏名 住所等の多様な漢字の入力が必要となる Web を用いた電子申請をイメージして 文字情報基盤漢字の実験サイトとする 本事業の目的および 4 章で述べる実験項目を満たす具体的なストーリーを検討して提

Delphi/400バージョンアップに伴う文字コードの違いと制御

(2) 操作性 わかりやすいユーザーインターフェース 難しい操作は避ける (3) 相互運用性と国際整合性本実験は相互運用性と国際整合性を担保していることを条件とする 特定の OS 特定の Web ブラウザに依存しない方式を検討する ただし UTF-8 が動作する環境を本実験の対象とする ISO/IE

フォント埋め込みに関する調査報告 プラネットファーマソリューションズ株式会社 2019 年 05 月 31 日 Copyright 2019 Planet Pharma Solutions, Inc. All Rights Reserved.

CommuniNet -ActiveX/OLE対応端末エミュレータ

開発・運用時のガイド JDK8への移行に伴う留意点 [UNIX]

HULFT-DataMagic for Windows Ver レベルアップ詳細情報 < 製品一覧 > 製品名 バージョン HULFT-DataMagic for Windows HULFT-DataMagic コード変換 オプション for Windows HU

IMI情報共有基盤 「表からデータモデル」 データ変換のみを行う方向け画面説明

自己紹介 フリーライターとして OpenOffice.org 日本ユーザー会に参加 日本語環境改善拡張機能 を開発 IPAex フォント Takao フォント用拡張機能も開発 オープンガイドブック OpenOffice.org 3 ( 翔泳社刊 ) 執筆メンバー OpenOffice.org 日本ユ

資料 0 平成 23 年度文字情報基盤推進委員会 第 3 回技術検討 WG 議事次第 日時平成 23 年 10 月 7 日 ( 金 )15:00~17:00 場所文京グリーンコートセンターオフィス 13 階会議室 C < 議事次第 > 1. 開会 資料確認 前回議事録確認 2. 文字情報基盤 Web

ETOS 画面の Web 化 / 帳票印刷のオープン化体験お試し変換サービスのご紹介 ACOS-4 システムの業務改善提案

平成14年度 情報技術開発支援事業審議委員会

文字コード (2) 林部祐太 国立国会図書館関西館電子図書館課 2013/9/27 1

Microsoft PowerPoint - char-1605temp.ppt [互換モード]

eYACHO 管理者ガイド

講習No.8

IPA の提供する 縮退マップ に される MJ 字集合 JIS 字集合への縮退対応関係はある 字について 縮退先として 1 つの漢字が されるとは限らず 縮退先として複数の候補が される IPA としては縮退先の候補を さないの場合があります 2.2. 縮退マップの成り ち IPA の提供する縮退

スライド 1

Microsoft Word _00_導入編.doc

RT Fontカタログ

スキル領域 職種 : ソフトウェアデベロップメント スキル領域と SWD 経済産業省, 独立行政法人情報処理推進機構

3/7 マイグレーション開発方針 顧客名 0 作成者 根岸正 < プログラム移行方針 > システム名称 A-VX システムマイグレーション作成日 2015/09/01 < COBOL 資産のプログラム移行 > COBOLソース ( メインとCOPYLIB) を入力としてSCC 言語変換ツールにてVB

資料 5 自治体クラウド推進 業務改革について 平成 27 年 9 月 14 日

管理番号 内容仮想テーブル設定画面およびマッチング条件設定画面においてコメントを設定した場合 変換エラーが発生する マッピング情報設定画面の出力情報に固定値を選択し区分に 動的バイナリ値 を指定した場合 関数を設定す

目次 概要 S/4HANAの導入方式 NECがご提供するサービス S/4HANA 導入ロードマップ策定支援サービス

SOC Report

リリース情報

データ連携基盤サブワーキンググループ(第1回)

< B68E9A89DB91E888EA97972E786C7378>

情報連携用語彙データベースと連携するデータ設計 作成支援ツール群の試作及び試用並びに概念モデルの構築 ( 神戸市こども家庭局こども企画育成部 千葉市総務局情報経営部業務改革推進課 川口市企画財政部情報政策課 ) データ構造設計支援ツール設計書 2014 年 9 月 30 日 実施企業 : 株式会社ア

<4D F736F F F696E74202D D F838C815B F C835B83938E9197BF2E B93C782DD8EE682E890EA97705D205B8CDD8AB B83685D>

親指シフトキーボード(FMV-KB611)、JISキーボード(FMV-KB621)、FMV-LIFEBOOK(親指シフトキーボードモデル)をお使いになる方へ

PHP 分科会 '12/01 OpenSource 協議会 System i 2012/01/26

セットアップカード

BIP Smart FAQ

日本語入力システムの概要 日本語入力システムはインプットメソッド (Input Metho d) のうち 特にパソコンやワープロ 携帯電話などに日本語を入力するためのものを指す 通常はキー入力をソフトウェアで制御して実現する パソコンにおいて 英文の入力は一般のキーボードでタイプライター同様にタイプ

Oracle SQL Developer Data Modeler

Password Manager Pro スタートアップガイド

親指シフトキーボード(FMV-KB611)、JISキーボード(FMV-KB621)、FMV-LIFEBOOK(親指シフトキーボードモデル)をお使いになる方へ

いまさら聞けない日本語ドメイン名

資料 1 平成 25 年度文字情報基盤 運用検討 SWG 委員名簿 (2014 年 2 月 6 日現在 ) 主査 楠 正憲 内閣官房社会保障改革担当室番号制度推進管理補佐官 委員 牛込英樹 富士通株式会社ミドルウェア事業本部データマネジメント ミドルウェア事業部第五開発部マネージャー 梅原忍 財団法


<< 目次 >> 1 PDF コンバータのインストール ライセンスコードの入力 PDF にフォントを埋め込みたい場合の設定 PDF オートコンバータ EX で使用しない場合 PDF コンバータ単体で使用する場合の説明 PDF コンバータのアン

スライド 1

◎phpapi.indd

2. Windows Vista から共有フォルダのアクセスについて 対象製品 PNS25, PNB20S, PNS30 (F/W 3.x.x) Window Vista クライアントから 弊社 NAS 製品の共有フォルダにアクセスする際 Vista 側の設定を変更する必要がございます 対処方法は次

わんくま同盟 大阪勉強会 #1

Java Scriptプログラミング入門 3.6~ 茨城大学工学部情報工学科 08T4018Y 小幡智裕

FUJITSU Software Systemwalker for ERPパッケージ ジョブ連携 V16.0 紹介資料

講習No.9

NEC Express5800 シリーズ COBOL Enterprise Edition クライアントライセンス V1 COBOL Enterprise Edition クライアントライセンス V1 (1 年間保守付き ) COBOL Enterprise Edition クライアントライセンス

MySQL Cluster

入札方式別操作

Microsoft PowerPoint - 【HULFT】効果的なHULFT活用講座(①機能編)( )2.pptx

日本企業のCSIRT実例紹介

使用する前に

9601 F09F 9611 F0A F0B F0BD 9641 F0C F0A F0AA 9622 F0B F0BE 9642 F0C F0A F0AB 9623 F0B F0BF 9643 F0C9

K5移行サービス ご紹介資料

スライド 1

uCosminexus EUR 08-20新機能のご紹介

InputMan for Windows Forms バージョン比較表

2 NTT データビズインテグラル会社概要 会社名 本社所在地 株式会社 NTT データビズインテグラル NTTDATA BIZINTEGRAL CORPORATION 住所 東京都港区六本木三丁目 5 番 27 号六本木山田ビル 2 階 電話 設立年月日

JP1 Version 11

JDL Webストレージサービス はじめにお読みください

出入国在留管理庁正字検索システムユーザーマニュアル 第 1.3 版

はじめにお読みください

入札方式別操作

JACi400のご紹介~RPGとHTMLで簡単Web化~


<4D F736F F F696E74202D2091E63389F15F8FEE95F1835A834C A CC B5A8F FD E835A835890A78CE C CC835A834C A A2E >

<4D F736F F D B838B95FB964082CC939D88EA82C C F E58702C C37816A91CE899E8

Red Hat Enterprise Linux Server 7 動作確認表

Hitachi Compute Adapter -Hitachi Compute Plug-in for VMware vCenter- サポートマトリックス

日立製作所と日本オラクル、Linux 環境における

PDFオートコンバータEX

Microsoft PowerPoint - A3② JaSST_MISRA2004ソースコード品質診断.ppt

HULFT-DataMagic Ver2.2.0 製品対応OS

スキル領域 職種 : マーケティング スキル領域と MK 経済産業省, 独立行政法人情報処理推進機構

Step2 次に ご自身がお使いのパソコンの設定を確認します Step1 電子証明書の準備 Step2 パソコンの設定 Step3 新規ユーザ登録 本システムで電子申請を行うために必要な動作環境及び Web ブラウザは以下のとおりです 尚 最新の環境は下記 URL でご確認ください ( 参考 URL

技術レポート 1)QuiX 端末認証と HP IceWall SSO の連携 2)QuiX 端末認証と XenApp の連携 3)QuiX 端末認証 RADIUS オプションと APRESIA の連携 Ver 1.1 Copyright (C) 2012 Base Technology, Inc.


はじめに このマニュアルは BACREX-R を実際に使用する前に知っておいて頂きたい内容として 使用する前の設定や 動作に関する注意事項を記述したものです 最初に必ずお読み頂き 各設定を行ってください 実際に表示される画面と マニュアルの画面とが異なる場合があります BACREX-R は お客様の

IBM Rational Software Delivery Platform v7.0 What's

はじめに 電子入札システム / 入札情報システムをご利用いただくためには 事前準備をしていただく必要があ ります 事前準備の流れは 以下の通りです ( それぞれの準備内容は 各章を参照してください ) 1 アクセス用 URL 2 ID/ パスワードの取得 3 パソコン インターネット回線等の準備 4

PHP 開発ツール Zend Studio PHP アフ リケーションサーハ ー Zend Server OSC Tokyo/Spring /02/28 株式会社イグアスソリューション事業部

NEC COBOL Enterprise Edition Developer クライアントライセンス V2.0 COBOL Enterprise Edition Developer クライアントライセンス V2.0 (1 年間保守付 ) COBOL Enterprise Edition Develo

Oracle DatabaseとIPv6 Statement of Direction

ミガロ.製品 最新情報

BIP Smart FAQ

日経ビジネス Center 2

Transcription:

IT モダナイゼーション Summit 2018 ~ どうする? 最後のレガシー ~ 既存 COBOL 資産を有効活用した事例紹介 ~ 今後必要となる膨大な種類の漢字にどう対応するか ~ 2018/4/13 株式会社日立製作所公共システム事業部全国公共システム第一本部 河合孝志

Contents 1. システムを取り巻く環境における文字の課題 2. システム環境における COBOL の現状 3. 政府が推進する Society5.0 デジタル ガバメント実行計画 4.IMI( 共通語彙基盤と文字情報基盤 ) 5.COBOL 資産を国際標準の文字情報基盤に対応させるための課題 6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ 7. まとめ 1

1. システムを取り巻く環境における文字の課題 2

1. システムを取り巻く環境における文字の課題 システムを取り巻く環境 オープン化 レガシーシステムの再構築 既存業務システムの段階的移行 既存業務システムとの並行稼働 システム統合 / マイグレーション 複数業務システムの統合 既存業務システムの段階的移行 既存業務システムとの並行稼働 クライアント環境の更新 新 OS (Windows 7,8.1,10) の段階的導入 新 OS (Windows 7,8.1,10) への全面切替 法 制度 住民基本台帳法 出入国管理及び難民認定法 マイナンバー制度 官民データ活用推進基本法 Society5.0 の実現 さまざまなプラットフォーム (OS) 環境間でのシステム連携やデータ移行が発生 こんな不安はありませんか? 文字規格の混在で 文字化け 字形差が生じる 法改正の時の文字対応って一体何をすればよいの クライアント OS を更新すると 文字コード が変わるらしい 外字の移行 統合をどうしたらいいのか分からない 文字の重複登録で 業務システム間で名寄せができない 外字の作成 配布 管理を含めた運用に手間がかかる めざすビジョン お客さまのシステム環境に合わせて 情報システムに必要とされる文字環境 *1 ( 外字を含む ) の整備と既存資産を活かし BPR を実現するデータ流通基盤への対応 *1 ビジネスプロセス リエンジニアリング (Business Process Re-engineering) の略 企業活動の目標 ( 売上 収益率など ) を達成するために 既存の業務内容や業務フロー 組織構造 ビジネスルールを全面的に見直し 再設計 ( リエンジニアリング ) すること 3

1. システムを取り巻く環境における文字の課題 ~2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017~ Client OS Windows 2000 Windows XP JIS2004 規格が正式サポート Windows Vista 2010 年 7 月 13 日延長サポート終了 Windows 7 Windows 8.1 2014 年 4 月 9 日延長サポート終了 JIS90 互換フォント非サポート JIS90 規格標準 OS サポート終了 Windows 10 JIS90 互換フォントをサポートする OS が無くなる 2017 年 4 月 11 日延長サポート終了 2020 年 1 月 14 日延長サポート終了 ( 予定 ) 2023 年 1 月 10 日延長サポート終了 ( 予定 ) Server OS Windows 2000 Server Windows Server 2003 2010 年 7 月 13 日延長サポート終了 Windows Server 2008 JIS2004 規格が正式サポート ( 注 1) 各 OS 名称は略称で表記しています ( 注 2) 本資料では Microsoft,TM, マークは表示していません ( 注 3) Windows Server 2003 は,Windows Server 2003 R2 を含みます ( 注 4) Windows Server 2008 は,Windows Server 2008 R2 を含みます ( 注 5) Windows Server 2012 は,Windows Server 2012 R2 を含みます 2015 年 7 月 14 日延長サポート終了 Windows Server 2012 JIS90 互換フォント非サポート JIS90 規格標準 OS サポート終了 JIS90 互換フォントをサポートする OS が無くなる 2020 年 1 月 14 日延長サポート終了 ( 予定 ) 2023 年 1 月 10 日延長サポート終了 ( 予定 ) Windows Server 2016 4

1. システムを取り巻く環境における文字の課題 Windows Vista,Windows Server 2008 以降の対応 JIS X 0213(JIS2004) に対応した日本語入力 日本語フォントを搭載 変更点 1 JIS 第 1 第 2 水準漢字の 168 文字の字形が変更となる 変更点 2 JIS 第 3 第 4 水準漢字の文字が標準で入力される エンコード方式として UTF-16 を採用 変更点 3 4 バイト文字が標準で入力される 5

2. システム環境における COBOL の現状 6

2. システム環境における COBOL の現状 COBOL の利用状況 7

2. システム環境における COBOL の現状 新規 改良 保守 8

2. システム環境における COBOL の現状 システム再構築における COBOL 資産の取り扱いは 1COBOL からの脱却 動的プログラミング言語 (JavaScript Ruby Python 等 ) 静的型付き言語 (Java C Swift C++ 等 ) 2 オンライン処理は COBOL 脱却 バッチ処理は COBOL 継続 オンライン処理は 業務端末要件も加味して JavaScript Ruby Python Java C Swift C++ 等でスクラッチ開発 バッチ処理は 大量データ処理を書きやすい ( レコード入出力指向 ) 計算機は二進数でも人に合わせて十進数が中心 ( 基本的に演算は十進数 ) の COBOL を継続利用 3COBOL の継続利用 ( 保守性が高い ) ターゲット 静的言語 ( アプリケーションが稼働時に使うメモリ量を想定可能 ) 一つの文に多くの処理を詰め込まない (1 ステップずつ処理が進み 理解しやすい ) 長期にわたる互換性 ( 国際規格が言語仕様を定義 互換性を保ちながら言語仕様が進化 ) 9

2. システム環境における COBOL の現状 システム再構築における COBOL 資産の取り扱いは 3COBOL の継続利用 ( 保守性が高い ) 外的環境変化 (P: 政治面 E: 経済面 S: 社会面 T: 技術面 ) へ対応するには オープン化 レガシーシステムの再構築 既存業務システムの段階的移行 既存業務システムとの並行稼働 システム統合 / マイグレーション 複数業務システムの統合 既存業務システムの段階的移行 既存業務システムとの並行稼働 クライアント環境の更新 新 OS (Windows 7,8.1,10) の段階的導入 新 OS (Windows 7,8.1,10) への全面切替 法 制度 住民基本台帳法 出入国管理及び難民認定法 マイナンバー制度 官民データ活用推進基本法 Society5.0の実現 ターゲット 静的言語 ( アプリケーションが稼働時に使うメモリ量を想定可能 ) 一つの文に多くの処理を詰め込まない (1 ステップずつ処理が進み 理解しやすい ) 長期にわたる互換性 ( 国際規格が言語仕様を定義 互換性を保ちながら言語仕様が進化 ) 注目 10

3. 政府が推進する Society5.0 デジタル ガバメント実行計画 11

3. 政府が推進する Society5.0 デジタル ガバメント実行計画 未来投資戦略などの政策にて Society5.0 の実現に向けて Society5.0 基盤構築の加速をうたっている Society5.0 実現に向けた政府動向と府省の取り組みについて紹介する Society5.0 基盤構築の加速 政策動向の動き 実現に向けた府省などの取り組み データ連携のための相互運用性の確保 データ等の標準化 12

3. 政府が推進する Society5.0 デジタル ガバメント実行計画 未来投資戦略 2017 Society5.0 の実現に向け 先端技術をあらゆる産業 社会生活に導入していくことが必要だと 未来投資戦略などで示している *1 Society5.0 の実現に向けて 施策がより具体化 *1 Internet of Things の略 センサーやデバイスといった モノ がインターネットを通じてクラウドやサーバーに接続され 情報交換することにより相互に制御する仕組み 引用 : 内閣官房日本経済再生総合事務局未来投資戦略 2017-Society5.0 に向けた改革 - 13

3. 政府が推進する Society5.0 デジタル ガバメント実行計画 未来投資会議 第 4 次産業革命 で世界最先端をめざすために必要な事項を整理 5 つのイニシアティブにて Society5.0 基盤構築の加速を宣言 新しい経済政策パッケージ 新しい経済政策パッケージ へ Society 5.0 のインフラ整備として横断的なデータ連携基盤構築を推進 国内の整備にとどまらず 欧米との連携を年頭に 日米欧 10 億人のデータ共通市場の整備をめざす 2020 年までに全国に展開できる基盤を整備 2019 年 G20 で Society5.0 を世界に発信 2017 年 11 月 17 日 2017 年 12 月 8 日 総合科学技術 イノベーション会議 (CSTI *1 ) 2017 年 12 月 25 日 Society5.0 の実現に向け 人工知能 と データ連携基盤 を両輪として推進 データ連携基盤 の推進は CSTI が司令塔となり SIP *2 /PRISM *3 を中核に 分野毎 分野間のデータ連携基盤を整備する *1 Council for Science, Technology and Innovation *2 内閣府総合科学技術 イノベーション会議が司令塔機能を発揮し 府省の枠や旧来の分野を超えたマネジメントにより 科学技術イノベーション実現のために創設した国家プロジェクト Strategic Innovation Promotion Programの略称 *3 政府研究開発投資目標 ( 対 GDP 比 1%) の達成に向け 2018 年度に創設する官民研究開発投資拡大プログラム Public/Private R&D Investment Strategic Expansion PrograM 14

3. 政府が推進する Society5.0 デジタル ガバメント実行計画 出典 :Society5.0 重要課題ワーキンググループ ( 第 1 回 ) 資料 3 15

3. 政府が推進する Society5.0 デジタル ガバメント実行計画 Society5.0 重要課題 WG での整備方針 データ流通の拡充 相互運用性の実現 Society5.0 アーキテクチャの整備 日本発の国際標準化 16

3.政府が推進するSociety5.0 デジタル ガバメント実行計画 デジタル ガバメント実行計画について 平成30年1月16日開催 eガバメント閣僚会議(第4回) 資料1-1 デジタル ガバメント実行計画について より抜粋 *1 *2 *1 chief information officer の略 最高情報責任者を意味する *2 National center of Incident readiness and Strategy for Cybersecurity の略 内閣サイバーセキュリティセンターを意味する 17

3.政府が推進するSociety5.0 デジタル ガバメント実行計画 デジタル ガバメント実行計画について 平成30年1月16日 資料1-1より抜粋 18

3.政府が推進するSociety5.0 デジタル ガバメント実行計画 データ標準の社会全体への展開について 出典 第30回新戦略推進専門調査会電子行政分科会 第12回規制制度改革ワーキングチーム 第13回各府省情報化専任審議官等連絡会議 合同会議 資料2 19

3.政府が推進するSociety5.0 デジタル ガバメント実行計画 デジタル ガバメント実行計画について 平成30年1月16日 資料1-1より抜粋 20

3.政府が推進するSociety5.0 デジタル ガバメント実行計画 データ標準の社会全体への展開について 出典 第30回新戦略推進専門調査会電子行政分科会 第12回規制制度改革ワーキングチーム 第13回各府省情報化専任審議官等連絡会議 合同会議 資料2 21

3.政府が推進するSociety5.0 デジタル ガバメント実行計画 データ標準の社会全体への展開について 出典 第30回新戦略推進専門調査会電子行政分科会 第12回規制制度改革ワーキングチーム 第13回各府省情報化専任審議官等連絡会議 合同会議 資料2 22

4. IMI( 共通語彙基盤と文字情報基盤 ) 23

4.IMI( 共通語彙基盤と文字情報基盤 ) 出典 : データ連携基盤サブワーキンググループ ( 第 1 回 ) 資料 4-1 24

4.IMI( 共通語彙基盤と文字情報基盤 ) 出典 : データ連携基盤サブワーキンググループ ( 第 1 回 ) 資料 4-1 25

4.IMI(共通語彙基盤と文字情報基盤) デジタル ガバメント実行計画について 平成30年1月16日開催 eガバメント閣僚会議(第4回) デジタル ガバメント実行計画 より抜粋 26

4.IMI( 共通語彙基盤と文字情報基盤 ) 出典 : データ連携基盤サブワーキンググループ ( 第 1 回 ) 資料 4-1 27

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 28

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは 独立行政法人情報処理推進機構 (IPA) が平成 22 年度電子経済産業省推進費 ( 文字情報基盤構築に関する研究開発事業 ) を受託 行政で使われる文字を整理 戸籍統一文字 55,270 の漢字 住民基本台帳ネットワークシステム統一文字 19,563 の漢字 同定 整理して 58,842 字を国際規格と対応付け or 新規提案 JIS 漢字, 常用漢字, 表外漢字, 人名用漢字まで含めて整理 文字図形, 各種文字コード, 読み等の情報を一覧化 フォントを整備 29

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは 同定 整理した全ての文字を国際標準で使えるようにする ISO/IEC 10646 (Unicode の国際標準版 ) に登録済みの文字と対応付け ISO/IEC 10646 に登録されていなかった文字を提案し標準化 Unicode コンソーシアムに IVD (*) 提案し, 規格上はひとつの文字に包摂 ( 統合 ) された複数の文字を IVS (*) を使って区別できるようにする 外字のないデータ流通の世界へ (*) IVD: Ideographic Variation Database (*) IVS: Ideographic Variation Sequence/Selector 30

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは IT 総合戦略本部 新戦略推進専門調査会 パーソナルデータに関する検討会 各府省 CIO 連絡会議 電子行政オープンデータ実務者会議 情報セキュリティ政策会議 電子行政分科会 人材育成分科会 政府情報システム塗りつぶし部分 :: 関連する会議体刷新等 WG 協力依頼 報告 情報共有基盤推進委員会 委員長 須藤修 ( 東京大学情報学環長 ) 有識者 武田英明 ( 共通語彙基盤 WG 座長 ), 林史典 ( 文字情報基盤 WG 座長 ) 関係団体 一般社団法人情報サービス産業協会 ( ソフト業界 ), 一般社団法人電子情報技術産業協会 ( ハード業界 ) オブザーバ 内閣官房 (IT 総合戦略室, 社会保障改革担当 ), 総務省 ( 行政管理局 ) 共通語彙基盤 WG < 実施内容 > 情報連携用語彙基盤 DB の構築 API カタログの整備 情報連携用ツールの整備 各委員会,WG の設置主体は経済産業省, 事務局は IPA 各 WG の下には, 具体的な検討を行う SWG を設置 文字情報基盤 WG < 実施内容 > 標準化の実施 ( フォントの整備 ) 導入ガイドの作成 文字情報 DB の構築 文字情報検討 SWG 運用検討 SWG 文字情報基盤 DB 検討 SWG 31

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは 2017 年 12 月 20 日付で, 国際標準で 58,840 字が利用可能に 既存の ISO/IEC 10646 のコードにない文字について, SC 2 に提案 SC 2/WG 2/IRG で漢字の協議 国際投票 規格発行 数次に分けて提案 文字情報基盤文字を規格化完了 正確には, 漢字 2 字と変体仮名約 300 字が未規格化 2017-06-20 Unicode 10.0.0 発行 2017-12-14 Unicode コンソーシアムにIVD 登録 2017-12-20 ISO/IEC 10646:2017 発行 (Unicode 10.0.0 相当 ) 32

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは ユニコード (ISO/IEC 10646) の全体像 21 ビットの空間に文字を定義 全てが 2 バイトコード ( と 2 バイトコードの組み合わせ ) 一つの面に 65536 のコードポイント (16 ビットで表現 ) 0 面 ~16 面の合計 17 面を使う (21 ビット ) 0 面に定義された文字しか使わないなら, 2 バイト固定長と同等 17 面 256 256 33

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは ユニコードの代表的な符号化方式 UTF-16 0 面 2バイトの固定長 1 面 ~16 面 4バイトの固定長 (2つのコード位置を組み合わせる) 2 つのコード位置の値のビット列を組み合わせて 1 面 ~16 面の 21 ビットのコード位置を表現 UTF-8 0 面 ~16 面 1~4バイトの可変長で表現 ( 若いコード位置ほど短い ) ( 説明略 ) 34

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは ユニコードの符号化方式 UTF-16 0 面の文字は,2 バイトで表現 1 面 ~16 面の文字位置を, サロゲート文字のペアで表現 (2 バイト +2 バイト =4 バイト ) 0 面の D800~DBFF の領域と,DC00~DFFF の領域を特別に確保 1 面 ~16 面の文字の表現 0 面の D800~DBFF から 1 つ,DC00~DFFF から 1 つを拾い, 両者を合わせて 1 面 ~16 面の 21 ビットのコード位置を表現 17 面 D800~DBFF DC00~DFFF IVS に使われるコードは第 14 面 4 バイトで表現要 サロゲート文字のペア ( ビットで表現 ) 110110wwwwxxxxxx 110111xxxxxxxxxx --- 16ビット --- 16ビット 21 ビット表現に再構成 uuuuu xxxxxx xxxxxxxxxx ( ただし,uuuuu = wwww + 1) uuuuu は,1 面 ~16 面を指す 35

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは ユニコードの代表的な符号化方式の整理 包摂 ( 統合 ) した文字の元の形を区別するには, IVS (Ideographic Variation Selector/Sequence) を指定する IVS は, 第 14 面の 240 個のコード位置 (E0100~E01EF) として定義されている (UTF-16 では, サロゲートペアの 4 バイトで表現 ) 符号化方式 UTF-16 UTF-8 ベースの文字の符号位置 必要バイト数 ベースの文字 IVS の指定合計 0000~FFFF 2 4 6 10000~10FFFF 4 4 8 0000~007F 1 4 5 0080~07FF 2 4 6 0800~FFFF 3 4 7 10000~10FFFF 4 4 8 36

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは IVS を加えた UTF-16 表現の具体例 UTF-16 表現 5317_E0101 5317_E0102 5317 DB40 DD01 5317 DB40 DD02 UTF-16 表現 29031_E0100 D864 DC31 DB40 DD00 29031_E0101 D864 DC31 DB40 DD01 37

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 文字情報基盤事業とは IT モダナイゼーション 既存システム ( シフト JIS/EUC を処理 ) への変更を最小限に IT モダナイゼーションして, 文字情報基盤の 6 万字に対応可能に 接続先システム UTF-8/16 + IVS シフト JIS/EUC 既存システム (COBOL 等 ) 動的マッピングによるコード変換 UTF-8/16 + IVS 38

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 システム環境毎の文字環境の違い A システム 文字コード :KEIS,JEF,JIPS など文字集合 :JIS X 0208:1978 or 1983 B システム 文字コード : シフト JIS 文字集合 :JIS X 0208:1990 C システム 文字コード :Unicode 文字集合 :JIS X 0213:2004 JIS X 0212 文字情報基盤文字コード :Unicode 文字集合 :ISO/IEC 10646 JIS 第 1,2 水準 約 6,800 字 JIS 第 1,2 水準 6,879 字 JIS 第 1,2 水準 6,879 字 JIS 第 1,2 水準 6,879 字 Windows 特殊文字 457 文字 外字領域 約 9000 字 メーカ拡張文字含 外字領域 1,880 字 JIS 第 3,4 水準 4,354 字 JIS 補助漢字 6,067 字 JIS 第 3,4 水準 4,354 字 JIS 補助漢字 6,067 字 Windows 特殊文字 457 文字 Windows 特殊文字 457 文字 ( 注 ) 表記はあくまでも一例です 実際には Windows 特殊文字を含まない場合があるなどシステムによって異なります JIS 第 3,4 水準と補助漢字 および Windows 特殊文字は重複する文字が存在します 文字情報基盤は IPAmj 明朝バージョン 005.01(2016 年 7 月最新 ) の情報です 扱う文字数が異なるため連携が困難 外字領域 6,400 字 Windows Vista 以降の OS における標準文字領域 その他の戸籍統一文字 住基統一文字で UCS 符号化されている文字 約 37,000 字 その他の戸籍統一文字 住基統一文字で IVS 符号化されている文字 5,930 字 その他の戸籍統一文字 住基統一文字で符号化対象外の文字 1,941 文字 39

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 既存 COBOL システムを Unicode データに対応させるには シフト JIS KEIS など : 文字サイズは固定 UTF-8 UTF-16 など : 文字サイズは可変 シフトJISとUTF-8,UTF-16の文字サイズ ( バイト数 ) 文字種 / 文字コード シフトJIS UTF-8 UTF-16 英数字 (ASCII) 1 1 2 半角カナ 1 3 2 全角記号 2 3 2 全角カナ かな 2 3 2 漢字 2 3~4 2, 4 日本語のバイト数が増加する 半角 1 バイト 全角 2 バイトでなくなる コードが変わる 影響大 40

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 既存 COBOL システムを Unicode データに対応させるには 日本語のバイト数が増加する 例 : 高橋 高 4 バイト 6 バイト 領域サイズの見直し シフト JIS コード例 UTF-16 コード例 UTF-16コード例 (IVS 無しの場合 ) 8D82 9AD8 8BB4 6A4B 9AD8 D86D DF8E 半角 1 バイト 全角 2 バイトでなくなる 文字列処理の見直し 文字数のカウント 文字列の比較 文字列のコピー etc. コードが変わる 日本語文字コード判定方式の見直し 単純な修正では不可能! 全般的に再設計が必要 41

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 既存 COBOL システムを Unicode データに対応させるには シフト JIS コード 異体字セレクタを含む UTF-16 に変更する場合 01 KANJI-AREA PIC N(3). ( 文字位置 1 つ = 2 バイト ) 01 KANJI-AREA PIC N(12). 文字データの変数を,4 倍の領域に拡張する必要がある こうした変数を含むレコード内のレイアウトが変更になりレコード設計からやり直す必要がある 42

COBOL資産を 5. 国際標準の文字情報基盤に対応させるための課題 既存COBOLシステムをUnicodeデータに対応させるには COBOLでは文字列の文字位置同士を順番に比較 高 橋 9AD8 6A4B 9AD8 D86D 高 DF8E DB40 DD01 (U+2B78E_E0101) IVS有りの場合 文字 同士を比較するには データ内容を見て 各 文字 の開始 終了位置を認識する処理の追加が必要 43

5. COBOL 資産を国際標準の文字情報基盤に対応させるための課題 既存 COBOL システムを Unicode データに対応させるには 文字列の部分抽出には追加処理が必要 シフト JIS コードの文字列用のコーディング 異体字セレクタ付き UTF-16 の文字列用のコーディングへ変更 01 K-AREA PIC N(3). : : : : MOVE K-AREA(2:1) TO W-AREA 01 K-AREA PIC N(12). : 文字列の内容を調べ 文字位置 k と文字位置数 l を求める : MOVE K-AREA(k : l) TO W-AREA 追加処理 2 番目の文字位置から 1 文字位置分を取得 k 番目の文字位置から l 文字位置分を取得 シフト JIS では, 文字位置を使って抽出する文字列部分を指定 異体字セレクタ付きの UTF-16 では, 内容を調べて, 開始文字位置 と 文字位置の数 を求める処理を追加 44

6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ 45

6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ 既存 COBOL システムを Unicode データに対応させるには 日本語のバイト数が増加する 例 : 高橋 高 4 バイト 6 バイト 領域サイズの見直し シフト JIS コード例 UTF-16 コード例 UTF-16コード例 (IVS 無しの場合 ) 8D82 9AD8 8BB4 6A4B 9AD8 D86D DF8E 半角 1 バイト 全角 2 バイトでなくなる 文字列処理の見直し 文字数のカウント 文字列の比較 文字列のコピー etc. コードが変わる 日本語文字コード判定方式の見直し 単純な修正では不可能! 全般的に再設計が必要 スクラッチで造り直し 既存資産の有効活用 46

6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ 文字に関するシステム仕様 文字コードの体系 エンコーディング法 文字セット ( コレクション ) の 3 つを忘れずに指定することが大事 # ときどき まぜこぜになっています 取り扱う日本語文字集合の範囲 :JIS X 0213:2012 文字の符号化方式 :UTF-8( ) JIS X 0221:2007(ISO/IEC 10646(UCS)) の UCS-4 の範囲を符号化なお 取り扱う文字集合の範囲は 将来的な変化があった場合には 各機関のシステムの対応がなされることを前提として 文字の符号化方式を従前のままとしつつ より広い範囲の文字集合 ( 文字情報基盤等 ) に変更していくことが考えられる この場合においても 柔軟に対応できるよう 拡張性を考慮したシステム設計とすること 情報提供ネットワークシステム等の設計 開発等業務 調達仕様書 ( 平成 26 年 1 月 ) 47

6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ 文字を受け入れるときの注意 どんなコードで来るか? どんなエンコーディング法で来るか? どんな文字セットが来るか? JIS X 0213 10,050 952 JIS X 0208 6,355 2,743 JIS X 0212 補助漢字 5,801 3,058 ちまたにはいろいろな文字セットがある 入管正字 152 文字情報基盤 58,815 48

6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ 文字を受け入れるときの注意 コード エンコードの正規化をする 決めた範囲を超えた文字を入れられないようにする ( 丁寧に謝る ) 一般向けに送信する文字範囲は JIS の第一 ~ 第四水準までとする ( 電子政府構築の方針 ) 範囲を超えた文字を入力しようとした際に, その代替案を ( 親切に ) ガイドする ( 検索 縮退 ) そのシステムで使うことにした文字のセットを明確にし そのセットから外れた文字を受け取ったときには 警告を出してそれを拒絶するなどの機能を埋め込むことが求められる 49

6. 既存 COBOL 資産を有効活用した事例紹介 ~ 国際標準の文字情報基盤に対応するために ~ A 行政分野ユーザ様の事例 課題 短期間で 既存資産を有効利用して開発コスト抑制 業務プログラム 業務データ品質の確保 窓口機関 A 行政データセンター 関連機関 ネットワーク ネットワーク 参照 業務データ A 行政情報システム 抽出 / 転送 業務データ A 行政情報業務データ管理システム 帳票発行 業務端末 事例の特徴 既存 COBOL 資産を有効利用し Unicode(IVS) 対応を実現 既存 COBOL 資産への改修を最大限抑制する動的マッピング採用 (COBOL 資産 : 約 900 本 250Kstep) 全体 6.0 ヶ月 50

既存COBOL資産を有効活用した事例紹介 6. 国際標準の文字情報基盤に対応するために 既存COBOLシステムをUnicodeデータに対応させるには バイト数を意識するCOBOL資産は IVSのマルチバイト対応には 多大な工数を費やす レガシー資産を有効活用するため 従来のシフトJISをそのまま使用 AP/DBサーバ Windows シフトJIS UTF-16 印刷管理 シフトJIS UTF-16 UTF-16 シフトJIS 8A8B KEIS 2004 7041 UTF-16 845B DB40 DD00 動的マッピング テーブル UTF-16 UTF-16 バッチ業務システム COBOL コード変換ライブラリ シフト JIS 帳票生成サーバ(Windows UTF-16 UTF-16 DB UTF-16 UTF-16 SPOOL プリンタサーバ Windows オープンプリンタ バッチ業務で扱う文字コードを変更せずに対応 51

7. まとめ 52

7. まとめ Society5.0 基盤構築の加速 政策動向の動き 実現に向けた府省などの取り組みデータ連携のための相互運用性の確保 データ等の標準化 データ流通基盤 接続先システム UTF-8/16 + IVS シフト JIS/EUC 既存システム (COBOL 等 ) IMI 共通語彙基盤文字情報基盤 動的マッピングによるコード変換 IT モダナイゼーションソリューション UTF-8/16 + IVS 53

7. まとめ モダナイゼーション技術についての問い合わせ 株式会社日立製作所サービスプラットフォーム事業本部 IoT クラウドサービス事業部事業推進本部ミドルウェアソリューション窓口 E-mail: midsol-p@itg.hitachi.co.jp 関連する URL ITモダナイゼーションソリューション http://www.hitachi.co.jp/mid-sol/search_s/modernization/ COBOL2002 http://www.hitachi.co.jp/soft/cobol/ 54

ご清聴ありがとうございました IT モダナイゼーション Summit 2018 ~ どうする? 最後のレガシー ~ 2018/4/13 株式会社日立製作所公共システム事業部 河合孝志 全国公共システム第一本部 UCS-2 : UCS-2とは 国際符号化文字集合 (Universal Coded Character Set) の部分集合のこと 符号化文字集合の国際規格の1つであるISO/IEC 10646として定められており 2バイトの値として定義されている UTF-8 : UCS/Unicodeを8ビット系システムで扱えるよう 8ビット 1~6バイトに変換するエンコード方式 (ASCIIと同じ文字セット部分は1バイト それ以外は2~6バイト) UTF-16: UCS/Unicode において 1 文字を 16 ビット一つまたは二つで表現するエンコード方式 16 ビットを二つ使うことで 16 面拡張する ( サロゲート以外の文字は UCS-2 の 2 バイトと同じ 16 ビット 拡張 16 面の文字はサロゲートペアの 32 ビットで表現 ) EUC : UNIX 上で日本語の文字を扱う場合にもっとも多く利用されている文字コード ( 符号化方式 ) のひとつである JEF : JEF 漢字コード (Japanese processing Extended Feature) は 1979 年に富士通が策定した文字コード JIPS : JIPS(Japanese Information Processing System) はNECが開発した日本語処理システムの名前であり システム上で使われる漢字コード KEIS : Kanji processing Extended Information System は日立製作所が開発した日本語処理システムの名前であり システム上で使われる漢字コード HITACHI は 株式会社日立製作所の商標または登録商標です Microsoft Visual Basic Windows Windows Server および Windows Vista は 米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です Oracle と Java は Oracle Corporation 及びその子会社 関連会社の米国及びその他の国における登録商標です その他記載の会社名 製品名は それぞれの会社の商標または登録商標です 製品の改良により予告なく記載されている仕様が変更になることがあります 55