資料 1 平成 25 年度文字情報基盤 運用検討 SWG 委員名簿 (2014 年 2 月 6 日現在 ) 主査 楠 正憲 内閣官房社会保障改革担当室番号制度推進管理補佐官 委員 牛込英樹 富士通株式会社ミドルウェア事業本部データマネジメント ミドルウェア事業部第五開発部マネージャー 梅原忍 財団法人地方自治情報センター住民基本台帳ネットワークシ ステム全国センターシステム担当上席マネージャ 大山水帆 川口市情報政策課課長 田丸健三郎 日本マイクロソフト株式会社 技術統括室 / イノベーションセ ンター本部長 平林元明 株式会社日立製作所公共システム事業部公共イノベーショ ン事業推進本部主管 平本健二 経済産業省 CIO 補佐官 安田雅義 新宿区総合政策部情報政策課 吉本明平 日本電気株式会社公共ソリューション事業部マネージャー 田代秀一小林龍生沼田秀穂池田佳代武藤圭祐 事務局情報処理推進機構国際標準推進センター長情報処理推進機構国際標準推進センター専門委員情報処理推進機構国際標準推進センター専門委員情報処理推進機構国際標準推進センター専門委員情報処理推進機構国際標準推進センター
文字情報基盤導入ガイド ( 案 ) ドラフト (2014 年 2 月 6 日版 ) 1. 本ガイドの目的本ガイドは 平成 25 年 6 月 14 日の閣議決定 世界最先端 IT 国家創造宣言 1 のⅢ.3.(1) 節 利便性の高い電子行政サービスの提供 に示された 文字の標準化 共通化に関しては 今後整備する情報システムにおいては 国際標準に適合した文字情報基盤を活用することを原則とする との方針に沿ったシステム構築 運用を行うための具体的な技術的指針を示すとともに 文字情報一覧表 2 関係国際規格等 導入に当たって参照すべき資料を明確とすることを目的としている 2. 文字情報基盤について文字情報基盤とは 2002 年度 ~2008 年度に実施された 汎用電子情報交換環境整備プログラム の成果を出発点とし 2010 年度に内閣官房情報通信技術 (IT) 担当室 ( 現 IT 総合戦略室 ) 総務省 法務省 経済産業省 文化庁などの関係府省や専門家 産業界関係者が参加する文字情報基盤推進委員会を 独立行政法人情報処理推進機構 ( 以下 IPA と呼ぶ) を事務局として設置し 検討が開始された事業である 住民基本台帳ネットワークシステム統一文字 ( 以下 住基統一文字 と呼ぶ ) 戸籍統一文字に収録された漢字を整理し 各文字体系との対応関係等をまとめた文字情報一覧表と 文字フォント (IPAmj 明朝フォント ) を整備するとともに それらの文字符号の国際標準化を推進している 図 1 に 現在の文字情報基盤検討体制を示す 文字情報基盤ワーキンググループは経済産業省に設置され IPA が事務局を務めている 1 閣議決定 世界最先端 IT 国家創造宣言 http://www.kantei.go.jp/jp/singi/it2/kettei/pdf/20130614/siryou1.pdf 2 文字情報基盤文字情報一覧表 :http://mojikiban.ipa.go.jp/1311.html - 1 -
IT 総合戦略本部 新戦略推進専門調査会 パーソナルデータに関する検討会 各府省 CIO 連絡会議 電子行政オープンデータ実務者会議 情報セキュリティ政策会議 電子行政分科会 人材育成分科会 政府情報システム刷新等 WG 塗りつぶし部分は関連する会議体 協力依頼 報告 情報共有基盤推進委員会 委員長 須藤修 ( 東京大学情報学環長 ) 有識者 武田英明 ( 共通語彙基盤 WG 座長 ) 林史典( 文字情報基盤 WG 座長 ) 関係団体 JISA( ソフト業界 ) JEITA( ハード業界 ) オブザーバ内閣官房 (IT 総合戦略室 社会保障改革担当室 ) 総務省( 行政管理局 ) 各委員会 WG の設置主体は経済産業省 事務局は IPA 各 WG の下には 具体的な検討を行なう SWG を設置 共通語彙基盤 WG < 実施内容 > 情報連携用語彙基盤 DB の構築 API カタログの整備 情報連携用ツールの整備 主査 武田英明 (NII 教授 ) 関係省庁 ( 課長級 ) IT 室 社保室 内閣府防災 総務省 国交省 国会図書館 文字情報基盤 WG < 実施内容 > 導入ガイドの作成 文字情報 DB の構築 フォント整備 標準化の実施 < メンバー > 右表のとおり 氏名 位置付け 所属 座長 林史典 有識者 聖徳大学教授 委員 三上喜貴 有識者 長岡技術科学大学教授 ( 副学長 ) 委員 氏原基余司有識者 文化庁 委員 大山水帆 自治体 川口市 委員 梅原忍 関係団体 LASDEC 委員 課長級 関係省庁 総務省自治行政局 住民制度課 委員 課長級 関係省庁 総務省総合通信基盤局高度通信網振興課 委員 課長級 関係省庁 法務省民事局 オブザーバ 課長級 関係省庁 ( 利用 ) 内閣官房 IT 室 オブザーバ 課長級 関係省庁 ( 利用 ) 内閣官房社保室 オブザーバ 課長級 関係省庁 ( 利用 ) 総務省行政管理局情報システム管理室 委員 - SWG 座長 ( 文字情報 ) 委員 - SWG 座長 ( 運用 ) 委員 - SWG 座長 ( 技術 ) 図 1 文字情報基盤の検討体制 (2013 年度 ~) 2.1. 文字情報基盤で提供する成果物等 文字情報基盤の事業成果物として IPA は 以下のものを公開している 3 (1) IPAmj 明朝フォント文字情報基盤で整備された文字 ( 戸籍統一文字の漢字 :55,270 文字 住基統一文字の漢字 :19,563 文字を整理した結果 ) 約 60,000 文字を収録したフォントであり IPA フォントライセンス v1.0 により 無償公開されている ISO/IEC 10646 に準拠して符号化されている 符号化方式の詳細は 2.2 節 国際標準化状況は 2.3 節を参照のこと (2) 文字情報基盤文字情報一覧表 (MJ 文字情報一覧表 ) 文字情報基盤で整備された文字について 文字図形 各種文字コードとの対応関係 読み 画数 部首等の漢字属性情報 SVG フォーマットによる文字図形イメージ情報等を収録し 文字の 見える化 を図る一覧表である クリエイティブ コモンズ ライセンス 2.1 表示 継承 により無償公開されている 文字情報一覧表の項目一覧は 本ガイドの 別添 を参照のこと (3) 報告書等 3 文字情報基盤成果物等は http://mojikiban.ipa.go.jp/ から公開されている - 2 -
平成 22 年度調査事業の成果報告書文字情報基盤事業の在り方に係る検討結果等 平成 24 年度文字情報基盤導入実証実験成果報告書自治体現場への導入実験の結果報告書 実験に用いたデータ ( コード変換表等 ) 等を公開 ) 関連委員会の議事概要を公開 2.2. IPAmj 明朝フォントの符号化方式 IPAmj 明朝では戸籍統一文字 住基統一文字を包含する全約 6 万文字を図 2 のように国際符号化文字集合 ISO/IEC10646 4 Universal Coded Character Set ( 以下 UCS と呼ぶ ) に準拠して符号化している IPAmj 明朝フォント Ver.002.02 戸籍統一 ( 漢字のみ ) (55,270 文字 ) 住基統一 ( 漢字のみ ) (19,563 文字 ) マイクロソフト Office 2013 Apple iwork (Pages 5.0, Numbers 3.0, Keynote 6.0) 一太郎 2014 徹 ( てつ ) (2014 年 2 月発売予定 ) 等が IVS 技術に対応 非漢字 (2,014 図形 /1,684 文字 ) 縦書用文字 リガチャを含む 文字情報基盤漢字 (58,814 文字 ) ISO/IEC に全文字受理済 (2012 年 11 月 ) 符号化作業進行中 ISO/IEC 10646 UCS (Universal Character Set) 1,684 文字 24,210 文字 BMP ( 全 65,536 文字 ) ほぼ全ての情報機器で利用可能 6,092 文字 26,237 文字 2,275 文字 CJK 統合漢字拡張 B,C,D ( 全 47,000 文字 ) IVS 現在は符号化対象外 市販の最新の情報機器の多くで利用可能 一部の OS アプリケーションで対応が始まっている 図 2 文字情報基盤の符号化状況 図に示すように 全約 6 万文字は BMP 5 と呼ばれる領域へ符号化された文字 : 約 26,000 文字 拡張領域 6 と呼ばれる領域へ符号化された文字 : 約 26,000 文字 IVS 7 と呼ばれる方式で符号化された文字 : 約 2,000 文字 ( 2014 年中に約 6,000 文字 ) 4 ISO/IEC 10646 Universal Coded Character Set(UCS):2014 4th edition 対応する国内規格は JIS X 0221:2014 ( いずれも 2014 年中に発行予定 ) 5 BMP (Basic Multilingual Plane): 16 ビットで文字を指定できる範囲で 基本面 と呼ばれる すべての情報機器はこれに対応している 6 文字の指定に 32 ビットを要する領域 一部旧式の情報機器は対応していない場合がある この領域への符号化は ISO/IEC において順次進められており 拡張 E が 2014 年度に出版予定 拡張 F の標準化作業が進行中である - 3 -
符号化が未了の文字 : 約 6,000 文字 ( 2014 年中に約 1,900 文字 ) の各領域へ符号化されている これら領域毎に ソフトウェア ( アプリケーションソフトや OS ミドルウエア等) の対応状況が異なる 特に IVS は 最新の標準に基づくものであり 2014 年 2 月時点で PC 用の市販ワープロソフト等はほぼ対応が完了しているが 基幹業務系ソフト等の対応はまだ開始されたばかりである 2.3. 国際標準化状況文字情報基盤で整備された約 6 万文字は UCS に従って符号化を行っているが 図 3 に示すように 2014 年末において約 1,900 文字が国際標準化機構 (ISO/IEC JTC1) における符号化作業中のものとなる これらについては符号化作業完了まで2~3 年を要するものとみられる ( 遅くとも 2020 年までには完了の見込みである ) 全約 5 万文字のうち 符号化実装が未了の文字 6,800 6,100 2,400 1,900 2013 年度 2014 年度 約 3700 文字 約 1900 文字 2015 年度以降 約 500 文字 現在 IVD 登録作業中の IVS 実装 ISO/IEC 10646:2014( 予定 ) を受けた UCS 実装 符号化完了! 2012 年 10 月 ISO/IEC JTC1/SC2/WG2/IRG へ提案し 受理済み 2013.11 月 IPAmj 明朝フォント v.002.02 公開 2013.12 月 Unicode consortium が登録を受理し パブコメ中 (~2014.3 月 ) 図 3 文字情報基盤の符号化作業状況 3. 文字情報基盤導入にあたっての基本方針文字情報基盤を情報システムへ導入するにあたっては 以下の点に配慮する必要がある 1) 国際標準と矛盾しない技術を用いること 2) 既存システムとの共存性 導入コストの低さなど 経済合理性を考慮すること 3) 技術の進展 標準化の進展に沿った適切な手順を踏むこと 上記 1) は 国際標準と矛盾しない技術を用いることにより 市場に在る一般的情報機器の活用が可能となること 機器間 組織間での文字情報の交換に係る変換等のコストが不要となること 等から 電子行政システムの構築 運用に係るコストダウンにつながることが期待さ 7 IVS(Ideographic Variation Sequence / Selector ) : 字形選択子 と呼ばれるもので 字形が類似しており 符号的には区別されない文字について その字形を指定するための符号 - 4 -
れる 国際標準として参照すべき事項については 8 章を参照のこと 上記 2) については 行政機関においては人名漢字等を処理するための様々なバージョンの情報機器が稼働しており これらを一度に置き換えることなく それらと新規システムとの共存を図る方策をとることにより 移行に係るコストの低減を図ることが必要である 上記 3) については 文字情報基盤の国際標準化が現在進行中であること また 情報機器の対応についても過渡的状況にあることから これらの進展の各段階での機器間での相互運用性 共存可能性を十分配慮した導入計画を立てることが求められる また 最終的には 行政で用いられる各種情報システム間での文字情報の交換を UCS に基づく一貫した様式で行うシステムへ移行するべきであることを視野に入れる必要がある 4. 利用する文字の範囲について実際に業務で使用する文字の範囲等については 当該業務に係る法令等に従うことが必要であるが 一般的には 業務効率や相互運用性を考慮し 業務内容に応じた適切な大きさの文字範囲を使用するよう検討することが必要である 表 1 に 適用場面ごとに想定される文字 / 文字図形の範囲と符号化方式の例を示す ( 要検討 ) 文字の絞込みの定義に係る国際標準については 8.3 節 文字集合の絞込みに係る定義 を参照のこと 表 1 適用業務と文字の範囲 ( 参考 ) 文字情報基盤 文字情報基盤 で整備されたで整備された文字図形 ( 字文字図形 ( UCS JIS X 0213 JIS X 0208 常用漢字 体レベル 8 ) レベル 9 ) IVD MJ 文字情報一 JIS X 文字 / 文字図形集 Moji_Joho 覧表に含まれる 8.3 節参照 8.3 節参照 0213:2012 合の定義 collection UCS 符号位置附属書 12 戸籍業務 (*A) 住民記録業務 (*A) 法人関連業務 (*A) 生徒名簿等 ( 字形に正確さが求められ (*A) る場合 ) 生徒名簿等 ( 日常業務 ) 組織内に閉じた業務8 UCS に加え IVS 等を指定し 細かな文字図形を区別する利用法 9 UCS のみを指定し IVS を指定しない利用法 この場合 フォントの当該 UCS 符号に対するディフォルト図形として実装された文字図形が表示される - 5 -
(*B) 外部への通知等情報公開等 (*C) (*C) 外部からの申請等一般的な書類作成災害等緊急時対応システム (*B) (*B) 一般向け広報文書正確な人名表記を要する通知文等 (*C) (*C) 一般的な申請等正確な人名表記を要する申請等 (*D) (*D) (*B) (*B) (*A) 必要に応じ 文字情報基盤で整備された文字図形以外の文字図形を 外字 等として利用することが有り得るが できる限り文字情報基盤の文字範囲に収まるよう 調整することが望ましい (*B) 市場にある一般的情報機器の対応状況に応じ 変化する (*C) JIS X 0213 範囲以外の文字については 図形イメージによる表示 伝送を検討する (*D) JIS X 0213 範囲以外の文字については 表示を図形イメージによるものとするほか Web 上に漢字入力を支援するサービスを設けることを検討する 5. システム間接続の運用の基本方針 5.1. 文字図形の厳密な一致性が不要な場合一般事務向けのシステム等では 文字図形について厳密な一致性は求められず JIS X 0213 や UCS で採用されている包摂あるいは統合の考え方 ( 文字図形の差がわずかである文字については同一の符号を与えるという考え方 ) に従い 文字情報を交換することが適当である この場合は 2つのシステムに異なるデザインのフォントが実装されている場合にも UCS の符号のみを交換すれば十分である ただし 同じ UCS を使用しているシステムでも 一方が JIS X 0208 相当の文字集合のみをサポートしており 他方が JIS X 0213 相当の文字集合を使用しているといった場合等 使用する文字図形集合の大きさに差がある場合においては 大きな集合から小さな集合への (N 対 1 の ) 対応関係をまとめた 縮退マップ の採用 (5.3 あるいは 文字を図形イメージ情報として伝送する (8.4 参照 ) 等の必要が生じる 5.2. 人名等文字図形の厳密な一致性が求められる場合人名を扱う行政事務等では 使用する文字図形に対し 戸籍に記載された文字図形との間 - 6 -
あるいは過去に使用した文字図形との間等での高度な図形的一致性が求められる場合がある この場合 異なるシステム間での文字情報交換について 以下のような手法が考えられる (1) 文字情報基盤文字情報一覧表を媒介とした対応付け文字情報基盤で整備された文字図形は 戸籍統一文字及び住基統一文字の文字図形との間で 1 対 1 の対応関係を持つよう作られている 人名に用いられる漢字を処理するための既存の情報システムは 人名が戸籍由来であることから 戸籍統一文字 住基統一文字に同定可能な字形を持つ独自フォントを採用していることが多い その結果 これらシステムで用いられている多くの文字図形は 文字情報基盤が整備した文字図形に同定可能である そのため 固有の文字体系を持つシステムの持つ文字図形を 一旦文字情報基盤の文字図形に同定し その対応関係を明らかにしておけば これを媒介にして 他のシステムで用いられている文字図形と 容易に対応することが可能となる このような対応法を用いることにより N 種類の文字体系について それらと文字情報基盤の文字図形との対応関係を記述した N 通りのマップを作るだけで N N のシステム間を接続することが可能となり 対応付けの効率が飛躍的に高められる また ある文字体系と文字情報基盤との対応関係のマップは 当該文字体系の提供者がその責任において作成することができ そのマップと他の体系について他の体系の提供者が作ったマップを組み合わせて使用することで 最終的な文字対応をとることができることから 文字の対応マップ作成に係る責任分界が明確となる 結果 責任分界の面でも 文字情報交換に係るシステム構築の容易性が拡大する このような対応付け方法の有効性は IPA の実施した実証実験においても確認されている 10 将来的には文字情報基盤の文字図形は 全て UCS および IVS によって参照できるようになる予定であるが 現在は ISO/IEC JTC1 での規格化手続きの進行中であり 2014 年度末においても約 1,900 文字については国際標準化された符号による指定はできない そのため 変換マップ等において文字情報基盤で整備された文字図形を識別するためには 将来的には UCS+IVS を用いることが推奨されるが 当面は MJ 文字図形名 を用いることが必要となる 相互に合意した組織の間では これらの文字を UCS で規定された 私用面 へ割り当てた いわゆる 外字 のコードを交換することも有り得る ただし その場合においては 合意した組織 外へ 当該外字コードが流出しないよう 十分な配慮を行う必要がある また 外字を使用した文書を保存する際には 外字コードが不変なものでないことを十分配慮する必要がある (2) その他の方法 ( 図形イメージ情報の交換 ) 文字情報基盤の文字へ同定できない文字図形については 字形そのものを図形 ( イメージ ) 情報として交換する必要がある その技術的方法は 8.4 に示した 各交換方式の特徴を表 2 に示す 対象業務における文字図形の厳密性への要求 アプリケーションの対応状況等に応じ 適切 10 文字情報基盤を自治体等のシステムで活用する実証実験の結果については http://mojikiban.ipa.go.jp/category/03/03002 に掲載されている - 7 -
な方式の採用を検討することが求められる 表 2 交換手段の特徴 交換方式 相互運用性 対応ソフトの豊富対応ソフト伝えられる文字さ ( 一般アプリケの豊富さ ( 基図形の厳密さーション ) 幹システム ) UCS(BMP) UCS(BMP+ 拡張領域 ) UCS+IVS (*B) 文字図形情報の交換 (MJ 文字図形名の活用 ) ( ブラウザ等 ) (*B) 文字図形情報の交換 ( 独自文字図形の利用 ) (*A) (*A) ( ブラウザ等 ) (*B) 外字の利用 (UCS 私用面の利用 ) / (*C) / (*C) (*A) 文字の図形的形状を伝えることができるが その文字を特定するための情報を伝えること はできず 検索や意味の解釈に支障をきたす場合がある (*B) システム内では外字へ変換するなどの作りこみは可能 (*C) 当該外字の利用について相互に合意した組織においては厳密な文字図形情報を伝達できる が 当該外字コードを当該組織外に流出させた場合においては 文字化け等の障害を起こ す また 外字コードを含んだ文書を保存するにあたっては 外字コードが不変なもので ないことを十分配慮する必要がある 5.3. 縮退変換の活用 2 つのシステムの扱える文字集合の大きさが異なる場合 大きな文字集合を小さな文字集合にマップさせる 縮退変換 を行うという考え方がある 例えば 災害時の対応等 被災者支援等のために 文字図形の厳密な識別よりも 市販の情報機器等を活用する即応性 利便性 検索性などが優先される場合がある 市販情報機器では行政機関等が用いている人名漢字を扱えない場合も多く 変換に大きな手間を要したり 文字化け等が起きることが東日本大震災の経験でも多く指摘された このような場合に備え 人名などを扱うために用意された大きな文字セットを JIS X 0208 等の最小限の文字セットへ縮退変換するためのテーブルをあらかじめ用意することが求められる また 災害対策といった特殊な場合でなくとも 通常業務においても 業務効率やシステム構築コストの関係から 文字図形の数を抑制することは重要である 文字情報基盤が整備した文字図形と 1 対 1 に同定できない文字のうち 通常業務で多く用いられている文字等については 8.4 のような図形情報による交換だけでなく 文字情報基盤が整備した文字への縮退変換マップの整備等も検討する (7.1 参照 ) 11 UCS の私用面 (15 面 16 面 : 0F0000-10FFFF) には 相互に合意した組織の間で 外字 を登録し 私的に ( 外部へ流出させずに ) 使用することが認められている - 8 -
なお 一旦 小さな文字図形集合に縮退された情報を大きな文字図形集合に再変換した場合 大きな文字図形集合における識別粒度が保証されないことに留意する必要がある 6. 導入の手順最終的には 文字情報基盤が整備した文字図形の全てが UCS および IVS により扱えることを目指している また 究極的には 文字情報基盤が整備した文字図形を使う全てのシステムが IVS に対応することが望まれる しかし これらは 標準化およびソフトウェアの対応状況の進展に応じ 段階的に進めてゆく必要がある 当然 その過程のどの段階においても 既存システムと新規システムとの間の相互運用性は維持しなくてはならない また 将来的には文字情報基盤が整備した文字図形以外の文字図形を全く使用しないことにするという選択肢も有り得るが 本ガイドでは そのような選択肢は想定せず こういった文字については 図形 ( イメージ ) 情報として 8.4 に示したような方式に則って交換可能とすることを目標とする システム構築は 同一組織内に閉じたシステム間における情報交換と 組織を超えた情報交換とに分けて考える必要がある 組織を超えた 情報交換においては 例えば 外字 フォントを共有する (8.5 参照 ) といったことを想定しない方法を検討する必要がある これらを一覧にまとめると表 3 の様になる 表 3 各組織 各段階における導入の方針 短期 中 長期 組織内部 ( 内部実装 ) 特に内部実装を変更する必要は無い IVS を含む UCS が使用可能なシステムの導入を図る 行政組織間 自治体間 ( 文字情報の交換 ) 図 4 に示す 交換表現 により 状況と必要に応じ UCS IVS 図形情報等を交換する システムには 交換表現 に対応した変換システムを装 文字情報一覧表に記載された文字図形は すべて IVS を含む UCS 表現を用い その他の図形文字は図形 ( イメージ ) 情報として交換する 備し 交換された情報を内部表現へ変換する 特に相互に合意のとれた組織間では 私用面に割り当てたコードの交換も検討する 組織外 ( 開放系への情報発信 ) 使用する部分文字レパートリ (8.3 参照 ) を明記する 符号化方式 (Shift-JIS など ) を明記する 符号化範囲外にある文字図形 使用する部分文字レパートリ (8.3 参照 ) を明記する IVS を含む UCS の符号化方式を用いる IVS が使用できない環境へ向 - 9 -
組織外 ( 開放系からの入力 ) は図形 ( イメージ ) 情報として発信する 文字図形を厳密に識別する必要のない外部組織等への情報公開 災害対応等のために縮退変換マップを活用する 縮退のためのマッピングテーブルは原則公開する 使用可能な部文字レパートリ (8.3 参照 ) を制御する 別途 手動による入力手段 (GUI による選択入力等 ) を提供する けた発信のため 必要に応じて図形 ( イメージ ) 情報の伝送を併用する 文字図形を厳密に識別する必要のない外部組織等への情報公開 災害対応等のために縮退変換マップを活用する 縮退のためのマッピングテーブルは原則公開する MJ 文字図形のすべての図形文字を識別入力可能とする 別途 手動による入力手段 (GUI による選択入力等 ) を提供する システム A 交換表現 システム B 符号化文字 UCS+IVS 文字情報基盤がカバーする範囲 符号化文字 UCS+IVS に変換 <8FBB, E0102> UCS+IVS に変換 <8FBB, E0103> 私用領域 ( 外字 ) MJ 文字図形名に変換 MJ 文字図形名 該当システムの私用領域に対応付け 私用領域 ( 外字 ) 文字図形情報として交換 図形情報 該当システムの私用領域に対応付け 符号化文字の集合としては JIS X 0208, JIS X 0213, UCS などが想定される 規格により例示字形が異なる場合があることに留意する 既存システムの私用領域 ( 外字 ) にある文字には UCS IVS MJ 文字図形に対応するものもあることに留意する 複数のシステム間で文字情報基盤のカバーする文字の文字情報を交換する際には 対応する UCS 符号 +IVS 又は MJ 文字図形名を用いる それ以外の文字については 送信側 受信側で合意した方式により図形 ( イメージ ) 情報を伝送する UCS から該当システムの符号化文字に変換する際 縮退対応 ( 複数の UCS を単一の該当システム符号位置に対応 ) させ 再度該当システムから UCS への対応付けを行うと 双方向での情報の保全は保証されてないことに留意する 図 4 文字情報交換のイメージ 7. 今後整備するべき事項 7.1. 行政システムの構築等で参照するための一覧表等 - 10 -
文字情報の円滑な交換を支援するため 文字情報基盤として 以下のような情報を検討し 整備 公開するものとする (1) 文字情報基盤文字情報一覧表に含まれる UCS 符号位置を列挙した一覧表 (2) 文字情報基盤が整備した文字図形のうち 対応する UCS 符号位置を持たないものすべての MJ 文字図形名の一覧表 (3) 交換表現 ( 図 4 参照 ) のリファレンスとなるスキーマ類 (4) 文字情報基盤が整備した文字図形を 以下のように分類して掲載した一覧表および それらの文字図形を直接参照するための URI A) UCS に対応するデフォルトグリフ 12 MJ 文字図形の通常のオープンタイプフォント実装において IVS を用いなくても該当文字図形が表示される範囲の文字図形 B) UCS に対応するデフォルトグリフ以外の文字図形 MJ 文字図形で対応する UCS が存在するもののうち IVS を用いなければ該当文字図形が表示できない文字図形 C) 対応する UCS 符号位置を持たない MJ 文字図形 MJ 文字図形一覧表において 現在 対応する UCS 符号位置を持たない文字図形 (ISO における標準化作業過程にあるもの 拡張 F として規定されることが想定される) これらの一覧表を参照することにより IVS に対応しないシステムでの内部表現のために IVS 文字を外字として作成し 使用する場合 符号位置を持たない文字図形をシステム内で外字として使用する際等の参考とすることができる (5) 変体仮名文字の文字図形 (6) 行政で多く用いられるにもかかわらず 文字情報基盤で整備した対象となっていない文字図形について 文字情報基盤で整備された文字図形に縮退変換するための変換テーブル (7) 文字情報基盤で整備された文字を JIS X 0213 範囲の文字へ縮退対応させるための対応表 (8) 災害対応等を想定し 文字情報基盤で整備された文字を JIS X 0208 範囲の文字へ縮退対応させるための対応表 7.2. 国際標準化活動現在 Unicode Consortium が管理する IVD に登録されている Moji_Joho Collection を拡充し 文字情報基盤が整備したすべての文字図形に対して IVS が一意に定まるよう拡張登録を行う作業を進めている また 残された 1,900 文字については その符号化提案が国際標準化団体に受理され 符号化作業が進行中である さらに 以下のような標準化を計画している (1) ISO/IEC JTC1/SC2/WG2 に対し 文字情報基盤で整備された全ての文字図形に対応する UCS の符号位置を UCS の部分レパートリとして追加提案する (2) 公用文への適用が義務づけられている常用漢字表に含まれる漢字及び 日本語のローマ字 12 デフォルトグリフは IVS を明に指定しない場合に表示される文字図形である http://mojikiban.ipa.go.jp/1292.html 参照 - 11 -
表記に必要となる文字 ( 長音記号付きのローマ字等 ) についても 併せて部分レパートリとしての提案を行う (3) JIS X 0221 の附属書 JA において Moji_Joho collection を参照することの提案を対応する国内委員会に行う (4) 変体仮名文字の符号化につき ISO/IEC JTC1 WG2 へ提案する UCS の CJK 統合漢字拡張 F の規格化及び IVD Moji_Joho collection の拡張登録が終了すれば 文字情報基盤文字情報一覧表に記載されている文字図形のすべてを IVS で記述することが可能となり 文字図形集合として Moji_Joho Collection を指定するだけで 文字図形集合を特定することが可能となり 当該文字図形セットに対応する民間のフォントの活用等を含め 情報システムの利便性が いちじるしく向上することが期待される 7.3. 最終目標に至るまでのロードマップ 国際標準化活動 文字情報基盤事 業 2012 年 IRG で拡張 F 審議開始 ( 済 ) 2013 年 文字情報一覧表 003.01 公開 IPAmj 明朝 002.02 公開 2014 年 IVD Moji_Joho 文字情報一覧表 collection( 第 1 次 ) バージョンアッ 公開 プ MJ 文字図形相当の部 IPAmj 明朝バー 分文字レパートリの ジョンアップ UCS Annex A への追 加を ISO/IEC JTC1 に 提案 IVD Moji_Joho collection の拡張登録 ( 第 2 次 ) 2018 年 拡張 F の標準化完了 文字情報一覧表 IVD Moji_Joho バージョンアッ collection 追加登録 プ ( 第 3 次 ) IPAmj 明朝バー JIS X 0221 改正 ジョンアップ (Annex JA の増補改 文字情報基盤事 正 ) 業の成果物と国 既存システムとの文字情報交換 UCS+ 図形 ( イメージ ) 情報 UCS+ 図形 ( イメージ ) 情報 IVS を含む UCS + 図形 ( イメージ ) 情報 IVS を含む UCS IVS を含む UCS + 図形 ( イメージ ) 情報 新規システム内部実装 UCS(UTF-16) UCS 実装文字以外の私用領域へのマッピング UCS(UTF-16) UCS 実装文字以外の私用領域へのマッピング UCS(UTF-16) UCS 実装文字以外の私用領域へのマッピング UCS+IVS の実装の推奨 UCS+IVS の実装促進 - 12 -
際標準の整合性の達成 2020 年 IVS を含む UCS + 図形 ( イメージ ) 情報 UCS+IVS の必須化 8. ( 参考 ) 文字情報の交換に係る標準規格等 13 8.1. 符号化文字集合と文字図形集合 図 5 に示すように UCS では細かな字形の差異を区別しないことを原則としており その結果 行政の業務上で区別されるべき複数の文字図形に対して同一の符号 ( 文字コード ) が与えられる場合がある UCS では同一符号を与えられた複数の文字図形から一つを指定する手段として 字形選択子 (Variation Selector :VS) という特別な符号列を定義しており 14 この VS を 文字符号 に付記することにより 同一の文字符号を持つ文字図形から一つの文字図形を選択して指定することができる この符号と字形選択子 (VS) の列を Ideographic Variation Sequence(IVS) と呼ぶ IVS によって指定することのできる文字図形は Unicode Consortium に登録するむねが UCS で規定されている Unicode Consortium ではこの文字図形を IVD(Ideographic Variation Database) 15 として管理している 文字情報基盤で用いている IVS は 現在 この IVD の中の Hanyo-Denshi collection という集合を用いているが 情報規格調査会は現在 文字情報基盤が整備した文字図形のうち未だ IVD に登録されていない文字図形を含めた文字図形全体を 改めて Moji_Joho collection として 新規登録する手続きを進めており ( 図 3 参照 ) 2014 年中にはその手続きが完了する見込みである その結果 文字情報基盤で整備された文字図形のうち 約 1,900 文字図形を除くすべての文字図形が 国際標準に従って指定できるようになる 16 2014 年度以降に出荷される一般 PC 向けの OS, Web ブラウザ ワープロ等のソフトウェアのほとんどが IVS に対応しており 今後 IVS に対応した環境は急速に含むと考えられる 13 本ガイドでは 符号化文字 という用語を UCS で定義されている Character の訳語として 文字図形 という用語を ISO/IEC TR 15285 Information technology An operational model for characters and glyph で定義されている glyph の訳語として用いる なお UCS の翻訳規格である JIS X 0221 では 文字 を Character の訳語として用いていることに留意する必要がある 14 IVS の概略については http://mojikiban.ipa.go.jp/1292.html を参照のこと 15 http://www.unicode.org/ivd/ 16 文字情報基盤が参照する IVD の collection は 2014 年度中に Hanyo-Denshi collection から Moji_Joho collection へ変更されることになるが 多くの IVS 値は新 collection へ継承されており また 旧フォントを前提にして作成された文書ファイル等に対する 新フォントの上位互換性は保たれる - 13 -
UCS 符号は 細かな字体 (glyph, 文字図形 ) の差異は区別せず 複数の字体を一つの符号に統合している UCS 符号 845A 845B VS E0100 E0101 UCS 符号と VS( 字形選択子 ) を並べて記述すること ( この列を IVS と言う ) で 文字図形を指定することができる 図中の VS の値は説明のための仮の値であり 実際の規格とは異なります E0102 8FBA 8FBB E0100 E0101 図 5 IVS( 字形選択子 ) について 8.2. エンコーディング方式 (encoding scheme) 8.1 に述べた規定に従って符号化された文字を 通信時やファイル格納時等に実際にコンピュータが利用できる形式に変換する方式 どのような方式でビット列化するかを定めた規定であり UCS の場合 UTF-8 UTF-16 UTF-32 等が用いられる 8.3. 文字集合の絞込みに係る定義 UCS には ローマ字 漢字 ハングル アラブ系文字 インド系文字 その他多様な文字が規定されている その中で 日本の行政業務で必要とするのは一部であり UCS で規定された文字全体の中の どの様な部分集合を 行政向け情報システムの調達等において指定するかを意識する必要がある 17 UCS では 用途に応じて絞り込まれた文字集合を UCS の部分文字レパートリ と呼び その Annex A の章において多数規定している これらのうち 日本の行政現場の実務に関わるものとしては 以下のようなものがある BASIC JAPANESE( 基本日本文字集合 ) JIS X 0201,ISO/IEC 646 の IRV 及び JIS X 0208 に相当する基本部分集合 JIS2004 IDEOGRAPHICS EXTENSION(JIS2004 拡張漢字集合 ) 17 もし UCS に対応する とのみ仕様書に書いてしまうと 仕様に合致した製品の入手は極めて困難なものとなってしまう - 14 -
JIS X 0213 の第 3 水準及び第 4 水準漢字部分に相当する拡張用の部分集合 JAPANESE NON IDEOGRAPHICS EXTENSION( 拡張非漢字集合 ) JIS X 0213 の非漢字部分 ( ただし,JIS X 0208 にも含まれるものを除く ) に相当する 拡張用の部分集合 COMMON JAPANESE( 通用日本文字集合 ) a) に示した BASIC JAPANESE に, 日本の市販 PC 等で広く用いられている拡張を加えた 部分集合 Shift-JIS を用いるシステムで しばしば用いられる 日本文字部分レパートリのうち,BASIC JAPANESE 及び COMMON JAPANESE は, それ ぞれを単独で又は他の日本文字部分レパートリと組み合わせて用いることが想定されている 他の三つのレパートリは, 単独で用いることは想定されていない JIS X 0213 2004 に規定された文字の集合を UCS における 部分レパートリ の定義の言葉で表現した場合 (1) BASIC JAPANESE,JIS2004 IDEOGRAPHICS EXTENSION 及び JAPANESE NON IDEOGRAPHICS EXTENSION の組合せ と表現することとなる その他 非漢字等の必要性や 市販パソコンにおける拡張文字との互換性への必要等に応じ (2) COMMON JAPANESE 及び JIS2004 IDEOGRAPHICS EXTENSION の組合せ (3) COMMON JAPANESE,JIS2004 IDEOGRAPHICS EXTENSION 及び JAPANESE NON IDEOGRAPHICS EXTENSION の組合せ といった指定が有り得る これ以外の組み合わせは 通常業務での必要性が考えにくく また 市販システム等などとの互換性の観点から推奨されない 文字情報基盤で整備した文字図形全体の集合を指定する際は 上記 3 種類のいずれかの組み合わせ指定に加え IVD における Moji_Joho collection の文字図形集合を参照することとなる Moji_Joho collection については ISO/IEC 10646 の国際一致規格である JIS X 0221 の次期以降の版において参照するようにすることを検討する (7.2 参照 ) ただし 文字情報基盤で整備された全 6 万文字図形のうち 約 1,900 文字については ISO での標準化作業が進行中であることから これらが UCS および IVD で指定できるようになるにはしばらく時間がかかる それまでの間 この範囲の文字図形については 文字情報基盤で整備した文字情報一覧表で示された MJ 文字図形名の集合として指定する必要がある (7.1 参照 ) 8.4. 文字図形イメージの交換 UCS や IVS を持たない文字図形については 情報システム間で それを図形 ( イメージ ) として交換する必要がある 図形 ( イメージ ) を交換するための規格として広く知られているものに - 15 -
SVG 18, PNG 19 がある 文字図形に係るデータを XML 文書等に埋め込む場合 以下のような記法が考えられる 本 記法は JIS X 4166 XML 文書へのグリフ識別子埋め込み の記法を参考にしたものである 20 XML 一般においては <glyph uri= [ 文字図形に係る URI] /> ( ここで glyph は 指定したグリフをこの場所へ表示することを示すタグとして別途定義するもの タグ名を含め 別途 リファレンスとなる定義を規定する (7.1 参照 ) ) 一般の html ブラウザ向けでの記述では <span glyph:uri= [ 文字図形に係る URI] > 代 </span> ( ここで 代 は URI で指定された当該グリフを表示できない環境で代替えとして置き換えられる文字 ( 列 ) glyph は文字図形を指定するための属性として別途リファレンスとなる定義を規定する (7.1 参照 ) ) ここで参照する文字図形が 文字情報基盤で整備された図形であれば [ 文字図形に係る URI] の部分に glyph.mojikiban.ipa.go.jp/<mj 文字図形名 > のように記述することにより 指定可能である 21 MJ 文字図形名 は 文字情報基盤で整備された文字図形を一意に識別するために設けられた MJxxxxxx のような MJ+6 桁の数字から構成される識別名である 文字情報基盤で整備した対象となっていない文字図形を指定する必要がある場合 SVG PNG 等の標準規格で表現した図形を別途独自に用意し そこの URI を指定することで図形を交換することが可能である この場合 当該 URI は長期に渡って内容を維持管理する必要がある また 図形情報をデータファイルの形で別途伝送した上で そのファイル名を指定するといった手段も有る この場合は 文字図形に係る情報は 受け手が管理する必要がある 8.5. 外字の利用 UCS では 特定の範囲 ( 私用面 :Private Use Plane, PUP) の文字符号に 利用者が独自の文字図形を割り振って使うことが認められている このようにして使用する文字を一般に 外字 と呼ぶ 外字 の符号は 利用者が任意に与えるものなので 異なる利用者間で符号のみを交換す 18 SVG: Scalable Vector Graphics. W3Cで標準化された図形表記のフォーマット (http://www.w3.org/standards/techs/svg) 19 PNG: Portable Network Graphics. ISO/IEC 15948:2004 として規定されている 20 JIS X 4166 は 文字図形の参照を ISO/IEC 10036 に基づいて登録されたグリフ名を参照するものとしているが ここでは一般的 URI で参照するものとして記載した 21 同 URI は近く IPA から公開予定である (6.1 参照 ) - 16 -
ると 同一符号が両者で異なる文字図形に対応することとなり いわゆる 文字化け の原因となり 情報交換上の混乱を来す そのため 外字の利用は特定組織の内部あるいは 密接に連携した組織間のみにとどめ それら組織外への送信には用いるべきでない - 17 -
別添 文字情報一覧表の項目 項目内容 MJ 文字図形名 MJ 文字情報一覧表内で一意に定めた文字図形の名称戸籍統一文字番号 6 桁の 10 進数の戸籍統一文字番号を記した 住基ネット統一文字コ J+ に続けて 4 桁の 16 進数の住民基本台帳ネットワークシステムード統一文字コードを記した 入管正字コード平成 23 年法務省告示第 582 号第二項第四号正字に示された 工業標準化法 ( 昭和二十四年法律第百八十五号 ) に基づく日本工業規格 ( 以下 日本工業規格 という )X 〇二二一号 ( 以下 国際符号化文字集合 という ) に規定する漢字 ( 国際符号化文字集合附属書 JA 日本文字部分レパートリに該当するものに限る ) 及び別表第一に定める漢字をいう の 16 進数を記した 入管外字コード平成 23 年法務省告示第 582 号第二項第 7 号に示された 国際符号化文字集合に規定する私用文字として別表第一に定める文字の符号化表現 の 16 進数を記した 漢字施策 常用漢字 は 常用漢字表( 平成 22 年 11 月 30 日内閣告示 ) に示された通用字体 ( 常用漢字表で括弧が添えられていない漢字 ) に示された漢字である 人名用漢字 は 戸籍法施行規則別表第二の 漢字の表一 二 に示された漢字である X0213 X0213 欄には JIS X 0213:2004 の面区点位置を記した X0213 包摂連番包摂連番欄には 該当する文字に JIS X 0213:2004 の包摂規準を適用させると符号化できる場合 包摂規準連番を記した X0213 包摂区分包摂区分欄には 0 2 の 2 種を記した 0 は 該当する文字が JIS X 0213:2004 規格票の例示する字体に相当する字形であることを示す 2 は 該当する文字が JIS X 0213:2004 の包摂規準を適用できる字体に相当する字形であることを示す X0212 X0212 欄には JIS X 0212:1990 の区点位置を記した 対応する UCS 対応する UCS 欄には U+ に続けて ISO/IEC 10646:2012 の 16 進数の UCS コードを記した ただし UCS コード情報の確度や対応状況が異なるため UCS 対応カテゴリー 欄に確度情報を記した 対応する互換漢字互換漢字に該当する MJ 文字図形名には 対応する互換漢字欄に U+ に続けて ISO/IEC 10646:2012 の 16 進数の UCS コードを記した 実装した UCS IPAmj 明朝フォント Ver.002.02 の実装において当該図形に対して割り当てる UCS コードを記した 同一の UCS コードを持つ図形が複数ある場合において フォント実装において対応付ける図形 ( デフォルトグリフ ) は 下記の優先順位により決定した 1. 常用漢字表に掲載されている字形 2. 人名用漢字別表 ( 戸籍法施行規則別表第二漢字の表 ) に掲載されている字形 i
3. 住民基本台帳ネットワークシステム統一文字コードと対応する UCS が一致する字形 4. JIS X 0213:2004 に掲載されている例示字形 5. UCS の J 欄 ( 日本提案の字体 ) に掲載されている例示字形 6. 法務省告示第 582 号別表 1 に掲載されている字形 7. 康煕字典体 市区町村が使用する外字の実態調査 の出現頻度 UCS 対応カテゴリー 対応する UCS 欄の確度のカテゴリー分けを下記 (A1,A2,A3,A4,E,F) のように行った 実装した IVS MJ 文字図形バージョン登記統一文字番号 ( 参考 ) 部首 ( 参考 ) 内画数 ( 参考 ) 総画数 ( 参考 ) 読み ( 参考 ) 大漢和 カテゴリー A 平成 23 年度から平成 25 年度までの文字情報基盤整備事業で確認済みのもの A1) ISO/IEC10646 CJK 統合漢字に J ソースがあるもの (JIS X 0213 JIS X 0212 に例示されている文字を含む ) A2) 住基ネット統一文字で住基ネット統一文字コードが 3400~9FA5 のもの A3) Unicode Consortium の IVD Version 2010-11-14 の Hanyo-Denshi コレクションとして登録されているもの A4) 文字情報基盤整備事業において個別に確認したもの カテゴリー E ISO/IEC 10646:2014( 予定 ) の発行により 対応する UCS コードの確定が見込まれるもの カテゴリー F 現在 ISO に提案中であり 対応する UCS コードが存在しないもの Unicode Consortium の IVD Version 2010-11-14 の Hanyo-Denshi コレクションにより実装した IVS を記した IPAmj 明朝フォント Ver.002.02 および SVG 図形ファイルに収録した文字図形 (MJ 文字図形 ) のバージョンを記した 8 桁の 10 進数の登記統一文字番号を記した 部首欄には部首番号を記した 康煕字典 の部首の通し番号により 1 から 214 までである 内画数欄には部首内画数 ( 部首を除いた残りの部分の画数 ) を記した 総画数欄には文字の総画数を記した 読み欄には文字の読みを記した 原則として 音読みは片仮名 訓読みは平仮名である 大漢和欄には 諸橋轍次 大漢和辞典 ( 修訂第二版第六刷 大修館書店 2001 年 ) 及び鎌田正 米山寅太郎 大漢和辞典補巻 ( 初版 大修館書店 2000 年 ) の親字番号を記した なお 大漢和辞典 及び 大漢和辞典補巻 の親文字と漢字字体に差異があるものの同定が可 ii
日本語漢字辞典汎用電子整理番号 ( 参考 ) 平成明朝 ( 参考 ) 更新履歴 能なものには 親字番号の末尾に # を付けて示した 日本語漢字辞典欄には 新潮社編 新潮日本語漢字辞典 ( 第四刷 新潮社 2008 年 ) の検字番号を記した 汎用電子情報交換環境整備プログラムの漢字情報テーブルにおけるレコードの通し番号を記した 平成明朝体グリフのグリフ名 平成明朝体グリフは汎用電子情報交換環境整備プログラムの文字グリフ作業委員会にて制作されたものである 本一覧表において 過去に変更された情報の履歴を記し 変更のあった事項毎に MJ 文字情報一覧表バージョン番号を行頭に付した iii
文字情報基盤導入テクニカルスタディ ( 案 ) ドラフト (2014 年 2 月 6 日版 ) 1. 本テクニカルスタディの目的本テクニカルスタディは 文字情報基盤で整備された漢字の全てに UCS あるいは IVS の符号が付与されるまでの過渡的期間への対応 及び 同期間終了後のシステム移行等を文字情報基盤導入ガイド ( 以下 導入ガイド と呼ぶ ) の趣旨に沿って円滑に進めるために必要な 具体的な技術情報を共有することを目的とする 2. 過渡的期間の定義導入ガイドに示したとおり 文字情報基盤で整備された漢字のうち 約 1,900 文字については ISO/IEC JTC1 SC2 WG2 1 ( 以下 ISO/IEC と呼ぶ ) による標準化作業 ( 拡張 F 標準化作業 ) の過程にあり その終了には 2 年 ~ 数年を要する 2014 年末から この標準化作業が終了するまでの期間を ISO/IEC 作業期間 と呼ぶこととする ISO/IEC 作業期間 は 遅くとも 2020 年までには終了する ISO/IEC 作業期間 が終了した後は文字情報基盤で整備された漢字の全てが UCS 符号と IVS により活用可能となる 文字情報基盤で整備された漢字のうち約 6,000 文字図形は IVS によって指定することが必要であるが 現状 一部の PC 向けアプリを除き IVS を使えるシステムの普及は十分でない ISO/IEC 作業期間 終了後も 基幹情報システム等においては IVS に未対応の情報機器が相当期間併存することが見込まれる IVS 未対応の情報機器が併存する期間を 非 IVS 機器併存期間 と呼ぶこととする 2014 2015 2016 2017 2018 2019 2020 2021 ISO/I9C 作業期間 非 IVS 機器併存期間 3. 文字情報基盤暫定私用コード ISO/IEC 作業期間 が終了するまでの間 文字情報基盤で整備された漢字のうち 約 1,900 文字図形については UCS 符号が与えられていない また 現状では 一部の PC 向けアプリを除き IVS を使えるシステムの普及は十分でない そこで ISO/IEC 作業期間 において本テクニカルスタディに基づく文字情報基盤の運用に合意した組織 ( 以下 合意組織 と呼ぶ ) 間において 暫定的 かつ私的 ( 相互に合意した者の間でのみ使用 ) な符号体系として UCS の定める私用面 (PUP:Private Use Plane) を活用 1 国際符号化文字集合 (UCS) 規格を策定する組織 1 / 4
した 文字情報基盤暫定私用コード 1 を定義する 併せて 非 IVS 機器併存期間 において IVS に未対応の機器でも文字情報基盤で整備した全ての文字を使用可能とするための体系として 文字情報基盤暫定私用コード2 を定義する( 図 1 参照 ) これらの暫定コードは UCS の規定に則り 合意組織 間のみで私的に共有するものとし その外部に伝送してはならない ISO/IEC 作業期間 が終了した時点では 合意組織 間も含め 組織外部に伝送する文字情報は 原則 UCS+IVS による符号体系によるものとする 組織間情報交換に使用するコードを実際に UCS+IVS へ移行するのは ISO/IEC 作業期間 終了からゆとりを持たせ 2019 年末とする ( この時期については 今後の状況に応じ 合意の上で変更することが有り得る ) 3.1. 文字情報基盤暫定私用コード1 文字情報基盤で整備された漢字のうち ISO/IEC による標準化過程にある約 1,900 文字図形及び IVS で指定することの必要な約 6,000 文字図形 及び変体仮名文字図形を UCS の規定する PUP である第 16 面 (U+100000~U+10FFFF) へ別表のように収容したものを 文字情報基盤暫定私用コード1 とする 3.2. 文字情報基盤暫定私用コード2 文字情報基盤暫定私用コード1 から ISO/IEC 作業期間が完了した結果 符号位置が確定した文字を当該符号位置へ配置したものを 文字情報基盤暫定私用コード2 とする 文字情報基盤暫定私用コード2 の詳細は ISO/IEC 作業期間 が終了した後 速やかに IPA が公開する U+000000 UCS の構造 現状 (2014 年 ) 文字情報基盤暫定私用コード 1 文字情報基盤暫定私用コード 2 最終形 (UCS+IVS) 基本面 U+00FFFF PUA U+020000 拡張 A~E 拡張 F U+0F0000 U+100000 私用面 (PUP) 変体仮名 IVS Moji_Joho collection 符号化未了 図 1 文字情報基盤暫定私用コードの関係 2 / 4
4. 過渡的期間における文字情報交換の原則 4.1. ISO/IEC 作業期間 における情報交換図 2 に示すように ISO/IEC 作業期間 においては 組織間の情報交換については JIS X 0213:2012 を基本とするが 合意組織 間では文字情報基盤暫定私用コード1を使用することができる 組織内部においては 文字情報基盤暫定私用コード1を含み 任意のコード体系を使用することができるが 当該文字を文字情報基盤の整備した文字図形に同定する作業を行っておくことが推奨される 本テクニカルスタディに基づく文字情報基盤の運用について相互に合意した組織 組織 A 組織 B JIS X 0213:2012 による交換を原則とする Web 等での表示の際に 必要に応じ JIS X 0213:2012 範囲外の文字を図形イメージによって表示することは有り得る 組織 X 組織内におけるコード体系は自由 文字情報基盤の整備した文字図形への同定作業を行うことが推奨される ISO/IEC 作業期間 中は 文字情報基盤暫定私用コード1 の運用を可とする JIS X 0213:2012による交換を基本とする ISO/IEC 作業期間 中は 文字情報基盤で整備した範囲の漢字を文字情報基盤暫定私用コード1で交換することを可とする 文字情報基暫定私用コード1の使用は 2019 年末を持って終了し 以後 全ての漢字はUCS+IVSにより交換する 図 2 ISO/IEC 作業期間中における情報交換の原則 4.2. ISO/IEC 作業期間 終了後における情報交換 ISO/IEC 作業期間終了後は 文字情報基盤で整備した全ての漢字を UCS と IVS によって指定可能となる そこで 2019 年末を以て文字情報基盤暫定私用コード1を廃止する 2020 年からは 図 3 に示すように 合意組織 間においても 漢字の情報交換には UCS+IVS を使用するものとする 非 IVS 機器併存期間中においては 組織内部で文字情報基盤暫定私用コード2を使用することができる ただし この時点では多くの市販情報機器 (PC 等 ) が IVS に対応していることが予想されるため 文字情報基盤暫定私用コード2の使用は 極力基幹情報システム等の内部に限るものとし 通常のオフィス機器での使用や 保存文書ファイルの作成については UCS+IVS を使用することが強く推奨される 3 / 4
組織内の情報システムにおいて 文字情報基盤暫定私用コード1を使用していた場合 ISO/IEC 作業期間 終了後 速やかに 保存された文書等を含め 文字コードを UCS+IVS 又は文字情報基盤暫定私用コード2( ファイルの保存等への利用は推奨されない ) へ変換することが求められる 文字情報基盤暫定私用コード2に対応した文字フォントは IVS を使用する環境との間での文字表示上の互換性を配慮した実装とする 非 IVS 機器併存期間が終了した際は 文字情報基盤暫定私用コード2を廃止する この時点で文字情報基盤暫定私用コード2を使用して作成された文書ファイル等は UCS+IVS へコード変換することが求められる 本テクニカルスタディに基づく文字情報基盤の運用について相互に合意した組織 組織 A 組織 B JIS X 0213:2012 による交換を原則とする Web 等での表示の際に 必要に応じ JIS X 0213:2012 範囲外の文字を図形イメージによって表示することは有り得る 組織 X 組織内におけるコード体系は自由 非 IVS 機器併存期間 においては 文字情報基盤暫定私用コード 2 の運用を可とする ただし 組織内においても 文書ファイルの保存等は UCS+IVS を用いることが推奨される JIS X 0213:2012による交換を基本とする 文字情報基盤で整備した範囲の漢字を UCS+IVSによって情報交換することを可とする ( 文字情報基盤暫定私用コード2は原則使用しない ) 図 3 ISO/IEC 作業期間終了後における情報交換の原則 5. 推奨される準備作業行政機関等が外部へ情報を提供する際に使用する文字コードとしては JIS X 0213:2012 とすることが原則とされており これに対応するためには 行政機関等が現行システムで使用している文字を JIS X 0213:2012 の文字セットへ縮退対応させる必要が生じる また 行政機関などで交換可能な文字セットが拡大された際への対応も必要である このための準備としては 現行システムで使用している文字を 文字情報基盤の文字へ同定し MJ 文字図形名 と対応付けを行っておくことが推奨される 文字情報基盤で整備された漢字のうち JIS X 0213:2012 文字セット範囲内の文字においては MJ 文字図形名と JIS X 0213:2012 の面区点位置との1 対 1 対応表が既に IPA から提供されている また 文字情報基盤で整備した全ての文字を JIS X 0213 の文字セットへ縮退対応させる対応表については 2014 年度中に整備する ( 運用ガイド 7.1 章参照 ) なお 自治体の作成した外字と文字情報基盤の整備した文字図形との対応付けには 総務省自治体クラウドの調査事業の成果物 ( 各自治体へ配布済 ) を活用することができる 4 / 4