2011 年 11 月 11 日 IPA 文字情報基盤 Web 実証実験事業 ( 案 ) 1. 目的文字情報基盤推進事業で整備した約 6 万字の漢字 ( 文字情報基盤漢字 : 図 1 参照 ) を 広く一般国民に閲覧してもらえるよう Web 上に公開し 氏名 住所等の多様な漢字をパソコンから入力 出力 ( ディスプレイ プリンタ ) できる環境を準備する 本実験は 文字情報基盤のメリットを体験できるデモンストレーションという広報的側面と Web ブラウザへ伝送し 表示するための技術的手段の検討 実証 そして課題を洗い出して収集することを目的とする 戸籍統一 ( 漢字のみ ) (55,267 文字 ) 登記固有文字 (10,330) 住基統一 ( 漢字のみ ) (19,432 文字 ) 非漢字 (2,002 図形 /1,672 文字 ) 縦書用文字 リガチャを含む 1,672 文字 23,497 文字 文字情報基盤漢字 (58,712 文字 ) 7,160 文字 25,781 文字 2,274 文字 今回は符号化対象外 ISO/IEC 10646 BMP ( 全 65,536 文字 ) ほぼ全ての情報機器で利用可能 CJK 統合漢字拡張 B,C,D ( 全 47,000 文字 ) IVD 市販の最新の情報機器の多くで利用可能 一部の OS で対応が始まっているが アプリケーションでの対応は未達 図 1 文字情報基盤漢字 2. 実験シナリオ対象が一般国民であるため 以下のことを前提とした実験環境を構築する (1) 内容氏名 住所等の多様な漢字の入力が必要となる Web を用いた電子申請をイメージして 文字情報基盤漢字の実験サイトとする 本事業の目的および 4 章で述べる実験項目を満たす具体的なストーリー 構築環境 利用方法を検討して提案すること Web ページ構造としては 文字情報基盤推進事業の広報と本実験の趣旨 内容を告知するトップページの下 各実験項目を満たす実験ページを展開する 1
(2) 操作性 わかりやすいユーザーインターフェース 難しい操作は避ける (3) 相互運用性と国際整合性本実験は相互運用性と国際整合性を担保していることを条件とする 特定の OS 特定の Web ブラウザに依存しない方式を検討する ただし UTF-8 が動作する環境を本実験の対象とする ISO/IEC10646 CJK 統合漢字の規格に準拠することが方針である 本実験では IPAmj 明朝フォントの UCS 実装を変更しない 本実験では IPAmj 明朝フォント UCS 実装外文字 ( 文字図形 ) に対して PUA 等の外字領域への UCS 実装は行わない 入力 表示された文字列は 相互運用性と国際整合性を維持した上での再利用性に配慮する (4) 用語文字情報基盤 Web 実証実験事業で使用する主要な用語の定義は以下の通りとするものとする No 用語定義補足 01 IVD Unicode Ideographic Variation Database:IVS 方式による異体字識別番号を登録したデータベース Unicode Consortium への登録制となっている 本事業が対象とする具体的な字形については http://unicode.org/ivd/pri/pri167/index.html 参照 02 IVS Variation selectors and variation sequences: 文字が 形状の異なる複数の異体字を持つ場合 通常のコードスペースで符号化する文字符号は原則 1つとし 個別の異体字表記については 文字コードではなく 異体字識別番号によって識別しようという考え方である IPAmj 明朝フォントへの実装において IVS を割り当てた文字を IVS 実装漢字と呼ぶ 03 MJ 文字情文字情報基盤推進事業で整備した文字情報の一覧表であ報一覧表る 成果物の漢字に付けられた固有名 (MJ 文字図形名 ) と住基ネット統一文字コード 戸籍統一文字番号等 国際符号化文字集合 JIS コード等との対応関係及び 各種属性情 2
報 主要な漢字字典を典拠とする参考情報などが一覧表として記載している IPAmj 明朝ダウンロードサイト MJ 文字情報一覧表 検索システム ( 試行版 ) を参照 04 IPAmj 明朝フォント http://ossipedia.ipa.go.jp/ipamjfont/ 文字情報基盤推進事業で整備した TrueType ベースの OpenType フォーマットによるフォントである IPAmj 明朝ダウンロードサイト MJ 文字情報一覧表 検索システム ( 試行版 ) を参照 http://ossipedia.ipa.go.jp/ipamjfont/ 05 IPAmj 明朝 IPAmj 明朝フォントへの実装において ISO/IEC10646 CJK 統フォント合漢字 (UCS) の符号位置を割り当てた漢字を IPAmj 明朝フ UCS 実装漢ォント UCS 実装漢字と呼ぶ 字 06 IPAmj 明朝 IPAmj 明朝フォントへの実装において UCS の符号位置を持っフォントていないグリフであり 文字図形として扱う UCS 実装外漢字 07 文字図形本実証事業では IPAmj 明朝フォント UCS 実装外文字は 1 文字 1ファイルの文字図形データの状態で 表示にはインライン画像として扱う 3. 事業の概要 3.1. 実験環境の構築 OSS オープン ラボが提供する仮想マシン上に 4 章で述べる実験項目を確認可能な環境を構築すること OSS オープン ラボおよび実験に用いる IPAmj 明朝フォント MJ 文字情報一覧表については以下を参照のこと OSS オープン ラボ https://www.openlab.ipa.go.jp/modules/information/index.php OSS オープン ラボ利用者マニュアル https://www.openlab.ipa.go.jp/modules/information/usersmanual.pdf IPAmj 明朝ダウンロードサイト MJ 文字情報一覧表 検索システム ( 試行版 ) http://ossipedia.ipa.go.jp/ipamjfont/ 3
3.2. 実験の実施及び報告書の作成 次章で述べる実験項目に沿った確認作業を実施して結果をまとめる 4. 実験項目 4.1. 文字入力 (1) 実験概要文字情報基盤漢字 6 万字 (IPAmj 明朝フォントへの UCS 実装外漢字を含む ) を Web ブラウザ上で入力できる環境の確認 IPAmj 明朝フォント UCS 実装外漢字 ( 文字図形 ) や IVS 実装漢字を含む所望の文字情報基盤漢字 6 万字が入力できる具体的な Web ベースでのソリューションの確立 所望の漢字に到達できる入力手法の確認 公開中の MJ 文字情報一覧表およびその検索システムも踏まえ Web ブラウザ上での入力の役割を整理する (2) 実験項目 (a) JIS X0213 範囲の文字入力大多数の使用者にストレスのない入力方法として クライアント端末で使用している OS 付属の IME 等を使って IPAmj 明朝フォントの文字入力を行えることを前提とする (b) CJK 統合漢字拡張 B,C,D 領域のIPAmj 明朝フォントUCS 実装漢字およびIVS 対応ブラウザに対するIVS 実装漢字の文字入力 クライアント端末の IME で入力できない (IPAmj 明朝フォントに UCS 実装されている ) 漢字に対する Web ベースでの入力方法を構築 当該入力方法においては JIS X0213 範囲における単体での漢字入力も包含する 上記入力方法により ユーザーが所望する漢字を 1つまたは複数の入力候補漢字から選択可能な状態で提示し ユーザーは簡単な操作で入力確定する 入力候補漢字を表示する際には 各候補漢字のメタ情報である MJ 文字情報一覧表の文字情報をあわせて提示する (c) IPAmj 明朝フォントUCS 実装外文字 ( 文字図形 ) および IVS 未対応ブラウザに対するIVS 実装漢字の文字入力 画像として扱うが 上記 (b) とシームレスな Web ベースでの入力方法を確立する 4.2. 文字出力 (1) 実験概要一般国民が IPAmj 明朝フォントを普段使用しているパソコンにインストールできない ( インストールしない ) 前提で 実験サイトへアクセスしてくることを想定し IPAmj 明朝フォントが PC クライアント端末にない場合でも文字情報基盤漢字の全グリフが表示 プリントできる環境構築について実験を行う 4
(2) 実験項目 (a) WebFont 方式による表示確認 W3C(World Wide Web Consortium) の CSS3(Cascading Style Sheets3) 規格に定義されている WebFont 方式による表示確認 ( 上記 (4.1) 実験項目との組み合わせ実験 ) IPAmj 明朝フォントの IVS 実装漢字表示の可否 縦組み表示の可否 反応時間等をテスト項目とする 複数の Web フォント方式を用いて 各テスト項目におけるメリット / デメリットを整理 IPAmj 明朝フォント UCS 実装外文字 ( 文字図形 ) のインライン画像表示 適切な文字図形のインライン画像表示のためのフォーマットを確認する CJK 統合漢字拡張 B,C,D 領域 および IVS に未対応な Web ブラウザについては 未対応部分を上記 UCS 実装外文字と同様に文字図形として扱い インライン画像表示を行うこと ( 図 2 参照 ) クライアント端末の Web ブラウザに合わせてユーザーに負荷なく 適切な画面に遷移すること 戸籍統一 ( 漢字のみ ) (55,267 文字 ) 登記固有文字 (10,330) 住基統一 ( 漢字のみ ) (19,432 文字 ) 非漢字 (2,002 図形 /1,672 文字 ) 縦書用文字 リガチャを含む 文字情報基盤漢字 (58,712 文字 ) 今回は符号化対象外 1,672 文字 23,497 文字 25,781 文字 2,274 文字 7,160 文字 ISO/IEC 10646 BMP ( 全 65,536 文字 ) ほぼ全ての情報機器で利用可能 CJK 統合漢字拡張 B,C,D ( 全 47,000 文字 ) IVD フォントには未実装 市販の最新の情報機器の多くで利用可能 一部の OS で対応が始まっているが アプリケーションでの対応は未達 Web ブラウザ違いによる文字の扱いのパターン Web フォント Web フォント Web フォント 文字図形 文字図形 文字図形 図 2 Web ブラウザ違いによる文字の扱いのパターン (b) OSおよびWebブラウザによる振る舞い違いの確認 およびその吸収方法の確認 OS(WindowsXP, VISTA, 7 Mac OS X10.6, 10.7 以降 Linux(Debian 系最新版 Fedora 系最新版 )) および Web ブラウザ (IE6.0, 7.0, 8.0, 9.0 以降 Firefox3.6, 6.0, 5
7.0 以上 Google Chrome14.0 以降 Safari5.0, 5.1 以降 Opera11.52 以降 ) による振る舞いの違いの確認 およびその吸収方法の確認 Web アクセスに使用されたクライアント端末の OS/ ブラウザの統計を取る ( ログ管理 ) (c) Webフォント機能未対応 Webブラウザでの対応方法 CSS3 の Web フォント機能に未対応な Web ブラウザでアクセスが来た場合には Web フォント機能に対応した Web ブラウザへのバージョンアップあるいは IPAmj 明朝フォントのインストールのどちらかの対応をメッセージで要求する 上記に対応できない環境に対しては 本実験では特別な対応 ( 全文字を画像出力する等 ) を行う必要はないものとする (d) プリント確認 実験用に作成した所望の漢字を入力した画面表示を印刷の実証実験を行う そのための 出力イメージを提案し 作成すること 4.3. スマートフォン スレート ( タブレット ) 端末での課題抽出 (1) 実験概要 PC 以外に於いても急速に普及しつつある CSS3 の Web フォント機能を正式採用する Web ブラウザを搭載した主要なスマートフォン スレート ( タブレット ) 端末での入力 表示の状況を確認し 課題抽出も合わせて行う (2) 実験項目 (a) 実験環境 4.1 および 4.2 の実験を行うために構築した実験環境をそのまま用いる (b) 状況確認対象 ios4 以降 Android 2.3 以降 Windows Phone 7.5 以降の OS を搭載したデバイスとする パソコン向けに構築した入力 表示の実験環境を用いて スマートフォン スレート ( タブレット ) 端末における文字情報基盤漢字の入力 表示課題を明確にする 6
Web 電子申請実証実験イメージ クライアント端末 Web/IME サービス Web Font サービス文字図形サービス Web サーバーへアクセス HTML 要求 OS/ ブラウザ情報の確認 Web フォントに対応済みブラウザか IVS 対応済みブラウザかを認識 Web フォントに対応済みでないブラウザがアクセスしてきた場合 < 表示要求 > Web ブラウザのバージョンアップあるいは IPAmj 明朝をダウンロードおよびインストールが必要な旨を表示 IVS に対応済みでないブラウザがアクセスしてきた場合 < 表示要求 > 文字表示 IVS 符号化文字について 符号化外文字の扱いとするデータベースにサーバー側で動的に切り替える < 表示要求 > 画像表示 IME サーバーに収納している辞書および CSS を用いて 指定の Web フォントから表示グリフを取り出し表示する < 表示要求 > IME サーバーに収納している辞書 指定の文字図形を取り出しインライン画像表示する 図 3 Web 電子申請実証実験イメージ 4.4. データ運用 (1) 実験概要上記 4.1, 4.2 実験結果である Web ブラウザ上に表示された文字列 ( 文字図形を含む ) をコピーし他のアプリケーションソフトウエアにペーストする際に 最低限の文字情報が交換できる相互運用性を確認する 具体的には IPAmj 明朝フォント UCS 実装外文字 ( 文字図形 ) を画像で扱った場合には テキストエディタ上では MJ 文字図形名を示す文字列を表示する運用実験を行う (2) 実験項目 (a) インライン画像としてコピー & ペーストする場合 Web ブラウザに表示されたインライン画像を含む文字列をインライン画像表示が可能な MS Word 等へコピー & ペーストした際に ペースト先もインライン画像で表示する (b) 文字列としてコピー & ペーストする場合 Web ブラウザに表示されたインライン画像を含む文字列をインライン画像表示が不可能なメモ帳等のテキストエディタへのコピー & ペーストした際に インライン画像は ペースト先では MJ 文字図形名 を示す文字列を表示する 文字列のコピーは 特定のブラウザに依存しないものとする セキュリティにも配慮 7
し Web ブラウザにプラグイン ( アドオン ) 等をインストールしないものとする 4.5. 実験参加者からのフィードバック収集機能の構築 一般の実験参加者が当該システムを利用して 問題があった場合にフィードバックできるプロセスを提案し 実装すること 5. 事業の実施体制 (1) 実施要員に 本件 文字情報基盤 Web 実証実験 業務の遂行に必要な関連知識 十分なプロジェクト管理能力を有していること (2) 実施要員に ISO/IEC 10646(UCS) Unicode Consortium JIS X 0213 や JIS X 0221 などの情報交換用符号化文字集合規格の資料を理解し 実験対象となる OpenType フォント IVS の仕様内容を正しく説明出来る知識を有する経験者を含めること (3) プロジェクト管理等により 作業計画を明確に定め 作業項目毎の工程管理を行い 作業の遅延等が生じた際は IPA 担当者に報告すること 6. 事業期間及びスケジュール契約締結日から 201 年月日 ( ) まで (1) 実験開始日 : (2) 実験実施報告書 : 具体的なスケジュールについては別途相談の上決定するものとする 7. 検収関連事項 7.1. 納入日 7.2. 納入場所独立行政法人情報処理推進機構技術本部国際標準推進センター 8. 納入物件以下記載資料の電子データを収めた記録媒体 (CD-R 又は DVD-R) 一式 (1) 実験環境構築プログラム一式 (2) 実験実施報告書実証実験実施報告は Microsoft Office2003 互換または Open Office 形式とすること以上 8