IPA の提供する 縮退マップ に される MJ 字集合 JIS 字集合への縮退対応関係はある 字について 縮退先として 1 つの漢字が されるとは限らず 縮退先として複数の候補が される IPA としては縮退先の候補を さないの場合があります 2.2. 縮退マップの成り ち IPA の提供する縮退

Similar documents
< B68E9A89DB91E888EA97972E786C7378>

<4D F736F F D F4390B38DCF94C581798E9197BF A88CF88F596BC95EB2E646F6378>

行政の情報化と文字情報基盤


出入国在留管理庁正字検索システムユーザーマニュアル 第 1.3 版

2. 実験シナリオ 対象が一般国民であるため 以下のことを前提とした実験環境を構築する (1) 内容氏名 住所等の多様な漢字の入力が必要となる Web を用いた電子申請をイメージして 文字情報基盤漢字の実験サイトとする 本事業の目的および 4 章で述べる実験項目を満たす具体的なストーリーを検討して提

ンロード可能であり 今後の運用 保守も情報処理推進機構が実施していく予定です 運用 保守にあたっては 行政現場の実務や国際標準との整合性をとり 文字情報の更なる正確性を期していく予定です 文字情報基盤の普及を図るために 説明会を札幌 仙台 東京 大阪 福岡で 11 月から実施予定です 詳細は情報処理

4_Dojo_OpMan_v200.xlsx

< F2D48508C668DDA81698ABF8E9A816A5B8CEB8E9A92F990B35D2E6A>

Microsoft Word - 導入カ?イト? fix版.docx

(2) 操作性 わかりやすいユーザーインターフェース 難しい操作は避ける (3) 相互運用性と国際整合性本実験は相互運用性と国際整合性を担保していることを条件とする 特定の OS 特定の Web ブラウザに依存しない方式を検討する ただし UTF-8 が動作する環境を本実験の対象とする ISO/IE

スライド 1

資料 1 平成 25 年度文字情報基盤 運用検討 SWG 委員名簿 (2014 年 2 月 6 日現在 ) 主査 楠 正憲 内閣官房社会保障改革担当室番号制度推進管理補佐官 委員 牛込英樹 富士通株式会社ミドルウェア事業本部データマネジメント ミドルウェア事業部第五開発部マネージャー 梅原忍 財団法

帝国議会の運営と会議録をめぐって


<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >

Microsoft PowerPoint _tech_siryo4.pptx

資料 0 平成 23 年度文字情報基盤推進委員会 第 3 回技術検討 WG 議事次第 日時平成 23 年 10 月 7 日 ( 金 )15:00~17:00 場所文京グリーンコートセンターオフィス 13 階会議室 C < 議事次第 > 1. 開会 資料確認 前回議事録確認 2. 文字情報基盤 Web

書式に示すように表示したい文字列をダブルクォーテーション (") の間に書けば良い ダブルクォーテーションで囲まれた文字列は 文字列リテラル と呼ばれる プログラム中では以下のように用いる プログラム例 1 printf(" 情報処理基礎 "); printf("c 言語の練習 "); printf

ProからPr5Pr6字形変更2013.indd

JICA 事業評価ガイドライン ( 第 2 版 ) 独立行政法人国際協力機構 評価部 2014 年 5 月 1

<8ABF8C9F92508CB3838A E786C73>

自己紹介 フリーライターとして OpenOffice.org 日本ユーザー会に参加 日本語環境改善拡張機能 を開発 IPAex フォント Takao フォント用拡張機能も開発 オープンガイドブック OpenOffice.org 3 ( 翔泳社刊 ) 執筆メンバー OpenOffice.org 日本ユ

かんたん携帯9 ユーザーガイド

IPA

STARTプログラム.indd

シンプルスマホ2 ユーザーガイド

はいたっく2012-7

プログラミング基礎I(再)

農業農村整備民間技術情報データベース技術概要書 (2/4) 17: 連絡先の郵便番号と住所をご記入ください < 郵便番号は半角数字 > < 2/6 > 連絡先 会社名住所担当部署担当者関連 URL MAIL 19 TEL FAX 1 18: 連絡先の担当部署をご記入

文字コード略歴 よこやままさふみ社内勉強会 2012/05/18 文字コード略歴 Powered by Rabbit 2.0.6

しがだい23号.indb

Microsoft Word - no103.docx

について 本機のの基礎知識 画面について メールや電話帳など 文字が入力できる状 態になると 右のような画面が表 示されます. この章は ことわりがない限り 画面 での操作を説明しています の基本操作 にはダイヤルキーを利用します つのキーには キー に印字されている複数の文字が割り当てられており

目 次 1. 使用する電磁的記録媒体 1 2. ファイル構成, ファイル名及び記録すべき事項 1 3. ファイル形式 1 4. 使用可能文字規定等 1 5. ファイルへの記録方法 2 6. 申請データ仕様 6-1. 登記共通事項ファイル (COMMON.xml) 譲渡人ファイル (JT


事業者が行うべき措置については 匿名加工情報の作成に携わる者 ( 以下 作成従事者 という ) を限定するなどの社内規定の策定 作成従事者等の監督体制の整備 個人情報から削除した事項及び加工方法に関する情報へのアクセス制御 不正アクセス対策等を行うことが考えられるが 規定ぶりについて今後具体的に検討

住基即時 / 一括システムと住基情報交換システムの概要 〇住基即時システム 年金に関する届出において 電子申請を利用した届出の場合に住民票の添付を不要とするため また届出していただいた方の本人確認 生存確認等を行うために 住民基本台帳ネットワークシステム ( 以下 住基ネット という ) への即時照

Functional Programming

<4D F736F F D20302D AE8E59936F8B4C C90BF82CC95B68E9A81698A4F8E9A816A93FC97CD82C98AD682B782E98FEE95F1208C668DDA97702E646F63>

AQUOS ケータイ ユーザーガイド

<4D F736F F D C90BF8ED A93C192E890DA8EED8AC7979D DEC837D836A B2E646F6378>

イ -3 ( 法令等へ抵触するおそれが高い分野の法令遵守 ) サービスの態様に応じて 抵触のおそれが高い法令 ( 業法 税法 著作権法等 ) を特に明示して遵守させること イ -4 ( 公序良俗違反行為の禁止 ) 公序良俗に反する行為を禁止すること イ利用規約等 利用規約 / 契約書 イ -5 (

Microsoft Word - 【6.5.4】特許スコア情報の活用

特定個人情報の取扱いの対応について

スライド 1

医療事故調査・支援センター~センターの役割と手引~

2008年6月XX日

紀要ドラフト.indd

スライド 1

Taro-1803 平行線と線分の比

シンプルスマホ3 ユーザーガイド

Microsoft Word - MTransㇹㇿㅼㅋ㇬㇤ㅛ+丕苬ㅦㅼㇶㅼ咂ㆂ;_ver1.7_original.docx

文字入力 ソフトウェアキーボードを切り替える...56 文字入力画面の見かた...56 文字を入力する...58 文字入力の便利な機能を利用する...60 iwnn IME の設定を行う

文字入3-2 力3 文字入力について ひらがな 漢字 カタカナ 英数字 記号 絵文字などが入力できます ダイヤルボタンの文字割り当てについて (ZP.17-12) ❶ ❷ ❸ ❶ 入力モード切替操作漢 : 漢字 ひらがな入力モード 1 カナ : カタカナ入力モード英 : 英字入力モード数 : 数字入

スライド 1

Y.OzFont ペン字版 Y.OzFont は ペン字風の手書き TrueType 和文フォントです 仕事にも使えるキッチリした字体で JIS 第 3~4 水準までの総てを実装した本格派です 外字も大量に収録し OpenType の字形切り替え機能 (OpenType Feature Tag) U

手がかり再生 ( 最大 点 ) () 採点方法 一つのイラストについて 自由回答及び手がかり回答の両方とも正答の場合は 点 自由回答のみ正答の場合は 点 手がかり回答のみ正答の場合は 点 なお 手がかり回答時において 一つのヒントに二つ以上の回答をさせないこと ( 例 : 果物 に対して メロン り


SL-8号電話機 取扱説明書

00~33.換気マニュアル

Microsoft Word - Omrono_yuserDic.doc

スライド 1

Xperia™ XZ ユーザーガイド

科学的モデリング 2 回 継承 2 無断転載 & 無断配布を禁じます 第 2 回 : 科学的モデリング 継承 2 継承される特性( プロパティ ) 第 2 回の話題 継承は何を継承するのか? 今回のコラムの話題は 継承される特性 ( プロパティ ) についてです そもそもサブクラスはスーパークラスか

スライド 1

コンピュータ工学講義プリント (7 月 17 日 ) 今回の講義では フローチャートについて学ぶ フローチャートとはフローチャートは コンピュータプログラムの処理の流れを視覚的に表し 処理の全体像を把握しやすくするために書く図である 日本語では流れ図という 図 1 は ユーザーに 0 以上の整数 n

manaba course 出席機能 操作マニュアル


(5) 作業グループの設定 < 解答 > ( ア )=2 作業グループは 複数のシートにカーボン紙のように 同じ編集ができる機能です 先頭 Sheet1 をクリックしてから Shift キーを押しながら 末尾 ( まつび ) の Sheet3 をクリックすると Sheet1 ~ Sheet3 がグル

日本機械学会 生産システム部門研究発表講演会 2015 資料

フォント埋め込みに関する調査報告 プラネットファーマソリューションズ株式会社 2019 年 05 月 31 日 Copyright 2019 Planet Pharma Solutions, Inc. All Rights Reserved.

目次 更新履歴... 1 画面設計書の目的... 3 必要な内容... 3 画面一覧... 4 必要な内容... 4 画面遷移... 5 画面レイアウト... 6 入力パラメータ... 7 必要な内容... 7 項目定義... 8 必要な内容... 8 部品の種類... 9 ( 参考 ) 部品指定と

1. はじめに 2

~ 目 次 ~ 1. 履 修 登 録 のながれ 1 2. 利 用 可 能 な 機 能 について 2 3.Web 履 修 登 録 画 面 へのログイン ログアウト 方 法 3 4. 予 備 登 録 ( 定 員 設 定 科 目 の 履 修 ) (1) 予 備 登 録 5 (2) 予 備 登 録 状 況

Datalink_summary

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1

使用する前に

航空機の運動方程式

データ連携基盤サブワーキンググループ(第1回)

スライド タイトルなし

スライド 1

スライド 1

コンテンツの一部多言語化並びに Flash の改修 ( 舞台芸術教材 日本の伝統音楽歌唱編 ) に関すると はやわかり の英語翻訳範囲に動画の内容 ( ナレーションなど ) は含みますでしょうか 動画は現在の動画 ( 日本語版 ) をそのまま用い 日本語解説のみを英語に翻訳する想定で問題はございませ

Functional Programming

<4D F736F F F696E74202D208E9197BF B8BB38EF690E096BE8E9197BF2E707074>

スライド 1

電話機の取り扱い濁点 半濁点の入力方法 文字の入力方法 文字を入力するには 入力画面で入力モードを選択し ダイヤルボタンを押して文字を入力します 入力モードによって 入力できる文字が異なります 同じ文字を続けて入力する場合は を押してカーソルを右移動してから 2 文字目を入力します 例 : を押すた

504 特定事業等に係る外国人の入国 在留諸申請優先処理事業 1. 特例を設ける趣旨外国人研究者等海外からの頭脳流入の拡大により経済活性化を図る地域において 当該地域における特定事業等に係る外国人の受入れにあたり 当該外国人の入国 在留諸申請を優先的に処理する措置を講じることにより 当該地域における

(Microsoft Word - \202v\202a\202s\203G\203N\203Z\203\213.doc)

Team JBA (日本バスケットボール協会 新会員登録管理システム)

Microsoft Word - TMFM_Product.doc

短納期開発現場への XDDP 導入手法

平成23年度全国学力・学習状況調査問題を活用した結果の分析   資料

Team JBA (日本バスケットボール協会 新会員登録管理システム)

TinyVPN とブリッジ接続機能による LAN 統合方法 PU-M TinyVPN とブリッジ接続機能による LAN の統合方法 Version 1.7 シモウサ システムズ (C) Shimousa Systems Corporation. All righ

ベースのソフトウェア情報と突合するかといった点が重要になるが 実際には資産管理ツールだけでは解決できず 最終的に専門的な知識を有した人の判断が必要とされる この点の解決策としては 2012 年 5 月にマイクロソフトも対応を表明した ISO/IEC のソフトウェアタグに期待が集まって

SGEC 附属文書 理事会 統合 CoC 管理事業体の要件 目次序文 1 適用範囲 2 定義 3 統合 CoC 管理事業体組織の適格基準 4 統合 CoC 管理事業体で実施される SGEC 文書 4 CoC 認証ガイドライン の要求事項に関わる責任の適用範囲 序文

磁気ディスクを提出する方法による申請における申請書様式と申請書のPDFファイルの作成手順について

対象者年度更新後の状態年度更新後の登録手続き 1-6. 選手 指導者への個人 ID とパスワードの伝達 選手 指導者に個人 ID とパスワードを知らせます 1-7. 全日本ジュニア体操クラブ連盟 日本新体操連盟 全日本学生体操連盟 全日本社会人体操競技連盟 ( 以下 直接登録団体 ) への登録 直接

Transcription:

資料 5 縮退マップ利 ガイド ( 案 ) ドラフト (2015 年 3 24 ) 1. 縮退マップの 的インターネットを使った情報公開や電 申請など 不特定多数の 般利 者を対象とするサービスでは 利 者の使う多様なデバイスで表 ができるよう 使う 字の範囲を JIS X 0213 の範囲 ( 約 1 万 字 ) とするなど 必要最 限に絞ることが求められます 組織内での 常的情報処理においても 使 する 字の範囲を不必要に きくせず 業務に応じた範囲を設定することが 業務効率化の上で適切です 名を 籍に合わせて正確に表記することが求められる業務等で いられる情報処理システムと 上記のように 使 する 字の範囲を適切に絞ることが求められる業務で いられる情報処理システムとの間の情報連携を効率化するためには 規模な範囲の 字と 規模な範囲の 字との対応関係 ( 縮退対応の関係 ) を明らかにするとともに この対応関係を統 的に管理し 組織内や組織間での対応関係に係る不整合を抑制することが必要です IPA の提供する 縮退マップ は 籍統 字と住 基本台帳ネットワークシステム統 字を合わせて整理した 約 6 万 字の 字情報基盤の 字 ( 以後 MJ 字集合と呼ぶ ) と 約 1 万 字の JIS X 0213(JIS 第 1 準 第 4 準 ) の 字 ( 以後 JIS 字集合と呼ぶ ) の対応関係を 出す際の規範として使われることを 的としています 2. 縮退マップとは 2.1. 概要 IPA では 現在 字情報基盤で整理した 字の 字情報のデータベース化を進めており (2015 年夏から試験公開 2016 年春から本格公開予定 ) その 環として 図形的類似 異体字 誤字 正字 本字等の 字の関係を整理しています IPA の提供する 縮退マップ は このような関係性を JIS 字集合への縮退 という視点から整理して 覧表の形式としたものです 1 / 7 ドラフト 2015.3.24

IPA の提供する 縮退マップ に される MJ 字集合 JIS 字集合への縮退対応関係はある 字について 縮退先として 1 つの漢字が されるとは限らず 縮退先として複数の候補が される IPA としては縮退先の候補を さないの場合があります 2.2. 縮退マップの成り ち IPA の提供する縮退マップは MJ 字集合に属する 字について その関係性を 以下の様な根拠に基づいて JIS 字集合への結びつきの有無を調査した結果をまとめたものです ( ア ) 図形的な類似性を調べ JIS X 0213 に定義された 包摂規準 および UCS(ISO/IEC 10646) に定義された統合規則 (Unification Rules) に照らして JIS 字集合に属する 字に包摂 / 統合されると判断されるもの ( イ ) 法務省が した 籍法関連の通達 : 誤字俗字 正字 覧表 ( 平成 六年 〇 四 第 四 号 事局 通達 ) 正字 俗字等対照表 ( 平成 年 〇 〇 第五 〇 号通知別表 ) に された関係性から JIS 字集合に属する 字へ結びつけられると判断されるもの ( ウ ) 辞書類 1 に された異体字等の関係性から JIS 字集合に属する 字へ結びつけられると判断されるもの ( エ ) 法務省の 在留カード等に係る漢字 名の表記等に関する告 ( 平成 23 年法務省告 第 582 号 ) により JIS 字集合に属する 字へ結びつけられると判断されるもの ( オ ) 辞書により 固有な意味を持つ 字であること等が確認され JIS 字集合に属する 字への対応を付けることはできないと判断されるも 1 漢和辞典 ( 修館書店 ) 字源 ( 川書店 ) 新 字典 ( 講談社 ) 本語漢 字辞典 ( 新潮社 ) 漢語林 ( 修館書店 ) 2 / 7 ドラフト 2015.3.24

の ( カ ) 上記 ( ア ) ( オ ) で処理できなかった 字について 読み 字形などから JIS 字集合へ属する 字へ結びつけられると判断されるもの この調査の概要を図 1 縮退マップ作成の 順図 1 に します ( から下は から左へ出ている線の先の処理ができなかった残りについて処理する ) Start JIS X 0213 包摂基準 UCS 統合規則の適 約 14,500 字 籍法関連の通達 辞書 外国 登録関連の告 による関係付け 約 15,000 字 辞書により縮退できない 字 (JIS X 0213 関連字 ) であることを確認 約 30,000 字 義等からの推定 約 400 字 約 400 字 縮退候補 つの MJ 字に対し 複数の縮退先候補が対応付く場合がある IPA としては縮退候補を さない 複数候補から つを選ぶために 選択ポリシの策定や 間の介 が必要 読みかなに変えるなど 間の介 が必要 図 1 縮退マップ作成の 順 2.3. 縮退候補を複数 す場合 2.2 に した 順により 字の関係を調べてゆくと 関連付けられた 字の複数が JIS 字集合に属する場合が出てきます さらに 法務省の告 により 複数の 正字等 のどちらへ対応付けても良いとされているものもあります その際 候補となる複数の 字のうち どちらの 字との結びつきがより適切であるかについて その 字が実際に いられる状況等に関する情報抜きで あらかじめ客観的に判断するのが困難である場合もあります そのような場合 IPA ではその全てを縮退の候補として し あえて つだけを選ぶことは っていません 2.4. 縮退候補を さない場合 ( ア ) 辞書の上で 固有の意味等を持つ 字であると判断され JIS 字集合に属する別の 字へ対応付けることは適切ではないと判断したもの 3 / 7 ドラフト 2015.3.24

このような 字は約 30,000 字ありました その例を以下に します これらの約 30,000 字は 辞書に掲載されていたことから 籍統 字に収録されており その結果 MJ 字集合に含まれていますが その多くは複数の 字を合成して作られた 字や 動植物名 中国古典に由来する固有名詞等 特定の意味を持つ 字であり 本語の表記 地名 名などで いられる図形 字から選定 された JIS X 0213 への対応付けができません したがって これらの 字の縮退先として JIS 字集合に属する 字の漢字を すことは適切では無いと判断しています また これらの 字が実際に 本の 名に使 されている例は極めて少ないと考えられます このような 字については 漢字 字への縮退変換は わず 読み仮名へ置き換える あるいは 複数の漢字からなる熟語等へ置き換えるといったことが適切であると考えられます ( イ ) 辞書に 出すことができず 読み 意味等も不明な 字このような 字は約 400 字ありました その例を以下に します これらについては 引き続き調査を う必要があります 現在構築中の 字情報データベースでは こういった 字についての情報を 利 者からフィードバックしていただくための仕組みを組み込んでいます 4 / 7 ドラフト 2015.3.24

準備作業3. 縮退マップの活 3.1. 活 において注意すべき点 IPA が す縮退マップには 2.3 に したように ある 字について その縮退候補が複数 されている場合があります この場合には 縮退の変換を う現場において それら候補から つを選ぶ作業が必要となります また 2.4 に したように 縮退候補を していない 字もあります その場合には 複数の漢字からなる熟語等に置き換えることや 読み仮名へ置き換えるといった対応が必要となります 名の読み については 必ずしも辞書に されている通りでない場合も多く また 辞書に複数の読みが されている場合にはそのどれであるかを判断する必要があり 機械的な処理は困難です したがって MJ 字集合が いられたデータを JIS 字集合の 字だけからなるデータへ変換する作業の場 において あるいはその変換のためにコンピュータへセットする 変換テーブル を作成する場 において 実際の縮退先を判断するために現場毎の の判断が必要となることがあります 図 2 に 縮退マップの活 イメージを します 縮退マップ (IPA 提供 ) 変換現場での作業 MJ025760 U+8FBB 対応先の確定 変換作業時の の介 有無等に係るポリシを決め 変換テーブルを作成 MJ059692 MJ068029 U+6681 常 漢字 U+66C9 名 漢字 候補無し 動的縮退変換処理 ( の介 が求められる場合もあり得る ) 変換作業変換テーブル 図 2 縮退マップの活 イメージ 5 / 7 ドラフト 2015.3.24

3.2. 縮退変換処理の例 ( ア ) 変換テーブルの準備ここで 変換テーブル とは IPA の提供する 縮退マップ を参照し MJ 字集合が いられたデータを JIS 字集合の 字だけからなるデータへ変換する為にコンピュータにセットするためのテーブルを指します 縮退マップに縮退先として複数の候補が されている 字については 現場において その実際の縮退先を選択する必要があります 複数候補の中から つを選ぶ 法として 常 漢字に属するもの 画数の さい物 JIS コードの最も若いもの といった規則を決め それに従って変換テーブルを作成することなどが考えられます この がかりになる情報は IPA の提供する 字情報 覧表及び 字情報データベースから得ることができます 縮退マップに縮退先の候補が されていない 字については その読み仮名や 複数漢字からなる熟語等へ変換するよう テーブルを構成することが考えられます したがって 変換テーブルは 漢字 字を別の漢字 字に変換するものとは限らず 漢字 字を 複数 字からなる 字列に置き換えることもあることを念頭にシステムを設計することが求められます また 変換不能であることを す特殊な 字 ( 例えば 等 ) に置きかえるように変換テーブルを構成しておき その処理を先送りするようにシステムを構築することも考えられます この場合 等に加え オリジナルな 字の MJ 字図形名あるいは UCS コードを データの中に記録として残すよう 変換テーブル及びデータ構造を構成しておくと 後の処理を容易にすることができます ( イ ) データ変換作業上記 ( ア ) で準備した変換テーブルを い これをデータ変換 のコンピュータへセットするなどしてデータを変換する作業を います など 変換テーブルにおいて変換不能であることを す 字に き当たった場合 の介 を求めることが適当である場合が考えられます それに備えた適切なユーザインタフェースを考慮してシステムを設計してお 6 / 7 ドラフト 2015.3.24

く必要があります 漢字 字を複数 字の漢字または仮名の列に置き換えるように変換テーブルが構成されている場合には 変換前と変換後で 字数が変化することを考慮の上 そのデータを いるシステムを設計しておく必要があります 7 / 7 ドラフト 2015.3.24