お使いのオフィスソフトは新常用漢字に対応してますか 今こそ OpenOffice.org へ乗り換えよう オープンソースカンファレンス 2010 Tokyo/Fall 主催 : オープンソースカンファレンス実行委員会 会場 : 明星大学日野キャンパス 26 号館 509 9 月 10 日 ( 金 ) 13:00-13:45 OpenOffice.org 日本ユーザー会鎌滝雅久
自己紹介 フリーライターとして OpenOffice.org 日本ユーザー会に参加 日本語環境改善拡張機能 を開発 IPAex フォント Takao フォント用拡張機能も開発 オープンガイドブック OpenOffice.org 3 ( 翔泳社刊 ) 執筆メンバー OpenOffice.org 日本ユーザー会は特定非営利活動法人申請中です
本日のセミナー内容 新常用漢字について パソコンと新常用漢字 Windows XP で新常用漢字を利用する Microsoft Office 2003 で新常用漢字を利用する Microsoft Office 2003 XP+OpenOffice.org で新常用漢字を利用する 漢字表現の多様化時代に向けて まとめ
新常用漢字について
常用漢字とは 政府が定める 常用漢字表 に規定された漢字 常用漢字表 の前書き この表は, 法令, 公用文書, 新聞, 雑誌, 放送など, 一般の社会生活において, 現代の国語を書き表す場合の漢字使用の目安を示すものである http://www.bunka.go.jp/kokugo/main.asp?fl=list&id=1000003929&clc=1000000068 旧 常用漢字表 は 1945 文字で 1981 年に制定 1981 年以降に登場したシフト JIS EUC-JP の文字コードは旧 常用漢字表 に対応している
常用漢字表 の改定の流れ 2000 年 表外漢字字体表 制定 2009 年 常用漢字表 から 5 字を削除し 表外漢字字体表 から 196 字を追加する改正案が文部科学省に提出 2010 年 4 月 第 41 回漢字小委員会で改正案が承認 2010 年 6 月 文化審議会 が答申 早ければ 2010 年 11 月に内閣告示される予定
新常用漢字制定の背景とねらい パソコンや携帯端末の普及 手書きでは難しい漢字が表現できる 例 ) 憂鬱 の 鬱 語彙 の 彙 など 常用漢字表 に制定することで 逆に難しい漢字が氾濫することを防ぐ意味合いもある 字体の尊重 康煕字典 ( 清朝の康煕帝が定めた字典 ) にそった字体を尊重 ( 表外漢字字体表 も参考にしている ) 2 点しんにょうなど ( 一部の 1 点しんにょうは許容字体 )
パソコンと新常用漢字
新常用漢字の問題点その 1 シフト JIS では表示できない漢字が含まれる 4 バイト文字 ( 口へんに七 ) の採用 シフト JIS の 叱 とは字体が異なるが 康熙字典 に含まれるため 常用漢字表 に採用された UTF- 8 コードは U + 20B9F シフト JIS にない旧字の採用 剝 ( 剥の旧字 ) UTF- 8 コード U + 525D 塡 ( 填の旧字 ) UTF- 8 コード U + 5861 頰 ( 頬の旧字 ) UTF- 8 コード U + 9830
新常用漢字の問題点その 2 新常用漢字で字体が変更される 19 文字 茨淫 葛僅餌煎詮遡遜嘲捗溺賭謎箸蔽餅 ( 餠 ) 蔑 当スライドでは 上記を JIS X 0213 : 2004/JIS 2004 で表示 Windows XP 搭載の JIS X 0208 規格のフォントでは異なる表示になる
新常用漢字と文字コード 文字コードに注目して図式化 UTF-8 UTF- 16 USC-2 シフト JIS 新常用漢字表 剝塡頰 剥填頰叱
新常用漢字に対応する OS Windows Vista/7 UTF-16 ( JIS X 0213 : 2004/JIS 2004 ) Mac OS X 10.5 以降 UTF-16 ( JIS X 0213 : 2004/JIS 2004 ) Linux 主要ディストリビューション UTF-8 Windows XP 文字コードは UCS-2 まで 新常用漢字 に完全対応していない
Windows XP で新常用漢字を利用する
Windows XP の準備 対応アプリケーションを用意する フォントを用意する メイリオフォント MS ゴシック & MS 明朝フォントパッケージ IPAex フォント TakaoEx フォント その他 JIS X 0213 : 2004/JIS 2004 対応フォント
フォントの入手 メイリオフォント http://www.microsoft.com/downloads/details.aspx?familyid=f7d758d2-46ff-4c55-92f2-69ae834ac928&displaylang=ja&hash=vind6pglrlihvwvh06bd %2bVpYyi6dBreBCPciojF1rEMv3CEdVfp%2f50KdteSdPo4DQ3B6tihIJ5IgRC5%2f %2boUjuw%3d%3d MS ゴシック & MS 明朝フォントパッケージ http://www.microsoft.com/japan/windows/products/windowsvista/jp_font/jis04/def ault.mspx IPAex フォント http://ossipedia.ipa.go.jp/ipafont/ TakaoEx フォント https://launchpad.net/takao-fonts
Office 2003 で 4 バイト文字を表示 フォントパッケージ導入前 フォントパッケージ導入後
Microsoft Office 2003 で新常用漢字を利用する
XP+Office 2003+ 対応フォント 表示できるものの新常用漢字の入力に問題 XP 付属の Microsoft IME 新常用漢字表で字体が変更された 19 字は問題ない 剝塡頰 の 4 文字は変換できない ほてん の変換候補は 補填 しかる の変換候補は 叱 ( シフト JIS ) スタート - すべてのプログラム - アクセサリ - システムツール - 文字コード表 剝塡頰の 3 文字は UTF-8 の文字コードで入力可能 4 バイト文字の は表示できない Office の 挿入 - 記号と特殊文字 4 バイト文字の も入力可能
文字コード表を利用した入力 Unicode を入力し アプリケーションにコピー 2 2 3 1
記号と特殊文字を利用した入力 文字コードを入力し 挿入 1 2
Windows XP の限界 ユニコードの UCS-2 までという制限 フォントの CJK Unified Ideographs Extension B/CJK 統合漢字拡張 B 以降の領域の文字の扱いに注意 など 4 バイトのユニコード文字が格納されている領域 アプリケーションによっては 2 文字分と扱われる場合がある OS 付属の文字コード表は非対応
XP+OpenOffice.org で新常用漢字を利用する
OpenOffice.org の新常用漢字対応 IPA フォント Takao フォントなどの対応フォントのインストールだけで利用可能 MS フォントの対応パッケージを利用しない場合は OS の UI フォントを IPA フォントに変更する
OpenOffice.org で新常用漢字を入力 メニューの 挿入 - 記号と特殊文字 を利用する 2 1
Google 日本語入力でさらに便利に Google 日本語入力 http://www.google.com/intl/ja/ime/ Windows Mac OS X に対応したフリーの IME オープンソースプロジェクト化され オープンソース版 IME mozc が Linux 用にリリース 一部の新常用漢字の入力に対応
Google 日本語入力に辞書登録する 変換候補に表示されない漢字を辞書登録する
Baidu Type の場合 フリーで利用できるもう一つの IME http://type.baidu.jp/ Windows XP/Vista/7 ( 32 ビット版のみ対応 ) 辞書登録可能
XP 付属の Microsoft IME の場合 辞書登録できるものの変換窓で 4 バイト文字は表示できない 変換後の入力は問題ない
漢字表現の多様化時代に向けて
異体字対応フォントで広がる漢字表示 IPAex フォントの特長は異体字対応 JIS0213:2004 制定時に字体変更された文字の旧字体を異体字として収容 http://sourceforge.jp/projects/ipafonts/releases /46162/changelog
従来の多様な漢字への対応 独自の文字コード体系 一般的にはユーザー定義文字 ( 外字 ) 官庁では戸籍統一文字 住民基本台帳ネットワーク統一文字 民間では今昔文字鏡や GT 書体 TRON コードなど 相互運用はとても望めない状態
異体字の特長 国際的な規格として統一されつつある 確実な相互運用性の確保が可能 文字コード + 異体字セレクタという仕組み ( これを 包摂 と呼ぶ ) 字体の似た文字を 1 つの文字コードで管理 検索時に文字コードだけ指定すれば異体字も表示 名前のような多様な固有名詞の区別が可能に 渡辺の 辺 の字 山崎の 崎 字など 葛飾区と葛城市など JIS2004 で変更された旧字
異体字対応環境 OS Windows Vista/7 Mac OS X? Linux? アプリケーション メモ帳 ( Windows 7 ) Microsoft Office 2007/2010 Microsoft IME 2007/2010 フォント 小塚明朝 / 小塚ゴシック ( Mac OS X 付属 ) IPAex フォント TakaoEx フォント JIS2004 の旧字のみ収録
OpenOffice.org の異体字対応 現在は異体字の入力 表示とも不可 異体字の入力時 ブランクスペースが挿入される 異体字機能を付加するため開発中 OpenOffice.org の不具合 要望データベースである IssueTracker の登録 http://ja.openoffice.org/issues/show_bug.cgi? id=103123
Linux と異体字 利用できるアプリケーションを調査中 Emacs では表示可能 ( 対応した libotf を用意し再コンパイルが必要 ) 異体字セレクタの入力には対応
まとめ
新常用漢字に対応した環境への移行 Windows 2000/Microsoft Office 低スペックの PC をそのまま利用するなら Linux + OpenOffice.org ( 3.2 以降 ) Windows XP/Microsoft Office Windows XP/Microsoft Office 買い替えが可能なら Windows 7/Microsoft Office 2010 Mac OS X/Microsoft Office 2008 Mac OS X/Microsoft Office 2008 コスト削減が必要なら サポートが終了した Microsoft Office 2003 から OpenOffice.org ( 3.2 以降 ) に乗り換え
参照情報 OpenOffice.org SNS の M.Kamataki の日記 http://oooug.jp/sns/?m=diary&a=page_list&target_c_member_id=1 Windows XP のメモ帳で異体字を表示する方法も紹介しています 常用漢字表 http://www.bunka.go.jp/kokugo/main.asp?fl=list&id=1000003929&clc= 1000000068 新常用漢字表が迫る Unicode 移行 シフト JIS では対応不可能 http://itpro.nikkeibp.co.jp/article/column/20091209/341831/ 異体字セレクタ http://ja.wikipedia.org/wiki/%e7%95%b0%e4%bd%93%e5%ad%97%e3%82%bb %E3%83%AC%E3%82%AF%E3%82%BF
OpenOffice.org 日本ユーザー会 OpenOffice.org Q&A http://oooug.jp/faq/ 質問や疑問 要望 不具合の報告はこちらへ OpenOffice.org Users Group SNS OpenOffice.org Users Group SNS http://oooug.jp/sns/ ユーザー同士の情報交換に利用してください openoffice@freeml.com などの ML もあります 本日の資料の公開場所 http://openoffice-docj.sourceforge.jp/wiki/ Documentation/OpenOffice.org_Seminar