第 七 回 多 言 語 組 版 研 究 会 資 料 2003 年 8 月 4 日 有 限 会 社 P.WORD
Ⅰ. 言 語 について Ⅰ-1. ハングル 韓 国 語 朝 鮮 語 コリア 語 などの 違 い Ⅰ-1-a ハングル ハングルは 言 語 を 指 す 言 葉 ではなく 文 字 を 指 す 言 葉 Ⅰ-1-b 韓 国 語 と 朝 鮮 語 韓 国 語 と 朝 鮮 語 は 言 語 としては 同 じ それぞれの 政 府 の 方 針 で 正 書 法 が 若 干 異 なるように なり 半 世 紀 以 上 それぞれに 発 展 変 化 してきたが 方 言 程 度 の 差 と 言 える < 特 徴 的 な 違 い> 発 音 (ソウル 言 葉 とピョンヤン 言 葉 ) 分 かち 書 きのルール 例 : 韓 国 北 朝 鮮 拝 呪 赤 陥. 拝 呪 赤 陥. (できる) 沿 識 持 還 沿 識 持 還 (キム 先 生 ) 語 頭 がㄹ(r,l) ㄴ(n)で 始 まる 単 語 の 表 記 例 : 韓 国 北 朝 鮮 政 俳 持 嫌 俳 持 ( 留 学 生 ) 尻 鎧 鰍 鎧 ( 年 内 ) 文 末 の 違 い 例 : 韓 国 北 朝 鮮 - 鞠 醸 柔 艦 陥 - 鞠 心 柔 艦 陥 (-なりました) -어요 -습니다 (-でした) 単 語 そのものの 違 い 例 : 韓 国 北 朝 鮮 鉢 舌 叔 是 持 叔 (トイレ) 亀 獣 喰 飲 剛 ( 弁 当 ) Ⅰ-1-c Korean Language その 他 の 呼 称 韓 国 朝 鮮 語 韓 朝 鮮 語 ハングル 語 * コリア 語 ** * **は 間 違 った 呼 び 方 です 1
Ⅰ-2. 表 音 文 字 ハングルの 仕 組 み Ⅰ-2-a 訓 民 正 音 (フンミンジョンウム) 15 世 紀 中 ごろ 口 や 喉 の 形 ( 子 音 )と 障 子 の 格 子 模 様 ( 母 音 )からヒントを 得 たという 説 や 天 地 人 を 表 しているとも 言 われている 漢 文 とハングル( 彦 文 オンムン ) 当 初 漢 文 は 貴 族 とインテリの 文 字 ハングルは 庶 民 と 女 の 文 字 と 言 われた Ⅰ-2-c 子 音 と 母 音 の 組 み 合 わせからなる( 別 紙 反 切 表 参 照 ) 19 個 の 子 音 : 鼻 匹 彦 菱 姫 媛 謬 彪 標 漂 瓢 票 表 評 柊 膝 紐 俵 氷 21 個 の 母 音 : <10 個 の 基 本 母 音 > 豹 描 秒 錨 蒜 彬 斌 賓 頻 瓶 <11 個 の 合 成 母 音 > 廟 病 苗 鋲 蛭 鰭 品 浜 瀕 貧 敏 Ⅰ-2-d パッチム: 終 声 音 文 字 の 下 につく 子 音 照 括 馬 室 推? [an nycng ha se yo] (こんにちは) Ⅰ-2-e 発 音 の 特 徴 パッチム+ 母 音 = 連 音 化 例 : 至 穣 [san-cp] ( 産 業 ) 紫 赫 / [sa-ncp] 平 音 の 濁 音 化 例 : 薦 爽 亀 [tse-dzu-do] ( 済 州 島 ) 亀 獣 喰 [to-si-rak]( 弁 当 ) 詰 まる 音 のパッチム+ 鼻 音 = 鼻 音 のパッチム 例 :- 脊 艦 陥 [ip-ni-da] (-です) - 績 艦 陥 / [im -ni-da] Ⅰ-2-e 発 音 記 号 1 子 音 鼻 匹 彦 菱 姫 媛 謬 彪 標 評 平 音 : k,g n t,d r,l m b,p s 無 音,n dz,ts h 瓢 票 表 漂 激 音 : k h t h p h ts h 柊 膝 紐 俵 氷 濃 音 :?k (kk)?t (tt)?p (pp)?s?ts 2
2 母 音 豹 描 秒 錨 蒜 彬 斌 賓 頻 瓶 基 本 母 音 : a ja c jc o jo u ju m (-i ) i 廟 病 苗 鋲 蛭 鰭 品 浜 瀕 貧 敏 合 成 母 音 : f jf e je wa wf we wc we wi m i Ⅰ-3. 日 本 語 に 似 ている 韓 国 語 Ⅰ-3-a 文 法 主 語 + 目 的 + 動 詞 の 順 番 が 同 じで 日 本 人 が 最 も 学 びやすい 言 語 と 言 える Ⅰ-3-b 漢 字 語 : 漢 字 の 発 音 は 基 本 的 に 一 つ ( 例 外 も 若 干 あります) 冪 膣 沿 慎 [ kimycng ] 俚 蔕 跋 榎 推 析 [ km mjoil ] Ⅱ. 文 字 コードにつて Ⅱ-1 KS( 半 角 )8ビット 系 これは 日 本 語 の 半 角 カタカナのように ASCII が 未 定 義 のまま 残 した(ASCII は7ビット 定 義 なので +1 ビットが 余 っているので) 残 りの 128 文 字 に ハングルを 入 れようとしたもの です ただ ハングルは 困 ったことに 24 の 字 母 さえ 定 義 すればよいというものではありませ ん KS 工 業 規 格 になったのか 規 格 案 に 止 まったかはわかりませんが この 規 格 では 24 文 字 のハングル 字 母 を 並 べただけでした 正 KS 8 ビット 系 안녕하세요 ㅇㅏㄴㅕㅇㅎㅏㅅㅔㅇㅛ このように パッチムを 表 すことができなかったので すぐに 使 われなくなりました Ⅱ-2 KS 完 成 型 と 組 み 合 わせ 型 その 後 韓 国 では コンピュータ 各 メーカーが 勝 手 なハングル 文 字 コードを 勝 手 に 作 った 規 格 乱 立 時 代 に 入 りました それらを 統 一 したのが 現 在 のKS 完 成 型 および 組 み 合 わせ 型 2 種 の 規 格 です 3
Ⅱ-2-a KS 完 成 型 KS 完 成 型 は 最 優 勢 のコーディング 系 で unix で 使 われる EUC (Extended Unix Code) と 同 じ 方 針 を 取 ったもの その 基 本 コード セットは 7ビット+7ビットで 定 義 されてい ますが 現 実 の 運 用 においては 8ビット+8ビット であり これは 日 本 の EUC と 正 確 に 同 じもので Windows/Mac で 採 用 されています 完 成 型 は 全 体 で 8836 文 字 を 表 現 できますが それをさらに 記 号 類 外 国 語 文 字 ハング ル 漢 字 というふうに 分 割 し その 結 果 ハングルは 2350 文 字 しか 存 在 できなくなりまし た これでは 古 語 などを 含 むことができませんが 完 成 型 はそれらを 切 り 捨 てました (1992 年 の 規 格 書 KSC 5601-1992 韓 国 政 府 規 格 に) 十 分 とは 言 えない 文 字 数 ですが 完 成 型 と して 北 朝 鮮 側 でも 採 用 しています Ⅱ-2-b KS 組 み 合 わせ 型 完 成 型 が 切 り 捨 てた 古 文 字 発 音 記 号 などまでも 表 そうというのがが KS 組 み 合 わせ 型 です 仕 組 みは ハングルの 初 中 終 の3つの 部 分 にそれぞれ5ビットを 与 えるというもので すが この 組 み 合 わせ 型 は KS 完 成 版 が 出 るまでのハングル 文 字 コード 規 格 乱 立 時 代 の 生 き 残 りです 韓 国 で 一 番 のシェアーを 誇 る アレアハングル というワープロソフト がこの 組 み 合 わせ 型 方 式 といえます ( 厳 密 には 独 自 の 異 なる 内 部 コードを 使 っています ) アレアハングル は 古 文 字 発 音 記 号 その 他 の 記 号 も 豊 富 でハングル 入 力 には 優 れてい て 日 本 のユーザーも 少 なくありません しかし たのアプリケーションとの 互 換 性 が 低 い ことと 日 本 語 との 混 植 には 適 さない 面 があります Ⅱ-3 Shift-KS:Korean Writer 文 字 コードとして KW コード という 言 い 方 をすることがありますが これは 高 電 社 の Korean Writer のハングルのことで Shift-JIS コード 系 の 単 なるフォント セットです な ので KW 形 式 と 言 った 方 が 正 しいでしょう ちょうど unix の 日 本 語 EUC と 韓 国 パソコンの KS とは 同 じ 領 域 にあるので 単 にフォ ント 切 り 替 で 相 互 混 在 できるのと 同 じように Shift-JIS のコード 系 に 韓 国 KS と 同 じフォ ントを 当 てはめて 行 くと Korean Writer になります つまり Shift-KS というわけです この KW テキストつまり Shift-KS テキストでは もちろん 韓 国 パソコンと 互 換 性 がありま せん 高 電 社 もそれは 承 知 しているので だから KW KS 変 換 ツールが 付 属 していま す 同 じような 仕 組 みのものでユニコテック 社 の すらすらハングル 入 力 があります こちら は CGS コード と 言 っていますが やはり Shift-JIS コード 系 のフォント セットなので CGS 4
形 式 と 言 うべきでしょう すらすら シリーズの 前 身 は Wink というソフトです KoreanWriter より 書 体 が 豊 富 なのが 特 徴 です Windows では KS コードと Jis コードとを 基 本 的 には 同 時 に 表 示 処 理 することが 出 来 ませ ん ハングル 組 版 を 行 うには 上 記 の 変 換 ツールを 使 って KS コードを Jis コードに 変 換 し て 組 まなければなりません * 文 字 コードに 関 しては 以 下 のサイトを 参 考 にしました 詳 しくはこちらをご 覧 下 さい http://home.att.ne.jp/yellow/han-lab/com/code1.html#code 付 録 :ハングル 文 字 コード 一 覧 Encoding Other Names Vendor/Standard Body Other Rosette Names CP10003 Macintosh Korean Microsoft & IBM CP10003 CP1361 Korean Johab (based on KSC 5861-1992) Microsoft & IBM CP1361 CP949 Microsoft & IBM CP949 EUC-KR KS_C_5861-1992 Unix EUC-KR, EUC-K ISO 2022-KR Johab KS_C_5601-1987 International or National Standard ISO-2022-KR International or National Standard Johab KoreanAutoDetect See KoreanAutodetect Rosette Autodetect KoreanAutoDetect KS_C_5601-1987 KS_C_5861-1992 ISO-2022-KR EUC-KR International or National Standard ISO-2022-KR International or National Standard KS_C_5861-1992 MacKorean Macintosh MacKorean 5
Ⅲ. ハングル 組 版 Ⅲ-1 組 版 規 則 Ⅲ-1-a 句 読 点 句 読 点 は 横 書 きは, と. 縦 書 きは と が 基 本 です 本 来, は 日 本 語 のように 多 用 しません 単 語 の 併 記 のときに 使 うくらいですが 最 近 は 日 本 語 のように 使 う 文 も 目 にするようになりました Ⅲ-1-b 分 かち 書 き: 基 本 は 半 角 スペース ハングルには 日 本 語 にない 分 かち 書 き があります 単 語 と 単 語 の 間 には 全 てスペース が 入 ります ( 会 社 名 などではスペースなしで 表 記 することもあります) 基 本 的 に 半 角 スペー スです この 分 かち 書 きのルールが 南 北 で 異 なります 韓 国 では 戦 後 たびたび 正 書 法 の 改 定 がなさ れ 分 かち 書 きのルールがその 都 度 変 更 になりました 今 は 1988 年 版 で 落 ち 着 いています が 分 かち 書 きが 増 えています 北 朝 鮮 の 方 が 分 かち 書 きが 少 ないです 度 々の 変 更 のためか ネイティブスピーカーでも 分 かち 書 きはよく 間 違 えます * 組 版 においての 分 かち 書 き の 留 意 点 日 本 語 と 同 じように 句 点 の 行 以 外 の 行 端 は 揃 えて 組 みますが 半 角 スペースが 行 末 に 来 る ときは ぶら 下 がり のようになって 見 えなくなります しかし 見 えなくても 分 かち 書 き されていることを 忘 れてはいけません うっかり 余 分 なスペースだと 思 って 削 除 してしま うと 分 かち 書 きの 誤 りになってしまいますので 入 力 編 集 過 程 では 十 分 気 をつけなけ ればなりません Ⅲ-1-c その 他 の 組 版 規 則 日 本 語 と 同 様 に 通 常 一 行 目 の 行 頭 は 一 文 字 下 げにします 禁 則 処 理 も 基 本 的 に 日 本 語 と 同 じです 約 物 は 使 い 方 が 多 少 違 います 引 用 符 : 韓 国 では 通 常 や 北 朝 鮮 では を 使 うことが 多 い タイトルや 論 文 名 : ( 韓 国 ) ( 北 朝 鮮 ) 書 籍 名 : ( 韓 国 ) ( 北 朝 鮮 ) 三 点 リーダー: 同 じ だが 韓 国 では と 下 付 にすることもある * 日 本 語 OS 環 境 でハングル DTP を 行 うとき KS 完 成 型 で 表 せない 古 文 字 発 音 記 号 をどの ように 解 決 するかがポイント 原 稿 データを 生 かすために WindowsDTP を 推 奨 するが いか にきれいに 作 字 して 補 うかによって 完 成 度 の 高 い 組 版 を 作 成 できるかが 決 まる 6
Ⅲ-2 日 本 語 との 混 植 Ⅲ-2-a 文 字 サイズ フォントを 合 わせる 明 朝 の 場 合 日 本 語 が 大 きく 見 えるので 指 定 よりハングルを 大 きくしなければならない 場 合 があります フォントは 日 本 語 と 類 似 フォントに 揃 えるが 明 朝 とゴシックでは 字 体 そのものが 異 な ってしまうものがあるので 初 心 者 向 けには 要 注 意 例 : 濯 陥 / 濯 陥 達 陥 / 達 陥 / 達 陥 伝 / 伝 / 伝 廃 越 / 廃 越 / 廃 越 (その 他 のフォントは 別 紙 フォントサンプル 参 照 ) Ⅲ-2-b 日 本 語 とハングルの 文 字 数 文 法 も 漢 字 語 も 日 本 語 と 類 似 している 部 分 が 多 いが 通 常 ハングルのほうが 日 本 語 より 文 字 数 が 多 い 口 語 体 はハングルが 短 くなる 場 合 が 多 い ( 別 紙 対 訳 参 照 ) Ⅲ-2-d ルビのルール 色 々 パッチムの 鼻 ク, 菱 ル, 姫 ム, 媛 プ は 小 さくする : 設 股 陥 [チャル モクタ](よく 食 べる) 濁 音 化 する 時 の 切 : ジャ または ヂャ 激 音 を ひらがなルビ にして 平 音 と 差 別 化 する 場 合 : 達 陥 [ちゃッタ]( 探 す) 濃 音 は 語 頭 に ッ をつけて 平 音 と 差 別 化 する 場 合 もある : 察 軒 [ッパ ルリ]( 早 く) 菊 陥 の 場 合 :[テッタ]または[トゥェッタ](できた) 校 の 場 合 :[モル]または[ムォル]( 何 を) 基 本 的 に 一 文 字 対 応 のルビが 望 ましいが 菊 の トゥェッ ように 一 文 字 に4 文 字 の ルビがつくこともあり 微 調 整 できれいに 仕 上 げるしかない Ⅲ-3 貨 幣 数 字 日 付 の 表 示 Ⅲ-3-a 貨 幣 :ウォン 漢 字 で 書 くと 雖 つまり 日 本 の 円 と 同 じです そのため お 互 いに 固 有 名 詞 として そ の 国 の 発 音 どおりにしています つまり 漢 字 は 同 じでも 据 ウォン と 円 エン になります 7
Ⅲ-3-b 数 字 : 日 本 語 と 同 じように 漢 数 詞 と 固 有 数 詞 がある 1 2 3 4 5 6 7 8 9 10 百 千 万 億 兆 漢 数 詞 : 析 戚 誌 紫 神 整 ( 建 ) 張 独 姥 淑 拷 探 幻 常 繕 固 有 数 詞 : 馬 蟹 却 実 掛 陥 叱 食 叱 析 咽 食 期 焼 肌 伸 Ⅲ-3-c 日 付 の 表 示 2003 年 8 月 4 日 は 分 かち 書 きして 書 く:2003 鰍 8 杉 4 析 1 日 2 日 3 日 4 日 5 日 6 日 7 日 8 日 9 日 10 日 漢 数 詞 : 析 析 戚 析 誌 析 紫 析 神 析 整 ( 建 ) 析 張 析 独 析 姥 析 淑 析 固 有 数 詞 : 馬 欠 戚 堂 紫 碑 蟹 碑 翫 歯 審 歯 戚 掘 食 球 掘 焼 斐 掘 伸 碑 15 日 20 日 100 日 漢 数 詞 : 淑 神 析 戚 淑 析 拷 析 固 有 数 詞 : 左 硯 什 巷 劾 拷 析 1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 漢 数 詞 : 析 杉 戚 杉 誌 杉 紫 杉 神 杉 政 ( 嫌 ) 杉 張 杉 独 杉 姥 杉 獣 杉 淑 析 杉 淑 戚 杉 正 月 / 舛 杉, 旧 正 月 / 姥 舛 Ⅲ-4 インデックス( 索 引 )の 作 り 方 Microsoft Word で 単 語 を 亜 蟹 陥 虞 (カナタラ) 順 に 並 べ 替 える 1 言 語 の 選 択 ツール その 他 の 校 正 ツール 言 語 の 選 択 韓 国 語 2 並 べ 替 え 罫 線 並 べ 替 え Microsoft Word では KS コードと KS-Jis のどちらでも 並 べ 替 えが 可 能 だった 8
Ⅲ-5 キーボードと 入 力 方 式 ハングル 入 力 方 式 は 以 下 の 3 通 りがあります キーボード は KoreanWriter のものです 基 本 的 に 共 通 ですが ローマ 字 方 式 は 若 干 異 なる ようです 2 ボル 式 にぼる しき 2[beol-sik]/[tu-beol-sik] ハングル 字 素 を 母 音 と 子 音 に 分 類 し 割 り 当 てるキーボード 配 列 キー 割 り 当 ての 数 が 少 なく 覚 えやすい 反 面 ミスタイプ 率 が 比 較 的 高 いといわれています 韓 国 のパソコンユーザーの 80% 以 上 が 利 用 しているとされています 3 ボル 式 さんぼる しき 3[beol-sik]/[se-beol-sik] ハングル 字 素 を 初 声 中 声 終 声 に 分 類 し 割 り 当 てるキーボード 配 列 ミスタイプが 少 なく キー 割 り 当 て 数 が 多 い 割 にはシフトキーを 押 す 頻 度 が 低 いとされていますが 3-89 3-90 最 終 字 板 といった 配 列 上 のバリエーションが 存 在 することに 注 意 が 必 要 です 現 時 点 では 3-90 が 最 も 多 く 使 われているようです 9
ローマ 字 入 力 日 本 語 入 力 では 圧 倒 的 に 多 いローマ 字 入 力 ですが 韓 国 ではほとんど 使 われていません ローマ 字 入 力 が 一 般 化 するためには (1)ローマ 字 入 力 が 便 利 だと 思 うほど 自 言 語 での 入 力 が 面 倒 る (2)アルファベットと 自 言 語 の 対 応 が 共 通 のものとして 広 く 認 識 されている といったこと が 必 要 でしょう 日 本 語 の 世 界 はこの 条 件 を 両 方 とも 満 たしています 他 方 韓 国 語 の 世 界 は すでにタイプラ イターでキーを 叩 いて 印 字 するということが 行 われていたことからいえば (1)の 条 件 には 当 ては まりません 加 えて 2ボル 式 が 開 発 されたことで 一 層 自 言 語 での 入 力 は 楽 になったわけです し また 自 言 語 とアルファベットの 規 則 的 対 応 ということでいうと 韓 国 語 は 対 応 が 曖 昧 です ルールが 頻 繁 に 変 わっり 決 まっても 勝 手 に 使 っていることが 少 なくありません こうしたことで 言 えば ハングルの 世 界 では 日 本 語 の 世 界 のように アルファベットを 介 した 入 力 が 便 利 であるという 認 識 は 成 り 立 ちにくいと 思 われます 10
第七回 多言語組版研究会 ハングル 参考資料 サンプル 1. ローマ字表記 発音記号の代わりとして使われることもある ① 母音 単母音 二重母音 ㅏ ㅓ ㅗ ㅜ ㅡ ㅣ ㅐ ㅔ ㅚ ㅟ a eo o u eu i ae e oe wi ㅑ ㅕ ㅛ ㅠ ㅒ ㅖ ㅘ ㅙ ya yeo yo ㅝ ㅞ ㅢ yu yae ye wa wae wo we ui ② 子音 破裂音 ㅂ ㅃ ㅍ g,k kk k d,t tt t b,p pp p ㅈ ㅉ ㅊ ㅅ ㅆ ㅎ j jj ch s ss h 2. 古文字サンプル 11 ㄴ ㅁ ㅇ n m ng 音 ㅌ 流 ㄸ 音 ㄷ 鼻 ㅋ 摩擦音 破擦音 ㄲ ㄱ ㄹ r,l
NHK テレビハングル 講 座 タイトル 大 韓 民 国 の 看 板 朝 鮮 民 主 主 義 人 民 共 和 国 の 印 刷 物 タイトル 朝 鮮 日 報 の 記 事 (NHK ハングル 講 座 テキスト 2002.4 月 号 65 頁 から)からも 分 かるように 韓 国 で は 漢 字 を 使 う 方 向 に 行 きはじめている 12