Microsoft Word - mltp2.docx



Similar documents
TIPS - 棚 割 りを 開 始 するまで Liteを 起 動 し 企 業 情 報 の 追 加 を 行 い 棚 割 を 行 う 企 業 の 追 加 をして 下 さい 企 業 情 報 の 追 加 時 に エラーメッセージが 表 示 された 場 合 別 途 TIPS トラブルが 発 生 した 場 合

1. アクセスする 2. 簡 易 検 索 画 面 (fig. 1) アクセスすると 最 初 に 出 る 画 面 です 検 索 語 入 力 ボックスにキーワードを 入 力 して 論 文 検 索 ボタンをクリックし ます 3. ボックス 下 部 のチェック 項

5-2 一 般 ユーザー 用 :メール 2 送 信 者 のリンクをクリックすると 受 信 メールの 内 容 を 見 ることができます 受 信 メール 内 容 画 面 項 目 送 信 者 宛 先 CC 本 文 (テキスト) 本 文 (HTML) メールアドレスのリンクをクリックするとアドレス 帳 へ

メール 受 信 画 面 のレイアウトを 変 更 することができます ここでは 初 期 設 定 のレイアウトで 表 示 されているボタ ンやマークについて 解 説 します メール 一 覧 画 面 には 受 信 したメールが 一 覧 表 示 されます メール 受 信 タブをクリックすると 受 信 箱 フ

Microsoft Word - 311Tools_END

5 振 込 依 頼 書 の 作 成 方 法 ()ツールの 起 動 コピーまたはダウンロードしたツールをダブルクリックして 開 いてください (ツール 起 動 の 際 マクロを 有 効 にしてください ) ダブルクリック 後 以 下 のメッセージが 出 力 されますので 読 み 取 り 専 用 ボタン

PowerPoint プレゼンテーション

医 療 費 自 己 負 担 額 支 払 明 細 書 入 力 シート - 目 次 - < 第 1 章 > 共 通 事 項 説 明 医 療 費 自 己 負 担 額 支 払 明 細 書 入 力 シート 目 次 1.1 本 システムの 注 意 点 入 力 項 目 について 基 本 情

目 次 1. 大 学 情 報 データベースシステムの 使 用 方 法 について EXCEL 一 括 登 録 EXCEL ダウンロード 検 索 条 件 の 指 定 プレビュー EXCEL ダウンロード(データ 抽 出 あ

Ver 改 訂 日 付 改 訂 内 容 1

治 験 実 施 管 理 システム NMGCP 向 け Excel 形 式 プロトコール 作 成 手 順 書 V4.0.3 対 応 版 第 1 版 株 式 会 社 富 士 通 アドバンストエンジニアリング All Rights Reserved,Copyright 株 式 会 社 富 士 通 アドバン

文科省様式3-2集計オプションマニュアル

1.2. ご 利 用 環 境 推 奨 ブラウザ Internet Explorer Google Chrome(バージョン 32 時 点 で 動 作 確 認 済 み) Mozilla Firefox(バージョン 26 時 点 で 動 作 確 認 済 み) Safari 7

目 次 1. Web メールのご 利 用 について Web メール 画 面 のフロー 図 Web メールへのアクセス ログイン 画 面 ログイン 後 (メール 一 覧 画 面 ) 画 面 共 通 項 目

<4D F736F F D C97F195CF8AB DEC90E096BE8F912091E6312E313294C52E646F63>

2

入 札 参 加 資 格 申 請 システム 操 作 マニュアル 入 札 参 加 資 格 の 資 格 有 効 ( 変 更 ) 日 を 迎 えると 追 加 届 の 登 録 ができるようになります ( 入 札 参 加 資 格 申 請 の 定 時 受 付 では いずれかの 申 請 先 団 体 から 入 札 参

目 次 JAVIS Appli の 基 本 機 能... 3 JAVIS Appli について... 3 音 声 確 認 機 能 JAVIS Appli( 有 償 版 )の 機 能... 4 音 声 で 読 みの 確 認 をする... 4 辞 書 機 能... 5 単 語 を 登 録 する... 5

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 15ページに 汎 用 データ 受 入 に 関 する よくあるお 問 い 合 わせをご 紹 介 しています Step1 (

目 次 1. 積 算 内 訳 書 に 関 する 留 意 事 項 1 ページ 2. 積 算 内 訳 書 のダウンロード 3 ページ 3. 積 算 内 訳 書 の 作 成 (Excel 2003の 場 合 ) 6 ページ 4. 積 算 内 訳 書 の 作 成 (Excel 2007の 場 合 ) 13

1

PowerPoint プレゼンテーション

160 アプリケーションとデータ 管 理 8.1 Microsoft Office Mobile Office Mobileでは 以 下 の4つのアプリケーションを 使 用 して Microsoft 文 書 を 作 成 編 集 閲 覧 することができます Word Mobile は Microsof

技術報告会原稿フォーマット

Microsoft Word - 第3章.doc

PowerPoint プレゼンテーション

Vol.7

Microsoft Word - 03accessデータベース演習レジメ.doc

かんたんQR

Mac OS Xでの利用設定 マニュアル

あいち電子調達共同システム

<4D F736F F D B68F918DEC90AC89898F4B899E977095D2816A2E646F63>

Microsoft PowerPoint - 雇保氏名変更.pptx

(Microsoft PowerPoint - Ver12\203o\201[\203W\203\207\203\223\203A\203b\203v\216\221\227\277.ppt)

縦 計 横 計 をSUM 関 数 で 一 度 に 計 算 する 縦 横 の 合 計 を 表 示 するセルが 計 算 対 象 となる セルと 隣 接 している 場 合 は 一 度 に 合 計 を 求 め ることができます 1 計 算 対 象 となるセル 範 囲 と 合 計 を 表 示 する セル 範

Microsoft PowerPoint _リビジョンアップ案内_最終.pptx

購買ポータルサイトyOASIS簡易説明書 b

(3) 下 記 画 面 が 表 示 されます 参 照 ボタンを 押 下 すると 図 5.1-4フォルダ 指 定 画 面 が 表 示 されるので 保 存 先 を 指 定 し OKボタン を 押 下 します 展 開 ボタンを 押 下 します 図 ファイルの 展 開 先 ( 保 存 場 所 )

名 刺 データ 登 録 最 初 の 名 刺 の 登 録 の 際 には ボタンを 押 します 名 刺 登 録 画 面 が 開 きますので ボタンを 押 すと 新 規 の 登 録 画 面 が 現 れます 各 項 目 に 名 刺 データを 入 力 していきます グループは 事 前 に 登 録 したてあるも

Microsoft Word - tb01.doc

C.1 共 有 フォルダ 接 続 操 作 の 概 要 アクセスが 許 可 されている 研 究 データ 交 換 システムの 個 人 用 共 有 フォルダまたは メーリングリストの 共 有 フォルダに 接 続 して フォルダを 作 成 したり ファイル をアップロードまたはダウンロードしたりすることがで

2 課 題 管 理 ( 科 学 研 究 費 補 助 金 ) 画 面 が 表 示 されます 補 助 事 業 期 間 終 了 後 欄 の[ 入 力 ] をクリックします [ 入 力 ]ボタンが 表 示 されていない 場 合 には 所 属 する 研 究 機 関 の 事 務 局 等 へお 問 い 合 わせく

一 括 登 録 方 法 一 括 登 録 をするには 予 め 専 用 の CSV ファイルを 作 成 する 必 要 があります 普 段 エクセルファイルで 管 理 をされている 方 は, 以 下 の 3 列 のみのデータとなるようにデータを 加 工 して CSV ファイルとして 保 存 して 下 さ

<4D F736F F D2090C389AA8CA72D92F18F6F2D D F ED28CFC82AF91808DEC837D836A B E838B A815B816A2E646F6378>

(3) 履 歴 種 別 設 定 で 表 示 する 履 歴 の 種 別 を 選 択 できます チェックを 入 れた 種 別 の 履 歴 が (1) に 表 示 されます (4) 表 示 日 設 定 で 履 歴 を 表 示 する 日 付 を 指 定 します 画 面 を 開 いたときは 現 在 の 日 付

エ CarotDAV が 起 動 すると 次 のようなウィンドウが 表 示 されます メニューバーにある File から New Connection の WebDAV を 選 択 します オ 次 のような 設 定 画 面 が 表 示 されたら General タブでネットワークアドレスなどを 設

1-1 一覧画面からの印刷

年齢別人数計算ツールマニュアル

G01 メニュー 画 面 の 説 明 1 前 年 度 のデータ または 会 員 管 理 DBからの 会 員 情 報 データをインポートする [ 前 年 度 一 括 申 告 データインポート] ソフト1の 講 習 会 等 名 簿 ソフトデータにデータ 付 加 するた めに 日 本 医 師 会 より 配

PC 移 行 は 以 下 の 流 れで 行 います 次 ページ 以 降 に 各 手 順 を 記 載 しますのでご 確 認 ください ( をクリックすると 該 当 の 説 明 にジャンプします ) 移 行 元 のPCでの 作 業 Step1 移 行 するデータをバックアップする (3ページ) [データ

データコピーとは データコピーは 古 い NAS のデータを 新 しい HDL-Z シリーズに 簡 単 にコピーできます 環 境 例 本 製 品 は 以 下 の 用 途 の 際 に 最 適 です 古 い HDL-Z シリーズから 新 しい HDL-Z シリーズへのコピー 古 い HDL-Z シリーズ

2016 年 度 情 報 リテラシー 三 科 目 合 計 の 算 出 関 数 を 用 いて 各 教 科 の 平 均 点 と 最 高 点 を 求 めることにする この2つの 計 算 は [ホーム]タブのコマ ンドにも 用 意 されているが 今 回 は 関 数 として 作 成 する まず 表 に 三 科

設定フロー ★印は必須の設定です

電子納品チェックシステム利用マニュアル

Microsoft Word - 操作マニュアル(石油コンビナート_オフラインソフト編)_v0.2.doc

Acrobat Reader DCのインストール・操作方法―Windows 10/8.1/7

Microsoft Word - アンケート集計マニュアル.docx

Ⅰ 校 外 における 研 修 の 留 意 点 1 校 外 における 研 修 のコマ 数 の 考 え ア) 午 前 午 後 の 講 座 は 0.5 日 (0.5 コマ) イ) 全 日 の 講 座 は 1.0 日 (1.0 コマ) 2 校 外 における 研 修 として 選 択 できない 講 座 研 修

以 下 に 手 順 の 流 れを 記 載 します 3ページ 以 降 で 各 項 目 の 手 順 を 説 明 します ( をクリックすると 該 当 ページにジャンプします ) また 4ページに 汎 用 データ 受 入 に 関 するよくあるお 問 い 合 わせをご 紹 介 しています Step (3ペー


スライド 1

インストーラーの 動 作 ここでは アドバンスト 多 目 的 会 員 購 読 者 システム を 例 に 説 明 しますが 他 の 製 品 でも タイトルが 異 なる 以 外 は 同 様 の 順 序 で 操 作 します 次 へ ボタンを 押 します 使 用 契 約 許 諾 書 を 表 示 します 同

情報処理技能検定試験 表計算2級 手順書

< 現 在 の 我 が 国 D&O 保 険 の 基 本 的 な 設 計 (イメージ)> < 一 般 的 な 補 償 の 範 囲 の 概 要 > 請 求 の 形 態 会 社 の 役 員 会 社 による 請 求 に 対 する 損 免 責 事 由 の 場 合 に 害 賠 償 請 求 は 補 償 されず(

目 次 電 子 申 請 を 使 用 した 申 請 の 流 れ 1ページ 申 請 書 ( 概 算 保 険 料 申 告 書 )の 作 成 2ページ 作 成 した 申 請 書 の 送 信 31ページ 状 況 照 会 電 子 納 付 を 行 う 62ページ 返 送 書 類 の 取 得 75ページ お 問 い

目 次 1 インストール 手 順 プログラム データファイルのインストール Microsoft Access2013Runtime SP1(32bit) 版 のインストール 基 本 操 作 ログイン メニュー...

Microsoft Word - word_05.docx

(Microsoft Word - Excel\211\236\227p2\217\315.docx)

Q3 どのようなデータを 見 ることができるのですか A3 分 析 ツール を 実 行 するとマクロが 作 動 し 図 1のような 分 析 ツールトップ 画 面 が 表 示 されます ( 例 : 佐 賀 市 立 佐 賀 小 学 校 ) 今 回 新 たに 追 加 された 分 析 ツールトップ 画 面

目 次 1.はじめに 1-1. はじめに 2. 操 作 2-1. 概 要 2-2. 操 作 方 法 ( 調 査 依 頼 の 確 認 ) 2-3. 操 作 方 法 ( 回 答 登 録 ) 2-4. 操 作 方 法 (ワークシート 出 力 ) 2-5. 操 作 方 法 (ワークシート 取 込 ) 3.

目 次 1.はじめに 書 式 の 説 明 表 紙 スケジュール 組 入 れ 基 準 併 用 禁 止 薬 併 用 注 意 薬 同 種 同 効 薬 医 師 モニタリング..

< 目 次 > 8. 雇 用 保 険 高 年 齢 雇 用 継 続 給 付 27 ( 育 児 休 業 給 付 介 護 休 業 給 付 ) 8.1 高 年 齢 雇 用 継 続 給 付 画 面 のマイナンバー 設 定 高 年 齢 雇 用 継 続 給 付 の 電 子 申 請 高

01_07_01 データのインポート_エクスポート_1

2 研 究 資 源 共 通 化 統 合 検 索 システムソフトウェア 利 用 者 用 マニュアル(ゲートウェイシステム) 目 次 1. はじめに 主 な 利 用 の 流 れ 検 索 検 索 画 面 検 索 画 面 の 設 定...

スライド 1

2016 年 度 情 報 リテラシー 次 に Excel のメニューから[ 挿 入 ]タブをクリックし 表 示 されたメニュー 内 の[グラフ]にある[ 折 れ 線 グラフ]のボタンをクリックする するとサブメニューが 表 示 されるので 左 上 の[ 折 れ 線 ]を 選 択 する [ 挿 入 ]

論文誌用MS-Wordテンプレートファイル

目 次 遺 失 物 管 理 プログラム 利 用 者 マニュアル 1. 動 作 条 件 遺 失 物 管 理 プログラムのインストール 運 用 の 流 れ 起 動 方 法 操 作 方 法 について 基 本 的 な 操

1.1 方 法 1 PC の 操 作 による 暗 号 化 1.Windows PC を 起 動 し スタート 画 面 を 表 示 します 2. 画 面 右 端 から 左 方 へスワイプし 設 定 をタップします - 2 -

Microsoft Word - RuLIS2操作マニュアル_地図を見る m.docx

勤 怠 項 目 6~10の 追 加 < 概 要 > 勤 怠 項 目 6~10を 追 加 しました それに 伴 い 下 記 の 箇 所 が 変 更 になりました ページ 場 所 誤 25 給 与 奉 行 への テキスト 書 出 順 勤 怠 項 目 1~ 勤 怠 項 目 5 27 内 容 勤 怠 項 目

4 応 募 者 向 けメニュー 画 面 が 表 示 されます 応 募 者 向 けメニュー 画 面 で [ 交 付 内 定 時 の 手 続 を 行 う] [ 交 付 決 定 後 の 手 続 を 行 う]をクリックします 10

研究者情報データベース

MapDK3のインストール

Microsoft Word - 修正_作業手順書.docx

<4D F736F F D2090BF8B818AC7979D8B40945C91808DEC837D836A B2E646F63>

2 Web ページの 文 字 サイズを 変 更 する Microsoft Internet Explorer 8 では 文 字 のサイズを 変 更 して Web ページをより 見 やすくする ことができます 文 字 のサイズを 変 更 する 場 合 は 画 像 やコントロールは 元 のサイズが 維

file:///L|/kajo/_RESOURCE/index.html

事前チェック提出用現況報告書作成ツール入力マニュアル(法人用)

ご 利 用 の 前 に 手 順 初 回 ご 利 用 時 に 必 ずご 確 認 ください ご 利 用 の 前 に (ご 利 用 環 境 の 確 認 ) P アクセス 方 法 (IMAGE WORKSサイトへアクセス) P 初 期 設 定 (JREのインストール) P

[1]メッセージ

事 前 確 認 2 1 事 前 確 認 1-1.ノート/メモパッドを 取 り 付 ける ノートブックタイプ 1 本 体 左 側 のはくりフィルムをはがす 2ノートの 表 紙 を 透 明 ポケットに 挿 入 する 3 表 紙 を 本 体 のへこみに 合 わせ 貼 り 付 ける 本 体

Microsoft Word _e-Gov提出マニュアル(化審法3条).doc

PATENTBOY/Netバージョンアップ説明書(Ver.1.92)

TeleOffice 3.0 Lync 2 TO

もくじ 0.はじめに 1 1. 用 紙 をスキャナで 用 紙 を 読 み 込 む 1 2. 書 式 定 義 マークした 部 分 を 個 々のデータとして 取 り 込 む 場 合 ( 複 数 回 答 対 応 ) マークした 部 分 をグループ 化 して 取 り 込 む 場 合

賞 状 を 作 ってみよう 1- 賞 状 フォルダを 使 用 賞 状 のテンプレートから ワードで 賞 状 の 文 章 を 作 成 します あらかじめ EXCEL で 作 成 した 受 賞 者 の 名 簿 から 学 年 クラス 名 前 を 入 れて 印 刷 します 1Excel の 賞 状 名 簿.

(Microsoft Word - Word\211\236\227p8\217\315.docx)

SoftBank 202F 取扱説明書

目 次 1 ログインする 1 2 研 修 情 報 を 登 録 する 2 step1 登 録 フォームに 入 力 する 2 step2 プレビューで 入 力 内 容 を 確 認 する 18 step3 下 書 き 保 存 する 20 step4 登 録 する 21 step5 管 理 者 による 承

Transcription:

MLTPについて MLTP(MultiLingual Text Processor)は 個 人 研 究 のために 作 成 した 簡 易 ツールで ある 統 計 的 テキスト 解 析 の 勉 強 を 主 な 目 的 とした 方 々のため 無 償 で 本 ツールを 公 開 する 需 要 に 応 じて オープンソース 形 式 でバージョンアップを 行 うことも 念 頭 に 入 れている 使 用 者 は 次 の 条 件 の 全 てを 受 諾 したものと 看 做 する 1. 法 律 上 の 請 求 の 原 因 の 種 類 を 問 わず 本 ソフトの 使 用 によるいかなる 損 害 に 関 し ても 一 切 の 責 任 を 負 わない 2. 営 利 目 的 の 個 人 法 人 団 体 等 が 利 益 を 得 るためのいかなる 直 接 間 接 の 使 用 も 禁 止 する 本 ツールの 主 な 機 能 は 複 数 のテキスト( 日 本 語 中 国 語 韓 国 語 英 語 )について テキスト 単 位 に 文 字 単 語 品 詞 などの 項 目 について 集 計 し 結 果 を 表 形 式 で 出 力 する MLTP は Java 言 語 で 書 かれており jar 形 式 でパッケージ 化 している MLTP のダウンロード(Windows のみで 検 証 されている) (1) 起 動 と 終 了 Zip 形 式 で 圧 縮 されている ダウンロードして 解 答 するとフォルダの 中 に 次 のような 3つのファイルと1つのフォルダがある 図 1 フォルダの 中 の 画 面 コピー MLTP のツールの 本 体 は mltp.jar である マウスで 左 クリックすると MLTP が 起 動 さ れる その 画 面 コピーを 次 に 示 す フォルダ sampl の 中 にはテキストサンプルが 用 意 されている 図 2 MLTP の 起 動 画 面

本 ツールは 中 国 語 韓 国 語 Windows 環 境 も 念 頭 に 入 れているので GUI 上 の 表 記 は 英 語 の 文 字 列 になっている 本 ツールが 扱 う 日 本 語 テキストのデータ 形 式 は 大 きく 分 けると 次 の2 種 類 である (1) タグを 考 慮 しない 一 般 の 電 子 テキスト(これを Plain Text とよぶ) (2) 言 語 の 何 らかの 単 位 にタグ 情 報 を 入 れたテキスト(これを Tagged Text とよぶ) 図 3 PlanText の 例 図 4 タグ 付 き(Tagged Text)の 例 タグは 日 本 語 全 角 の 山 括 弧 で 区 切 る 山 括 弧 の 中 は 自 由 に 記 述 することができる 形 態 素 解 析 ソフト JUMAN や ChaSen の 結 果 は MLTP ツールを 用 いて 上 記 のタグ 付 きの 形 式 に 変 換 することができる コマンドプロンプトから 起 動 することも 可 能 である テキストの 量 が 多 いときには コ マンドプロンプト 上 で 使 用 するメモリを 指 定 する 必 要 がある mltp.jar が 置 かれている フォルダにアクセスし 次 のようにコマンドを 実 行 する > java Xmx500m -jar mltp.jar コマンドの 中 の -Xmx500m は 使 用 するメモリを 500MB に 指 定 するオプションであ る ファイルの 量 が 多 くない 場 合 は -Xmx500m を 省 略 してもよい デフォルトは 256MB が 指 定 されている MLTP の 終 了 は file exit をクリックする 方 法 と 画 面 の 右 上 の 閉 じるボタン の

部 分 をクリックする 方 法 がある (2) ファイルの 読 み 込 み MLTP では 一 般 のテキストファイル(Plain Text)と 品 詞 などのタグが 付 いているファ イル(Tagged Text)についてデータの 集 計 を 行 う デフォルトは Plain Text になっている ファイルの 形 式 は txt 形 式 のみである ファイルの 操 作 を 行 うためには まず 操 作 画 面 の File List タブをクリックする 次 にボタン[Add New Files ] をクリックし ファイルが 置 かれているドライブとフォルダを 指 定 し 解 析 するファイルを 選 択 する 選 択 が 終 わったら [ 開 く]ボタンを 押 すと 選 択 されたファイルが 読 み 込 まれる このように 他 のフォルダのファイルを 読 み 込 み 付 け 加 えることが 可 能 である 図 5 ファイルを 読 み 込 む 画 面 図 6 ファイルが 読 み 込 まれた 画 面

ファイルの 読 み 込 み 作 業 が 終 わったら 操 作 画 面 の [Confirm ] ボタンを 押 し 確 認 作 業 を 行 うことが 必 要 である (3) タブと 機 能 Summary タブ: Summary タブは 読 み 込 んだファイルごとのサイズ 漢 字 の 数 平 仮 名 の 数 片 仮 名 の 数 文 の 数 などのデータを 集 計 する 集 計 結 果 は タブで 区 切 られた 形 式 とカンマで 区 切 られた 形 式 から 選 択 できる 結 果 の 保 存 は Output File の 窓 でフォルダを 指 定 し さらにファイル 名 を 付 け[Save ]ボタンを 押 す n-gram タブ: n-gram タブをクリックすると 図 7に 示 す 操 作 画 面 が 開 かれる n-gram のタイプおよび 出 力 ファイルの 形 式 などは 操 作 画 面 の 右 上 から 順 番 に 行 う まず n-gram のタイプを Ngram Type の 窓 で 指 定 する Unigram から Six-gram まで 集 計 可 能 である 次 に Cutoff 窓 で 値 を 指 定 する この 値 は 出 現 度 数 が 非 常 に 少 な い 項 目 をまとめるための 閾 値 である 例 えば Cutoff 値 を 100 にすると 全 てのテキストにおける 総 度 数 が 100 未 満 である 項 目 は OTHER という 項 目 にまとまる データ 表 のサイズのコントロールに 有 効 であ る 図 7 n-gram タブと 集 計 の 画 面 出 力 データの 形 式 は タブ 区 切 りとカンマ 区 切 りが 選 択 できる 出 力 データの 行 をテ

キストにするときには[in row] 列 をテキストにするには[in column]を 指 定 する 指 定 を 終 えたら [Processing ] ボタンを 押 すと 集 計 が 始 まる 集 計 にかかる 時 間 は 用 いたテキストの 量 と 集 計 する n-gram のタイプに 依 存 する 図 8 のメッセージ 画 面 が 現 れると 集 計 が 成 功 している [ 了 解 ]ボタンを 押 して [Processing Success] 画 面 を 閉 じ 結 果 を 保 存 する 作 業 に 進 む データ 解 析 は デー タ 解 析 の 専 用 ソフトを 用 いることを 前 提 としている 図 8 処 理 結 果 メッセージ Length タブ: Length タブでは 単 語 の 長 さ 文 の 長 さを 集 計 する 品 詞 タグが 付 いていないテキストの 場 合 は 文 の 長 さを 集 計 することができる 文 の 長 さを 計 るとき に 何 文 字 を1つの 項 目 にするかは 自 由 に 設 定 できる 図 9 に5 文 字 を1つの 単 位 と した 文 の 長 さの 分 布 を 求 める 画 面 コピーを 示 す 図 9 文 の 長 さの 分 布 を 求 める 画 面 Mark タブ: Mark タブでは 個 別 の 文 字 やマークを 指 定 し その 前 の 文 字 あ

るいはその 後 の 文 字 に 限 定 した bigram データを 集 計 する 図 10 に 読 点 がどの 文 字 の 後 に 打 たれているかに 関 して 集 計 した Mark タブの 画 面 コピーを 示 す 図 10 Mark タブの 画 面 KWIC タブ: KWIC (クウィック Keyword in Context)タブは 指 定 した 文 字 列 を 検 索 し その 前 後 の 一 定 の 長 さの 文 字 列 を 切 り 取 り 出 力 する テキストサンプルを 読 み 込 み 先 生 をキーワードとし その 前 後 10 文 字 ( 全 角 )を 切 り 取 った 画 面 コピー を 図 11 に 示 す 検 索 結 果 の 表 頭 の Left あるいは Right をマウスで 左 クリックする と 三 角 マークが 現 れる 三 角 マークをクリックすると 結 果 を 昇 順 降 順 にソートする 検 索 結 果 は 保 存 して Excel などに 読 み 込 んで 用 いることが 可 能 である 図 11 KWIC の 画 面

Word List タブ: Word List タブは 単 語 リストを 作 成 し 各 テキストにおける そ の 単 語 の 度 数 を 集 計 する 単 語 リストでは 論 理 演 算 が 用 いられる この 機 能 は 見 かけ 上 異 なる 単 語 を1つのグループにしたいときに 有 効 である Tools タブ: Tools タブには 全 てのテキストについて 文 字 列 の 置 換 JUMAN と 茶 筌 の 形 態 素 解 析 結 果 を MLTP に 用 いる 形 式 に 変 換 する 機 能 文 をランダムサンプ リングするなどの 機 能 を 備 えている 処 理 した 結 果 は 指 定 したフォルダの 中 に 自 動 的 に 元 のファイル 名 で 保 存 される (4) タグ 付 きデータの 集 計 MLTP では 次 に 示 すタグ 付 き txt 形 式 ファイルを 前 提 としている だから< 接 続 詞 > < 読 点 > 高 松 藩 < 人 名 >は< 副 助 詞 > < 読 点 > 徳 川 宗 家 < 人 名 >に< 格 助 詞 >とって< 動 詞 >は< 副 助 詞 > 御 三 家 < 普 通 名 詞 >に< 格 助 詞 > 次 ぐ< 動 詞 > 親 しい< 形 容 詞 > 間 柄 < 普 通 名 詞 >である< 判 定 詞 > < 句 点 > 単 語 文 節 の 後 に 付 けるタグは 全 角 山 括 弧 <>で 囲 む MLTP の Tools タブに は JUMAN 茶 筌 の 形 態 素 解 析 結 果 を 上 記 の 形 式 に 変 換 する 機 能 を 備 えている た だし JUMAN は 図 12 茶 筌 は 図 13 に 示 すようなフォーマットの txt 形 式 ファイルを 前 提 としている 図 12 MLTP で 用 いる JUMAN のフォーマット 図 13 MLTP が 用 いる 茶 筅 のフォーマット

JUMAN 茶 筌 の 出 力 結 果 を MLTP に 用 いる 形 式 に 変 換 する 手 順 を 次 に 示 す MLTP のメニュー Data Format から Targged Text を 指 定 する File List タブから JUMAN 茶 筌 の 形 態 素 解 析 結 果 のファイルを 読 み 込 む Tools タブをクリックし アクティブにする( 図 11 を 参 照 ) Tools タブには 2 つの サブタブ Format Converter と Replacement がある 図 14 Tagged Text の Tools タブの 画 面 サブタブ Format Converter をアクティブにし 形 態 素 解 析 ソフトの 種 類 (Chasen Format, Juman Format)を 指 定 し [Make Replacement List ] ボタンを 押 すと 図 15(a)の 品 詞 選 択 ダイアログボックスが 返 される [Select All ] ボタンを 押 すと 図 15(b)のように 全 ての 品 詞 タグの 前 にチェック 記 号 が 付 けられる 確 認 ボタン [Confirm ]を 押 すと 図 16 のような 結 果 が 返 される 図 15 品 詞 選 択 のダイアログボックス (a) (b)

図 16 品 詞 のタグ 形 式 の 変 換 画 面 形 態 素 解 析 の 品 詞 情 報 は 図 13 の 左 側 に 詳 細 の 品 詞 情 報 と 略 した 品 詞 情 報 を 縦 棒 で 区 切 り 返 す MLTP に 用 いる 品 詞 の 表 記 は この 窓 上 で 縦 棒 の 右 の 文 字 列 を 自 由 に 修 正 入 力 する 例 えば 品 詞 助 詞 - 副 助 詞 / 並 立 助 詞 / 終 助 詞 を 副 並 終 助 詞 にしたいときは 次 のように 記 述 する 助 詞 - 副 助 詞 / 並 立 助 詞 / 終 助 詞 副 助 詞 品 詞 タグを 修 正 した 画 面 コピーを 図 17 に 示 す この 品 詞 タグの 表 記 は 後 に 用 い るため [Save Replacement List ]ボタンを 用 いて 保 存 することが 可 能 である 図 17 品 詞 タグの 表 記 指 定 画 面

図 14 の 状 態 のままで [POS Replacing ] ボタンを 押 すと MLTP で 使 用 可 能 な タグ 付 き txt ファイルが c:\temp の 中 に 保 存 される ファイル 名 は 読 み 込 んだファ イルの 名 前 と 同 じになる ファイルの 保 存 フォルダは Output Path の 窓 で 指 定 する Java とは Java は 一 種 のプログラム 言 語 である Java で 開 発 されたソフトウェアは 特 定 の OS やマイクロプロセッサに 依 存 することなく 基 本 的 にはどのようなプラットフォームでも 動 作 する Java 言 語 は JAVA の 無 料 ダウンロード サイトからダウンロード インスト ールすることができる Jar とは JAR (JavaARchive)は 実 行 可 能 な Java アーカイブである Java では JAR (JavaARchive) という 圧 縮 形 式 で 複 数 のプログラムファイルをパッケージ 化 すること ができる 実 行 可 能 なパッケージとして 作 成 した***.jar ファイルは JRE(Java Runtime Environment) がインストールされている 環 境 であれば ***.jar をクリックす るだけでパッケージが 起 動 する ***.jar は 一 種 の 圧 縮 のファイルであるので 解 凍 す ることもできる したがって 圧 縮 形 式 jar を 解 凍 するソフトがインストールされている 環 境 の 場 合 は ***.jar をクリックすると ***.jar が 起 動 せず 解 凍 される 場 合 がある