北海道教育大学紀要 ( 人文科学 社会科学編 ) 第 66 巻第 1 号 平成 27 年 8 月 Journal of Hokkaido University of Education (Humanities and Social Sciences)Vol. 66, No.1 August, 201

Size: px
Start display at page:

Download "北海道教育大学紀要 ( 人文科学 社会科学編 ) 第 66 巻第 1 号 平成 27 年 8 月 Journal of Hokkaido University of Education (Humanities and Social Sciences)Vol. 66, No.1 August, 201"

Transcription

1 Title BCCWJ の品詞情報の解析精度について : 特に接続詞に注目して Author(s) 馬場, 俊臣 Citation 北海道教育大学紀要. 人文科学 社会科学編, 66(1): Issue Date URL Rights Hokkaido University of Education

2 北海道教育大学紀要 ( 人文科学 社会科学編 ) 第 66 巻第 1 号 平成 27 年 8 月 Journal of Hokkaido University of Education (Humanities and Social Sciences)Vol. 66, No.1 August, 2015 BCCWJ の品詞情報の解析精度について 特に接続詞に注目して 馬場俊臣 北海道教育大学札幌校日本語学研究室 On the Precision of the POS Information: Focusing on the Conjunctions in the BCCWJ BABA Toshiomi Department of Japanese Linguistics, Sapporo Campus, Hokkaido University of Education 概 要 接続詞研究においてBCCWJの品詞情報を利用する際の留意点を示すために,BCCWJで 接続詞 の品詞情報が付与された語 ( 長単位 ) の解析精度 ( 適合率 ) の調査を行い,(1) 接続詞 の使用頻度上位 20 語の適合率は63.0%~100.0% の範囲にあり特に で 唯 又 の適合率が低いこと,(2) レジスター別の適合率は 又 は 特定目的 ブログ 42.4% が, で は 特定目的 国会会議録 44.4%, 特定目的 知恵袋 46.0% が特に低いこと,(3) 誤判定の起こり易い環境として, 直前 直後 1 文字の組み合わせや文頭部分の複合辞や連語の誤解析などが関わる可能性があること,(4) 適合率に基づいて検索結果を補正することにより調査結果の信頼性を増すことができることなどを明らかにした BCCWJの 接続詞 の品詞情報を利用する際には, 解析精度が特に低い語及びレジスターがあることに十分留意する必要がある 1. はじめに 現代日本語書き言葉均衡コーパス (BCCWJ) を利用した接続詞研究の問題点と可能性に関する基礎的研究の一環として, 本稿では,BCCWJの接続詞に関する品詞情報の信頼性を見るために品詞情報 接続詞 1 の解析精度に関する調査を行い, その結果に基づいて, 品詞情報を利用する際の留意点を示す BCCWJの解析精度は, 長単位 短単位とも, データ全体に対して人手修正を行ったコアデータは99% 以 1 品詞情報として 接続詞 が付与されていることを, 以下 品詞情報 接続詞 又は単に括弧を付けて 接続詞 と略記する 他の品詞についても同様である 13

3 馬場俊臣 上, データの一部に対して人手修正を行ったコアデータ以外のデータは98% 以上 ( 小椋, 冨士池 (2011)) とされるが, 品詞によって解析精度は若干異なると予想される また, 同じく接続詞であっても語により解析精度が異なると予想される BCCWJを利用した重要な研究の一つに, 品詞比率に基づいた文章 文体研究がある 2 こうした巨視的な研究では, 品詞の違いによる解析精度の若干の異なりは, 分析結果に殆ど影響を与えず何ら問題は生じない しかし, 例えば特定の品詞に限定して, その品詞に属するいくつかの語 ( ないし語群 ) の使用頻度や使用比率を問題にする場合は対象とする語の解析精度の違いが分析結果に影響を及ぼす可能性がある 特に接続詞は, 属する語の種類 ( 異なり語 ) が少なく, 一つ一つの語の解析精度の違いが場合によっては分析結果に大きな影響を及ぼす恐れがある BCCWJを利用する際の基本としては, 利用マニュアル 3 や小木曽 (2014) に示されているように 解析誤り 形態素解析の弱点 があることを前提として, 研究目的 研究対象に応じて人手による点検が必要になる こうした点検を行うことによって, 語による解析精度の違いの問題を避けることができる しかし, 検索結果をそのまま利用する場合などでは特に, 一つ一つの語の解析精度の違いがどの程度有りうるのかという知見を予め知っておくことが重要である 本稿では, このような問題意識に基づいて,BCCWJの 接続詞 の品詞情報の信頼性を見るために, 接続詞 の用例の解析精度に関する調査を行う 調査内容は次の通りである ⑴ 接続詞 の使用頻度上位 20 語 ( 長単位 ) についてサンプル調査 ( 非コアデータ各 100 件 ) を行い, 語ごとの適合率 4 を明らかにする (4 章 ) ⑵ 接続詞 の使用頻度第 1 位であり適合率が低い 又 について, サンプル数を増やした詳細調査 ( 接続詞 副詞 各 1,000 件 ) を行い, 接続詞 及び 副詞 の適合率を明らかにし, さらに, レジスター別での違いも明らかにする 誤判定の起こり易い環境 ( 前後の文脈 ) についても検討する (5 章 ) ⑶ 適合率が最も低い で について, サンプル数を増やした詳細調査 ( 接続詞 格助詞 助動詞 各 1,000 件 ) を行い, 接続詞 及び 格助詞 助動詞 の適合率を明らかにし, さらに, レジスター別での違いも明らかにする 誤判定の起こり易い環境 ( 前後の文脈 ) についても検討する (6 章 ) 上記の調査結果を報告するに先立って,2 章でBCCWJの品詞情報を利用した接続詞研究の概観を行い, 3 章でBCCWJ 全体の品詞情報の解析精度について簡潔に示す また, 語ごとの解析精度 ( 適合率 ) の違いに留意することの重要性を見るために,4~6 章の調査結果に基づいて,7 章で適合率に基づいて検索結果の件数を補正することにより使用頻度の順位が変わることなどを示す 8 章で本稿全体のまとめを行う なお, 本研究は,BCCWJを利用した今後の接続詞研究に対して重要な基礎的知見を提供するとともに, 品詞情報付与に関する解析器の改良のための参考資料を提供するものでもある 2 品詞比率とジャンル ( レジスター ) 等の文体 文章構造の違いとの関連を分析した研究として, 冨士池他 (2011), 鯨井 (2011) などの研究がある なお, 左記の二つの研究では, 誤解析に対する人手修正を施したコアデータ ( 長単位 ) を使用している 3 国立国語研究所コーパス開発センター (2011), 国立国語研究所コーパス開発センター (2013) 4 本稿では解析精度として 適合率 を用いた 適合率 は 正しく品詞情報を付与された長単位数 / 当該品詞情報を付与された長単位数 100[%] で求めた 本稿の調査では 再現率 は調査しておらず, 従って F 値 も求めていない 詳しくは脚注 9 参照 14

4 BCCWJ の品詞情報の解析精度について 2.BCCWJの品詞情報を利用した接続詞研究 BCCWJは,2011 年に一般公開された 国立国語研究所が中心となって開発した日本語に関する初めての大規模均衡コーパス であり, 出版サブコーパス ( 書籍, 雑誌, 新聞 ), 図書館サブコーパス ( 書籍 ), 特定目的サブコーパス ( 白書, 教科書, ベストセラー,Yahoo! ブログ, 国会会議録など ) からなる約 1 億語 ( 短単位 ) 約 8 千万語 ( 長単位 ) のコーパスである 5 接続詞に関わる研究においても,BCCWJを利用した研究が増えている 本章では,BCCWJ 6 を利用した研究を例としていくつか紹介し, 接続詞に関わる研究においてもBCCWJの利用が進んでいることを示す 斎藤 (2009) は, 副詞, 連体詞, 接続詞の表記を調査し仮名表記, 漢字表記の傾向とその要因を分析したものであり,BCCWJ2008 年度版の 書籍 白書 の形態素解析済みのコアデータを用い品詞情報を利用している 砂川他 (2009) は, 複合的な接続表現 それなのに そのくせ それでいて の 使用域, 文法, 意味の使い分け をジャンル別の出現頻度や用法 意味別の使用割合などに基づいて分析したもので,BCCWJ 2008 年度版の全データ ( 書籍 は一部のみ) を用いている 文字列検索を行ったものと思われる 多田 (2010) は, 複合接続詞の用例調査と用法の検討に基づき 複合接続詞の全体像 について考察したものである BCCWJ2008 年度版の 書籍 データの 文頭 ngramの語連接 から約 200 語の 複合接続詞 を人手で抽出するとともに, 全データを対象に文字列検索によって接続詞の二重使用の用例を調査している 大内 (2012) は, 接続表現 ( 接続詞, 接続助詞 ) の二重使用に関して, 接続助詞 + 接続詞 の連接類型の組み合わせの傾向を考察したものである 接続助詞 + 接続詞 の組み合わせをBCCWJの品詞情報を利用して検索したものと思われる 馬場 (2013a)(2013b)(2014) は, 接続詞の二重使用の特徴, 承接順序の原則及び文体差を分析したもので,BCCWJの書籍データ及び全データを用い, 品詞情報 ( 長単位 ) を利用して 中納言 で検索して得られた用例を人手で点検した上で利用している 藤井 (2013) は, コーパスを用いて 条件構文基盤の談話標識化の諸相 を分析する際の指標や類型を提示したものである 接続詞に相当する 拘束文法機能語の非拘束化型 指示詞照応型 の一部について BCCWJの用例数を挙げ, 長単位 語彙素 接続詞 としてBCCWJに登録のない とすると などの形式についても広く使用されることを示している 宮内 (2013) は, 接続詞 なので の 書き言葉において用いられる場合の文体に関わる実態 を分析したもので,BCCWJ 全データを用い 中納言 で検索している 品詞情報 ( 長単位 ) を利用している 鯨井 (2013) は, 同一語のくり返しが集中する文脈における文章構造上の特徴 ( 接続詞等の使用など ) を分析したもので,BCCWJ(DVD 版 ) 特定目的サブコーパスの 教科書 を用い, 品詞情報 ( 長単位 ) を利用している また, 鯨井 (2014) は, 接続表現の前後文脈での 用語の類似度 を計り 内容展開と文脈間の用語の類似度との対応関係 を分析したもので,BCCWJ(DVD 版 ) 出版サブコーパスの 書籍 を用い, 品詞情報 ( 長単位 ) を利用している このように, 接続詞に関わる研究においてもBCCWJの利用が進んでいる ただし,BCCWJを利用した研究の中には, 検索ツールや検索方法の詳細, また, 検索結果に対する人手による点検の有無の詳細が示されていないものがある コーパスを用いた研究の特徴の一つに追試可能性が挙げられる それを保証するため 5 国立国語研究所コーパス開発センター (2011), 国立国語研究所コーパス開発センター (2013) 6 一般公開に先立つモニター公開データ (BCCWJ2008 年度版 ) を含む 15

5 馬場俊臣 には, 検索及び用例確定の方法を明示することが重要である 3.BCCWJ 全体の品詞情報の解析精度について調査結果を示すに先立って, 公表されているBCCWJ 全体の品詞情報の解析精度を示す 本稿の調査は,BCCWJにおいて, 接続詞 の品詞情報が付与された長単位 7 の語彙素を対象とする 検索ツールとして, 品詞情報を用いた検索ができる 中納言 を利用する BCCWJの形態論情報の付与では, 短単位解析には解析エンジンMeCabと形態素解析用辞書 UniDicを, 長単位解析には短単位解析結果から長単位を自動構成する解析器 ( 小椋, 冨士池 (2011)) を用いており 8, また ( 短単位全体の ) 1 億語のうち約 100 万語 ( コアデータ ) については, 自動解析後に人手修正を行い, 解析精度 99% 以上の高精度なデータとし, 形態素解析システムの学習用データとして用いた ( 同前 ) とのことである 接続詞に関しては,UniDicにおける接続詞( 短単位 ) は30 語であり (UniDic-mecab version の接続詞辞書 (Conjunction.csv) による ), さらに, 長単位では32の 連語 ( 従って, そうして, 其れとも, では等 ) が接続詞として扱われている ( 同前 ) BCCWJの形態論情報の解析精度は, コアデータは99% 以上, コアデータ以外のデータは98% 以上 ( 同前 ) とのことである レジスター別では, 白書, 書籍 ( 文学 ), 書籍 ( 文学以外 ), 新聞,Web(Y! 知恵袋 ) の各レジスターの 品詞 の解析精度 (F 値 ) 9 は, それぞれ , , , , となっており,98% 以上を実現している ( 同前 ) BCCWJの利用マニュアルに記載されている解析精度はF 値のみであり, 適合率及び再現率は示されていない 小木曽他 (2010) では, 新聞 ( 毎日新聞 2007 年度版 ) 文学作品 ( 新潮文庫の100 冊 ) ブログ (Yahoo! ブログ ) を用いてUniDic-mecabと他の解析器との精度比較を行い UniDic-mecab での適合率, 再現率,F 値を示している 新聞, 文学作品, ブログの順にそれぞれ 品詞 の適合率は0.9879,0.9772,0.9756であり98% 前後以上である 4. 高頻度接続詞の適合率 4. 1 調査の目的と方法本章では, 品詞情報 接続詞 の語のうち, 使用頻度上位 20 語 ( 長単位 )( 以下, 高頻度接続詞 と呼ぶ) について, サンプル調査 ( 非コアデータ各 100 件 ) を行い, 語ごとの適合率を明らかにする まず, 高頻度接続詞を取り出すために, 中納言 長単位検索で 品詞大分類接続詞 を指定し, 全 7 多くの接続詞研究において接続詞として扱われる語の単位は 長単位 にほぼ相当する 8 本稿での指摘はMeCab+UniDicにより付与された品詞情報の問題点でもある 9 適合率 ( 精度 ), 再現率,F 値は分類の評価指標として用いられる 適合率は付与された品詞がどのくらい正しいかを表す指標である 再現率は実際にある品詞であるものをどれくらいカバーして付与できているかを表す指標である F 値は適合率と再現率の調和平均である 接続詞を例にすると, 次の式で求められる ( 適合率 )=( 品詞情報 接続詞 を付与されて正しく接続詞であった件数 )/( 品詞情報 接続詞 を付与された件数 ) 100[%] ( 再現率 )=( 品詞情報 接続詞 を付与されて正しく接続詞であった件数 )/( 調査対象全体で実際に接続詞である件数 ) 100[%] (F 値 )=2 ( 適合率 ) ( 再現率 )/(( 適合率 )+( 再現率 )) 16

6 BCCWJ の品詞情報の解析精度について レジスター対象に検索 10 を行った 11 検索総件数は668,836 件である 語彙素を単位として集計し, 頻度合計上位 20 位までの語を選定した ( 表 1 参照 ) 12 次に, 各語からサンプルを抽出した コアデータについては自動解析後に人手による修正を行っているため, サンプル調査の対象は非コアデータのみとする 中納言 長単位検索で 語彙素 品詞大分類接続詞 を指定し検索 13 を行い, 検索結果画面上に表示された500 件のうち最初の100 件を調査対象とした 検索結果の画面表示については, 検索ヒット数が 500 件を超える場合, 検索結果からランダムで選ばれた500 件が表示されます ( 中納言オンライン マニュアル 更新日 : 版 ) とのことであり, 無作為抽出とみなした 14 得られた各語の用例 100 件の品詞を, 前後の文脈を読み取りながら人手により確認した 副詞など接続詞以外の品詞との判別が特に問題となるものについては, 次のような置き換え可能性を目安にして判断した また, コアデータでの品詞判定も参考にした 判定に迷う場合は接続詞とした 又 15 : 並びに, その上に, 又は に置き換えられるかどうか 再び, 同様に, 一方, 一体全体 まったく に置き換えられる場合は副詞 更に : その上に, それに加えて に置き換えられるかどうか ますます, もっと, 少しも (~ない) に置き換えられる場合は副詞 其れから : そして に置き換えられるかどうか その時から に置き換えられる場合は 代名詞 + 格助詞, 両方可能な場合は接続詞扱い 唯 : ただし に置き換えられるかどうか 単に に置き換えられる場合は副詞 猶 : 言い添える内容が続くかどうか 相変わらず, やはり, 一層, ちょうど ( のごとし ) に置き換えられる場合は副詞 で : それで に置き換えられるかどうか 其れでも : でも に置き換えられるかどうか でも に置き換えられず それで に置き換えられる場合は それ は代名詞 10 検索条件式は, キー : 品詞 LIKE " 接続詞 % " WITH OPTIONS unit="2" AND tglwords="10" AND limittoselfsentence ="0" AND endofline="crlf" AND tglkugiri="" AND encoding="utf-8" AND tglfixvariable="2" である なお, 中納言 では10 万件以上の一括ダウンロードができないため, いくつかのレジスターごとに分割してダウンロードを行った 11 本稿での 中納言 ( 現代日本語書き言葉均衡コーパス中納言 の検索結果は, 高頻度接続詞及び 又 の詳細調査に関しては2013 年 11 月 ~2014 年 2 月, で の詳細調査に関しては2014 年 12 月 ~2015 年 1 月の期間で得られた結果である 12 現代日本語書き言葉均衡コーパス 長単位語彙表 ver1.0 (DVDデータに基づく語彙表)( corpus_center/bccwj/freq-list.html)(2014 年 7 月閲覧 ) では, だから だが 所が の頻度合計はそれぞれ 21,010, 17,871,11,394であり, 本調査と比べいずれも非コアデータの頻度が2 件,1 件,6 件低くなっている 理由は不明である 13 検索条件式 ( 例として 又 を挙げる ) は次の通りである キー (: 語彙素 = " 又 " AND 品詞 LIKE " 接続詞 %")IN (registername=" 出版 新聞 " AND core="false")or (registername=" 出版 雑誌 " AND core="false")or (registername=" 出版 書籍 " AND core="false")or (registername=" 図書館 書籍 " AND core="false")or (registername=" 特定目的 白書 " AND core="false")or (registername=" 特定目的 ベストセラー " AND core="false")or (registername=" 特定目的 知恵袋 " AND core="false")or (registername=" 特定目的 ブログ " AND core="false")or (registername=" 特定目的 法律 " AND core="false")or (registername=" 特定目的 国会会議録 " AND core="false")or (registername=" 特定目的 広報誌 " AND core="false")or (registername=" 特定目的 教科書 " AND core="false")or (registername=" 特定目的 韻文 " AND core="false")with OPTIONS unit="2" AND tglwords="200" AND limittoselfsentence="0" AND endofline="crlf" AND tglkugiri="" AND encoding="utf-8" AND tglfixvariable="2" 14 ただし, 厳密に言うと完全なランダムではなく, 検索で見つかった順に並ぶ ( 山崎 (2013)) とのことである 15 又 の接続詞と副詞の判別の詳細については, 脚注 19 参照 17

7 馬場俊臣 4. 2 高頻度接続詞の適合率の調査結果 ( 語彙素別 ) 調査結果は, 表 1の通りである 調査対象 20 語全体の適合率は93.8% であり, 非コアデータ全体のF 値 98% 以上よりは低いが, 高い適合率になっている ただし, 語ごとに見ると, 適合率 90% 未満の語が 又 82.0%, 更に 89.0%, 其れから 87.0%, 唯 76.0%, 猶 89.0%, で 63.0% の6 語ある 又, 更に, 唯, 猶 は副詞の誤判定 16 が目立つ この4 語には副詞の同形の語彙素がある 其れから は代名詞 其れ との誤解析が目立つ で の適合率は特に低く格助詞及び助動詞の誤判定が目立つ このように, 語ごとに見た場合, 適合率が特に低い語があり, 注意が必要である 表 1 高頻度接続詞 ( 非コアデータ, サンプル調査 ) の適合率 ( 語彙素別 ) 17 順位語彙素 コアデータ頻度 非コアデータ頻度 頻度合計調査件数接続詞他品詞等適合率他品詞等内訳 1 又 ,543 86, % 副詞 13, 誤解析 又は 5 2 然し ,041 68, % 3 そして ,269 62, % 4 及び ,295 48, % 動詞 1 5 でも * ,397 36, % 6 又は * ,560 29, % 7 或いは ,490 26, % 副詞 2 8 だから * ,840 21, % 9 更に ,614 18, % 副詞 だが * ,695 17, % 11 其れから * 54 16,570 16, % 誤解析 ( 代名詞 + 格助詞 )13 12 唯 ,388 16, % 副詞 23, 誤解析 只松 1 13 然も ,570 14, % 14 猶 89 12,272 12, % 副詞 10, 誤解析 尚穆王 1 15 但し 80 11,667 11, % 誤解析 但一人 1 16 所が * ,295 11, % 17 で 74 10,866 10, % 格助詞 18, 助動詞 3, 誤解析 ( 助動詞 ) 9, 誤解析 ( その他 )5,( て の) 誤字 2 18 即ち 38 10,717 10, % 19 従って * 36 9,900 9, % 20 其れでも * 91 9,807 9, % 誤解析 ( 代名詞 + 格助詞 + 係助詞 )7 計 2,000 1, % 4. 3 高頻度接続詞の適合率の調査結果 ( レジスター別 ) 同じ調査データを用いレジスター別の適合率を集計した 表 2に,20 語全体の数値と適合率の低い 又, 唯, で の3 語の数値を示した 20 語全体では, 調査件数が少ない 特定目的 韻文 を除けば, 特定目的 知恵袋 84.9% 及び 特定目的 ブログ 86.6% の適合率がやや低くなってはいるが, 全体的にレジスター間で大きな違いは見られない しかし,( 調査件数が少ないレジスターを除くと ) 又 では 特定目的 白書 77.3%, 特定目的 ブログ 60.0%, 唯 では 図書館 書籍 64.0%, で では 出版 書籍 36.4%, 特定目的 知恵袋 45.0% が特に低くなっており, レジスターの違いによる適合率の大きな違いが見られる 16 本稿では, 品詞分類の誤りを 誤判定 と呼び, それ以外の形態素境界の誤りや長単位の構成に関する誤りなどを 誤解析 と呼び, 便宜的に呼び分ける 17 * を付けた語彙素は, 長単位で 連語 の接続詞となる語彙素である 18

8 BCCWJ の品詞情報の解析精度について 表 2 高頻度接続詞 ( 非コアデータ, サンプル調査 ) の適合率 ( レジスター別 ) 20 語全体 又 唯 で レジスター 調査件数 適合率 調査件数 適合率 調査件数 適合率 調査件数 適合率 出版 書籍 % % % % 出版 雑誌 % % % % 出版 新聞 % % 0 図書館 書籍 % % % % 特定目的 白書 % % 0 0 特定目的 教科書 % % 0 0 特定目的 広報誌 % % 0 0 特定目的 ベストセラー % % % 特定目的 知恵袋 % % % % 特定目的 ブログ % % % % 特定目的 韻文 % % 0 特定目的 法律 % 特定目的 国会会議録 % % % % 計 2, % % % % 4. 4 詳細な調査の必要性高頻度接続詞の適合率の調査によって, 調査対象 20 語全体の適合率は高いが, 語ごとでは適合率の低い語があること, また,20 語全体ではレジスターの違いによる適合率の違いはほぼ見られないが, 適合率の低い 又 唯 で ではレジスターによる適合率の違いが見られることが明らかになった 本章では高頻度接続詞について各 100 語を対象として調査を行ったが, サンプル数が少ないという問題点がある サンプル数を増やしてより詳細な調査を行う必要がある 本稿では, 適合率の低い語のうち 接続詞 使用頻度第 1 位の 又 及び適合率の最も低い で について詳細な調査を行う 5. 又 の詳細調査 5. 1 調査の目的と方法 接続詞 使用頻度第 1 位の 又 に関してより厳密な適合率を明らかにするため, またレジスターによる適合率の違いを詳細に分析するため, 接続詞 及び 副詞 の品詞情報が付与された 又 について調査 ( 以下, 詳細調査 と呼ぶ) を行った 詳細調査の前に, 念のために, 形態素解析システムの学習用データとして用いた人手による修正済みのコアデータについて適合率を確認する調査を行った 中納言 長単位検索で品詞情報を 接続詞 及び 副詞 と指定しコアデータ対象に検索 18 を行い, 得られた用例の品詞を前後の文脈を読み取りながら人手により確認した 19 その結果, 接続詞 の 又 899 件のうち889 件が接続詞であり適合率 98.9% であった また, 副 18 検索条件式は次の通りである 副詞 の検索では 接続詞 の箇所を 副詞 に置き換えた キー (: 語彙素 = " 又 " AND 品詞 LIKE " 接続詞 % ")IN (registername=" 出版 新聞 " AND core="true")or (registername= " 出版 雑誌 " AND core="true")or (registername=" 出版 書籍 " AND core="true")or (registername=" 特定目的 白書 " AND core="true")or (registername=" 特定目的 知恵袋 " AND core="true")or (registername=" 特定目的 ブログ " AND core="true")with OPTIONS unit="2" AND tglwords="300" AND limittoselfsentence="0" AND endofline="crlf" AND tglkugiri="" AND encoding="utf-8" AND tglfixvariable="2" 19 並びに, その上に, 又は ( 接続詞 ), 再び, 同様に ( ~もまた 等 ), 一方 ( 秋はまた収穫の季節でもある 等), 一 19

9 馬場俊臣 詞 の 又 247 件のうち241 件が副詞であり適合率 97.6% であった コアデータに関しては98% 前後以上の高い適合率であることが確認された 非コアデータを対象とした 又 の詳細調査の手順 方法を示す まず, コアデータと同様に品詞情報を指定し非コアデータ対象に検索 20 を行い, 接続詞 の 又 の用例 85,543 件, 副詞 の 又 の用例 28,756 件を得た これらの用例に対して, それぞれ層別無作為抽出 ( レジスター別の13 層 ) を行い, 接続詞 副詞 各 1,000 件を調査対象の用例として, 前後の文脈を読み取りながら人手により品詞を確認した なお, 接続詞 及び 副詞 の用例の抽出率は, それぞれ1.17%,3.48% である 5. 2 又 詳細調査での適合率の結果及び誤判定の要因 又 の詳細調査による品詞判定の結果を表 3に示す 表 3 又 詳細調査 ( 非コアデータ ) での適合率 品詞情報 人手による品詞判定接続詞副詞誤解析誤字 計 適合率 接続詞 , % 副詞 , % 計 1, 接続詞 の 又 1,000 件のうち858 件が接続詞であり適合率 85.8% であった 接続詞以外は, 副詞の誤判定 117 件, 誤解析 25 件 ( 又は 23 件, またぐ 三ツ又沼 各 1 件 ) であった 副詞 の 又 1,000 件のうち828 件が副詞であり適合率 82.8% であった 副詞以外は, 接続詞の誤判定 160 件, 誤解析 11 件 ( 又の名 3 件, 俟つ 2 件, 尾亦, 胡亦堂, 興復, 又七郎, 又左, 股 各 1 件 ), 誤字 1 件 ( 復雑 ( 複雑 )) であった 接続詞 の 又 に関しては4 章での100 件サンプル調査での適合率 82.0% に比べるとやや高くなってはいるが, それでも90% を下回っている 品詞情報を利用する際に十分留意する必要がある なお, 接続詞 の 又 の正解 858 件と 副詞 の 又 のうち接続詞の用例 160 件とを合わせると1,018 件となる 少なくとも 又 は, 仮に 接続詞 1,000 件の数値をそのまま利用したとしても大きな違いが生じないという見方もできるかもしれない 21 BCCWJの形態素解析は 機械学習に基づく形態素解析 ( 小木曽 (2014)) であるため, 誤判定の起こる要因を特定することは非常に困難である ここでは, 誤判定の起こり易い環境 ( 前後の文脈 ) を参考までに示しておく 表 4は, 又 の直前 1 文字と直後 1 文字の組み合わせ別に適合率を示した表 ( 調査件数 21 件 体全体 まったく ( どうしてまたそんなことをしたのだ またなんときれいな花だ 等) ( 副詞 ) への置き換えを目安に品詞判定を行った また, コアデータでの品詞判定も参考にした 接続詞と副詞の両方に解釈可能な用例など判定が難しい用例は, 付与された品詞情報を正解として処理した なお, 又貸し 又聞き 等は全体で名詞とした 又の名 又の日 も全体で名詞 ( 小椋, 小磯, 冨士池, 宮内, 小西, 原 (2011) 資料要注意語 参照 ) とした また, 山また山 一人また一人 のような同じ名詞を繋ぐ用法は辞書により扱いが異なる コアデータでは 一羽また一羽と死んでいきました は接続詞としているが, 詳細調査対象の非コアデータでは 足音が一歩, また一歩と大きくなった 人また人でぎっしり埋まる は 副詞 と判定されている 今回の調査ではコアデータに従い接続詞として扱う 20 検索条件式は, 全レジスターの非コアデータを指定した以外は, 脚注 18と同様である 21 ただし,5. 3に示すようにレジスター別では大きな違いが生じる場合がある 特に 特定目的 ブログ では, 接続詞 の 又 には副詞が5 割以上含まれるのに対し 副詞 の 又 には接続詞が144 件中 3 件あるのみであり, 接続詞 の 又 の使用頻度をそのまま用いるのは危険である 20

10 BCCWJ の品詞情報の解析精度について 以上のみ ) である 接続詞 副詞 ともに, 直前 1 文字が読点で直後 1 文字が 漢字 仮名 である + 漢字 + 仮名 の場合に1,000 件全体の適合率よりも低い適合率になっている また, 接続詞 全体の副詞の誤判定 117 件のうち読点の直後の用例は55 件 (47.0%) であり, 副詞 全体の接続詞の誤判定 160 件のうち読点の直後の用例は114 件 (71.3%) であり, 誤判定の多くは読点の直後である このように, 読点の直後での誤判定の多さが, 全体の適合率を下げる一つの要因となっている可能性がある 22 表 4 又 詳細調査 ( 非コアデータ ) での直前 直後各 1 文字別適合率 ( 調査件数 21 件以上のみ ) 接続詞 の 又 直前 + 直後各 1 文字 調査件数 適合率 ( 全角空白 )+ 漢字 % + 漢字 % + 仮名 % 仮名 % + 漢字 % % + 仮名 % ( 全角空白 ) % % ( 全角空白 )+, %,+, % +, % 調査件数計 1, % 副詞 の 又 直前 + 直後各 1 文字 調査件数 適合率 + 漢字 % + 仮名 % 仮名 % 仮名 + 仮名 % 仮名 + 漢字 % 調査件数 計 1, % 5. 3 又 詳細調査での適合率の結果( レジスター別 ) 同じ調査データを用いて, レジスター別に適合率を集計した ( 表 5 参照 ) レジスター別 ( 調査件数が10 以下のレジスターは除く ) に見ると, 接続詞 の 又 では, 特定目的 ブログ 42.4% が特に適合率が低い 副詞 の 又 では, 特定目的 国会会議録 65.1% が特に適合率が低い 23 レジスター別の使用頻度に基づいた接続詞の分析を行う際には, 適合率が低いレジスターがあることを十分に考慮する必要がある 6. で の詳細調査 6. 1 調査の目的と方法サンプル調査で適合率が最も低かった で に関してもより厳密な適合率を明らかにするため, またレジスターによる適合率の違いを詳細に分析するため, 接続詞 及びサンプル調査で誤判定の多かった 格助詞 助動詞 の で について詳細調査を行った 念のため, コアデータについて適合率を確認する調査をまず行った 中納言 長単位検索で品詞情報を 接 22 コアデータの読点の直後の用例のみを取り出してみると, 接続詞 全 120 件中 4 件が副詞であり ( 適合率 96.7%), 副詞 全 14 件中 1 件が誤解析 ( 名詞 又の名 ) であった ( 適合率 92.9%) 23 特定目的 ブログ 特定目的 国会会議録 で適合率が特に低くなったのは, 行動の叙述 ( 時間的 ), 並列的な事柄の提示 ( 非時間的 ) というそれぞれの内容的な特徴も関わっていると思われる 21

11 馬場俊臣 表 5 又 詳細調査( 非コアデータ ) での適合率 ( レジスター別 ) レジスター 接続詞 副詞 調査件数適合率調査件数適合率 出版 書籍 % % 出版 雑誌 % % 出版 新聞 % % 図書館 書籍 % % 特定目的 白書 % % 特定目的 教科書 % % 特定目的 広報誌 % % 特定目的 ベストセラー % % 特定目的 知恵袋 % % 特定目的 ブログ % % 特定目的 韻文 1 0.0% % 特定目的 法律 0 0 特定目的 国会会議録 % % 計 1, % 1, % 続詞 格助詞 助動詞 / 連用形 / 一般 ( 以下 助動詞 と略す ) と指定しコアデータ対象に検索 24 を行い, 接続詞 の で 74 件, 格助詞 の で 14,016 件, 助動詞 の で 2,155 件の用例を得た 格助詞 助動詞 については件数が膨大であるため, 中納言 の検索結果画面上に表示された500 件のうち最初の 100 件のみを対象とした 得られた用例の品詞を前後の文脈を読み取りながら人手により確認した 25 調査の結果, 接続詞 の で 74 件のうち67 件が接続詞であり適合率 90.5% であり, コアデータにしてはやや低くなっている 接続詞以外は格助詞 4 件, 助動詞 2 件, 誤解析 ( 助動詞 - 複合辞 )1 件である いずれも 特定目的 知恵袋 又は 特定目的 ブログ の用例であった 格助詞 の で 100 件のうち97 件が格助詞であり適合率 97.0% であった 格助詞以外は助動詞 3 件である 助動詞 の で 100 件のうち 99 件が助動詞であり適合率 99.0% であった 助動詞以外は格助詞 1 件である コアデータに関しては, 接続詞 の適合率が90.5% でやや低いが, 格助詞 助動詞 は 98% 前後以上の高い適合率であることが確認された 非コアデータを対象とした で の詳細調査の手順 方法を示す 又 の詳細調査とほぼ同様である まず, コアデータ調査と同様の品詞情報を指定し非コアデータ対象に検索 26 を行った 接続詞 の で の用例 10,866 件, 格助詞 の で の用例 1,201,872 件, 助動詞 の で の用例 235,239 件を得た これらの用例に対して, それぞれ層別無作為抽出 ( レジスター別の13 層 ) を行い, 接続詞 格助詞 助動詞 各 1,000 件を調査対象の用例として抽出して, 前後の文脈を読み取りながら人手により品詞を確認した なお, 24 検索条件式は次の通りである ( 語彙素, 品詞のみを示す ) 接続詞 は ( 語彙素 = " で " AND 品詞 LIKE " 接続詞 % "), 格助詞 は ( 語彙素 = " で " AND 品詞 LIKE " 助詞 - 格助詞 % "), 助動詞 は ( 語彙素 = " だ " AND 品詞 LIKE " 助動詞 % " AND 活用形 = " 連用形 - 一般 ") である 25 で の品詞判別に関しては, 小椋, 小磯, 宮内, 原 (2011)( 細則 12 出現形 で の品詞分類 ) で, で という形で切り出された短単位に品詞情報及び代表形を付与する際の基準を定める で の中には, 接続詞や接続助詞 て の連濁形, 助動詞 てる の未然形 連用形の連濁形などもあるが, 形態上容易に判別できるものを除くと, 残るのは格助詞 で と助動詞 だ の連用形 で である ここではその両者の仕分けに的を絞って記述する とし, 格助詞 で と助動詞 だ の連用形 で の判別の細則を示している 接続詞との判別については特に示されていない 26 検索条件式は, 全レジスターの非コアデータを指定した以外は, 脚注 24と同様である 22

12 BCCWJ の品詞情報の解析精度について 接続詞 格助詞 助動詞 の用例の抽出率は, それぞれ 9.20%,0.08%,0.43% である 6. 2 で 詳細調査での適合率の結果及び誤判定の要因 で の詳細調査による品詞判定の結果を表 6に示す 接続詞 の で 1,000 件のうち620 件が接続詞であり適合率 62.0% であった 接続詞以外で特に多かったのは, 格助詞の誤判定 193 件, 助動詞の誤判定 36 件, 誤解析 ( 助動詞 - 複合辞 )87 件であった 格助詞 の で 1,000 件のうち870 件が格助詞であり適合率 87.0% であった 格助詞以外で特に多かったのは, 助動詞の誤判定 95 件, 誤解析 ( 助動詞 - 複合辞 )24 件であった 助動詞 の で 1,000 件のうち708 件が助動詞であり適合率 70.8% であった 助動詞以外で特に多かったのは, 格助詞の誤判定 224 件, 誤解析 ( 助動詞 - 複合辞 )61 件であった 表 6 で 詳細調査 ( 非コアデータ ) での適合率 品詞情報 接続詞格助詞助動詞 動詞 接続助詞 終助詞 人手による判定 誤解析 誤解析 ( 助動詞 ( 接続詞 - 複合辞 ) - 連語 ) 誤解析 ( 副助詞 - 複合辞 ) ( 接続助詞 - 複合辞 )( 副詞 - 連語 ) 誤解析 ( その他 ) 接続詞 , % 格助詞 , % 助動詞 , % 誤字 計 適合率 誤解析( 助動詞 - 複合辞 ) というのは, 長単位で 複合辞 の 助動詞 として扱われる である でない ではありません ではない などである 27 接続詞 及び 格助詞 の場合は, もともと短単位の で の品詞判定の際の誤判定である 助動詞 の場合は, 短単位の で の品詞判定は成功しているが 長単位を自動構成する解析器 ( 小椋, 冨士池 (2011)) において誤解析 ( 長単位構成の失敗 ) が生じている 接続詞 の で に関しては4 章での100 件サンプル調査での適合率 63.0% とほぼ同じで極めて低くなっており, 品詞情報を利用する際に十分留意する必要がある なお, 品詞情報 格助詞 助動詞 についても適合率が低いが, 本研究は 接続詞 が主な対象であるため詳細は言及しない 接続詞 の 又 の場合同様に, 誤判定の起こる要因を特定することは非常に困難である 接続詞 の で に関しても, 又 同様に, 誤判定の起こり易い環境 ( 前後の文脈 ) を参考までに示しておく 表 7は, で の直前 1 文字と直後 1 文字の組み合わせ別に適合率を示した表 ( 調査件数 21 件以上のみ ) である 27 小椋, 冨士池 (2011)( 付録 2: 複合辞 ( 助動詞相当句 ) ) なお, 誤解析( 助詞 - 複合辞 ) や 誤解析( 接続詞 - 連語 ) なども, それぞれ長単位で 複合辞 の 助詞 として扱われる だけでなく ( 同 付録 1: 複合辞 ( 助詞相当句 ) ), 長単位で 連語 の 接続詞 として扱われる でも など ( 同 付録 3: 連語 ) である 23

13 馬場俊臣 表 7 で 詳細調査 ( 非コアデータ ) での直前 直後各 1 文字別適合率 ( 調査件数 21 件以上のみ ) 接続詞 の で 直前 + 直後各 1 文字 調査件数 適合率 仮名 + 仮名 % 仮名 + 漢字 % ( 全角空白 )+ 仮名 % + 仮名 % ( 全角空白 )+ 漢字 % 仮名 % ( 全角空白 ) % % % 調査件数計 1, % 格助詞 の で 直前 + 直後各 1 文字 調査件数 適合率 漢字 % 仮名 + 仮名 % 仮名 % 漢字 + 仮名 % 仮名 + 漢字 % 漢字 + 漢字 % 調査件数計 1, % 助動詞 の で 直前 + 直後各 1 文字 調査件数 適合率 漢字 % 漢字 + 仮名 % 仮名 + 仮名 % 仮名 % 仮名 + 漢字 % 漢字 + 漢字 % 調査件数計 1, % 接続詞 の で は, 直前 1 文字が 仮名 で直後 1 文字が 仮名 又は 漢字 である 仮名 + 仮名 仮名 + 漢字 の場合に適合率が極めて低い で の直前が 仮名 であれば接続詞ではないと予想されるが, 接続詞 と判定された用例がある程度あるということである 28 仮名の直後での誤判定の多さが, 全体の適合率を下げる一つの要因となっている可能性がある また, 直前 1 文字が ( 全角空白 ) や で直後 1 文字が 仮名 又は 漢字 である ( 全角空白 )+ 仮名 + 仮名 ( 全角空白 )+ 漢字 の場合も適合率が低い この場合は文頭であると予想されるが, で の直後に がない場合は接続詞ではない用例が多いということである それに対して, 直前 1 文字が 仮名 ( 全角空白 ) 等で直後 1 文字が である 仮名 + ( 全角空白 )+ + + の場合は1,000 件全体の適合率よりも高い適合率になっている 直後の読点の有無も適合率の高低に関わっているようである さらに, 接続詞 の で に関して, 誤判定が目立ったケースとして次の2 点を指摘することができる 一点目は, 数式や図などを削除している場合である BCCWJでは, 写真, イラスト, 図解など 外国語, 古典語, 数式など はサンプル範囲から排除されており, 文字入力においては削除され, その箇所には削除要素を示すタグが挿入されている 29 傾斜していない時のP 座標はである (PB24_00276), ベータ線に対する衝突阻止能 Scolは, で表される (PB55_00217) のような用例である 接続詞 1,000 件中このような削除が26 件 (0.026%) あり, いずれも誤判定 誤解析である 二点目は, 文頭部分における であるから, でないと ( 助動詞 - 複合辞 ) や でもって の誤判定 誤解 28 直前 1 文字が仮名の場合でも適合率が0% とならないのは, 例えば 銀魂はなぜか家族全員でみてましたムラムラしますで両親爆笑 ( `) (OY14_23917)(Yahoo! ブログ ) のような用例があるからである なお, コアデータの 接続詞 の用例の中に直前 1 文字が だ 万 の例が各 1 例ある ( この2 例以外の直前 1 文字は ( 全角スペース )!),? である) だ の用例は なんだかんだで毎日買い物をしているような? (OY14_11385) であり格助詞の誤判定である 前後の語の品詞 ( 長単位 ) は なん ( 代名詞 ) だ ( 助動詞 ) かん ( 代名詞 ) だ ( 助動詞 ) 毎日( 副詞 ) である 万 の用例は ラウンドは寄りより一個上で返済持ち越しで+ 九万八千最初はJFE 空売りして+ 六万で 川崎三万三千株買ったら耐えれず3ティックロス (` д ;) (OY01_00902) であり正しく接続詞と解析されている 前後の語の品詞 ( 長単位 ) は +( 補助記号 - 一般 ) 六万 ( 名詞 - 数詞 ) で ( 接続詞 ) ( 補助記号 - 読点 ) である 原文は blogs.yahoo.co.jp/asiouzi/ htmlで確認でき (2015 年 3 月閲覧 ), 原文では で の直前が1 行空きとなっており, さらに 六万 は と表記されている 直前 1 文字が仮名, 漢字の場合があるのは, この2 例を含むコアデータを形態素解析システムの学習用データとして用いたためであるという可能性もあるが, 品詞レベルの情報のみを解析に利用しているのであれば無関係となる 29 稲益, 丸山 (2009), 西部他 (2011), 丸山他 (2011) 24

14 BCCWJ の品詞情報の解析精度について 析の場合である が彼はもっとも肝心な点の理解ができていなかった であるから 内心では真実で有益であると思っていることでも ( 後略 ) (PB41_00093), まったくだ でもって 飲んでるとすぐに時間が経っちまう (LBq9_00089) のような用例である である でない は長単位では複合辞として一語の助動詞として扱われるが, 文頭の で を 接続詞 と誤判定したため長単位構成に失敗した例が目立った であるから, であれば のような である が21 件, でないと, でなかったら のような でない が24 件あった 文頭の でもって の で は格助詞であり, この誤判定も12 件あった 以上のように, 接続詞 の で に関しては, 直前 1 文字の仮名や直後 1 文字の, 数式や図の削除, 文頭の であるから, でもって 等が, 誤判定 誤解析の要因に関わっている可能性がある なお, 格助詞 助動詞 の で については, 接続詞 の で の場合ほどには, 直前 直後 1 文字別の適合率に大きな違いは見られない 6. 3 で 詳細調査での適合率の結果( レジスター別 ) 同じ調査データを用いて, レジスター別に適合率を集計した ( 表 8 参照 ) 表 8 で 詳細調査( 非コアデータ ) での適合率 ( レジスター別 ) レジスター 接続詞 格助詞 助動詞 調査件数適合率調査件数適合率調査件数適合率 出版 書籍 % % % 出版 雑誌 % % % 出版 新聞 % % % 図書館 書籍 % % % 特定目的 白書 2 0.0% % % 特定目的 教科書 % % 特定目的 広報誌 5 0.0% % % 特定目的 ベストセラー % % % 特定目的 知恵袋 % % % 特定目的 ブログ % % % 特定目的 韻文 % % 特定目的 法律 % 2 0.0% 特定目的 国会会議録 % % % 計 1, % 1, % 1, % 接続詞 の で に関して, レジスター別 ( 調査件数が10 以下のレジスターは除く ) に見ると, 特定目的 国会会議録 44.4%, 特定目的 知恵袋 46.0% が特に適合率が低い 特定目的 国会会議録 全 27 件では, 特に 誤解析 ( 助動詞 - 複合辞 ) 9 件及び 誤字 5 件の誤解析 誤字の多さが目立つ 誤解析 ( 助動詞 - 複合辞 ) 9 件はすべて前述の文頭の であるから でなければ 等であり, 誤字 5 件はすべて接続助詞 て の誤字である また, 特定目的 知恵袋 全 174 件では, 特に格助詞 65 件の誤判定が目立つ 特定目的 知恵袋 全 174 件に関しては, 調査件数 5 件以上で適合率が 0% であった直前 直後 1 文字の組み合わせは, 仮名 + 漢字 19 件, ( 全角空白 )+ 漢字 8 件, 仮名 + 仮名 5 件,?+ 漢字 5 件,?+ 仮名 5 件である 全角空白や? に関しては, 例えば 普通に i Pod で音楽を聴いていると 急に固まってそこから何も操作できないんです (OC02_04559), にがり & パイナップルのエキス? で脱毛できると聞きました (OC09_08042) のように全角空白や? が文頭 文末以外で使われている用例が目立った 25

15 馬場俊臣 なお, 格助詞 助動詞 の で については, レジスター別の顕著な違いは見られない 7. 適合率に基づいた検索結果の補正の重要性 本章では, 語ごとの解析精度 ( 適合率 ) の違いに留意することの重要性を見るために, 適合率に基づいて検索結果の件数を補正することにより, 接続詞 の使用頻度の順位が変わること, また 接続詞 の で 30 のレジスター別の使用頻度 (1 万語当たり ) の見方に違いが出てくることを示す 表 9は,4 章で扱った 接続詞 使用頻度上位 20 語について, 適合率に基づいて 非コアデータ頻度 に補正を加えることにより, 使用順位がどのように異なるかを示した表である 非コアデータ頻度 ( 補正後 ) は 非コアデータ頻度 に 適合率 を乗じた数値 31 であり, 頻度合計( 補正後 ) は コアデータ頻度 に 非コアデータ頻度 ( 補正後 ) を加えた数値である 順位( 補正後 ) は, この 頻度合計 ( 補正後 ) に基づいた順位である 表 9の通り,9 位以下で補正前と補正後で順位の異同がある 特に, で の 頻度合計 ( 補正後 ) は 6,920 件であり, この件数は補正前の ( 表外の )24 位 扠 (8,083 件 ),25 位 若しくは (6,873 件 ) の間に位置し,20 位以下の語も含めると で の順位は大きく下がる 表 9 適合率に基づいて補正を加えた 接続詞 の使用頻度順位 順位順位 ( 補正前 )( 補正後 ) 語彙素 コアデータ頻度 非コアデータ頻度 頻度合計 適合率 非コアデータ頻度 ( 補正後 ) 頻度合計 ( 補正後 ) 1 1 又 ,543 86, % 70,145 71, 然し ,041 68, % 68,041 68, そして ,269 62, % 62,269 62, 及び ,295 48, % 47,812 48, でも ,397 36, % 36,397 36, 又は ,560 29, % 29,560 29, 或いは ,490 26, % 25,960 26, だから ,840 21, % 20,840 21, 更に ,614 18, % 16,566 16, だが ,695 17, % 17,695 17, 其れから 54 16,570 16, % 14,416 14, 唯 ,388 16, % 12,455 12, 然も ,570 14, % 14,570 14, 猶 89 12,272 12, % 10,922 11, 但し 80 11,667 11, % 11,550 11, 所が ,295 11, % 11,295 11, で 74 10,866 10, % 6,846 6, 即ち 38 10,717 10, % 10,717 10, 従って 36 9,900 9, % 9,900 9, 其れでも 91 9,807 9, % 9,121 9,212 接続詞 合計 5, , , % 622, , 語 は 長単位 を用いている 31 小数第 1 位で四捨五入している 26

16 BCCWJ の品詞情報の解析精度について 表 適合率に基づいて補正を加えた 接続詞 の で のレジスター別使用頻度順位 順位順位 ( 補正前 )( 補正後 ) レジスター コアデータ頻度 非コアデータ頻度 頻度合計 使用頻度 (1 万語当たり ) 補正前 適合率 使用頻度頻度合計 (1 万語当た ( 補正後 ) り ) 補正後 1 1 特定目的 ブログ 35 4,487 4, % 3, 特定目的 知恵袋 8 1,890 1, % 出版 雑誌 % 特定目的 ベストセラー % 図書館 書籍 0 1,949 1, % 1, 特定目的 国会会議録 % 出版 書籍 3 1,533 1, % 特定目的 韻文 特定目的 広報誌 % 出版 新聞 % 特定目的 教科書 特定目的 白書 % 特定目的 法律 で 合計 74 10,866 10, % 6, 表 10は, 接続詞 の で について, レジスター別の使用頻度 (1 万語当たり ) の順位を, 補正前と補正後について比較した表である 頻度合計 ( 補正後 ) の算出方法は表 9の場合と同様である 補正前と補正後の順位は6 位,7 位の 特定目的 国会会議録 出版 書籍 以下で若干の変動がある さらにより重要なことは, 上位については順位の変動はないが, 使用頻度 (1 万語当たり ) の差が大きく縮まっていることである 2 位の 特定目的 知恵袋 は,3 位 出版 雑誌 及び4 位 特定目的 ベストセラー との差が縮まり, 全体の使用頻度により近い値になっている 8. まとめ接続詞研究においてBCCWJの品詞情報を利用する際の留意点を示すために,BCCWJで 接続詞 の品詞情報が付与された語 ( 長単位 ) の解析精度の調査 ( 非コアデータ対象 ) を行い, 以下の結果を得た 1 高頻度接続詞 20 語 ( 各 100 件対象 ) 全体の適合率は93.8% であり, 非コアデータ全体 ( 全品詞 ) に比べると低いが, 高い適合率になっている しかし, 語ごとに見ると, 適合率は63.0%~100.0% の範囲にあり適合率の低い語がある 適合率 90% 未満の語は, 又 82.0%, 更に 89.0%, 其れから 87.0%, 唯 76.0%, 猶 89.0%, で 63.0% の6 語である 又, 更に, 唯, 猶 は副詞の誤判定が多い 2 高頻度接続詞 20 語 ( 各 100 件対象 ) 全体では, レジスターの違いによる適合率の違いはほぼ見られない しかし, 適合率の低い 又 唯 で では, レジスターによる適合率の違いが見られる 3 又 の詳細調査(1,000 件対象 ) の結果, 適合率は 接続詞 85.8% である レジスター別では 接続詞 の 特定目的 ブログ 42.4% が特に低い 4 で の詳細調査(1,000 件対象 ) の結果, 適合率は 接続詞 62.0% である レジスター別では 特 32 特定目的 韻文 特定目的 教科書 は, で 詳細調査で用例が抽出されていないため適合率は不明であり, 補正後の順位は付していない 特定目的 法律 の順位も付していない 27

17 馬場俊臣 定目的 国会会議録 44.4%, 特定目的 知恵袋 46.0% が特に低い 5 誤判定の起こり易い環境 ( 前後の文脈 ) として, 直前 直後 1 文字の組み合わせが関わる可能性がある また 接続詞 の で の場合は特に文頭部分の であるから, でもって 等の複合辞や連語の誤判定 誤解析が関わる可能性がある 6 適合率に基づいて補正した使用頻度の数値を用いることにより, 調査結果の信頼性を増すことができる 適合率に基づいて補正することにより, 例えば接続詞使用頻度上位 20 語の順位や で のレジスター別順位が入れ替わる 接続詞研究では, 従来, コーパス検索の際に, 多くは文字列検索が行われ, また, 効率的に検索するために, 文頭に限定したり読点が後続する場合に限定したりすることも多かった 今後の研究において, BCCWJでの品詞情報が利用できることは極めて有益なことである 接続詞 全体での品詞情報の解析精度はコーパス全体 ( 全品詞 ) よりもやや劣るが, 接続詞 全体として他品詞と比較する場合には大きな問題は生じないであろう しかし, 異なり語の少ない接続詞内部で個々の語 ( 語群 ) を分析する場合には, 品詞情報の解析精度の違いが問題となる もちろん,BCCWJの品詞情報を利用する際には, 研究の目的や方法に応じて人手による点検が不可欠であるが, 検索結果をそのまま利用する場合では, 特に分析対象とする語の解析精度やそのレジスターによる違いを十分把握しておく必要がある 今後は, 誤判定, 誤解析の要因を明らかにし解析精度の向上を図ることが期待される 本稿の結果は品詞情報付与に関する解析器改良のための参考資料を提供するものでもある 文 献 稲益佐知子, 丸山岳彦 (2009) 第 Ⅰ 部 BCCWJ 構築におけるサンプリングの方針と基準 第 4 章 排除原則の運用 排除基 準と選択基準, 運用基準 柏野和佳子, 丸山岳彦, 稲益佐知子, 田中弥生, 秋元祐哉, 佐野大樹, 大矢内夢子, 山崎誠 現 代日本語書き言葉均衡コーパス における収録テキストの抽出手順と事例 文部科学省科学研究費特定領域研究 日本語コー パス データ班,pp 大内薫子 (2012) 接続表現の二重使用についてのコーパス調査 接続詞 + 接続詞 と 接続助詞 + 接続詞 の比較から 2012 年日本語教育国際研究大会予稿集第 2 分冊 日本語教育学会,p.230. 小木曽智信 (2014) 第 5 章 形態素解析 山崎誠 ( 編 ) 講座日本語コーパス 2. 書き言葉コーパス 設計と構築 朝倉 書店,pp 小木曽智信, 小椋秀樹, 小磯花絵, 宮内佐夜香, 渡部涼子, 伝康晴 (2010) 形態素解析辞書のベンチマークテスト IPAdic NAIST-jdic UniDicのジャンル別精度比較 言語処理学会第 16 回年次大会発表論文集 言語処理学会, pp 小椋秀樹, 小磯花絵, 冨士池優美, 宮内佐夜香, 小西光, 原裕 (2011) 現代日本語書き言葉均衡コーパス 形態論情報規 程集 第 4 版 ( 下 ) 国立国語研究所. 小椋秀樹, 小磯花絵, 宮内佐夜香, 原裕 (2011) 第 3 章 短単位 小椋秀樹, 小磯花絵, 冨士池優美, 宮内佐夜香, 小西光, 原裕 (2011) 現代日本語書き言葉均衡コーパス 形態論情報規程集 第 4 版 ( 下 ) 国立国語研究所,pp 小椋秀樹, 冨士池優美 (2011) 第 4 章形態論情報 国立国語研究所コーパス開発センター 現代日本語書き言葉均衡コー パス 利用の手引第 1.0 版 国立国語研究所コーパス開発センター,pp 鯨井綾希 (2011) 主成分分析を用いた文章構造の特徴抽出 品詞構成の変動に注目した分析 文芸研究 172, 日本文 芸研究会,pp 鯨井綾希 (2013) 同一語のくり返しが集中する文章構造の特徴 BCCWJ 特定目的サブコーパスの 教科書 を例として 日本語文法 13(2), 日本語文法学会,pp 鯨井綾希 (2014) 文章中の内容展開と用語類似度の変化との対応関係 接続表現の前後文脈に注目した分析 国語学 研究 (53), 東北大学大学院文学研究科国語学研究室内 国語学研究 刊行会,pp 国立国語研究所コーパス開発センター (2011) 現代日本語書き言葉均衡コーパス 利用の手引 第 1.0 版 国立国語研究所コー 28

18 BCCWJ の品詞情報の解析精度について パス開発センター. 国立国語研究所コーパス開発センター (2013) 現代日本語書き言葉均衡コーパス マニュアル第 1.1 版 (Web 公開用 ) 国立国語研究所コーパス開発センター.( 斎藤達哉 (2009) コーパスを用いた公共性の高い文章における表記改善への視点 特定領域研究 日本語コーパス 平成 20 年度公開ワークショップ ( 研究成果報告会 ) 予稿集 文部科学省科学研究費特定領域研究 日本語コーパス 総括班, pp 砂川有里子, 清水由貴子, 奥川育子 (2009) コーパスを用いた類義語研究 それなのに そのくせ それでいて の記述 日中言語研究と日本語教育 (2), 好文出版,pp 多田知子 (2010) 複合接続詞 文の文頭部分の階層性 国文論叢 (42), 神戸大学文学部国語国文学会,pp.52-39,68. 西部みちる, 大島一, 間淵洋子, 小林正行, 田島孝治, 高田智和, 山口昌也 (2011) 現代日本語書き言葉均衡コーパス における電子化テキストの構築 文部科学省科学研究費特定領域研究 日本語コーパス データ班. 馬場俊臣 (2013a) 接続詞の連続使用 二重使用 複合接続詞的使用も含めて 藤田保幸( 編 ) 形式語研究論集 和泉書院,pp 馬場俊臣 (2013b) 接続詞の二重使用の承接順序について 現代日本語書き言葉均衡コーパス を用いた再検討 語学文学 (52), 北海道教育大学語学文学会,pp 馬場俊臣 (2014) 接続詞の二重使用の承接順序及び文体差 現代日本語書き言葉均衡コーパス 全ジャンルによる追加調査 北海道教育大学紀要人文科学 社会科学編 65(1), 北海道教育大学,pp 馬場俊臣 (2015) BCCWJの接続詞の品詞情報の解析精度について 第 7 回コーパス日本語学ワークショップ予稿集 国立国語研究所言語資源研究系 コーパス開発センター,pp 藤井聖子 (2013) 現代日本語における条件構文基盤の談話標識( 化 ) その形式と機能に関する類型試案 東京大学大学院総合文化研究科言語情報科学専攻紀要 Language, Information, Text 20, 東京大学大学院総合文化研究科言語情報科学専攻,pp 冨士池優美, 小西光, 小椋秀樹, 小木曽智信, 小磯花絵 (2011) 長単位に基づく 現代日本語書き言葉均衡コーパス の品詞比率に関する分析 言語処理学会第 17 回年次大会発表論文集 言語処理学会,pp 丸山岳彦, 山崎誠, 柏野和佳子, 佐野大樹, 秋元祐哉, 稲益佐知子, 田中弥生, 大矢内夢子 (2011) 現代日本語書き言葉均衡コーパス におけるサンプリングの原理と運用 文部科学省科学研究費特定領域研究 日本語コーパス データ班. 宮内佐夜香 (2013) 接続詞 なので の書き言葉における使用について 現代日本語書き言葉均衡コーパス を資料として 中京国文学 (32), 中京大学文学会,pp 山崎誠 (2013) コーパスでできること2 BCCWJを例に 日本語学 32(14), 明治書院,pp 付記 本稿の内容の一部は, 第 7 回コーパス日本語学ワークショップ ( 国立国語研究所,2015 年 3 月 11 日 ) で発表したもの ( 馬場 (2015)) を加筆 修正したものである 会場において有意義なコメントを下さった方々に感謝申し上げる 本研究は, 平成 26~28 年度科学研究費補助金 ( 基盤研究 B) 日本語の多様な表現性を支える複合辞などの 形式語 に関する総合研究 ( 研究代表者 : 藤田保幸, 課題番号 : ) による成果の一部である ( 札幌校教授 ) 29

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69>

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69> 短単位 長単位データマニュアル ver.1.0 (2004-03-24) 山口昌也, 小椋秀樹, 西川賢哉, 石塚京子, 木村睦子 ( 国立国語研究所 ) 内元清貴 ( 情報通信研究機構 ) 目次 1. はじめに 2. 収録内容 3. データ形式 3.1 ファイル形式とファイル名 3.2 短単位 長単位混合形式概要実例各フィールドの説明 3.3 長単位形式概要実例各フィールドの説明 4. 転記テキストとの関係

More information

1. はじめに 2

1. はじめに 2 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1 1. はじめに 2 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 /

More information

先行研究 pp

先行研究 pp N N 1 BCCWJ 1 はじめに 2007 362 a a. b. a. b. a b 2007 363 A B A B A B A A B A B 1 2014 2 5 53 54 2007 363 2 先行研究 200719771989 1998 2001 1993 2004 1977 pp.122 130 N N 55 1989 2 pp.20 21 3 pp.34 35 2 3 56 1998

More information

タイトルは14ポイント&ボールドMS明朝

タイトルは14ポイント&ボールドMS明朝 言語単位と文の長さが品詞比率に与える影響 山崎誠 ( 国立国語研究所言語資源研究系 ) Influence of Word Unit and Sentence Length on the Ratio of Parts of Speech Makoto Yamazaki (Dept. Corpus Studies, NINJAL) 1. はじめに語類構成比の問題は語彙の分布問題の重要なテーマとして 1950

More information

3. データ本発表では 2011 年 12 月にリリースされた 現代日本語書き言葉均衡コーパス の DVD 版を使用した Disk1 の M-XML フォルダに含まれる xml ファイルが対象である この xml ファイルは可変長サンプルと固定長サンプルを統合したもので 短単位 長単位の形態論情報の

3. データ本発表では 2011 年 12 月にリリースされた 現代日本語書き言葉均衡コーパス の DVD 版を使用した Disk1 の M-XML フォルダに含まれる xml ファイルが対象である この xml ファイルは可変長サンプルと固定長サンプルを統合したもので 短単位 長単位の形態論情報の 共起語率の分布からみるテキストの語彙的特徴 山崎誠 ( 国立国語研究所言語資源研究系 ) Lexical Characteristics of Text as Seen in the Distribution of Co-occurrence Rate Makoto Yamazaki (Dept. Corpus Studies, NINJAL) 1. はじめに 現代日本語書き言葉均衡コーパス (Balanced

More information

中納言 の使い方 凡例 検索例 1 注 検索例 参考情報 注意点 1

中納言 の使い方 凡例 検索例 1 注 検索例 参考情報 注意点 1 中納言 の使い方 凡例 検索例 1 注 検索例 参考情報 注意点 1 1. 3つの検索方法 ( 一番上のタブ ) 短単位検索 } 形態論情報を使った検索長単位検索文字列検索 } 形態論情報を使わない検索 3つの検索方法の使い分け短単位検索 国名 + 語 のような組み合わせ検索で 語 を一度に検索できる 日本語 で検索してもヒットしない( 短単位では 日本 + 語 ) 長単位検索 日本語 でヒットする

More information

Title マルチメディア コーパスの 構 築 と 活 用 : 表 現 行 動 の 計 量 的 研 究 のために Author(s) 孫, 栄 奭 Citation 阪 大 日 本 語 研 究. 22 P.65-P.90 Issue 2010-02 Date Text Version publisher URL http://hdl.handle.net/11094/10048 DOI Rights

More information

<mergedsample sampleid=" サンプル ID" type="bccwj MorphXML" version="1.1" NumTrans="true"> M-XML_NT のファイルであっても 対象となる数字列が存在せず NumTrans 処理がなされていないものについてはこの属

<mergedsample sampleid= サンプル ID type=bccwj MorphXML version=1.1 NumTrans=true> M-XML_NT のファイルであっても 対象となる数字列が存在せず NumTrans 処理がなされていないものについてはこの属 第 9 章形態論情報付き統合形式 XML(M-XML) 小木曽智信間淵洋子前川喜久雄 9.1 M-XML の概要形態論情報付き統合形式 XML(Morphology-base XML 以下 M-XML と略記する ) は 文字ベースの XML(C-XML) フォーマットをもとにして 固定長 可変長サンプルを統合し 言語構造を一定程度反映させた XML フォーマットである 短単位 長単位の形態論情報を

More information

Title 必ず 絶対 きっと の文体的特徴 現代日本語書き言葉均衡コーパス の調査から Author(s) 前坊, 香菜子 Citation 一橋大学国際教育センター紀要, 5: Issue Date Type Departmental Bulletin Pap

Title 必ず 絶対 きっと の文体的特徴 現代日本語書き言葉均衡コーパス の調査から Author(s) 前坊, 香菜子 Citation 一橋大学国際教育センター紀要, 5: Issue Date Type Departmental Bulletin Pap Title Author(s) 前坊, 香菜子 Citation 一橋大学国際教育センター紀要, 5: 93-104 Issue 2014-07-30 Date Type Departmental Bulletin Paper Text Version publisher URL http://doi.org/10.15057/26866 Right Hitotsubashi University

More information

Microsoft Word - LRW-2017 [P-A-3-S].docx

Microsoft Word - LRW-2017 [P-A-3-S].docx 読点が接続詞の直後に打たれる要因について : 一般化線形モデルを用いた予測モデルの構築 岩崎拓也 ( 一橋大学大学院言語社会研究科 ) Factors Involved in Placing the Comma Immediately Following a Conjunction: An Analysis Using Generalized Linear Models Takuya Iwasaki

More information

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074> RD_301 構成要素一覧と検索 から構成要素の編集辞書 ( 削除 ) を作る 作成 ( 編集 ) する削除辞書を開きます 構成要素を検索します ドラック & ドロップでも OK 範囲を選択して右クリック 右クリック 削除辞書に登録 ( 追加 ) したい構成要素を選択しコピーします 削除辞書に追加 ( 貼りつけ ) ます Step5. 削除辞書に構成要素が登録 ( 追加 ) されます 構成要素一覧と検索

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

1.

1. Title 名 詞 型 助 数 詞 の 用 法 : 準 助 数 詞 セット と 組 を 中 心 に Author(s) 東 条, 佳 奈 Citation 阪 大 日 本 語 研 究. 27 P.109-P.136 Issue 2015-03 Date Text Version publisher URL http://hdl.handle.net/11094/51518 DOI Rights Osaka

More information

日本語「~ておく」の用法について

日本語「~ておく」の用法について 論文要旨 日本語 ~ ておく の用法について 全体構造及び意味構造を中心に 4D502 徐梓競 第一章はじめに研究背景 目的 方法本論文は 一見単純に見られる ~ておく の用法に関して その複雑な用法とその全体構造 及び意味構造について分析 考察を行ったものである 研究方法としては 各種辞書 文法辞典 参考書 教科書 先行研究として ~ておく の用法についてどのようなもの挙げ どのようにまとめているかをできる得る限り詳細に

More information

Hirosaki University Repository ファウストとグレートヒェン : グレートヒェン悲 Title 劇 とは何か? Author(s) 田中, 岩男 Citation 人文社会論叢. 人文科学篇. 16, 2006, p.43-77 Issue Date 2006-08-31 URL http://hdl.handle.net/10129/881 Rights Text version

More information

タイトルは14ポイント&ボールドMS明朝

タイトルは14ポイント&ボールドMS明朝 書き言葉的 として指導する必要のある語の分析 - 現代日本語書き言葉均衡コーパス を利用して - 木田真理 ( 国際交流基金日本語国際センター ) 柏野和佳子 ( 国立国語研究所言語資源研究系 ) Words that Need to Be Taught as "Written Language": Analysis of the BCCWJ Mari Kida (The Japan Foundation

More information

Title トップアスリ - トの陸上競技継続に関する研究 1: インタビュ - 調査を通 して Author(s) 松田, 賢一 ; 新沼, 英明 Citation 学校教育学会誌, 18: 1-13 Issue Date 2013-03 URL http://s-ir.sap.hokkyodai.ac.jp/dspac Rights Hokkaido University of Education

More information

修士論文 ( 要旨 ) 2015 年 1 月 付帯状況を表す X ヲ Y ニ に関する考察 指導新屋映子教授 言語教育研究科日本語教育専攻 213J3025 周阳

修士論文 ( 要旨 ) 2015 年 1 月 付帯状況を表す X ヲ Y ニ に関する考察 指導新屋映子教授 言語教育研究科日本語教育専攻 213J3025 周阳 修士論文 ( 要旨 ) 2015 年 1 月 付帯状況を表す X ヲ Y ニ に関する考察 指導新屋映子教授 言語教育研究科日本語教育専攻 213J3025 周阳 Master s Thesis(Abstract) January 2015 The Japanese Adverbial Phrase "X Wo Y Ni" for Indicating Attendant Circumstances:

More information

Title Author(s) Kobe University Repository : Kernel 英語関係代名詞 which の機能と習得 : コーパスに基づく記述的研究 天谷, ことみ / 石川, 慎一郎 Citation 神戸大学国際コミュニケーションセンター論集,4:1-16 Issue date 2007 Resource Type Resource Version URL Departmental

More information

Title 空を見つけた傾斜の土地 : ボクの家プロジェクト 再現部 Author(s) 堀, 寛史 Citation 臨床哲学. 11 P.75-P.90 Issue 2010-06-30 Date Text Version publisher URL http://hdl.handle.net/11094/7338 DOI Rights Osaka University そら 4 4 4 4

More information

Title 臨 床 哲 学 ネットワーキング 分 科 会 自 己 言 及 班 ワーキン グペーパー Author(s) Citation 臨 床 哲 学. 14(2) P.105-P.123 Issue 2013-03-31 Date Text Version publisher URL http://hdl.handle.net/11094/24723 DOI Rights Osaka University

More information

Title 源 氏 物 語 にみる 人 間 関 係 と 表 現 の 関 連 Author(s) 山 村, 愛 ; 斎 藤, 祥 子 Citation 北 海 道 教 育 大 学 紀 要. 人 文 科 学 社 会 科 学 編, 57(1): 95-104 Issue Date 2006-08 URL http://s-ir.sap.hokkyodai.ac.jp/dspac Rights Hokkaido

More information

6回目

6回目 ir05b.web 情報検索課題提出項目の確認 1. 検索課題の設定 2.Googleによる日本語キーワード検索 3. Google 以外の日本語キーワード検索 4. 英語検索エンジンによるキーワード検索 5. Web 情報検索のまとめ 6. 情報収集結果のまとめかた : サイトの信頼度 重点項目 (Web 情報検索のねらい ) 1 目的 目標の設定 4,5,6,7(kw11,12,13 ) 2 蓋然的信頼性

More information

Title 現 代 ことば 遣 い 小 考 ( 六 ) : 国 語 を 教 えるものの 自 戒 のために Author(s) 後 藤, 秋 正 Citation 札 幌 国 語 研 究, 6: 51-60 Issue Date 2001 URL Rights http://s-ir.sap.hokkyodai.ac.jp/dspac 本 文 ファイルはNIIから 提 供 されたものである Hokkaido

More information

多言語版「チュウ太のweb辞書」を用いた語彙学習

多言語版「チュウ太のweb辞書」を用いた語彙学習 < 日本語教育と AI: 研究実践例と今後の課題 > 読解支援システムへの AI 活用の可能性と留意点 東京国際大学 川村よし子 読解支援システムへの AI 活用の可能性と留意点 はじめに 1. 読解支援システムと自然言語処理技術 2. リーディング チュウ太 3. チュウ太のWeb 辞書 4. チュウ太のやさしくなーれ 5.AI 活用の可能性と留意点 はじめに はじめに AI( 人工知能 ) とは?

More information

Title インドネシアの日本語教育 Author(s) 田尻, 英三 鹿児島大学教育学部研究紀要. 人文 社会科学編 =Bulletin Citation of the Faculty of Education, Kagosh and social science, 35: 1-20 Issue Date 1984-03-15 URL http://hdl.handle.net/10232/7599

More information

Hirosaki University Repository Title 我 郷 土 の 天 然 紀 念 物 Author(s) 和 田, 干 藏 Citation 校 友 会 誌 郷 土 号. 2, 1934, p.1-30 Issue Date 1934-03-22 URL http://hdl.handle.net/10129/3761 Rights Text version publisher

More information

博士学位論文審査報告書

博士学位論文審査報告書 2 氏 名 RANADIREKSA, Dinda Gayatri 学 位 の 種 類博士 ( 文学 ) 報 告 番 号甲第 377 号 学位授与年月日 2014 年 9 月 19 日 学位授与の要件 学位規則 ( 昭和 28 年 4 月 1 日文部省令第 9 号 ) 第 4 条第 1 項該当 学位論文題目複合辞に関する研究 審 査 委 員 ( 主査 ) 沖森卓也加藤睦阿久津智 ( 拓殖大学外国語学部教授

More information

第 6 回コーパス日本語学ワークショップ予稿集 (2014 年 9 月, 国立国語研究所 ) BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on

第 6 回コーパス日本語学ワークショップ予稿集 (2014 年 9 月, 国立国語研究所 ) BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on BCCWJ と日英パラレル新聞コーパスに基づいた格外連体修飾形の研究 田邊和子 ( 日本女子大学文学部 ) Study of the Case-Outer Relative Clauses Based on the BCCWJ and Japanese-English Newspaper Parallel Corpus Kazuko Tanabe (Japan Women s University)

More information

shippitsuyoko_

shippitsuyoko_ 日本語 / 日本語教育研究 執筆要項 1. 書式 原稿の本文は日本語とする 原稿は横書きとする 原稿は A4 用紙に 35 字 30 行の書式で執筆する 原稿のポイントは 10.5 ポイントとする 投稿論文は A 論文と B 論文の二種類とする 両者は分量が異なるだけで内容に区別はない 原稿の分量は 次のとおり 投稿時の分量超過は認めない A 論文 16 ページ以内 ( 投稿時 タイトルページ1ページと本文

More information

柴山 専門英語の教育とコーパスの利用 動詞の判定基準は省略するが 検索の都合で 同じ語 図1 介入の語彙リスト最上部 の同じ語形が動詞と他品詞の両方に使われている場 合は動詞とした ただし後の用例検索では他品詞を除 外した 表4 動詞 助動詞のリスト 上位20位まで 介入 図2 根拠の語彙リスト最上部 図1と図2で目に付くことがある 両図の5位まで に入っている語が全く同じで すべて機能語(冠詞 前

More information

Title 体制化のクラスター分析による検討 II : 語句形式における体制化 Author(s) 桐村, 雅彦 Editor(s) Citation 大阪府立大学紀要 ( 人文 社会科学 ). 1981, 29, p.101-120 Issue Date 1981-03-31 URL http://hdl.handle.net/10466/10726 Rights http://repository.osakafu-u.ac.jp/dspace/

More information

指導内容科目国語総合の具体的な指導目標評価の観点 方法 読むこと 書くこと 対象を的確に説明したり描写したりするなど 適切な表現の下かを考えて読む 常用漢字の大体を読み 書くことができ 文や文章の中で使うことができる 与えられた題材に即して 自分が体験したことや考えたこと 身の回りのことなどから 相

指導内容科目国語総合の具体的な指導目標評価の観点 方法 読むこと 書くこと 対象を的確に説明したり描写したりするなど 適切な表現の下かを考えて読む 常用漢字の大体を読み 書くことができ 文や文章の中で使うことができる 与えられた題材に即して 自分が体験したことや考えたこと 身の回りのことなどから 相 年間授業計画 東京都立千早高等学校平成 29 年度教科国語科目国語総合年間授業計画 教科 : 国語科目 : 国語総合単位数 : 4 単位対象学年組 : HR11~HR16 ) 使用教科書 :( 精選国語総合 ( 東京書籍 ) ) 使用教材 :( 新版三訂カラー版新国語便覧 ( 第一学習社 ) しっかり書いて意味で覚える漢字トレーニング ( いいずな書店 ) 精選国語総合学習課題ノート ( 東京書籍

More information

Microsoft Word - CiNiiの使い方.doc

Microsoft Word - CiNiiの使い方.doc CiNii の使い方 CiNii とは 国立情報学研究所 (NII) では 各種サービスごとに提供しているコンテンツを統合するとともに 国内外の有用な学術情報資源との連携を可能とすることを目標としたプラットフォーム GeNii ( ジーニイ ) の構築を進めています GeNii の機能の一つとして NII 論文情報ナビゲータ CiNii ( サイニイ ) を提供します CiNii では 学協会で発行された学術雑誌と大学等で発行された研究紀要の両方を検索し

More information

タイトルは14ポイント&ボールドMS明朝

タイトルは14ポイント&ボールドMS明朝 形態素解析辞書 中古和文 UniDic を利用した古典学習教材の作成 須永哲矢 ( 昭和女子大学 ) Preparation of Teaching Materials in Classical Literature using an Electrical Dictionary for Morphological analysis "Chuko-Wabun UniDic" Tetsuya Sunaga

More information

(Microsoft Word - \207U\202P.doc)

(Microsoft Word - \207U\202P.doc) ( 科目別結果別結果の経年変化 平均通過率 通過率 % 以上の生徒の割合 通過率 % 以上の生徒の割合 国語数学外国語 A 問題 B 問題 A 問題 B 問題 A 問題 B 問題国語国語数学数学 Ⅰ 数学数学 Ⅰ OCⅠ 英語 Ⅰ OCⅠ 英語 Ⅰ 総合総合基礎基礎 H3 7.3 73. 35. 9..1. 5.1 9.7.5 7. H 73. 7. 3. 71. 57. 73.. 9.9 5.5

More information

0210研究会

0210研究会 複数のソーシャルメディアのレビューを 用いた商品比較基盤技術の提案 甲南大学大学院自然科学研究科服部祐基 甲南大学知能情報学部灘本明代 背景 ソーシャルメディアを用いて情報を取得する行為が多くなっている 商品の購入 商品認知の情報源 購入のきっかけとなった情報源 として 約 40% ものインターネットユーザがソーシャルメディアを活用している 1),2) ソーシャルメディアの書き込みを商品購入の際の参考にしているユーザが多く存在している

More information

Title 踊るサロメ の文体考察 Author(s) 真屋, 和子 Citation 一橋論叢, 134(3): 356-373 Issue 2005-09-01 Date Type Departmental Bulletin Paper Text Version publisher URL http://hdl.handle.net/10086/15563 Right Hitotsubashi

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

自立語と付属語 文法的な面からもう少し詳しく解説します ひとつの文は複数の文節からなります 文 つなみ津波が文節 き来ます文節 そして 文節は自立語だけ あるいは自立語プラス付属語で構成されています つなみ津波 が 自 + 付 き来ます 自 自 自立語 付 付属語 自立語とはその語だけで意味を持ち

自立語と付属語 文法的な面からもう少し詳しく解説します ひとつの文は複数の文節からなります 文 つなみ津波が文節 き来ます文節 そして 文節は自立語だけ あるいは自立語プラス付属語で構成されています つなみ津波 が 自 + 付 き来ます 自 自 自立語 付 付属語 自立語とはその語だけで意味を持ち やさしい日本語 のための分かち書きルール やさしい日本語 には 文を分かち書きにするというルールがあります ここでは 掲示物等で やさしい日本語 を使用する際の分かち書きの仕方について 詳しく説明します この分かち書きルールは外国人留学生 21 人にアンケートを行い 確実に情報が伝わるかや 誤解を生じることがないかなどについての検証を行いました また この分かち書きルールは社会言語学研究室が提案する

More information

Microsoft PowerPoint _Textmining2018_山崎.pptx

Microsoft PowerPoint _Textmining2018_山崎.pptx テキストマイニング 2018 2018.6.9 同志社大学文化情報学部夢告館 102 10:50-11:15 小説会話文への話者情報付与と その問題点 山崎誠 ( 国立国語研究所 ) 1 目次 1. 本研究の概要 2. はじめに 3. データと問題点 4. 分析事例 5. まとめ 2 1. 本研究の概要 会話文への発話者情報の付与によるコーパスの拡張 基盤研究 B(15H032312) 2015.4~2019.3

More information

Language Use in Atarashii Rekishi Kyokasho : Based on a comparative survey of 8 textbooks of Japanese history for junior high school student

Language Use in Atarashii Rekishi Kyokasho : Based on a comparative survey of 8 textbooks of Japanese history for junior high school student Title Author(s) 新しい歴史教科書 の言語使用 : 中学校歴史教科書 8 種の比較調査から 石井, 正彦 Citation 阪大日本語研究. 24 P.1-P.34 Issue Date 2012-02 Text Version publisher URL http://hdl.handle.net/11094/10788 DOI rights 24 2012 8 Language Use

More information

Title ジェンダーから 見 る 物 語 : インドネシアのラーマーヤナ における 男 性 像 と 女 性 像 Author(s) 福 岡, まどか Citation 大 阪 大 学 大 学 院 人 間 科 学 研 究 科 紀 要. 37 P.251-P.273 Issue 2011-03-31 Date Text Version publisher URL http://doi.org/10.18910/9258

More information

Title 大 学 における 郷 土 史 家 の 養 成 : レスター 大 学 イギリス 郷 土 史 学 科 の 場 合 Author(s) 石 井, 健 Citation 北 海 道 教 育 大 学 紀 要. 人 文 科 学 社 会 科 学 編, 65(1): 43-57 Issue Date 2014-08 URL http://s-ir.sap.hokkyodai.ac.jp/dspac Rights

More information

Hirosaki University Repository 近世出羽国 象潟 : 名所 名勝における歴史的景 Title 観の保存と開発 Author(s) 長谷川, 成一 Citation 文経論叢. 人文学科篇. 12, 1992, p.91-136 Issue Date 1992-03-19 URL http://hdl.handle.net/10129/323 Rights Text version

More information

立ち読みページ

立ち読みページ Chapter 5 文章校正やコメント 変更履歴など 文書を校閲するときに役立つ機能を解説します 作成する文書を確認する 172 文章を校正する 173 文字の意味を調べる 178 コメントを挿入する 181 変更履歴を使って文書を校閲する 187 2つの文書を比較する 194 196 Chapter 5 学習前に習得すべきポイントを理解しておき 学習後には確実に習得できたかどうかを振り返りましょう

More information

Title 問題解決行動における内的認知変数 Author(s) 中島, 義明 ; 太田, 耕平 Citation 大阪大学人間科学部紀要. 20 P.49-P.70 Issue 1994-03 Date Text Version publisher URL http://doi.org/10.18910/11129 DOI 10.18910/11129 Rights Osaka University

More information

Title 江戸川乱歩と昭和ベルエポック Author(s) 堀江, 珠喜 Editor(s) Citation 大阪府立大学紀要 ( 人文 社会科学 ). 1995, 43, p.91-104 Issue Date 1995-03-31 URL http://hdl.handle.net/10466/10776 Rights http://repository.osakafu-u.ac.jp/dspace/

More information

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手

3.BCCWJ における固有表現抽出のエラー分析手法 3.1 BCCWJ における KNP のエラー分析今回エラーの分析をするにあたって BCCWJ のうち YAHOO! 知恵袋 白書 YAHOO! ブログ 書籍 雑誌 新聞 の 6 つからランダムサンプリングした計 136 個のテキストに対して人手 BCCWJ における固有表現抽出のエラー分析 市原正陽 ( 茨城大学工学部情報工学科 ) 山崎舞子 ( 東京工業大学大学院総合理工学研究科 ) 古宮嘉那子 ( 茨城大学工学部情報工学科 ) Error Analysis of Named Entity Extraction in BCCWJ Masaaki Ichihara(Department of Computer and Information

More information

Title ジブリ 映 画 のメタファー(2) : 意 志 をめぐる 考 察 Author(s) 角, 一 典 Citation 北 海 道 教 育 大 学 紀 要. 人 文 科 学 社 会 科 学 編, 64(1): 107-122 Issue Date 2013-09 URL http://s-ir.sap.hokkyodai.ac.jp/dspac Rights Hokkaido University

More information

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C

IPSJ SIG Technical Report 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version C 1,a) 1,b) N-gram 75.9% 1. Firefox Linux (Open Source Software: OSS) (Mailing List: ML) (Bug Tracking System: BTS) (Version Control System: VCS)?? 1 NNCT, 22 Yatatyou,Yamatokoriyamashi, Nara 639 1080, Japan

More information

コンピュータ応用・演習 情報処理システム

コンピュータ応用・演習 情報処理システム 2010 年 12 月 15 日 データエンジニアリング 演習 情報処理システム データマイニング ~ データからの自動知識獲得手法 ~ 1. 演習の目的 (1) 多種多様な膨大な量のデータを解析し, 企業の経営活動などに活用することが望まれている. 大規模データベースを有効に活用する, データマイニング技術の研究が脚光を浴びている 1 1. 演習の目的 (2) POS データを用いて顧客の購買パターンを分析する.

More information

(3) 現実は甘くなかった 人材紹介会社に登録に行くと まず 年齢がネック だと言われた ( 朝日新聞 ) 上記の用例は日本の新聞記事から引いた実際の使用例である しかし 例 (1) と例 (2) における 甘い の意味用法は 上の 4 つの国語辞書の意味項目に該当するものが見つけ

(3) 現実は甘くなかった 人材紹介会社に登録に行くと まず 年齢がネック だと言われた ( 朝日新聞 ) 上記の用例は日本の新聞記事から引いた実際の使用例である しかし 例 (1) と例 (2) における 甘い の意味用法は 上の 4 つの国語辞書の意味項目に該当するものが見つけ コーパスに基づく多義語 甘い の意味再分類及び語義分布調査 姜紅 ( 北京外国語大学日本学研究センター 北京第二外国語学院日本語学院 ) The Semantic Classification of Amai and Its Semantic Distribution Based on Corpus JIANG Hong(Beijing Foreign Studies University, Beijing

More information

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx)

(Microsoft Word - deim2009\215\305\217I\224\305_kobayashi.docx) DEIM Forum 2009 C6-4 Web 上のレビュー情報からユーザが重要視する製品の特徴を抽出する手法の提案 小林大祐 井上潮 東京電機大学工学研究科 101-8457 東京都千代田区神田錦町 2-2 E-mail: 08gmc13@ed.cck.dendai.ac.jp, inoue@c.dendai.ac.jp あらまし製品のレビューを書くための Web サイトが存在し, 利用者も多い.

More information

Hirosaki University Repository 六 朝 道 教 における 応 報 説 の 発 展 : 教 理 展 開 追 迹 の 一 Title 試 論 Author(s) 秋 月, 觀 暎 Citation 弘 前 大 学 人 文 社 会, 33, 1964, p.25 60 Issue Date 1964-03-30 URL http://hdl.handle.net/10129/1537

More information

Title 自 然 の 記 号 = 書 物 観 とガリレオ 的 科 学 Author(s) 金 子, 務 Editor(s) Citation 人 文 学 論 集. 1993, 11, p.31-47 Issue Date 1993-03-01 URL http://hdl.handle.net/10466/8821 Rights http://repository.osakafu-u.ac.jp/dspace/

More information

Hirosaki University Repository Title 東 北 北 部 の 縄 文 式 に 後 続 する 土 器 Author(s) 村 越, 潔 Citation 弘 前 大 学 教 育 学 部 紀 要. 14, 1965, p.27-34 Issue Date 1965-03-30 URL http://hdl.handle.net/10129/722 Rights Text

More information

Title デンマークにおける 子 どもケアと 学 校 教 育 の 連 携 につい て Author(s) 沢 広, あや Citation 大 阪 大 学 教 育 学 年 報. 9 P.149-P.162 Issue 2004-03 Date Text Version publisher URL http://hdl.handle.net/11094/7061 DOI Rights Osaka University

More information

平成23年度全国学力・学習状況調査問題を活用した結果の分析   資料

平成23年度全国学力・学習状況調査問題を活用した結果の分析   資料 平成 23 年度全国学力 学習状況調査問題を活用した結果の分析 1 調査結果の概要 (1) 全体的な傾向 伊達市教育委員会 市内の小 中学校においては 全体として以下のような特徴がみられた 平成 23 年度全国学力 学習状況調査問題を活用した北海道における学力等調査は 札 幌市を除く178 市町村 及び特別支援学校小学部 特別支援学校中学部 中等教育学校 が実施をした 実施した学校数と児童生徒数については

More information

Title 体 験 話 法 の 機 能 について : 二 重 の 視 点 性 の 観 点 から Author(s) 三 瓶, 裕 文 Citation (37): 17-32 Issue 2012-05 Date Type Journal Article Text Version publisher URL http://hdl.handle.net/10086/25722 Right Hitotsubashi

More information

Title セカンドチャンスとしての 海 外 留 学? : 教 育 達 成 のため のトランスナショナルな 移 動 とそのリスク Author(s) 芝 野, 淳 一 Citation 大 阪 大 学 教 育 学 年 報. 18 P.81-P.96 Issue 2013-03-31 Date Text Version publisher URL http://hdl.handle.net/11094/24310

More information

Title 初級日本語学習者による助詞 は が を の習得過程 ( 水谷信子先生退官記念号 ) Author(s) 井内, 麻矢子 Citation 言語文化と日本語教育 Issue Date 1995-07-01 URL http://hdl.handle.net/10083/50167 Rights Resource Type Departmental Bulletin Paper Resource

More information

Title 自閉症スペクトラム障害における文脈にもとづく表情認知過程 Author(s) 日高, 茂暢 Citation 北海道大学大学院教育学研究院紀要, 114: 101-121 Issue Date 2011-12-27 DOI 10.14943/b.edu.114.101 Doc URLhttp://hdl.handle.net/2115/48187 Right Type bulletin

More information

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin

言語資源活用ワークショップ 2019 発表論文集 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Usin 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用 谷田部梨恵 ( 茨城大学大学院理工学研究科 ) 佐々木稔 ( 茨城大学工学部情報工学科 ) Semi-Supervised Word Sense Disambiguation Using Unlabeled Examples of Each Genre Rie Yatabe (Ibaraki University) Minoru Sasaki

More information

韓 国 人 留 学 生 のライフストーリーから 見 た 日 本 人 学 生 と Titleの 社 会 的 ネットワークの 特 徴 : 自 分 らしさ という 視 点 から Author(s) 中 山, 亜 紀 子 Citation 阪 大 日 本 語 研 究. 19 P.97-P.127 Issue 2007-02 Date Text Version publisher URL http://hdl.handle.net/11094/8367

More information

Hirosaki University Repository Title 古墳時代における えみし の位置付けについて Author(s) 女鹿, 潤哉 Citation 弘前大学國史研究. 110, 2001, p.1-20 Issue Date 2001-03-30 URL http://hdl.handle.net/10129/3227 Rights Text version publisher

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 前半第 2 回 ) 辻慶太 http://slis.sakura.ne.jp/cje3 1 情報検索システムの世界観 情報の生産者研究者, 作家, 記者など 情報の最終利用者 ( エンドユーザ ) 生産 情報の登録者 DB 登録者, 分類者, 索引作成者など 登録 検索 計算機上のシステム 検索エンジン,DB, インタフェースなど 支援 蓄積される情報図書, 雑誌, 画像, 音声など

More information

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版 独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版 目次 1. はじめに... 3 2. インストール方法... 4 3. プログラムの実行... 5 4. プログラムの終了... 5 5. 操作方法... 6 6. 画面の説明... 8 付録 A:Java のインストール方法について... 11

More information

日中両言語における人称代名詞の対照研究

日中両言語における人称代名詞の対照研究 Nara Women's University Digital I Title 日中両言語における人称代名詞の対照研究 Author(s) 付, 敏 Citation 古代文化とその諸相, p.7, p121-136 Issue Date 2007-08-31 Description URL http://hdl.handle.net/10935/1432 Textversionpublisher

More information

コーパスに基づく言語学教育研究報告 8

コーパスに基づく言語学教育研究報告 8 No.82012 5 5 1. 2. 2009 BCCWJ 2007 1 12 BCCWJ Yahoo! BCCWJ 57,807 4,459 5,110 854 1,500 Yahoo! 45,725 159 57,807 2009 3. 1 2 3 X A 3 20102011 1 2 X A 1 X X X X X A 2 1 X A 3 1 1 2 3 2 http://mainet.ath.cx/bbs/sst/sst.php?act=dump&cate=hxh&all=2035&n=2

More information

Title 英 語 の 同 族 目 的 語 構 文 の 特 性 について Author(s) 大 庭, 幸 男 Citation 待 兼 山 論 叢. 文 化 動 態 論 篇. 45 P.95-P.118 Issue 2011-12-26 Date Text Version publisher URL http://hdl.handle.net/11094/25115 DOI Rights Osaka

More information

Hirosaki University Repository Title 更 級 日 記 の 特 徴 的 表 現 について Author(s) 伊 藤, 守 幸 Citation 弘 前 大 学 国 語 国 文 学. 7, 1985, p.21-31 Issue Date 1985-03-20 URL http://hdl.handle.net/10129/4129 Rights Text version

More information

クイックマニュアル(利用者編)

クイックマニュアル(利用者編) クイックマニュアル エコノス株式会社 目次 1. 利用イメージ 2. ログイン画面 3. 検索画面 4. クロールサイト管理画面 5. ユーザ管理 6. 検索履歴確認 7. クロール結果確認 8. ダウンロードパスワード設定 9. URLチェック 2 1. ご利用イメージ (1/2) 基本的な機能のご利用について 1 サイトへアクセスしログイン関連ページ :2. ログイン画面 2 検索対象の URL

More information

Title 独裁者 の英音法 : 文章構造とリズム構造 Author(s) 寺島, 隆吉 Citation [ 岐阜大学教養部研究報告 ] vol.[25] p.[303]-[ Issue Date 1989 Rights Version 岐阜大学教養部英語研究室 (Faculty of General Gifu University) URL http://repository.lib.gifu-u.ac.j

More information

Title 英 語 の 不 定 詞 に 見 られる 主 格 的 機 能 の 発 達 Author(s) 山 川, 喜 久 男 Citation 一 橋 大 學 研 究 年 報. 人 文 科 学 自 然 科 学 研 究, 2: 87-128 Issue 1960-03-31 Date Type Departmental Bulletin Paper Text Version publisher URL

More information

Hirosaki University Repository Title 監 査 法 人 の 未 来 像 : 監 査 法 人 の 研 究 Author(s) 柴 田, 英 樹 Citation 人 文 社 会 論 叢. 社 会 科 学 篇. 23, 2010, p.67-99 Issue Date 2010-02-28 URL http://hdl.handle.net/10129/3261 Rights

More information

Title ゲルマン語の歴史と構造 (1) : 歴史言語学と比較方法 Author(s) 清水, 誠 Citation 北海道大学文学研究科紀要 = The Annual Report on Science, 131: 1( 左 )-40( 左 ) Issue Date 2010-07-20 DOI Doc URLhttp://hdl.handle.net/2115/43276 Right Type

More information

モ ~b.

モ ~b. Title 織田作之助 それでも私は行く 論 : 京都日日新聞 を手がかりに Author(s) 斎藤, 理生 Citation 國語と國文學. 89(10) P.33-P.47 Issue 2012-10 Date Text Version publisher URL http://hdl.handle.net/11094/56972 DOI Rights Osaka University モ ~b.

More information

Title 江 戸 時 代 における 中 国 絵 画 受 容 の 問 題 : 池 大 雅 の 款 記 に 見 られる 写 意 をめぐって Author(s) 濱 住, 真 有 Citation 待 兼 山 論 叢. 美 学 篇. 44 P.1-P.27 Issue 2010-12-24 Date Text Version publisher URL http://hdl.handle.net/11094/5067

More information

近 世 スウェーデンにおける 軍 事 革 命 : 初 期 ヴァーサ 朝 期 Titleからグスタヴ2 世 アードルフ 期 におけるスウェーデン 軍 制 の 展 開 Author(s) 古 谷, 大 輔 Citation 大 阪 大 学 世 界 言 語 研 究 センター 論 集. 3 P.1-P.28 Issue 2010-03-11 Date Text Version publisher URL http://hdl.handle.net/11094/8974

More information

コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 数理システムユーザーコンファレンス 2007

コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 数理システムユーザーコンファレンス 2007 コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 1. 注目される CGM(1) CGM とは Consumer Generated Media インターネットなどを活用して生活者が内容を生成していくメディア 個人の情報発信をデータベース化

More information

Title 棭斎書簡四通 Author(s) 柏崎, 順子 Citation 書物 出版と社会変容, 1: 63-74 Issue 2006-04-20 Date Type Journal Article Text Version publisher URL http://hdl.handle.net/10086/16589 Right Hitotsubashi University Repository

More information

Title デイヴィッド アーモンドの 作 品 の 構 造 : 主 人 公 の 成 長 を 辿 って Author(s) 小 坂, 麻 綾 ; 星 野, 立 子 Citation 北 海 道 教 育 大 学 紀 要. 人 文 科 学 社 会 科 学 編, 62(2): 27-42 Issue Date 2012-02 URL http://s-ir.sap.hokkyodai.ac.jp/dspac

More information

Title 石 門 心 学 と 不 生 禅 Author(s) 山 東, 功 Editor(s) Citation 言 語 文 化 学 研 究. 日 本 語 日 本 文 学 編. 8, p.9-26 Issue Date 2013-03-31 URL http://hdl.handle.net/10466/14255 Rights http://repository.osakafu-u.ac.jp/dspace/

More information

Title 鎌 倉 幕 府 の 顕 密 寺 院 政 策 Author(s) 海 老 名, 尚 Citation 北 海 道 教 育 大 学 紀 要. 人 文 科 学 社 会 科 学 編, 61(2): 1-16 Issue Date 2011-02 URL http://s-ir.sap.hokkyodai.ac.jp/dspac Rights Hokkaido University of Education

More information

Title 国 民 年 金 国 民 健 康 保 険 未 加 入 者 の 計 量 分 析 Author(s) 湯 田, 道 生 Citation 経 済 研 究, 57(4): 344-357 Issue 2006-10-25 Date Type Journal Article Text Version publisher URL http://hdl.handle.net/10086/20334 Right

More information

早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月

早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月 早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月 本研究は ネパール人日本語学習者 ( 以下 NPLS) のリズム生成の特徴を明らかにし NPLS に対する発音学習支援 リズム習得研究に示唆を与えるものである 以下 本論文 の流れに沿って 概要を記述する 第一章序論 第一章では 本研究の問題意識 意義 目的 本論文の構成を記した

More information