<4D F736F F D E382E32372E979B82D982A98C7697CA8D918CEA8A77975C8D658F575F93FC8D6594C52E646F6378>

Similar documents
添付エクセルデータに関する注記

1. はじめに 2

a223_imai

博士論文概要 タイトル : 物語談話における文法と談話構造 氏名 : 奥川育子 本論文の目的は自然な日本語の物語談話 (Narrative) とはどのようなものなのかを明らかにすること また 日本語学習者の誤用 中間言語分析を通じて 日本語上級者であっても習得が難しい 一つの構造体としてのまとまりを

早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月

Microsoft Word - 論文要旨(松田真希子) _1_

語話者コーパスと多く違わないが 学習者コーパスのほうはカバー率が高いことが分かった また 学習者が推量助動詞 そうだ みたいだ らしい 準体助詞 の 終助詞の産出が少ないことが分かった これらのことから 学習者は文の基本的な成分を構成する単語を多用するが ムードを表す語彙の使用が少なく 表現が単調で

スライド 1

スライド 1

甲37号

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

紀要8.pdf

Microsoft Word - SPSS2007s5.doc

Microsoft Word - mstattext02.docx

Title Author(s) ロシア語母語話者における因果関係の表現の習得について Marina, Sereda-Linley Citation Issue Date Text Version ETD URL DOI rights

2 という指摘がある では 3 級文法の選定基準はどうなっているのか 国際交流基金 ( 1994) によると 原則は比較的広範囲に用いられている初級教科書 8 種の中から 4 種以上に出ているものを採用としつつ 過去数年の日本語能力試験の問題を調査し 必要なものは追加したとある 教材に採用されている

2 116

多言語版「チュウ太のweb辞書」を用いた語彙学習

先行研究 pp

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

HidekiTanakaGakushuin

H4-1.ai

早稲田日本語教育学21号_11研究論文-1_李先生02.indd

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

<43534A2F925A925088CA814592B CA B835E B D836A B202D B B69>

シャドーイングの魅力と謎

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

象 ) の 2 つの概念について検討した 本論文は 理論的な研究と実証的な研究を参考に視点を 視座 と 注視点 の二つに分けて捉えた 視座とは 話者の空間的及び心理的立場を示すものであり その視座を判定する構文的手掛かりとしては 受身表現 授受表現 使役表現 移動表現 主観表現 感情表現の 6 つの

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

表 5-1 機器 設備 説明変数のカテゴリースコア, 偏相関係数, 判別的中率 属性 カテゴリー カテゴリースコア レンジ 偏相関係数 性別 女性 男性 ~20 歳台 歳台 年齢 40 歳台

Microsoft Word - 文档1

発達教育10_087_古池.indd

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

青焼 1章[15-52].indd

横浜市環境科学研究所

英語の音声教育と音声研究

スライド 1

情報処理学会研究報告 IPSJ SIG Technical Report 日本語を学習する外国人を対象とした日本語テキスト難易度推定手法 劉志宇 内田理 本研究では, 語彙の難易度と構文の複雑さからテキストの難易度を推定し, 日本語能力試験の受験級の形で提示する手法を提案する. 本手法では, 読解学

1 高等学校学習指導要領との整合性 高等学校学習指導要領との整合性 ( 試験名 : 実用英語技能検定 ( 英検 )2 級 ) ⅰ) 試験の目的 出題方針について < 目的 > 英検 2 級は 4 技能における英語運用能力 (CEFR の B1 レベル ) を測定するテストである テスト課題においては

散布度

PowerPoint プレゼンテーション

日本語「~ておく」の用法について

Microsoft PowerPoint - e-stat(OLS).pptx

JCLWorkshop_No.8

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

evaluation TylerR. W p

H26_大和証券_研究業績_C本文_p indd

スライド 1

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft Word ishige.doc

ス言語学の影響でコロケーション分析がコーパスと統計指標 (raw frequency, t-score, log-likelihood ration, MI-score, など ) によって行われるようになった それにも関わらず現在でも統計的に採集されるデータは手作業で分析しなければならない 一般的

Microsoft PowerPoint - データ解析基礎2.ppt

JCLWorkshop_No.8

ビジネス統計 統計基礎とエクセル分析 正誤表

 日本語学習者にとって、日本語の丁寧体と普通体の使い分け、すなわちスピーチレベルシフトの習得は難しいと言われている


1.民営化

Medical3

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

スライド 1

韓暁の学位論文


コンビニデザートに対する生活者の意見でわかるブランド評価 テキストマイニングによる 意見 の分析 Contents 1 注目される CGM 2 ネットにひろがる意見 3 意見を 言葉 で分析 4 パネルの解説 5 ご協力いただいた企業様 数理システムユーザーコンファレンス 2007

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - apstattext04.docx

ワークシート 分析 わかる できる つながる 三連携 言語領域文化領域グローバル社会領域 休日 趣味の尋ね方や答え方について n 語で口頭で復習する (A1) 休日 趣味の尋ね方や答え方について n 語で口頭で質問し答えることができる (B1) リストアップした内容を各グループ内で討論

2. 先行研究及び本研究の課題 2.1 日本語の敬語について敬語は敬意表現の一種である 文化庁 (2000) によれば敬意表現とは次のようなものである 敬意表現とは, コミュニケーションにおいて, 相互尊重の精神に基づき, 相手や場面に配慮して使い分けている言葉遣いを意味する それらは話し手が相手の

応用言語学特講発表資料第 7 章前半担当 :M.Y. [ 第 7 章 ] 語彙の習得 1. 第二言語学習者が目標とすべき語彙サイズ A) 語彙サイズ の定義第二言語習得論の中でよく用いられる 語彙サイズ には研究者のなかでも複数の見解がある (Nation&Meara,2002) それらは以下のとお

日本語漢字単語とベトナム語漢越音における音韻類似性調査 長野真澄 A Survey of Phonological Similarity between Japanese Kanji-Words and Vietnamese Han-Viet sounds Masumi NAGANO キーワード :

jphc_outcome_d_014.indd

(Microsoft Word - JCLWorkshop2013_2\214\303\213{.doc)

目次 はじめに P.02 マクロの種類 ---

.{...i.....j.R.c

NINJAL Project Review Vol.3 No.3

<4D F736F F D208CA48B8689EF838C E646F63>

2015_kisyuu

国際数学・理科教育動向調査(TIMSS2015)のポイント

英英辞典のdefining vocabularyを活用した単語テストのVocabulary Levels Testによって算出した語彙数と読解力テスト及びTOEIC総合点(L&R)との相関性に関する一考察

「日中Skype会話コーパス」を用いた話題別語彙の抽出 ―「食」の場合―

広東語母語話者の促音の知覚と生成 ― 広東語の「入声(にっしょう)」による影響を中心に

等が自国語普及の取り組みを強化し 海外における日本語の地位は相対的に低下しているといわれる とくに 英語を第一外国語として設定している東南アジア地域においては 第二外国語の地位をめぐる争いが激化している 中国は孔子学院 ( 高等教育 ) 孔子課堂( 初等 中等教育 ) 韓国は世宗学堂を世界的規模で増

10 AB C D 4

170524定例研究会_阿部全体

コメンテーターの立場 日常的に手話を使用し, ろうコミュニティにも深く関わっているろう者 開発 ( 経済 ) 学, 手話 ( 言語学 ), 障害学にコミットしている専門研究者 手話の音韻 形態 統語の研究では 日本手話のみならず 途上国を含めた複数の手話を研究 今回のプロジェクトには全く関わっておら

表 1 各研修の概要 研修 Ⅰ 研修 Ⅱ 研修 Ⅲ 調査対象者数 ( 出身国数 ) 49 名 (30 か国 ) 15 名 (3 か国 ) 32 名 (30 か国 ) 研修期間 ( 実施時期 ) 約 6 か月 (10 月 ~3 月 ) 約 2 か月 (1 月 ~3 月 ) 約 8 か月 (10 月 ~

タイトルは14ポイント&ボールドMS明朝

1. 研究の背景 目的 背景 臼杵の町は 城下町であったこともあり 地形を上手に利用した特色のある街並みが形成されている 現在臼杵では 歴史的景観を保存 再生する街並みづくりが行われている そして中央通商店街周辺においても整備計画が持ち上がっている 目的 VR をもちいた景観シミュレーションにより

Microsoft Word - å“Ÿåłžå¸°173.docx

1. インストール方法 STEP 1 ダウンロードしたファイルを任意の場所に解凍し Setup.exe をダブルクリックしてください 下記画面が表示されたときは [ 詳細情報 ] をクリックし 表示された画面で [ 実行 ] をクリックしてください STEP 2 Microsoft.Net Fram

岡山大学教師教育開発センター紀要, 第 4 号 (2014),pp 原著 全学日本語コースレベル設定と ACTFL-OPI 実践報告 森岡明美 1 坂野永理 1 内丸裕佳子 1 岡山大学言語教育センターの全学日本語コースでは, 初級から上級まで7レベルのクラスを提供しているが, この

Exfront4.1.0リリースノート

夏季五輪の メダル獲得要因はなにか

<4D F736F F D2091B28BC68CA48B8695F18D908F912E646F63>

Microsoft Word - 214J3903.docx

file:///C:/Users/k-hidume/AppData/Local/Temp/~hh8CD7.htm

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Transcription:

日本語学習者の発話量と言語テストの得点の関連性について 李在鎬 ( 筑波大学 ), 村田裕美子 ( ミュンヘン大学 ) 小林典子 ( 元筑波大学 ), 酒井たか子 ( 筑波大学 ) 1. 研究背景学習者コーパスとは, 言語学習者の産出データを格納したデータベースのことである 一般的には, 学習言語の熟達度 (proficiency) の差が言語使用にどのようなバイアスを与えるかを調査する目的で使用する そのため, 学習者コーパスの開発者は何らかの方法で学習者の ( 学習言語に対する ) 熟達度を判断し, アノテーション情報として公開している 熟達度を判断する方法としては,2つの方法が利用される 1つ目は, 産出データそのものに対して, 直接的に熟達度を判断する方法,2つ目は, 言語テストを使用し, 産出データとは独立して熟達度を判断する方法である 1つ目の方法については,ACTFL OPI(oral proficiency interview; 以下 OPI) の枠組みがよく利用される そして,2つ目の方法については,SPOT(Simple Performance-Oriented Test; 以下 SPOT, 詳細は小林 2014,2015 参照 ) がよく利用される 1つ目の方法を利用したコーパスとしては, 鎌田修氏と山内博之氏による KY コーパス が広く知られている 2つ目の方法を利用したコーパスとしては, 伊集院郁子氏が構築した 日本 韓国 台湾の大学生による日本語意見文データベース および金澤 (2014) の YNU 書き言葉コーパス があげられる なお, 本研究が利用する ドイツ語話者日本語学習者話し言葉コーパス (Spoken Corpus of German Learners of Japanese; 以下, GLJ コーパス ) は OPI と SPOT をともに利用しているコーパスである点で, ハイブリット的データベースと言える (OPI と SPOT の関連については岩崎 2002 参照 ) 本研究では, GLJ コーパス を用いて, 言語テスト SPOT が日本語学習者の発話データをどの程度, 説明できるかを調査する 具体的には重回帰分析と分散分析を行い,SPOT の得点と発話量の関連を考察する 2. データと分析方法 2.1. データ1:GLJ コーパス GLJ コーパスとは, 村田 李 (2015) によって開発されている学習者コーパスで, ドイツ語母語話者 45 名の発話データを収録した学習者コーパスである コーパスの基本設計において, KY コーパスと同様に,OPI を用いて熟達度を判断している コーパスの中には, テスターと学習者による 2 者の対話データが文字化されているが,OPI の判定ルールに基づいて, 初級学習者, 中級学習者, 上級学習者にカテゴリー化されている 各集団の学習者数およびコーパスサイズを表 1 に示す GLJ コーパスの特徴として, すべての学習者はテスターと対話を行ったあとに, インターネット日本語テストである SPOT (http://ttbj.jp/) を受けており, コーパスデータ ( 話し言葉データ ) と言語テストの得点が比較できるように構成されている

表 1. GLJ コーパスのサイズ 熟達度区分 学習者数 延べ語数 * 初級学習者 15 名 67,751 中級学習者 15 名 83,107 上級学習者 15 名 95,837 総計 45 名 246,695 * 延べ語数は,UniDic+Mecab の解析結果に基づいて計算 2.2. データ2:SPOT 本研究では,GLJ コーパスの発話量と言語テストの関連を捉えるため,SPOT の得点データを利用する ここでは,SPOT について述べる SPOT は, 日本語の客観テストの一つであり, 以下の特徴を持っている ( 小林 2015) (1) 言語運用能力を間接的 客観的に測定するテストである (2) 短時間で実施できるテストである (3) 能力差が比較的大きな集団を 2~4 段階程度の能力別グループに分けるテストである SPOT は自然な速度で読み上げられる文を 1 文ずつ聞きながら,1 カ所の空欄に平仮名 1 文字を挿入するという形式の問題である 今回は WEB 版 SPOT を使っており, 図 1 のテスト項目が音声とともにディスプレイ上に表示される 図 1. SPOT90 の問題提示画面 SPOT にはいくつかのバージョンがあるが, 本研究では SPOT90 を利用した SPOT90 は 30 問ずつの SPOT90-1 SPOT90-2 SPOT90-3 で構成されており, それぞれのテストセットの難易度は次のように設定されている まず, SPOT90-1 は初級向けで, 日本語能力試験の N4-N5 レベルの学習者を対象にしている SPOT90-1 の音声は声優による明瞭な

ものを使用している 次に, SPOT90-2 は初級後半から上級前半向けで, 日本語能力試験の N2-N4 レベルの学習者を対象にしている SPOT90-2 の音声は日本語教師のやや不明瞭なものを使用している 最後に, SPOT90-3 は上級向けで, 日本語能力試験の N1-N2 レベルの学習者を対象にしている 2.3. 分析方法 本研究では, 言語テストの成績と学習者の発話量の関連を明らかにする目的で, 以下の分析を行った 分析 1)GLJ コーパスの学習者の発話特徴量を独立変数,SPOT の得点を従属変数にして, 重回帰分析を行った 分析 2)GLJ コーパスにおける熟達度による集団間で,SPOT の得点および回答時間にどのような差があるかを分散分析で検討した 分析 1) では SPOT の得点の違いが発話量にどのような関連を持っているか調査する 分析 2) では SPOT の得点と日本語の熟達度がどのような関連を持つか調査する なお, 学習者の発話特徴量を抽出するため, 全文字データを形態素解析エンジンの MeCab 0.996 と解析辞書の UniDic 2.2.0 で解析し, 李ほか (2014) で有効とされた変数を利用し, 発話特徴量を抽出した 具体的には, 語種別の使用頻度 ( 和語, 漢語, 外来語, 混種語 ), 品詞の比率 ( 助詞率, 名詞率, 動詞率 ), 平均文長である 3. 結果 3.1 重回帰分析の結果重回帰分析では, SPOT90 の合計得点を従属変数, 発話特徴量を独立変数にして, ステップワイズ法で分析をしてみた 分析の結果, 助詞率と平均文長による回帰モデルが得られ, 高い予測力を持つことが明らかになった (R 2 =.807) SPOT90 の得点 =-164.791+ 助詞率 *114.050+ 平均文長 *63.498 の回帰式が得られた この結果を受け, 平均文長と助詞率の散布図を作成してみた ( 図 2) 図 2 の数値は SPOT の得点であるが, 左下に 30~40 点前後の学習者が分布しており, 右上に進むにつれ,50 点,60 点, さらには 70 点前後の学習者が分布している これにより, 助詞率と平均文長が言語テストの得点に対して強い予測力を持つことが明らかになった このことを踏まえ,2 つの変量は, 言語能力の差を反映する変数である可能性があると考え, より詳細に分析してみた 図 3 の横軸は,GLJ コーパスに付与されている学習者の熟達度であり, 縦軸は変量を表す 左の図は平均文長であり, 右の図は助詞率である 平均文長の場合, 初級では,16 語程度の長さで構成されているが, 中級では,23 語, 上級では 29 語で構成されている 次に助詞率で言えば, 初級は 14%, 中級では 17%, 上級では 20% 程度が助詞である

図 2. 平均文長と助詞率の散布図 図 3. 平均文長と助詞率の箱ひげ図 3.2 分散分析の結果 2 つの方法で分散分析を行った 方法 1)SPOT90の得点を独立変数,GLJコーパスの熟達度を従属変数にして平均値に差があるか調査した 方法 2)SPOT90の回答時間を独立変数,GLJコーパスの熟達度を従属変数にして平均値に差があるか調査した 方法 1) による調査結果として,SPOT90-1,SPOT90-2,SPOT90-3のいずれにおいても, 有意差があった (SPOT90-1はF(2,42)=51.422, p<.001,spot90-2はf(2,42)=74.004, p<.001,spot90-3はf(2,42)=68.505, p<.001,spot90 全体はF(2,42)=99.080, p<.001)( 得点分布は図 4 参照 )

図 4. SPOT90 の箱ひげ図初級向け SPOT である SPOT90-1 の場合, 初級においてはかなり幅があるが, 中央値は 17 点であった 中級は 27 点であるが, 上級は 29 点となり, 中上級に関しては初級に比べ, 差が小さい 中級向け SPOT である SPOT90-2 では, 初級の幅が大きいことは,SPOT90-1 と同じであったが, 中級と上級の間に中央値で言えば,5 点ほど差がついた 上級向け SPOT である SPOT90-3 では上級と中級と初級でほぼ等間隔の差がついており, 能力の差を適確に捉えられていると考えられる SPOT90 合計 では初級の幅が非常に大きいものの,3 つの熟達度で十分な得点差が見られる SPOT は, 即時応答的な問題形式を使って, 言語運用力を測るという目的で作られたテストである このことを検討すべく, 方法 2) として, 回答時間と OPI レベルの関連を調べてみた 方法 2) による調査の結果,SPOT90-1 と SPOT90-2 で OPI レベルによる回答時間の差に統計的有意が認められる結果となった ( 図 5) SPOT90-3 については, 有意である可能性が見られた (F(2,42)=2.948, p=0.063) SPOT90-3 は SPOT 全体においてもっとも難しいものであり, 非母語話者全体において時間を要している可能性がある これについては矢崎 (2006) の考察を参考に, 母語話者と非母語話者の差という視点から, 今後, さらに調査する必要がある

(F(2,42)=9.564, p<.001) (F(2,42)=13.725, p<.001) 図 5. OPI レベルによる SPOT90-1 と 90-2 の回答時間 4. まとめ発話データの産出量で SPOT の得点を予測させると 80% 以上, 妥当な結果が得られるため, SPOT は会話の産出力を測定するテストであると言える また, 産出能力を測った OPI レベルと言語テストの能力を示す SPOT の得点の関連を分析した結果,OPI レベルによって, すべてのテストセットの得点に統計的な有意差が観察された そして,SPOT の回答時間においては, 初級向けの SPOT90-1 と中級向けの SPOT90-2 において,p<.001 水準で差があることが明らかになった 以上の分析結果により,GLJ コーパスの収録データにおける言語能力の差を SPOT は正確に捉えていると結論づけられる 参考資料 矢崎彩, 李海南, ウォンサミンスリーラット, 高橋美野梨, 酒井たか子, 小林典子 (2006) 上級日本語学習者向け SPOT(Simple Performance-Oriented Test) の開発 日本語教育方法研究会誌 13(1), 16-17. 岩崎典子 (2002) 日本語能力試験(SPOT) の得点と ACTFL 口頭能力評価 (OPI) のレベルの関係について 日本語教育 114 号, 100-105. 小林典子 フォード順子 山元啓史 (1996) 日本語能力の新しい測定法 SPOT 世界の日本語教育 6 号, 201-236. 小林典子 (2014) SPOT について 月刊日本語学 2014 年 10 月号, 42-51. 小林典子 (2015) SPOT 日本語教育のための言語テストガイドブック 110-126, くろしお出版村田裕美子 李在鎬 (2015) ドイツ語母語話者の話し言葉コーパスの開発 (Japanologentag 2015 - LMU München) 李在鎬 宮岡弥生 林炫情 (2013) 学習者コーパスと言語テスト 言語テストの得点と作文のテキスト情報量の関連性 言語教育評価研究 (AELE) 2 号, 22-31.