コーパスに基づく言語学教育研究報告 9

Size: px
Start display at page:

Download "コーパスに基づく言語学教育研究報告 9"

Transcription

1 コーパスに基づく言語学教育研究報告 No.9 (2012) 編集距離を用いた英文自動エラータグ付与ツ ールの開発と評価 投野由紀夫 ( 東京外国語大学大学院総合国際学研究院 ) 望月源 ( 東京外国語大学大学院総合国際学研究院 ) 要旨学習者の発話 作文データにはさまざまなエラーが含まれており, 第二言語習得研究ではこの習得段階ごとのエラーの特徴分析が盛んに行われている 1 つの問題は, 学習者データの規模が大きくなってくるとエラー分析のためのエラータグ付けが予想以上に困難になり, そのため大規模学習者コーパスに関するエラー分析はあまり進んでいない 本研究ではこのような現状を受けて, 対応する正解文さえ用意すれば編集距離を用いて自動的にオリジナル文と正解文を対比して差分を特定し, エラータグを付与するツールの開発に関して報告し, その評価実験とエラータグ付与データの分析例を紹介する 1. はじめに第二言語習得研究では学習者言語 (learner language) の分析がその中心的な課題の 1 つになる 学習者言語の分析の方法的には, 内省や文法性判断テスト (grammatcalty udgement test), 条件統制下での誘因タスク (elctaton task) などが考えられるが, そのうちで最も自然な産出に近いものが自由英作文や自由会話などの自然産出データ (natural producton data) である (Ells REF) この 10 年ほどでコーパス言語学の分野の隆盛に伴い, 第二言語習得研究でも学習者コーパス (learner corpus) という新しい研究領域が発展してきた (Granger REF) 中間言語をコーパス分析する際にさまざまな処理レベルが考えられるが, 通常のコーパス言語学で行われる言語注釈付の処理のうち, 品詞付与 (POS taggng), 構文解析 (syntactc parsng) に関しては, 学習者データの場合には一般に精度が低くなることが知られている (REF) これは学習者データがエラー( 誤用 ) を含むからで, そのエラーの同定と解析に関する研究は 1 つの大きな注目すべき分野となってきている 本研究では, この英作文中に含まれるエラーを正解文との対応データにより編集距離 (edt dstance) という手法を用いて自動同定し, 自動的にエラータグを付与するツールの開発とその評価に関して報告する -71-

2 2. 関連研究 2.1. 学習者コーパスを用いたエラー分析学習者コーパスの研究は程度の差こそあれ, たいていは学習者のエラーを扱っている ただ全体的な焦点がエラー分析であるよりは, 母語話者と比較して過剰使用 (overuse), 過小使用 (underuse) といった現象も含めて包括的に分析している研究も多い (Granger 1998) 特定のエラーを扱った研究としては, スペリング (He 1998), 語彙 (Ch Man-la et al. 1994; Mlton and Freeman 1996; Lenko-Szymanska 2003), 動詞 (Källkvst 1995), 時制 (Granger 1999; Housen 2002), 冠詞 (Mason & Uzar 2001), 談話 照応関係 (Flowerdew 2000), コロケーション (Tono 1996; Nesselhauf 2005) などがあり, 複数の品詞エラーや文法エラーを総合的に分析したものとしては Ncholls (2003), Abe and Tono (2005), Albert et al. (2009) などがある またこれらの応用としてエラー分析の結果は Longman Dctonary of Contemporary Englsh (LDOCE, 第 5 版,2009),Cambrdge Advanced Learner s Dctonary (CALD, 第 3 版, 2008) といった学習英英辞典にコラムで掲載され用法上の注意喚起がされている エラー分析の方法的には, 大別して 2 通りのやり方が一般的である 1 つは, 包括的なエラータグセットを準備し, すべての作文データに人手でタグ付与を行うもの Cambrdge Learner Corpus (CLC) がその代表的なものであるが, これは膨大な時間と労力がかかるため, CLC 以外のコーパス プロジェクトでは比較的小規模データに付与するに留まっているのが現状である 1 もう 1 つは, 研究課題となる特定の言語事象を対象としてエラー分析をする方法 2 で, 上記の研究例のほとんどがこのタイプになる そのような中で自動エラー分析に対する期待は大きく, 大量の学習者データの自動分析が今後の大きな関心になってきている 2.2. 自動エラー分析工学系の分野では自然言語処理の方法を応用して自動エラー分析の試みがこの10 年間で大きく発展してきた 関連分野としては, 英作文の自動評価 採点システムがあり, 現在主要なものだけでも Proect Essay Grade (PEG) (Page 2003), Intellgent Essay Assessor (IEA) (Landauer, Laham, and Foltz 2000), Electronc Essay Rater (E-rater) (Bursten and Marcu 2000), IntellMetrc (Ellot 2003) などがある IEA は Pearson Knowledge Technologes (PKT) として, WrteToLearn や Versant といった学習システムに, また E-rater は Educatonal Testng Servce (ETS) の Crteron という自動英作文評価システムに, そして IntellMetrc は Vantage Learnng の My Access という英作文評価システムでそれぞれ具体的に応用されている これらのシステムは, 人間の評価したグレード別英作文のテキスト, あるいは同種の内容の母語話者の英文から機械学習により言語特徴を抽出したものにグレード別の閾値 (threshold) を決め, 新たな英作文の特徴と照合した際に, 一定の閾値を超えた項目に加点するという方法をとり, その特徴抽出分野は各システムによって統語 談話 内容分析などの独自モジュールを持つ 90 年代はテキスト長, 文の長さ, 単語の種類, といった表層的 1 Cambrdge Learner Corpus は公称 3000 万語 (95000 件の英作文 ) にエラータグが付与されている 2 課題別タグ付与 (Problem-orented taggng) と呼ぶ -72-

3 な情報が多く, 後に IEA のように潜在意味分析 (Latent Semantc Analyss) (Foltz 1996) を用いて, 意味解析に迫るような試みもされている すべてのシステムが英作文の総合評価 (holstc scorng) を行うと同時に, 観点別のスコアも算出でき, 人間の評価との相関も極めて高いことが報告されている (Dkl 2006) これらの英作文評価の場合は, 英作文全体の評価が目的であるが, 文法項目の自動エラー同定はまた別の関心をもって研究されている 大部分のデータ駆動型 (data-drven) の手法はある単語の文脈での適切な使用か否かの判定を, 伝統的な文脈情報を利用したスペリング エラーの同定 (Goldng 1995; Goldng and Roth 1996) と同様の分類手法を用いて行う 特にエラー同定で盛んに研究されているのは冠詞と前置詞で, これは両者共に機能語で屈折などをもたないいわゆる閉じた類 (closed class) であること, そして学習者データでもエラー確率が高い項目であることがあげられる 文脈を用いた分類手法は, 対象となるエラー項目の生起する文脈 ( 通常, 冠詞や前置詞であればその前後 2-3 語 ) を特徴ベクトルとして捉える この際に特徴ベクトルとしては単語または形態素情報 (Knght and Chander 1994), 品詞情報 (Izum et al. 2003; Gamon et al. 2008),WordNet からの情報 (Lee 2004; DeFelce and Pulman 2007) などがある 分類器 (classfer) の選択は, 決定木 (Knght and Chander 1994; Gamon et al. 2008) を使ったものもあったが, 最近は最大エントロピー (maxmum entropy) 分類器をアルゴリズムとして用いたものが主流である 訓練データとしては, 母語話者の大規模コーパス ( 例 :BNC) を用いたり, グレード別リーディング教材を用いる試みもある (Han et al. 2004) これらの分類課題としてとらえるアプローチ以外に, 言語モデルを用いた手法も若干ではあるが見られる 基本的な考え方としては, 言語モデルのスコアが著しく低い部分にエラーがあると疑う, というものである 最も古いものでは Atwell(1987) が品詞 n-gram モデル, また Chodorow and Leacock (2000) の相互情報量 (Mutual Informaton) とカイ 2 乗統計を用いたもの,Turner and Charnak (2007) の構文解析情報を用いた言語モデル, 汎用言語モデルとエラータイプ別分類器を用いた混合的アプローチ (Gamon et al. 2008) などがある 3. 編集距離を用いたエラー自動判定自動エラー分析は現在エラーの種類などを限定した範囲ではかなりの成果を上げているが, 一方で生の英作文データを入力してそれに各種エラータグを自動付与するというところまではいっていない その 1 つの大きな理由は, 機能語以外の膨大な内容語に関するエラーが非常に多岐にわたるため, これらの分析に関しては前述の英作文の自動採点などでも正確に判定できないためである 我々の主目的は, 大規模学習者データへのエラータグ付与をできるだけ正確にかつ自動で付与する手法の開発である エラータグを全種類マニュアルで付与している例としては前述の CLC や NICT JLE Corpus( 和泉他 2004) があるが, タグセットを記憶してすべてのエラーに付与する作業は人間でも相当に複雑かつエラー判定などの信頼性も問われる むしろ, エラー判定をするよりも, 英作文を自然な英文になるように添削してもらい, その -73-

4 添削データとの比較で誤り部分を機械処理で検出した方が早いのではないか, というのが我々の問題意識であった 3.1. 編集距離について 編集距離 ( あるいは レーベンシュタイン距離 ) とは,2 つの文字列があるときに, 一方の文字列をどのくらい編集するともう一方の文字列が作成されるかを距離として計算することで,2 つの文字列の類似度 ( 相違度 ) を測る尺度である ここでは編集距離について説明する 編集距離では, 文字列に対して行える操作をそれぞれ以下のように定義される 置換 挿入 削除 の 3 種類であるとする 置換 は, 元の文字列の中のある 1 文字を, 別の 1 文字に入れ替える操作 挿入 は, 元の文字列のどこかに適当な 1 文字を挿入する操作 削除 は, 元の文字列のある 1 文字を, 削除する操作 2 つの文字列について, 片方の文字列に 置換, 挿入, 削除 の操作を繰り返すことで, もう片方の文字列を作り出すことができると考える ある文字列 X と文字列 Y との文字列間の 距離 は, 文字列 Y を,X から作り出すのに必要な 置換, 挿入, 削除 操作の回数の最小値と定義される 例えば, 文字列 start と smart,color と colour,sport と spot およびより複雑な例である rapd と rabbt および grease と grape の編集距離はそれぞれ以下のように考えられる 文字列 start から smart を作り出すことは,start の 2 文字目 t を m に 1 回置換することで行えるので, 編集距離は 1 である 文字列 color と colour では,color の 5 文字目に u を挿入して colour が作成できるので, 編集距離は 1 である 文字列 sport と spot では,sport の 4 文字目 r を削除して spot が作成できるので, 編集距離 1 である より複雑な例として, 文字列 rapd と rabbt では, rapd の 3 文字目 p を b に置換し, 次に b を挿入し, 最後の d を t に置換するという 3 つの操作が必要になるので, 編集距離は 3 である 文字列 grease と grape では, grease の 3 文字目の e を削除し, 5 文字目の s を p に置換する 2 つの操作が必要になるので, 編集距離は 2 である -74-

5 DP マッチングによる編集距離の計算編集距離は動的計画法を用いた DP マッチング法 ( 浪平,1989) によって比較的簡単に計算することができる 2 文字間の編集距離を測るための動的計画法は次のように定式化できる x x Lx y y Ly 文字数 I の文字列 X を 1 2 I とし, 文字数 J の文字列 Y を 1 2 J とする 部分文字列 x 1 x 2 Lx と部分文字列 y 1 y 2 L y の編集距離を g(, ) とする ( 最終的に求める編集距離は, g( I, J ) である ) 文字間の距離 d x, y ) を次のように定義する ( x = y なら 0 d ( x, y ) = 式 (1) x y なら1 DP マッチング法では, g(, ) の直前の状態として可能性のある, g( 1, ), g (, 1), g( 1, 1) が計算済みで値がわかっているとして, それぞれの値から g(, ) を求めることを考える ここで, x と y に対して, 行える操作は, 置換( x を y に置換 ), 削除 x を削除 ), 挿入( y を挿入 ) の 3 つであるので, g(, ) を求めるには, 次の組み ( 合わせが考えられる g(0,0) = 0 g(,0) = g( 1,0) + d( x,0) ( > 0) g(0, ) = g(0, 1) + d(0, y ) ( > 0) g( 1, ) + 1 g(, ) = max g( 1, 1) + d( x, y ) g(, 1) + 1 ( > 0, > 0) 式 ( 2) 文字列 X を rapd, 文字列 Y を rabbt としたときの計算の様子を経路の図として示すと図 1 のようになる 図 1 中の縦軸が に対応し, 横軸が に対応し, 左下が g (0,0), 右上が g( I, J ) とする 編集距離 g( I, J ) は図中で ( 0,0) の位置から ( I, J ) = (5,6) の位置に向かって, 一致, 置換, 挿入, 削除を繰り返してたどりつくことができる経路の中から最も距離の短い経路を選択することで得られる この例の rapd と rabbt では, r が一致( 位置は ( 1,1) ), a が一致( ( 2,2) ) した後,rapd の 3 文字目 p を b に置換し( ( 3,3) ), b を挿入し ( ( 3,4) ), b が一致し( ( 4,5) ), d を t に置換する( ( 5,6) ) という経路が最短になる このうち, 一致する文字は編集操作がないので, 編集距離は 3 になる ( 図の太字矢印部分が編集操作を示す ) -75-

6 5 d 4 3 p 2 a 1 r r a b b t 図 1:DP マッチングの例 この DP マッチングを,2 つの文字列間でなく,2 つの文間に適用すれば, 文と文の一致度を計算することもでき,2 文間のどの単語とどの単語が対応するかが計算できる DP マッチングの学習者データへの応用前述したように我々の目的は, 大規模学習者データへのエラータグ付与をできるだけ正確にかつ自動で付与する手法の開発である そのための手法として, 学習者データとそれを添削したデータを用意し, 両者を自動比較する手法をとる 以下の例のように, 入力として, 学習者データと, その添削データがあると仮定し, 学習者データ文 I usually bred and mlk. 添削データ文 I usually eat bread and mlk. 編集距離を計算する DP マッチングアルゴリズムに基づいて, 各文のそれぞれの単語の対応を自動的に計算し, 誤りの種類を判定するプログラムを作成することができるようにする 具体的には, 上記の学習者データ文と添削データ文を 2 つの文字列としてペアで与えると, 添削データ文に対する学習者データ文の一致度を計算することで,DP マッチングでは,I, usually, and, mlk が一致し,eat が削除されているという答えを得たい さらに,bread と bred は単語の位置としては一致する (bread を bred で置換している ) が, a が削除された綴り誤りであるということも判定したい この目的に適した手法として望月らによる英語学習者のディクテーション支援システム ( 望月ら 2000) で用いられた文レベルと単語レベルの 2 段階の DP マッチング手法が応用できる 2 つの文字列間の DP マッチングを文のレベルで行えば, マッチングの対象は文字でなく単語になる そのため, 削除 されている単語は学習者データで抜け落ちている 脱落 した単語を示すことになる この例では,eat が脱落しているので, 学習者が動詞 eat を書き漏らした ( 誤った ) ということが判断できる また, 文のレベルで 置換 と判断された bread と bred を対象に単語のレベルで DP マッチングを行えば, マッチングの対象は文字になる そのため, a が削除されている綴り誤りであることが判断できる ただし, ディクテーション学習では流れてくる音声を聞き取るため, 正解の文と学習者データとの単語の語順が大きく入れ替わることが少ないが, 作文の場合は, 正しい文に対して, 語順が入れ替わっていることが多く起きる可 -76-

7 能性がある この場合,DP マッチング手法の 置換 挿入 削除 だけ十分でなく, 解析精度が大きく下がる可能性がある 対策として語順の入れ替わりを考慮した 転移 を考える必要がある 3.2. 今回作成したプログラムについてエラー自動判定プログラムは, 大きく次の 2 つのバージョンにわかれる 1 つ目は, 前節で説明した DP マッチング法を適用した基本手法で,( 望月ら,2000) を改良して作成したバージョンである 2 つ目は, 転移を考慮して, 基本手法の DP マッチングの結果を修正するバージョンである 以下 2 つの手法について説明する 基本手法本研究で用いる DP マッチング法を適用した基本手法の定義は次のようになる 単語レベルのマッチング と 文レベルのマッチング の 2 段階のマッチングを行う 単語レベルのマッチング では, 単語ペアを対象に, 単語内の 1 文字をマッチングの単位とする 文レベルのマッチング では, 文ペアを対象に, 文内の 1 単語をマッチングの単位とする まず単語レベルでのマッチングを行っておき, 文レベルのマッチングの際に, 単語レベルのマッチング結果を考慮することによりマッチングを高い精度で行う どちらのレベルでも 置換, 挿入, 削除 の 3 つの操作を想定する この考えのもと, g(, ) を求める DP マッチングの計算式は次の漸化式のようになる g(, ) = max{ g( 1, ) + d( x,*), g( 1, 1) + d( x, y g(, 1) + d(*, y )} ), 式 (3) ここで, * は対応する文字( あるいは単語 ) がないことを意味し, 文字 ( 単語 ) 間の距離 d x, y ) はそれぞれ次の場合に対応する ( d( x,*) d( x, y ) d(*, y ) x に対応するyの文字がない 削除 xとy が対応する場合で, x y であれば 置換, 式 (4) x = y であれば 一致 xにない文字 y が存在する 挿入 d( x, y ) を次式のように定義する -77-

8 x = y x y で x y で の場合 1 x = * または y x * かつy * の場合, 単語レベルでは, 0 = * の場合, 0 g w ( x, y ) 文レベルでは, max( x, y ) 式 (5) g w ( x, y ) ここで文レベルの場合の値の計算式は, 単語 x と単語 y の単語レベルの max( x, y ) DP マッチングの結果 g w ( x, y ) を, 長い方の文字数で割った値を意味する また初期値は, 以下の式のように設定する g( 0,0) g(,0) g(0, ) = = = 0 n = 1 n= 1 d( x,*)(1 I ) n d(*, y )(1 J ) n 式 (6) 単語数 I の文 X と単語数 J の文 Y のマッチングは次のように行う まず, 式 (6) により初期値を与える 次に, 式 (3) により, g(, ) の値を再帰的に計算し, g( I, J ) まで計算をする 文レベルのマッチングでは, * は対応する単語がないことを意味する 各 g(, ) の計算で, d( x, y ) における単語レベルのマッチング結果が必要になった場合, 単語 x と y を用いて単語レベルのマッチングを再帰的に行う 単語レベルにおいては, * は対応する文字がないことを意味する 文 X を正解文とし, 文 Y を学生の文とすると, マッチングの結果から誤りの状態が次のように特定できる x = *, y * の場合は, 余分な単語の付加 ( 付加 誤り,addton error) x *, y = * の場合は, 必要な単語の抜け落ち ( 脱落 誤り,omsson error) x y, x *, y * の場合は, 単語の綴り誤り ( 誤形成 誤り,msformaton error) 以上の処理を反映させたプログラム ( プログラム A とする ) を Ruby により作成した 語順を勘案した改良手法ここでは, 転移を考慮して, 基本手法の DP マッチングの結果を修正するバージョンについて説明する 今, 以下の英文ペアがあったとする 学習者データ文 I eat breakfast bred and mlk 添削データ文 I eat bread and mlk for breakfast 前述の基本となる DP マッチング法をこの英文ペア ( 添削データ文を文 X とし学習者データ文を文 Y とする ) に適用すると, 以下の結果を得る -78-

9 I eat <add>breakfast</add> <msf= bread >bred</msf> and mlk <oms>for</oms><oms>breakfast </oms> ここで, タグのない単語は一致していることを意味する また,<add>breakfast</add> タグは 挿入 操作に対応し, 余分な単語 breakfast が学習者データ文に 付加 (addton) されている, と判断されたことを意味する <oms>for</oms> タグは 削除 操作に対応し, 必要な単語 for が学習者データ文では抜け落ちている 脱落 (omsson), と判断されたことを意味する また,<msf= bread >bred</msf> タグは, 置換 操作に対応し, 正しい綴り bread が誤った綴り bred と表記されている 誤形成 (msformaton), と判断されたことを意味する そのため, この解析結果では, 添削データ文に対し, 学習者データ文では,I, eat は正しく,breakfast が余分で,bread を bred と綴り誤りをし, and と mlk は正しいが,for と breakfast が脱落している ということになる DP マッチングの結果としては正しい結果が得られているが, 学習者データの誤り分析の観点からは望ましい分析結果とは言えない この場合は, I, eat および,bread and mlk は正しいが,for が脱落し,breakfast が一番最後から eat の直後に転移 (transposton) している となるのが望ましい つまり, <add>breakfast</add> と <oms>breakfast</oms> は同じ単語であり, 転移 に該当すると判断されるべきである 本稿では, これを <trs_add>breakfast</trs_add> と <trs_oms>breakfast </trs_oms> と表現することにする こうした 転移 の問題に対応するため, ここでは転移誤りの可能性のある組み合わせを洗い出し,DP マッチングの結果を修正する方法を述べる ひとくちに転移誤りの可能性のある組み合わせといっても, その解析難易度にはいくつかのレベルが考えられる 非常に簡単にいうと, DP マッチングの 2 つの操作結果が直接的な転移のペアと解釈できる レベル, DP マッチングの結果を転移として修正するために, もう一つ別の操作が必要となる レベル, DP マッチングの結果を転移として修正するために, もう 2 つ別の操作が必要となる レベル, あるいはそれ以上の操作が必要となるレベル, という具合に, 必要な操作の数に応じて難易度が高くなる 本研究では, その中で最初のレベルである DP マッチングの 2 つの操作結果が直接的な転移のペアと解釈できる 場合について, 具体的な出現パターンを 3 パターンあげ, 対応するプログラムを作成した 以下で説明する なお, 説明のため, 単語を A,B, C のように簡略化して表現する また, 実際の DP マッチングのアルゴリズムに合わせて, 添削データ文, 学習者データ文の順番に例示する パターン I: 置換操作の結果, 綴り誤りであると判定される 2 つの単語が, それぞれ対応する転移のペアであるケース 添削データ文 A B C D E 学習者データ文 D B C A E 解析結果 : <msf= A >D</msf> B C <msf= D >A</msf> E このパターンでは,DP マッチングの結果として, 学習者データ文の D と A がそれぞれ添削データ文の A と D の綴り誤りであると判断されるが, 実際は,D と A が入れ替わってい -79-

10 る 転移 である 修正 :<trs= A >D</trs> B C <trs= D >A</trs> E パターン II: 転移している 1 つの単語が, 学習者データ文では付加, 添削データ文では脱落と判断されるケース 添削データ文 A B C D E 学習者データ文 A D B C E 解析結果 : A <add>d</add> B C <oms>d</oms> E このパターンでは,DP マッチング結果として, 学習者データ文側の D が付加され, 添削データ文側の D が脱落していると判断されるが, 実際は,D が転移している 修正 : A <trs_add>d</trs> B C <trs_oms>d</trs_oms> E パターン III: 転移している 1 つの単語が, 学習者データ文では脱落, 添削データ文では付加と判断されるケース 添削データ文 A B C D E 学習者データ文 B C D E A 解析結果 :<oms>a</oms> B C D E <add>a</add> このパターンでは,DP マッチング結果として, 添削データ文側の A が脱落し, 学習者データ文側の A が付加されていると判断されるが, 実際は A が転移している 修正 : <trs_oms>a</trs_oms> B C D E <trs_add>a</trs_add> 前述のパターン I,II,III について, それぞれ以下の方法で 転移 の可能性を調べる ここ では, 説明のため, 文字数 K の文字列 Z を z z z Lz K とし, 添削データ文を文 X, 学習 者データ文を文 Y,DP マッチングの結果として出力される操作のタグ付きの文を文 Z とする 例 : 文 X( 添削データ文 ) I eat breakfast bred and mlk 文 Y( 学習者データ文 )I eat bread and mlk for breakfast 文 Z( マッチング結果 )I eat <add>breakfast</add> <msf= bread >bred</msf> and mlk <oms> for</oms> <oms>breakfast</oms> パターン I パターン I では, ペアとなる msf があるかどうかを調べ, ペアが見つかったら, それらが転移であると判断する 具体的には, まず, 文 Z 内の単語を, 文の先頭 ( z 1 ) から調べていき, その中に msf タグがあるか調べる もし,k 番目の単語 ( z k ) に msf タグが見つかったら,k+1 番目以降の単語について msf タグがあるか調べる k+n 番目の単語 ( z k+ n ) に msf タグが見つかったら, 次の比較を行う z が <msf= x >y</msf> で, が k z k+ n -80-

11 <msf= y >x</msf> というように, z k の msf の属性値と z k+ n の単語が一致し, かつ z k の単語と z k+ n の msf の属性値が一致するならば,2 つの単語は転移である可能性が高いので, z k を <trs>x</trs> とし, を <trs>y</trs> とする z k+ n パターン II パターン II では, 付加 と判断され add タグのついた単語と 削除 と判断され oms タグのついた単語が対応関係にあるとき, それらは転移であると判断する 具体的には, まず, 文 Z 内の単語を, 文の先頭 ( z 1 ) から調べていき, その中に add タグがあるか調べる もし,k 番目の単語 ( z ) に add タグが見つかったら,k+1 番目以降の単語について oms k z + タグがあるか調べる k+n 番目の単語 ( k n ) に oms タグが見つかったら, 次の比較を行う 単語 zk と単語 z k + n が一致するかどうかを調べ, 一致するならば,2 つの単語は転移である可能性が高いので, z を <trs_add>y</trs_add> とし, を <trs_oms>x</trs_oms> とす る k z k+ n パターン III パターン III では, 削除 と判断され oms タグのついた単語と 付加 と判断され add タグのついた単語が対応関係にあるとき, それらは転移であると判断する 具体的には, まず, 文 Z 内の単語を, 文の先頭 ( z 1 ) から調べていき, その中に oms タグがあるか調べる もし,k 番目の単語 ( z ) に oms タグが見つかったら,k+1 番目以降の単語について add k z + タグがあるか調べる k+n 番目の単語 ( k n ) に add タグが見つかったら, 次の比較を行う 単語 zk と単語 z k + n が一致するかどうかを調べ, 一致するならば,2 つの単語は転移である可能性が高いので, z を <trs_oms>x</trs_oms> とし, を <trs_add>y</trs_add> とす る k z k+ n なお,I,II,III いずれの場合においても,2 つの単語が一致すると判断する基準として以下の 2 つを用いた (a) 2 つの単語内の文字列が 90% 以上一致している場合 (b) 2 つの単語内の文字列の一致度が 75% 以上で, かつ不一致の文字数が 2 以下の場合 プログラム A に, 以上の修正処理を施したプログラム ( プログラム B とする ) を Ruby により作成した 4. 実験 4.1. 正解文対応データの作成対象となる英作文データは投野が中心で構築した JEFLL Corpus( 投野 2007) を用いた JEFLL Corpus は日本人英語学習者の中高生約 1 万件の英作文コーパスである 1 万件のデータには正解文が対応付けデータとして整備されている 正解文は各作文の文レベルでの -81-

12 添削を日本における英語指導の経験のある母語話者に依頼したもので, できるだけ原文の意図を汲みながらローカルエラーを中心に文構造をあまり大幅に書き換えずに自然な英語になるよう添削を指示した 4.2. 実験 実験手順対応付けされたオリジナル文と添削文のデータを望月作成の ruby スクリプトで処理した 一対の英文を比較したアウトプットとして, 編集距離で判定された代入 (substtuton) 操作には誤形成 (msformaton), 挿入 (nserton) 操作には余剰 (addton), 削除 (deleton) 操作には脱落 (omsson) のエラータグをそれぞれ付与した これに対して, 評価用データとして高 1 データからランダムに 2000 文を抽出し, 正解文と対照させながら人手によるエラータグを付与した この 2 種類のデータを比較して, 自動付与の精度評価を行った 実験 1 の結果と考察表 1 に実験 1 の結果を示す 3 表 1: 対応データからの編集距離による自動エラータグ付与の評価 脱落 (omsson) 余剰 (addton) 誤形成 (msformaton) 正しい判定 誤った判定 タグ付与漏れ 適合率 (precson) 再現率 (recall) F 値 脱落 余剰エラーに関しては再現率は 100% で, 対応付けデータでの判定は非常に網羅的である さらに適合率も 96% 以上で, 精度も極めて高かった これに対して誤形成エラーは再現率はほぼ 99% と高かったが, 適合率は 72% に留まった プログラムとしては特に誤形成エラーが判定が難しく, 編集距離で誤形成と判定された部分は通常, 単語と単語が 1 対 1 で対応している場合にはほぼうまく処理できているが,(1) のように 1 対多対応しているケースでは判定がうまくいかないことが多かった (1) C: I wll take out kendo protecton frst. O: I wll brng kendo-bougu frst. T: I wll <oms>take</oms> <msf crr="out">brng</msf> <msf crr="kendo">kendo-bougu</msf> <oms>protecton</oms> frst. (C: 母語話者添削文,O: 学習者の書いたオリジナル文,T: タグ付与結果 ) 3 オリジナル データは Tono and Mochzuk (2009) を参照 -82-

13 (1) は本来的には brng と take out,kendo-bougu と kendo protecton がそれぞれオリジナルと正解で誤形成エラーとして対応していなければいけないが, プログラム的にはまず同一要素である kendo という部分を探してそこから前後の単語を 1 つずつ比べていくので, take と protecton が分析上は脱落エラーになってしまった これに関しては, 表 1 の集計の際には誤形成エラーの判定として誤りにカウントし, 脱落エラーの誤りには含んでいない さらに今回はエラーとは見なさなかったが,(2) に示すような語順に関するエラーの取り扱いに問題があることが判明した : (2) C: I lke model ralways. O: I lke ralway's model. T: I lke <add>ralway's</add> model <oms>ralways</oms>. これは本来的には同一要素の転置 (transposton) にあたるので, 語順のエラーと見なされるべきなのだが, 最初のプログラムではこの処理は手つかずであった 4.3. 実験 プログラムの改良と再実験実験 1 の結果を受けて, プログラムの改良を行った 転置に対応するため, 出力結果を見て以下のような後処理をするように改善した 4 : 1) 文中のエラー箇所に同一要素と思われる文字列があるかを判定 (a) 文字列が 90% 以上一致している場合 (b) 文字列の一致度が 75% 以上で, かつ不一致の文字数が 2 以下 2) 上記の要素を転置と見なし, 脱落 余剰のタグではなく, 転置 <trs> というタグを付与する これをもとに JEFLL Corpus に再度タグ付を試みた 評価実験のため, 今回は中 1 と高 1 のデータから各 50 サンプルを抽出し, プログラム処理後の転置のタグがついた部分を人手で確認し, 精度評価を行った 実験 2 の結果と考察評価実験の結果を表 2 に示す 4 この処理は Damerau-Levenshten dstance といわれる手法とほぼ同じ内容である -83-

14 表 2: 転置処理を行った自動エラータグ付与の精度 ( 転置部分のみ ) データ 正しい判定 誤った判定 判定漏れ 適合率再現率 中学 1 年 P: 0.94 R: 0.98 高校 1 年 P: 0.75 R: 0.89 プログラムの改善により, 転置部分の判定は適合率が中学が 94%, 高校が 75% で可能になった 再現率も中学 (98%) に比べ, 高校 (89%) は落ちる しかし, 従来の分析で誤認していた語順関連のエラーにかなりの精度で対応できることがわかった 実際の改善された処理例を (3) に示す : (3) C: I go to school n Setagaya. O: I go to setagaya school. T1: I go to <add>setagaya</add> school <oms>n</oms> <oms>setagaya</oms>. T2: I go to <trs_add crr = Setagaya >setagaya</trs_add> school <oms>n</oms> <trs_oms crr = setagaya >Setagaya</trs_oms>. T1 が従来のプログラムでのアウトプット,T2 が今回の改良版である Setagaya に関しては <trs_add> と <trs_oms> が 1 つの語順エラーのペアという判定をしている 次に処理がうまくいかなかったケースを考察する (4) C: My frends and I performed Love love love. O: I and my frens ensou suru Love love love. T2: <trs_add crr= I >I</trs_add> <add>and</add> <msf crr= My >my</msf> <msf crr= frends >frens </msf> <msf crr="and">ensou</msf> <trs_oms crr="i">i</trs_oms> <msf crr="performed">suru</msf> Love love love. (4) は対応関係としては,() My frends and I と I and my frens, () performed と ensou suru を関係づけたいのだが, 最初に一致した単語 I が順序的に間違っているのを無視して, それを固定した基点として前後のタグをつけてしまっている プログラムの文脈をチェックする順序を見直す必要がある さらに (5) のような文脈では, 過度の修正を行ってしまっている : (5) C: I lke sng a song, they lke sng a song too. O: I lke sngng a song and they lke sngng a song, too. T1: I lke <msf crr= sngng >sng</msf> a <msf crr= song >song,</msf> <oms>and </oms> they lke <msf crr= sngng >sng</msf> a <msf crr= song, >song</msf> too. T2: I lke <msf crr= sngng >sng</msf> a <trs>song,</trs> <oms>and</oms> they lke <msf crr= sngng >sng</msf> a <trs>song</trs> too. -84-

15 この例のように, 同じ語が 2 回あり, かつ <msf> で両者がエラー箇所としてタグ付されていると語順エラーの対象と間違ってしまうと言う過剰修正の例である これらの改善すべき点はあるものの, 実験 1 で明らかになった語順エラーに対する精度が実験 2 ではかなり向上していることが確認された これをもとにして JEFLL Corpus 全体に正解文に基づくエラータグを自動付与することができた 上記のタグ付与精度を念頭に置いて利用すればいろいろな研究の基礎資料となるエラータグ付きデータを提供できる可能性が開けた 全体的に, 正解文との対応データによる自動エラータグ付与は目視によるエラータグ付与よりも効率がよい まず表層の変形の仕方に着目して編集距離で差異を特定してしまい, 脱落 余剰 誤形成 語順の 4 タイプのエラータグを付与してから, それぞれの単語に品詞情報を付与すれば, タグ付与部分の品詞別分析データなどを比較的容易に作ることができる CLC などで付与している品詞別のエラータグはほとんど今回の我々の自動分析で特定できるエラーが多く, 正解文を作るという作業が時間がかかるものの, タグ付与を目視でやるよりは数段能率良く正解文を作成するのに集中することが可能である 5. エラータグの分析本論の中心的なテーマではないが, 自動付与したエラータグからわかる全般的なエラー傾向に関して最後に概略を触れておきたい 精度が高かった余剰エラーと脱落エラーを中心に述べる 5.1. 余剰エラー余剰エラーは 67 万語の JEFLL Corpus 中で,36,955 回出現した 表 3 が JEFLL Corpus の中学 1 年 ~ 高校 3 年までの余剰エラーとその 1 万語換算の正規化頻度である 表 3: 余剰エラー ( コーパスサイズ :1 万語換算 ) 中 1 中 2 中 3 高 1 高 2 高 3 決定詞 名詞 代名詞 副詞 形容詞 be 動詞 前置詞 法助動詞 to 不定詞 接続詞

16 これを見ると, 余剰エラーの中にはコンスタントにエラーが減少する項目 ( 名詞 ), 逆に増加する項目 ( 代名詞, 副詞, 動詞, 前置詞, 法助動詞, 接続詞 ), ほとんど一定のもの ( 決定詞, 形容詞,be 動詞,to 不定詞 ) があることがわかる 図 1, 図 2 はこれらの品詞別余剰エラー頻度と学年の関係を多変量解析したものである : 図 1: 対応分析 ( 余剰エラー ) 図 2: 階層化クラスター分析 ( 余剰エラー ) -86-

17 これを見る限り, 名詞の余剰エラーは中学 1 年にのみ顕著で, これはほとんどが英語が出てこないので代わりに日本語を使った部分である クラスター分析の結果からもわかるように, 相対頻度的には圧倒的に動詞に関する余剰エラーが他のエラーに類を見ないほど高頻度である そしてこれらの動詞エラーは相対的に中学よりも高校に多い 内容を見てみると, 動詞の選択間違いのエラー, 動詞の時制や相に関するエラーが多い やはり学習事項の難易度が上がってくると, 使いこなしが難しい部分にエラーが出る また英作文では学習段階初期よりも中級レベルの方が学習した事項をいろいろ使ってみようと試みて逆に初級よりも間違いを犯しやすくなるということも考えられる 5.2. 脱落エラー次に脱落エラーの全般的な傾向を表 4 に示す 脱落エラーは JEFLL Corpus 中には 83,221 回出現した これは余剰エラーの 2 倍強である いかに何かを落としてしまうエラーの方が, 付け足してしまうエラーに比べると外国語の産出の特徴になるかがわかるであろう ただ, 余剰エラーと決定的に違うのは, 脱落エラーは全体的に初級段階で多くてもレベルが上がるにつれて減っていくのが一般的であるのに対して, 余剰エラーはレベルが上がると同時にエラー頻度も増加するものがある, という点である 脱落エラーで最も顕著なのは決定詞 ( 冠詞類と some, any など ) と名詞である 特に冠詞の脱落エラーは日本人の英語の場合には日本語に冠詞がないために, 冠詞を持つ母語話者と比べるとエラー頻度が高い 次に動詞, 前置詞, 代名詞類は中 1 が非常に多いが, その後急に減少し, その後はあまり急激に減らずに一定量のエラーが観察される これらは脱落に関しては初期の落ちやすい時期を習得段階的に克服して安定する時期が中 2 を過ぎると出てくる ただ, 中 3 以降はまたさまざまな動詞や前置詞の新しい用法に触れるため, それらをリスクを冒して使ってみることによる誤りも増える 表 4: 脱落エラー (1 万語換算 ) 中 1 中 2 中 3 高 1 高 2 高 3 決定詞 名詞 代名詞 副詞 形容詞 be 動詞 前置詞 法助動詞 to 不定詞 接続詞 多変量解析の結果が図 3,4 である : -87-

18 図 3: 対応分析 ( 脱落エラー ) 図 4: 階層化クラスター分析 ( 脱落エラー ) クラスター分析の結果が前述の分類の結果を裏付けている デンドログラムの右側が比較的高頻度の脱落エラー群である 対応分析の結果は, 決定詞は高校のグループと近く, 動詞や代名詞は中学初期と近い これらの品詞関係の発達段階と脱落エラーは密接に関係していることが伺えるデータである -88-

19 6. 結論本論では英語学習者の英作文データに自動エラータグ付与を行う方法として, 正解文との対応付けデータを用い, 編集距離を用いて自動的に原文と正解文の差異を同定することで, 自動エラータグ付与を行うプログラムの開発とその評価を行った エラーの自動同定などの研究とは一線を画するが, 大量にエラータグ付与を行ってその学習者データをさらに精度の高いデータへと加工していくための非常に実際的な解決策となると期待される 結果は, 全体的に精度が高く現状でも十分運用できるレベルであることが分かった これを用いて, エラータグ付与のプロセスが簡略化され, 大規模データに比較的簡易に正確にエラータグが付与できる環境が整うことで, レベル別の学習者データの解析がますます進み, 多様な学習システムへの応用へと展開していくことを願ってやまない 引用文献投野由紀夫 (2007) 日本人中高生 1 万人の英語コーパス : JEFLL コーパス 小学館. 浪平博人 (1989) 学習コンピュータアルゴリズム, 技術評論社. 望月源, 神谷泰弘, 奥村学, 島津明 (2000) 英語ディクテーション学習支援システムの構築, 教育システム情報学会誌,19/13: Abe, M. and Tono, Y. (2005) Varatons n L2 spoken and wrtten Englsh: nvestgatng patterns of grammatcal errors across profcency levels. Proceedngs of Corpus Lngustcs 2005 Conference /LanguageLearnngandError/varatonsnL2.doc, accessed 08/09/2011. Albert, C., Garner, M., Rykner, A. and Sant-Dzer, P. (2009) Analyzng a corpus of documents wrtten n Englsh by natve speakers of French: classfyng and annotatng lexcal and grammatcal errors. Mahlberg, M., V. González-Díaz and C. Smth (eds.) Proceedngs of the Corpus Lngustcs Conference (CL2009), Unversty of Lverpool, UK, (20-23 July, 2009). Bursten, J. and Marcu, D. (2000) Benefts of modularty n an automated essay scorng system. (ERIC reproducton servce No. TM ). Atwell, E. (1987) How to detect grammatcal errors n a text wthout parsng t. Proceedngs of the 3rd EACL. Copenhagen, Cambrdge Advanced Learner s Dctonary, Cambrdge Unversty Press. [ 本文中では CALD と略記 ] Ch Man-La, A., Wong, P-Y, and Chau-png, M.W., (1994) Collocatonal problems amongst ESL learners: A corpus-based study. L. Flowerdew and A.K.K. Tong (eds), Enterng text. Hong Kong: Language Centre, Hong Kong Unversty of Scence and Technology, and Department of Englsh, Guangzhou Insttute of Foregn Languages, Chodorow, M. and Leacock, C. (2000) An unsupervsed method for detectng grammatcal errors. Proceedngs of the frst conference on North Amercan chapter of the Assocaton for Computatonal Lngustcs, San Francsco, CA, USA, Morgan Kaufmann Publshers Inc, -89-

20 De Felce, R., & Pulman, S. G. (2007) Automatcally acqurng models of preposton use. F. Costello, J. Kelleher, & M. Volk (eds.), Proceedngs of the Fourth ACL-SIGSEM Workshop on Prepostons. Prague: Assocaton for Computatonal Lngustcs, Dkl, S. (2006) Automated Essay Scorng. Turksh Onlne Journal of Dstance Educaton- TOJDE. Volume 7, Number 1, Artcle 5., Turkey, Ellot, S. (2003). IntellMetrc: from here to valdty. In Mark D. Sherms and Jll C. Bursten (Eds.). Automated Essay Scorng: A Cross Dscplnary Approach. Mahwah, NJ: Lawrence Erlbaum Assocates. Flowerdew, L. (2000) Investgatng referental and pragmatc errors n a learner corpus, Burnard, L. and McEnery, T. (eds.) Rethnkng Language Pedagogy from a Corpus Perspectve. Frankfurt am Man: Peter Lang, Foltz, P. W. (1996). Latent Semantc Analyss for text-based research. Behavor Research Methods, Instruments and Computers, 28(2), Gamon, M., Gao, J., Brockett, C., Klementev, A., Dolan, W.B., Belenko, D., and Vanderwende, L. (2008). Usng contextual speller technques and language modelng for ESL error correcton. Proceedngs of the Thrd Internatonal Jont Conference on Natural Language Processng. Hyderabad, Inda: Asan Federaton of Natural Language Processng, Goldng, A. (1995) A Bayesan Hybrd for Context Senstve Spellng Correcton. Proceedngs of the 3rd Workshop on Very Large Corpora. Cambrdge, USA Goldng, A. and Roth, D. (1996) Applyng Wnnow to context-senstve spellng correcton. Proceedngs of the Int. Conference on Machne Learnng, Granger, S. (1998) Learner Englsh on Computer. London: Addson Wesley Longman. Granger, S. (1999) Use of tenses by advanced EFL learners: evdence from an error-tagged computer corpus. Hasselgård, H. and Oksefell, S. (eds.) Out of Corpora - Studes n Honour of Stg Johansson. Amsterdam: Rodop, Han, N.-R., Chodorow, M. and Leacock, C. (2004) Detectng errors n Englsh artcle usage wth a maxmum entropy classfer traned on a large, dverse corpus. Proceedngs of the Fourth Internatonal Conference on Language Resources and Evaluaton. Lsbon: European Language Resources Assocaton, He, A. (1998) A corpus-based analyss of mddle school students' Englsh spellng errors Granger, S. and Hung, J. (eds.) Proceedngs of the Frst Internatonal Symposum on Computer Learner Corpora, Second Language Acquston and Foregn Language Teachng. (14-16 December,1998), Hong Kong:The Chnese Unversty of Hong Kong, Housen, A. (2002) A corpus-based study of the L2-acquston of the Englsh verb system, S. Granger, J. Hung, & S. Petch-Tyson (eds.) Computer learner corpora, second language acquston and foregn language teachng. Amsterdam: John Benamns, Ingels, P. (1997) A Robust Text Processng Technque Appled to Lexcal Error Recovery, Ph.D. -90-

21 thess, Cornel Unversty. accessed 01/08/2011. Izum, E., Saga, T., Uchmoto, K., Supnth, T., and Isahara, H. (2003) Automatc error detecton n the Japanese learners' Englsh spoken data. Companon Volume of the Proceedngs of the Assocaton of Computatonal Lngustcs (ACL) 2003, Japan, Izum, E., Uchmoto, K., & Isahara, H. (2004). The NICT JLE Corpus: Explotng the language learners speech database for research and educaton. Internatonal Journal of the Computer, the Internet and Management, 12(2), Källkvst, M. (1995) Lexcal errors among verbs: a plot study of the vocabulary of advanced Swedsh learners of Englsh, Workng Papers n Englsh and Appled Lngustcs 2. Research Centre for Englsh and Appled Lngustcs, Unversty of Cambrdge, Knght, K. & Chander, I. (1994). Automatc postedtng of documents. K. S. H. Forbus (ed.) Proceedngs of the 12th Natonal Conference on Artfcal Intellgence. Seattle: Morgan Kaufmann, Landauer, T. K., Laham, D., & Foltz, P. W. (2000) The Intellgent Essay Assessor. Mart A. Hearst (ed), The debate on automated essay gradng. IEEE Intellgent systems, accessed 01/08/2011. Lee, J. (2004) Automatc artcle restoraton. Proceedngs of the Human Language Technology Conference of the North Amercan Chapter of the Assocaton for Computatonal Lngustcs. Boston: Assocaton for Computatonal Lngustcs, Lenko-Szymanska, A. (2003) Lexcal problems n the advanced learner corpus of wrtten data. Paper presented at PALC 2003 (Practcal Applcatons of Language Corpora), Lodz, Poland, (4-6 Aprl, 2003). Longman Dctonary of Contemporary Englsh, London: Pearson Educaton. Ffth Edton. [ 本文中では LDOCE と略記 ] Mason, O. & Uzar, R. (2001) Locatng the zero artcle: how TEFL can beneft from NLP. Aston, G and L. Burnard (Eds.) Corpora n the descrpton and teachng of Englsh. Papers from the 5th ESSE conference, Bologna CLUEB, Mlton, J. and Freeman, R. (1996) Lexcal varaton n the wrtng of Chnese learners of Englsh. C.E. Persy (ed.) Synchronc Corpus Lngustcs. Amsterdam: Rodop, 2003, Nesselhauf, N. (2005) Collocatons n Learner Corpus. Amsterdam: John Benamns. Ncholls, D. (2003) The Cambrdge Learner Corpus error codng and analyss for lexcography and ELT. Proceedngs of Corpus Lngustcs 2003, papers/ncholls.pdf, accessed 08/09/2011. Page, E. B. (2003) Proect Essay Grade: PEG. M. D. Sherms & J. Bursten (eds.) Automated Essay Scorng: A Cross-Dscplnary Perspectve. Mahwah, NJ: Lawrence Erlbaum Assocates. Tono, Y. (1996) Usng learner corpora for lexcography, LEXIKOS 6: Tono, Y. and Mochzuk, H. (2009) Toward automatc error dentfcaton n learner corpora: a DP -91-

22 matchng approach. Paper presented at Corpus Lngustcs 2009 conference. Unversty of Lverpool, 22 July Turner, J., & Charnak, E. (2007) Language modelng for determner selecton. Human Language Technologes 2007: The Conference of the North Amercan Chapter of the Assocaton for Computatonal Lngustcs; Companon Volume, Short Papers. Rochester, NY: Assocaton for Computatonal Lngustc,

TALC Teaching and Language Corpora Wichmann et al. ; Kettemann & Marko ; Burnard & McEnery ; Aston ; Hunston ; Granger et al. ; Tan ; Sinclair ; Aston

TALC Teaching and Language Corpora Wichmann et al. ; Kettemann & Marko ; Burnard & McEnery ; Aston ; Hunston ; Granger et al. ; Tan ; Sinclair ; Aston TALC Teaching and Language CorporaWichmann et al. ; Kettemann & Marko ; Burnard & McEnery ; Aston ; Hunston ; Granger et al. ; Tan ; Sinclair ; Aston, Bernardini & Stewart G. Leech Leech Leech direct use

More information

1. はじめに 2

1. はじめに 2 点予測と能動学習を用いた効率的なコーパス構築 形態素解析における実証実験 京都大学情報学研究科 Graham NEUBIG 1 1. はじめに 2 形態素解析 べた書きの文字列を意味のある単位に分割し 様々な情報を付与 品詞 基本形 読み 発音等を推定 農産物価格安定法を施行した 価格 / 名詞 / 価格 / かかく / かかく安定 / 名詞 / 安定 / あんてい / あんてー法 / 接尾辞 /

More information

博士論文概要 タイトル : 物語談話における文法と談話構造 氏名 : 奥川育子 本論文の目的は自然な日本語の物語談話 (Narrative) とはどのようなものなのかを明らかにすること また 日本語学習者の誤用 中間言語分析を通じて 日本語上級者であっても習得が難しい 一つの構造体としてのまとまりを

博士論文概要 タイトル : 物語談話における文法と談話構造 氏名 : 奥川育子 本論文の目的は自然な日本語の物語談話 (Narrative) とはどのようなものなのかを明らかにすること また 日本語学習者の誤用 中間言語分析を通じて 日本語上級者であっても習得が難しい 一つの構造体としてのまとまりを 博士論文概要 タイトル : 物語談話における文法と談話構造 氏名 : 奥川育子 本論文の目的は自然な日本語の物語談話 (Narrative) とはどのようなものなのかを明らかにすること また 日本語学習者の誤用 中間言語分析を通じて 日本語上級者であっても習得が難しい 一つの構造体としてのまとまりを構成する 談話展開技術がどのようなものか明らかにすることである そのため 日本語母語話者と学習者に言葉のないアニメーションのストーリーを書いてもらった物語談話を認知機能言語学の観点から分析し

More information

英英辞典のdefining vocabularyを活用した単語テストのVocabulary Levels Testによって算出した語彙数と読解力テスト及びTOEIC総合点(L&R)との相関性に関する一考察

英英辞典のdefining vocabularyを活用した単語テストのVocabulary Levels Testによって算出した語彙数と読解力テスト及びTOEIC総合点(L&R)との相関性に関する一考察 英英辞典の defining vocabulary を活用した単語テストの Vocabulary Levels Test によって算出した語彙数と読解力テスト及び TOEIC 総合点 (L&R) との相関性に関する一考察 森永弘司 ( 同志社大学 ) 日本英語教育学会第 48 回年次研究集会 早稲田大学 2018 年 3 月 3 日 発表目次 1. はじめに 2. テストに関して 3. 参加者 4.

More information

Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students A Dissertation Submitted t

Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students A Dissertation Submitted t Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students MIZUMOTO, Atsushi Graduate School of Foreign Language Education and Research, Kansai University, Osaka,

More information

Présentation PowerPoint

Présentation PowerPoint 学習の可視化 多様化に関する研究会 2013 年 12 月 11 日 フランス語学習者における CEFR-J を用いた自己評価と 客観評価との関係 杉山香織 ( 東京外国語大学大学院博士課程 ) 川口裕司 ( 東京外国語大学 ) フランス語での取り組みの一例 学習の可視化に向けて CEFR-J を基にした can-do の調査 ( 自己評価 ) CEFR-J を基にしたタスクの作成 調査 ( 客観評価

More information

橡jttc2.PDF

橡jttc2.PDF 1 ( ) 1 GA GA GA MOGA (Multple-Objectve Genetc Algorthm) GA GA GA MOGA GA GA MOGA GA GA 3.1MOGA ( ) x x j f = f, f, 1 2 L, f q x x j x j f ( x ) f ( x ) f ( x ) f ( x ) L f ( x ) f ( x ) ( ) ( ) 1 1 j

More information

nlp1-12.key

nlp1-12.key 自然言語処理論 I 12. テキスト処理 ( 文字列照合と検索 ) 情報検索 information retrieval (IR) 広義の情報検索 情報源からユーザの持つ問題 ( 情報要求 ) を解決できる情報を見つけ出すこと 狭義の情報検索 文書集合の中から ユーザの検索質問に適合する文書を見つけ出すこと 適合文書 : 検索質問の答えが書いてある文書 テキスト検索 (text retrieval)

More information

ボルツマンマシンの高速化

ボルツマンマシンの高速化 1. はじめに ボルツマン学習と平均場近似 山梨大学工学部宗久研究室 G04MK016 鳥居圭太 ボルツマンマシンは学習可能な相互結合型ネットワー クの代表的なものである. ボルツマンマシンには, 学習のための統計平均を取る必要があり, 結果を求めるまでに長い時間がかかってしまうという欠点がある. そこで, 学習の高速化のために, 統計を取る2つのステップについて, 以下のことを行う. まず1つ目のステップでは,

More information

2 116

2 116 1 北陸大学 紀要 第27号 2003 pp. 115 122 中国人日本語学習者が間違えやすい表現について 王 国 華 A Study on the Expressions in which Chinese Learners of Japanese Frequently Make Mistakes Wang GuoHua Received October 28, 2003 1 はじめに 中国語を母国語とする日本語学習者の数は年々増え続けている

More information

040402.ユニットテスト

040402.ユニットテスト 2. ユニットテスト ユニットテスト ( 単体テスト ) ユニットテストとはユニットテストはプログラムの最小単位であるモジュールの品質をテストすることであり その目的は結合テスト前にモジュール内のエラーを発見することである テストは機能テストと構造テストの2つの観点から行う モジュールはプログラムを構成する要素であるから 単体では動作しない ドライバとスタブというテスト支援ツールを使用してテストを行う

More information

使用上の注意 はじめに ( 必ずお読みください ) この SIGN FOR CLASSROOM の英語の動画資料について 作成の意図の詳細は 2 ページ以降に示されているので できるだけすべてを読んでいただきたい 要約 このビデオは 聴覚障がいを持つ生徒たちに英語を教える時 見てわかる会話を表 出さ

使用上の注意 はじめに ( 必ずお読みください ) この SIGN FOR CLASSROOM の英語の動画資料について 作成の意図の詳細は 2 ページ以降に示されているので できるだけすべてを読んでいただきたい 要約 このビデオは 聴覚障がいを持つ生徒たちに英語を教える時 見てわかる会話を表 出さ 使用上の注意 はじめに ( 必ずお読みください ) この SIGN FOR CLASSROOM の英語の動画資料について 作成の意図の詳細は 2 ページ以降に示されているので できるだけすべてを読んでいただきたい 要約 このビデオは 聴覚障がいを持つ生徒たちに英語を教える時 見てわかる会話を表 出させることや 書く力を育てる 学習活動に活用できるようにという目的のために 作成されたものである 1 おすすめの見てわかる英語の表現和洋折衷案

More information

スーパー英語アカデミック版Ver.2

スーパー英語アカデミック版Ver.2 教材作成キット 教材作成キットは クラス管理者が授業の進捗に合わせた問題を学習させるために AE3 内の ライブラリ で提供されている教材群を利用して独自の 問題集 を作ったり 手持ちの中間 期末テストなどの教材データを登録してクラス管理者オリジナルの 問題集 を作成したりするための教材管理ツールです 以下にそれぞれの役割を説明しています 教材名 概要 1 AE 教材 AE 教材は AE3 内で用意された教材をピックアップし

More information

早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月

早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月 早稲田大学大学院日本語教育研究科 修士論文概要書 論文題目 ネパール人日本語学習者による日本語のリズム生成 大熊伊宗 2018 年 3 月 本研究は ネパール人日本語学習者 ( 以下 NPLS) のリズム生成の特徴を明らかにし NPLS に対する発音学習支援 リズム習得研究に示唆を与えるものである 以下 本論文 の流れに沿って 概要を記述する 第一章序論 第一章では 本研究の問題意識 意義 目的 本論文の構成を記した

More information

T_BJPG_ _Chapter3

T_BJPG_ _Chapter3 第 3 章 研究方法 3.1 研究のデザイン本研究では 処理されたデータが数字ではない その上 本研究に処理されることは言葉や物事の実際の状況である そのために使用される研究方法は定性的記述法 (Qualitative Descriptive) である (Sudaryanto, 1992: 62). 記述する方法では研究者がデータ分類によって データに関する特徴を挙げられる それに そのデータの性質的及びほかのデータとの関係に関することを判断する

More information

応用言語学特講発表資料第 7 章前半担当 :M.Y. [ 第 7 章 ] 語彙の習得 1. 第二言語学習者が目標とすべき語彙サイズ A) 語彙サイズ の定義第二言語習得論の中でよく用いられる 語彙サイズ には研究者のなかでも複数の見解がある (Nation&Meara,2002) それらは以下のとお

応用言語学特講発表資料第 7 章前半担当 :M.Y. [ 第 7 章 ] 語彙の習得 1. 第二言語学習者が目標とすべき語彙サイズ A) 語彙サイズ の定義第二言語習得論の中でよく用いられる 語彙サイズ には研究者のなかでも複数の見解がある (Nation&Meara,2002) それらは以下のとお [ 第 7 章 ] 語彙の習得 1. 第二言語学習者が目標とすべき語彙サイズ A) 語彙サイズ の定義第二言語習得論の中でよく用いられる 語彙サイズ には研究者のなかでも複数の見解がある (Nation&Meara,2002) それらは以下のとおりである 1 ワード ファミリー (word family) 1 つの動詞の活用形 屈折形 派生語を全てその動詞の基幹語の family であると数える概念

More information

11_寄稿論文_李_再校.mcd

11_寄稿論文_李_再校.mcd 148 2011.4 1 4 Alderson 1996, Chapelle 2001, Huston 2002, Barker 2004, Rimmer 2006, Chodorow et al. 2010 He & Dai 2006 2 3 4 2 5 4 1. 2. 3. 1 2 (1) 3 90 (2) 80 1964 Brown 80 90 British National Corpus

More information

スライド 1

スライド 1 心理と言語 A 第 13 回 論文レビュー Gass, S., & Mackey, A. (2007). Input, interaction, and output in second language acquisition. Logo The theory and its constructs (1) モデル (models) - 何らかの現象の how を説明 記述する 理論 (theories)

More information

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ

C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ C プログラミング演習 1( 再 ) 2 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ 今回のプログラミングの課題 次のステップによって 徐々に難易度の高いプログラムを作成する ( 参照用の番号は よくわかる C 言語 のページ番号 ) 1. キーボード入力された整数 10 個の中から最大のものを答える 2. 整数を要素とする配列 (p.57-59) に初期値を与えておき

More information

Microsoft PowerPoint - OS12.pptx

Microsoft PowerPoint - OS12.pptx # # この資料は 情報工学レクチャーシリーズ松尾啓志著 ( 森北出版株式会社 ) を用いて授業を行うために 名古屋工業大学松尾啓志 津邑公暁が作成しました パワーポイント 7 で最終版として保存しているため 変更はできませんが 授業でお使いなる場合は松尾 (matsuo@nitech.ac.jp) まで連絡いただければ 編集可能なバージョンをお渡しする事も可能です # 主記憶管理 : ページ置き換え方式

More information

<4D F736F F D E382E32372E979B82D982A98C7697CA8D918CEA8A77975C8D658F575F93FC8D6594C52E646F6378>

<4D F736F F D E382E32372E979B82D982A98C7697CA8D918CEA8A77975C8D658F575F93FC8D6594C52E646F6378> 日本語学習者の発話量と言語テストの得点の関連性について 李在鎬 ( 筑波大学 ), 村田裕美子 ( ミュンヘン大学 ) 小林典子 ( 元筑波大学 ), 酒井たか子 ( 筑波大学 ) 1. 研究背景学習者コーパスとは, 言語学習者の産出データを格納したデータベースのことである 一般的には, 学習言語の熟達度 (proficiency) の差が言語使用にどのようなバイアスを与えるかを調査する目的で使用する

More information

科目名 総合英語 ⅠA 対象学年 1 年 期間 通年 曜日 時限 金 1-2 限 授業回数 90 分 34 回 授業種別 講義 回 / 週 1 回 取得単位 4 単位 授業目的達成目標 読み 書き を通して 聞く こと 話す ことにも役立つ英語の力を習得させる 文法を踏まえてパラグラフの内容を迅速か

科目名 総合英語 ⅠA 対象学年 1 年 期間 通年 曜日 時限 金 1-2 限 授業回数 90 分 34 回 授業種別 講義 回 / 週 1 回 取得単位 4 単位 授業目的達成目標 読み 書き を通して 聞く こと 話す ことにも役立つ英語の力を習得させる 文法を踏まえてパラグラフの内容を迅速か 総合英語 ⅠA 対象学年 年 期間 通年 曜日 時限 金 - 限 数 0 分 回 授業種別 講義 回 / 週 回 取得単位 単位 読み 書き を通して 聞く こと 話す ことにも役立つ英語の力を習得させる 文法を踏まえてパラグラフの内容を迅速かつ正確に把握できる 英文でパラグラフを書くことができる 0 0 0 教科書の使い方 授業の受け方 + Self-Introduction ボキャビル文法解説

More information

(NICT) ( ) ( ) (NEC) ( )

(NICT) ( ) ( ) (NEC) ( ) (NICT) ( ) () (NEC) ( ) ! Paraphrase (Paraphrasing) l l ! l h"p://paraphrasing.org/bib- cat.html l 12 50 l 640 (2014 6)! l l l l l l ! [ ] 2! [ ] ( )! :............ 1 2 1 = 2 = ! [ ]! [ ]! :............

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074> RD_301 構成要素一覧と検索 から構成要素の編集辞書 ( 削除 ) を作る 作成 ( 編集 ) する削除辞書を開きます 構成要素を検索します ドラック & ドロップでも OK 範囲を選択して右クリック 右クリック 削除辞書に登録 ( 追加 ) したい構成要素を選択しコピーします 削除辞書に追加 ( 貼りつけ ) ます Step5. 削除辞書に構成要素が登録 ( 追加 ) されます 構成要素一覧と検索

More information

IPFCプロジェクトの概要

IPFCプロジェクトの概要 IPCF プロジェクトから対照中間言語分析へ フランス語, ポルトガル語, 日本語, トルコ語の対照中間言語分析国際ワークショップ 言語コーパスと学習者言語をめぐって 2018 年 11 月 5 日 ( 於東京外国語大学 ) 鈴木拓真 ( 東京外国語大学博士前期課程 ) 中川亮 ( 東京大学大学院修士課程 ) 川口裕司 ( 東京外国語大学 ) 1 現代フランス語の中間言語音韻論 (IPCF) IPCF

More information

Microsoft Word - 佐々木和彦_A-050(校了)

Microsoft Word - 佐々木和彦_A-050(校了) 教育総研発 A-050 号 知識が活かされる英語の指導とは ~ 使い途 あっての知識 ~ 代々木ゼミナール英語講師 佐々木和彦 文法や構文など 英語の知識を生徒に与えると そのような知識を与える前よりも生徒の読解スピードが圧倒的に遅くなることがあります 特に 教えられた知識を使おうとする真面目な生徒にそのような傾向があります もちろん 今までいい加減に読んでいた英文を それまでは意識したことがなかったルールや知識を意識しながら読むのですから

More information

(Microsoft Word - \207U\202P.doc)

(Microsoft Word - \207U\202P.doc) ( 科目別結果別結果の経年変化 平均通過率 通過率 % 以上の生徒の割合 通過率 % 以上の生徒の割合 国語数学外国語 A 問題 B 問題 A 問題 B 問題 A 問題 B 問題国語国語数学数学 Ⅰ 数学数学 Ⅰ OCⅠ 英語 Ⅰ OCⅠ 英語 Ⅰ 総合総合基礎基礎 H3 7.3 73. 35. 9..1. 5.1 9.7.5 7. H 73. 7. 3. 71. 57. 73.. 9.9 5.5

More information

Microsoft PowerPoint - mp11-06.pptx

Microsoft PowerPoint - mp11-06.pptx 数理計画法第 6 回 塩浦昭義情報科学研究科准教授 shioura@dais.is.tohoku.ac.jp http://www.dais.is.tohoku.ac.jp/~shioura/teaching 第 5 章組合せ計画 5.2 分枝限定法 組合せ計画問題 組合せ計画問題とは : 有限個の もの の組合せの中から, 目的関数を最小または最大にする組合せを見つける問題 例 1: 整数計画問題全般

More information

main.dvi

main.dvi THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. ( ) Estmaton and Analyss of Topc Models n Tme Seres Japanese / Chnese News and Blogs Shuo HU,LyZHENG, Yusuke

More information

nlp1-05.key

nlp1-05.key 実用的な構文解析 自然言語処理論 I 今までの例に挙げた文法は非常に単純 実用的な文法 いろいろな文に対応しなければならない それだけ規則の数も増える 5. 文法 3( 素性構造と ) 規則を効率的に管理する必要がある 1 2 一致の例 英語における一致 (agreement) 数 ( 単数形, 複数形 ) 人称 (1 人称,2 人称,3 人称 ) 名詞句の例 a desk the desks a

More information

PowerPoint Presentation

PowerPoint Presentation パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素 音節 単語 文 基本図形 文字 指紋 物体 人物 顔 パターン は唯一のデータではなく 似通ったデータの集まりを表している 多様性 ノイズ 等しい から 似ている へ ~ だ から ~ らしい へ 等しい から 似ている へ 完全に等しいかどうかではなく 似ているか どうかを判定する パターンを代表する模範的データとどのくらい似ているか

More information

アカウントの新規作成 1. Keio Academy of New York Admissions Portal にアクセス インターネットが使えるコンピューター等を利用し Keio Academy of New York Admissions Portal ( 以下 ポータル とよぶ ) にアクセ

アカウントの新規作成 1. Keio Academy of New York Admissions Portal にアクセス インターネットが使えるコンピューター等を利用し Keio Academy of New York Admissions Portal ( 以下 ポータル とよぶ ) にアクセ Keio Academy of New York Admissions Portal 操作マニュアルー志願者用ー 本操作マニュアルは頻繁に内容が更新されることがありますので ご利用の際は できるだけ 学院ホームページより最新版をダウンロードしてご確認ください Page1 アカウントの新規作成 1. Keio Academy of New York Admissions Portal にアクセス インターネットが使えるコンピューター等を利用し

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

11/27/2003 ( ) 1 UC Berkely FrameNet (FN) ( Frame Semantics (FS) Lexical Unit (LU) Commercial Transaction Fram

11/27/2003 ( ) 1 UC Berkely FrameNet (FN) (  Frame Semantics (FS) Lexical Unit (LU) Commercial Transaction Fram 11/27/2003 ( ) 1 UC Berkely FrameNet (FN) (http://www.icsi.berkeley.edu/~framenet/) Frame Semantics (FS) Lexical Unit (LU) Commercial Transaction Frame Japanese FrameNet (JFN) FS 2 フレームネットとは何か 狭義にはフレーム意味論(後述)に基づく電子辞書

More information

マウス操作だけで本格プログラミングを - 世界のナベアツをコンピュータで - プログラムというと普通は英語みたいな言葉で作ることになりますが 今回はマウスの操作だけで作ってみます Baltie, SGP System 操作説明ビデオなどは 高校 情

マウス操作だけで本格プログラミングを - 世界のナベアツをコンピュータで - プログラムというと普通は英語みたいな言葉で作ることになりますが 今回はマウスの操作だけで作ってみます Baltie, SGP System   操作説明ビデオなどは 高校 情 マウス操作だけで本格プログラミングを - 世界のナベアツをコンピュータで - プログラムというと普通は英語みたいな言葉で作ることになりますが 今回はマウスの操作だけで作ってみます Baltie, SGP System http://www.sgpsys.com/en/ 操作説明ビデオなどは 高校 情報科 の教材 指導案作ってみました http://www.beyondbb.jp/ Zip の教材内に入っています

More information

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1

次に示す数値の並びを昇順にソートするものとする このソートでは配列の末尾側から操作を行っていく まず 末尾の数値 9 と 8 に着目する 昇順にソートするので この値を交換すると以下の数値の並びになる 次に末尾側から 2 番目と 3 番目の 1 4. ソート ( 教科書 p.205-p.273) 整列すなわちソートは アプリケーションを作成する際には良く使われる基本的な操作であり 今までに数多くのソートのアルゴリズムが考えられてきた 今回はこれらソートのアルゴリズムについて学習していく ソートとはソートとは与えられたデータの集合をキーとなる項目の値の大小関係に基づき 一定の順序で並べ替える操作である ソートには図 1 に示すように キーの値の小さいデータを先頭に並べる

More information

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt)

(Microsoft PowerPoint - \203|\203X\203^\201[\224\255\225\\\227p\216\221\227\ ppt) Web ページタイプによるクラスタリングを用いた検索支援システム 折原大内海彰電気通信大学システム工学専攻 はじめに 背景 文書クラスタリングを用いた検索支援システム Clusty(http://clusty.jp/) KartOO(http://www.kartoo.com/) Carrot(http://www.carrot-search.com/) これらはすべてトピックによる分類を行っている

More information

生命情報学

生命情報学 生命情報学 5 隠れマルコフモデル 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 内容 配列モチーフ 最尤推定 ベイズ推定 M 推定 隠れマルコフモデル HMM Verアルゴリズム EMアルゴリズム Baum-Welchアルゴリズム 前向きアルゴリズム 後向きアルゴリズム プロファイル HMM 配列モチーフ モチーフ発見 配列モチーフ : 同じ機能を持つ遺伝子配列などに見られる共通の文字列パターン

More information

Microsoft Word - 博士論文概要.docx

Microsoft Word - 博士論文概要.docx [ 博士論文概要 ] 平成 25 年度 金多賢 筑波大学大学院人間総合科学研究科 感性認知脳科学専攻 1. 背景と目的映像メディアは, 情報伝達における効果的なメディアの一つでありながら, 容易に感情喚起が可能な媒体である. 誰でも簡単に映像を配信できるメディア社会への変化にともない, 見る人の状態が配慮されていない映像が氾濫することで見る人の不快な感情を生起させる問題が生じている. したがって,

More information

Microsoft PowerPoint - アルデIII 10回目12月09日

Microsoft PowerPoint - アルデIII 10回目12月09日 アルゴリズムとデータ構造 III 9 回目 : 月 9 日 全文検索アルゴリズム (Simple Serh, KMP) 授業資料 http://ir.s.ymnshi..jp/~ysuzuki/puli/lgorithm/index.html 授業の予定 ( 中間試験まで ) / スタック ( 後置記法で書かれた式の計算 ) / チューリング機械, 文脈自由文法 / 構文解析 CYK 法 / 構文解析

More information

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太 ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : 095739 K 氏名 : 當銘孔太 1. UNIX における正規表現とは何か, 使い方の例を挙げて説明しなさい. 1.1 正規表現とは? 正規表現 ( 正則表現ともいう ) とは ある規則に基づいて文字列 ( 記号列 ) の集合を表す方法の 1 つです ファイル名表示で使うワイルドカードも正規表現の兄弟みたいなもの

More information

立ち読みページ

立ち読みページ Chapter 5 文章校正やコメント 変更履歴など 文書を校閲するときに役立つ機能を解説します 作成する文書を確認する 172 文章を校正する 173 文字の意味を調べる 178 コメントを挿入する 181 変更履歴を使って文書を校閲する 187 2つの文書を比較する 194 196 Chapter 5 学習前に習得すべきポイントを理解しておき 学習後には確実に習得できたかどうかを振り返りましょう

More information

1.... 3 2.... 5 3.... 8 3.1.... 9 3.2.... 13 3.3.... 18 4.... 21 4.1.... 21 4.2.... 23 4.3.... 26 5.... 32... 33 1... 35 2... 39 1.... 39 2.... 43 2

1.... 3 2.... 5 3.... 8 3.1.... 9 3.2.... 13 3.3.... 18 4.... 21 4.1.... 21 4.2.... 23 4.3.... 26 5.... 32... 33 1... 35 2... 39 1.... 39 2.... 43 2 JILPT Dscusson Paper Seres 12-2 212 3 ( 22 6 18 ) 1 1.... 3 2.... 5 3.... 8 3.1.... 9 3.2.... 13 3.3.... 18 4.... 21 4.1.... 21 4.2.... 23 4.3.... 26 5.... 32... 33 1... 35 2... 39 1.... 39 2.... 43 2

More information

甲37号

甲37号 氏名 ( 本籍地 ) LE CAM NHUNG( ベトナム ) 学位の種類 博士 ( 文学 ) 学位記番号 甲第 75 号 学位授与年月日 平成 28 年 3 月 16 日 学位授与の要件 昭和女子大学学位規則第 5 条第 1 項該当 論 文 題 目 ベトナム人日本語学習者の産出文章に見られる視点の表し方及びその指導法に関する研究 - 学習者の< 気づき>を重視する指導法を中心に- 論文審査委員 (

More information

アプリケーション インスペクションの特別なアクション(インスペクション ポリシー マップ)

アプリケーション インスペクションの特別なアクション(インスペクション ポリシー マップ) CHAPTER 2 アプリケーションインスペクションの特別なアクション ( インスペクションポリシーマップ ) モジュラポリシーフレームワークでは 多くのアプリケーションインスペクションで実行される特別なアクションを設定できます サービスポリシーでインスペクションエンジンをイネーブルにする場合は インスペクションポリシーマップで定義されるアクションを必要に応じてイネーブルにすることもできます インスペクションポリシーマップが

More information

Microsoft PowerPoint - 05.pptx

Microsoft PowerPoint - 05.pptx アルゴリズムとデータ構造第 5 回 : データ構造 (1) 探索問題に対応するデータ構造 担当 : 上原隆平 (uehara) 2015/04/17 アルゴリズムとデータ構造 アルゴリズム : 問題を解く手順を記述 データ構造 : データや計算の途中結果を蓄える形式 計算の効率に大きく影響を与える 例 : 配列 連結リスト スタック キュー 優先順位付きキュー 木構造 今回と次回で探索問題を例に説明

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること

今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順 ) になるよう 並び替えること C プログラミング演習 1( 再 ) 4 講義では C プログラミングの基本を学び 演習では やや実践的なプログラミングを通して学ぶ 今回のプログラミングの課題 ( 前回の課題で取り上げた )data.txt の要素をソートして sorted.txt というファイルに書出す ソート (sort) とは : 数の場合 小さいものから大きなもの ( 昇順 ) もしくは 大きなものから小さなもの ( 降順

More information

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using

コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using コーパスを用いた中国語ネット語の判定システム 竇梓瑜 ( 東京農工大学工学府情報工学専攻 ) 古宮嘉那子 ( 東京農工大学工学研究院先端情報科学部門 ) 小谷善行 ( 東京農工大学工学研究院先端情報科学部門 ) A Detection System of Chinese Netspeak Using Text Corpus Ziyu Dou(Graduate School of Engineering,

More information

Water Sunshine

Water Sunshine 全国英語教育学会 2016 年 8 月 20 日 ( 土 ) 第 42 回埼玉大会 獨協大学 中高生の英語学習に関する実態調査 2014 学習実態と学習への意識の関係性などを探る 工藤洋路 ( 玉川大学 ) 大規模調査 調査の背景 2008 年 中学校英語に関する基本調査 ( 教員調査 ) 2009 年 中学校英語に関する基本調査 ( 生徒調査 ) ヒアリング調査 2013 年 中高生に対する聞き取り調査

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 後半第 2 回 ) 辻慶太 http://tsujikeita.hp.infoseek.co.jp/cje3 1 情報検索システムの世界観 情報の生産者研究者, 作家, 記者など 情報の最終利用者 ( エンドユーザ ) 生産 情報の登録者 DB 登録者, 分類者, 索引作成者など 登録 検索 計算機上のシステム 検索エンジン,DB, インタフェースなど 支援 蓄積される情報図書,

More information

Rational Roseモデルの移行 マニュアル

Rational Roseモデルの移行 マニュアル Model conversion from Rational Rose by SparxSystems Japan Rational Rose モデルの移行マニュアル (2012/1/12 最終更新 ) 1. はじめに このガイドでは 既に Rational( 現 IBM) Rose ( 以下 Rose と表記します ) で作成された UML モデルを Enterprise Architect で利用するための作業ガイドです

More information

4_Dojo_OpMan_v200.xlsx

4_Dojo_OpMan_v200.xlsx 北窓流四字道場操作マニュアル ver. 2.0.0 北窓流四字道場とは 北窓流四字道場 ( 以下 四字道場 ) は 楽を聞きながらクイズ形式で四字熟語を学べるソフトです 出題モード と 検索モード の2つモードがあります 出題モード では出題される問題に答えていきます 検索モード では読み( ひらがな ) または漢字を して四字熟語を検索できます どちらのモードでも熟語の読み 意味を表 でき 拡 字

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から

コロケーションリストのもう一歩先へ: 英和辞書の執筆者と使用者の立場から 概要 コロケーションリストのもう一歩先へ : 英和辞書の執筆者と使用者の立場から 成城大学社会イノベーション学部石井康毅 コロケーションは学習者にとって重要だが 連語辞典は使いこなせないことが多い コーパスから簡単に連語リストが作れる これは執筆者から見て非常に有用だが これだけでは 学習者向け辞書における実際の記述や用例の作成には不十分 コンコーダンスラインを丁寧に見なくてはいけないが 限られた時間の中で

More information

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1

(fnirs: Functional Near-Infrared Spectroscopy) [3] fnirs (oxyhb) Bulling [4] Kunze [5] [6] 2. 2 [7] [8] fnirs 3. 1 fnirs fnirs fnirs 1 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. fnirs Kai Kunze 599 8531 1 1 223 8526 4 1 1 E-mail: yoshimura@m.cs.osakafu-u.ac.jp, kai@kmd.keio.ac.jp,

More information

A Constructive Approach to Gene Expression Dynamics

A Constructive Approach to Gene Expression Dynamics 配列アラインメント (I): 大域アラインメント http://www.lab.tohou.ac.jp/sci/is/nacher/eaching/bioinformatics/ week.pdf 08/4/0 08/4/0 基本的な考え方 バイオインフォマティクスにはさまざまなアルゴリズムがありますが その多くにおいて基本的な考え方は 配列が類似していれば 機能も類似している というものである 例えば

More information

5temp+.indd

5temp+.indd 特集不自然言語処理 枠に収まらない リアルな 言語処理 5 日本語学習児の初期語彙発達 基応専般 小林哲生 永田昌明 NTT コミュニケーション科学基礎研究所 幼児の言語発達 発話データ収集の問題点 1 1 2 3 理 理 1 1 理 comprehensionproduction 理 理 1 first word 1 2 3 1 cross-sectional data 図 -1 12, 18,

More information

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の JMP によるオッズ比 リスク比 ( ハザード比 ) の算出と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2011 年 10 月改定 1. はじめに 本文書は JMP でロジスティック回帰モデルによるオッズ比 比例ハザードモデルによるリスク比 それぞれに対する信頼区間を求める操作方法と注意点を述べたものです 本文書は JMP 7 以降のバージョンに対応しております

More information

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では

More information

English Vocabulary Profile を指導に活用する 内田諭 Satoru Uchida ( 九州大学准教授 ) はじめに言語の運用レベルの測定基準として 近年 CEFR(Common European Framework of Reference) がよく用いられるようになってき

English Vocabulary Profile を指導に活用する 内田諭 Satoru Uchida ( 九州大学准教授 ) はじめに言語の運用レベルの測定基準として 近年 CEFR(Common European Framework of Reference) がよく用いられるようになってき 九州大学学術情報リポジトリ Kyushu University Institutional Repository English Vocabulary Profile を語彙指導に活用する 内田, 諭九州大学准教授 http://hdl.handle.net/2324/1932350 出版情報 : 英語教育. 65 (12), pp.32-34, 2017-01-14. 大修館書店バージョン :accepted

More information

担当部分 : 第 17 章 コーパスに基づく第二言語習得研究 応用言語学特講発表資料 担当 : K.I. はじめにコンピュータの発展に伴って 大量の言語データを電子化して蓄積するとともに その言語データをコンピュータで効率よく処理することが可能になってきた 具体的にはある言語の母語話者の記述や発話

担当部分 : 第 17 章 コーパスに基づく第二言語習得研究 応用言語学特講発表資料 担当 : K.I. はじめにコンピュータの発展に伴って 大量の言語データを電子化して蓄積するとともに その言語データをコンピュータで効率よく処理することが可能になってきた 具体的にはある言語の母語話者の記述や発話 担当部分 : 第 17 章 コーパスに基づく第二言語習得研究 応用言語学特講発表資料 担当 : K.I. はじめにコンピュータの発展に伴って 大量の言語データを電子化して蓄積するとともに その言語データをコンピュータで効率よく処理することが可能になってきた 具体的にはある言語の母語話者の記述や発話 或いはその言語を外国語として学習している人がその言語を書いたり話したりした内容をコーパスという形で蓄積し

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

untitled

untitled に, 月次モデルの場合でも四半期モデルの場合でも, シミュレーション期間とは無関係に一様に RMSPE を最小にするバンドの設定法は存在しないということである 第 2 は, 表で与えた 2 つの期間及びすべての内生変数を見渡して, 全般的にパフォーマンスのよいバンドの設定法は, 最適固定バンドと最適可変バンドのうちの M 2, Q2 である いずれにしても, 以上述べた 3 つのバンド設定法は若干便宜的なものと言わざるを得ない

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション No 区分実行版 dbsheetclient2013 リリースノート Project Editor 内容 2012/5/29 現在 管理 V 1 新機能 タスクタイプ 参照ブックを開く (62201) に以下の機能を追加しました 1 オープンしたブックのファイル名出力 指定したセルにオープンした Excel ブックのファイル名 ( パスを含む ) を出力します 2 オープンしたブックの上書き保存を許可する

More information

情報量と符号化

情報量と符号化 I. ここでの目的情報量の単位はビットで 2 種の文字を持つ記号の情報量が 1 ビットです ここでは 一般に n 種の文字を持つ記号の情報量を定義します 次に 出現する文字に偏りがある場合の平均情報量を定義します この平均情報量は 記号を適当に 0,1 で符号化する場合の平均符号長にほぼ等しくなることがわかります II. 情報量とは A. bit 情報量の単位としてbitが利用されます 1bitは0か1の情報を運びます

More information

言語モデルの基礎 2

言語モデルの基礎 2 自然言語処理プログラミング勉強会 1 1-gram 言語モデル Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 言語モデルの基礎 2 言語モデル 英語の音声認識を行いたい時に どれが正解 英語音声 W1 = speech recognition system W2 = speech cognition system W3 = speck podcast histamine

More information

PrimerArray® Analysis Tool Ver.2.2

PrimerArray® Analysis Tool Ver.2.2 研究用 PrimerArray Analysis Tool Ver.2.2 説明書 v201801 PrimerArray Analysis Tool Ver.2.2 は PrimerArray( 製品コード PH001 ~ PH007 PH009 ~ PH015 PN001 ~ PN015) で得られたデータを解析するためのツールで コントロールサンプルと 1 種類の未知サンプル間の比較が可能です

More information

書式に示すように表示したい文字列をダブルクォーテーション (") の間に書けば良い ダブルクォーテーションで囲まれた文字列は 文字列リテラル と呼ばれる プログラム中では以下のように用いる プログラム例 1 printf(" 情報処理基礎 "); printf("c 言語の練習 "); printf

書式に示すように表示したい文字列をダブルクォーテーション () の間に書けば良い ダブルクォーテーションで囲まれた文字列は 文字列リテラル と呼ばれる プログラム中では以下のように用いる プログラム例 1 printf( 情報処理基礎 ); printf(c 言語の練習 ); printf 情報処理基礎 C 言語についてプログラミング言語は 1950 年以前の機械語 アセンブリ言語 ( アセンブラ ) の開発を始めとして 現在までに非常に多くの言語が開発 発表された 情報処理基礎で習う C 言語は 1972 年にアメリカの AT&T ベル研究所でオペレーションシステムである UNIX を作成するために開発された C 言語は現在使われている多数のプログラミング言語に大きな影響を与えている

More information

【第一稿】論文執筆のためのワード活用術 (1).docx.docx

【第一稿】論文執筆のためのワード活用術  (1).docx.docx ワード活用マニュアル レポート 論文の作成に欠かせない Word の使い方を勉強しましょう ワードはみんなの味方です 使いこなせればレポート 論文の強い味方になってくれます 就職してからも必要とされるスキルなのでこの機会に基本的なところをおさえちゃいましょう 各セクションの最後に練習問題があるので HP に添付されているワークシート (http://www.tufs.ac.jp/common/library/lc/word_work.docx)

More information

メソッドのまとめ

メソッドのまとめ メソッド (4) 擬似コードテスト技法 http://java.cis.k.hosei.ac.jp/ 授業の前に自己点検以下のことがらを友達に説明できますか? メソッドの宣言とは 起動とは何ですか メソッドの宣言はどのように書きますか メソッドの宣言はどこに置きますか メソッドの起動はどのようにしますか メソッドの仮引数 実引数 戻り値とは何ですか メソッドの起動にあたって実引数はどのようにして仮引数に渡されますか

More information

shippitsuyoko_

shippitsuyoko_ 日本語 / 日本語教育研究 執筆要項 1. 書式 原稿の本文は日本語とする 原稿は横書きとする 原稿は A4 用紙に 35 字 30 行の書式で執筆する 原稿のポイントは 10.5 ポイントとする 投稿論文は A 論文と B 論文の二種類とする 両者は分量が異なるだけで内容に区別はない 原稿の分量は 次のとおり 投稿時の分量超過は認めない A 論文 16 ページ以内 ( 投稿時 タイトルページ1ページと本文

More information

ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1

ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1 ワトソンで体感する人工知能 フォローアップ情報 株式会社リックテレコム / 書籍出版部 ( 最終情報更新日 :2018 年 4 月 5 日 ) [INDEX] 2018 年 4 月 1 日時点の IBM Watson 仕様変更について ( 著者 : 井上研一氏からのフォロー情報 ) [ 変更点 -1] IBM Cloud の登録とライトアカウントについて [ 変更点 -2] IBM Cloud における

More information

コンピュータ応用・演習 情報処理システム

コンピュータ応用・演習 情報処理システム 2010 年 12 月 15 日 データエンジニアリング 演習 情報処理システム データマイニング ~ データからの自動知識獲得手法 ~ 1. 演習の目的 (1) 多種多様な膨大な量のデータを解析し, 企業の経営活動などに活用することが望まれている. 大規模データベースを有効に活用する, データマイニング技術の研究が脚光を浴びている 1 1. 演習の目的 (2) POS データを用いて顧客の購買パターンを分析する.

More information

JavaScript Web JavaScript BitArrow BitArrow ( 4 ) Web VBA JavaScript JavaScript JavaScript Web Ajax(Asynchronous JavaScript + XML) Web. JavaScr

JavaScript Web JavaScript BitArrow BitArrow ( 4 ) Web VBA JavaScript JavaScript JavaScript Web Ajax(Asynchronous JavaScript + XML) Web. JavaScr BitArrow JavaScript 1 2 2 3 4 JavaScript BitArrow 4 BitArrow BitArrow,, JavaScript,, Report of JavaScript Lessons on BitArrow, Online Programming Learning Environment Manabe Hiroki 1 Nagashima Kazuhei

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション M0 鈴木宏彰 1 IDN( 国際化ドメイン名 ) とは 通常のドメイン名はアルファベット 数字 ハイフンなどの ASCII 文字の集合からなり 単一の言語でしか表現できない ( 例 :waseda.jp) Unicode を使用することにより多言語にも対応したドメイン名が IDN( 例 : 早稲田.jp) IDN はブラウザ側で Punycode と呼ばれる Unicode から ASCII 文字への変換アルゴリズムを適応してから名前解決が行われる

More information

Rの基本操作

Rの基本操作 Microsoft Azure 高校生のための Azure Machine Learning By M. Takezawa 機械学習 (Machine Learning) とは 機械学習とは 機械にデータを学習させ データに潜むパターンや特性を発見し予測させることです Microsoft Azure Machine Learning とは Microsoft 社が提供する Azure の機能の一つであり

More information

DEIM Forum 2010 A Web Abstract Classification Method for Revie

DEIM Forum 2010 A Web Abstract Classification Method for Revie DEIM Forum 2010 A2-2 305 8550 1 2 305 8550 1 2 E-mail: s0813158@u.tsukuba.ac.jp, satoh@slis.tsukuba.ac.jp Web Abstract Classification Method for Reviews using Degree of Mentioning each Viewpoint Tomoya

More information

スライド 1

スライド 1 知識情報演習 Ⅲ( 前半第 2 回 ) 辻慶太 http://slis.sakura.ne.jp/cje3 1 情報検索システムの世界観 情報の生産者研究者, 作家, 記者など 情報の最終利用者 ( エンドユーザ ) 生産 情報の登録者 DB 登録者, 分類者, 索引作成者など 登録 検索 計算機上のシステム 検索エンジン,DB, インタフェースなど 支援 蓄積される情報図書, 雑誌, 画像, 音声など

More information

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1

NLP プログラミング勉強会 5 HMM による品詞推定 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 自然言語処理プログラミング勉強会 5 隠れマルコフモデルによる品詞推定 Graham Neubig 奈良先端科学技術大学院大学 (NAIST) 1 品詞推定 文 X が与えられた時の品詞列 Y を予測する Natural language processing ( NLP ) is a field of computer science JJ -LRB- -RRB- VBZ DT IN 予測をどうやって行うか

More information

Aptis 受験者ガイド 簡易版 2018 年 2 月

Aptis 受験者ガイド 簡易版 2018 年 2 月 Aptis 受験者ガイド 簡易版 2018 年 2 月 https://www.britishcouncil.jp/exam/aptis 1 Aptis 受験者ガイド Aptis テストをご紹介します Aptis は ブリティッシュ カウンシルが開発した革新的な英語力診断ツールです リーディング ライティング リスニング スピーキングの 4 つの英語スキルを考査します この試験は 1つのレベルのみをテストするのではなく

More information

スライド 1

スライド 1 Man in the Browser in Androidの可能性 Fourteenforty Research Institute, Inc. Fourteenforty Research Institute, Inc. 株式会社フォティーンフォティ技術研究所 http://www.fourteenforty.jp Ver 2.00.01 1 Android の普及と Man in the Browser

More information

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと .5 Gage R&R による解析.5.1 Gage R&Rとは Gage R&R(Gage Repeatability and Reproducibility ) とは 測定システム分析 (MSA: Measurement System Analysis) ともいわれ 測定プロセスを管理または審査するための手法である MSAでは ばらつきの大きさを 変動 という尺度で表し 測定システムのどこに原因があるのか

More information

Microsoft Word - WebClass Ver 9.08f 主な追加機能・修正点.docx

Microsoft Word - WebClass Ver 9.08f 主な追加機能・修正点.docx WebClass Ver 9.08f 主な追加機能 修正点 from9.07d 追加機能 共通 1. SCORM2004 形式の教材に対応しました 但し WebClass サーバの PHP のバージョンが 5.2.0 以上 &PHP に dom モジュールが組み込まれている環境が必要です SCORM2004 の教材のご利用を予定されている場合は WebClass サポートデスクまでご連絡をお願いいたします

More information

Delphi/400バージョンアップに伴う文字コードの違いと制御

Delphi/400バージョンアップに伴う文字コードの違いと制御 宮坂優大 株式会社ミガロ. システム事業部システム 1 課 [Delphi/400] Delphi/400 バージョンアップに伴う文字コードの違いと制御 はじめに Delphi 言語で扱う文字コード 文字コードの違いによる制御ポイント おわりに 略歴 1982 年 11 月 19 日生まれ 2006 年近畿大学理工学部卒業 2006 年 4 月株式会社ミガロ. 入社 2006 年 4 月システム事業部配属

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって

More information

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor

独立行政法人情報通信研究機構 Development of the Information Analysis System WISDOM KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the infor 独立行政法人情報通信研究機構 KIDAWARA Yutaka NICT Knowledge Clustered Group researched and developed the information analysis system WISDOM as a research result of the second medium-term plan. WISDOM has functions that

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

表紙.indd

表紙.indd 教育実践学研究 23,2018 1 Studies of Educational Psychology for Children (Adults) with Intellectual Disabilities * 鳥海順子 TORIUMI Junko 要約 : 本研究では, の動向を把握するために, 日本特殊教育学会における過去 25 年間の学会発表論文について分析を行った 具体的には, 日本特殊教育学会の1982

More information

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378> 3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては

More information

BOM for Windows Ver

BOM for Windows Ver BOM for Windows Ver.5.0 SR2 リリースノート Copyright 2007-2009 SAY Technologies, Inc. All rights reserved. このドキュメントには BOM Ver5.0 SR2 に関する最新情報が記載されています 対応 OS の追加 対応 SP と OS が増えました 機能追加 改良 1.Windows Server 2008

More information

職業訓練実践マニュアル 重度視覚障害者編Ⅰ

職業訓練実践マニュアル 重度視覚障害者編Ⅰ 資料 5 訓練カリキュラムの詳細 応用 高度な知識 技能の習得 4-1 社外文書 社外メールへの対応実施時期任意 (2-6 社内文書 社内メールへの対応の実施後 ) 実施内容メモからその趣旨を理解し ビジネス文書 ( 社外文書 ) の作成ビジネスメール ( 社外メール ) の作成訓練の流れテキスト ( 電子ファイル ) に沿って ビジネス文書 ( 社外文書 ) の概要を個別に説明 概要説明後 単独で演習課題実施演習課題はメールにより提出

More information

Microsoft PowerPoint - 09-search.ppt [互換モード]

Microsoft PowerPoint - 09-search.ppt [互換モード] ヒューリスティック探索 ( 経験を用いた探索 ) これまでに到達した探索木の末梢状態から展開される状態のうち, 解に至る可能性の高い状態に注目し, 探索の効率を高める. 末梢状態 : 探索木上で, これまでに探索した端の状態. 展開 : 与えられた節点に対し, 直接移行可能な全ての後継状態を作り出すこと. 探索の効率化に用いる判断基準 ( ヒューリスティック情報 ) 状態 s における評価関数 (

More information

スライド タイトルなし

スライド タイトルなし 情報分析演習 Access 第 3 回 注意 : この回の操作演習は 第 2 回で作成したアドレス帳の内容をもとに実施します クエリ query [1] 疑問, 質問.(question の形式張った語 ) [2] 疑い, 疑惑, 疑念 [3] 疑問符 [4] 問い合わせ ( ランダムハウス英和辞典より ) データベースでは 問合せや照会の意味で テーブルのデータからある条件に見合うものを引っ張り出し

More information

Basic descriptive statistics

Basic descriptive statistics データ 情報基盤の活用事例 Scopus-NISTEP 大学 公的機関名辞書対応テーブルの活用事例 ( その 1) 2013 年 7 月 1 日 科学技術 学術政策研究所 科学技術 学術基盤調査研究室 1 < はじめに > はじめに 本資料には Scopus-NISTEP 大学 公的機関名辞書対応テーブルの活用事例をまとめています 本資料と併せて Scopus-NISTEP 大学 公的機関名辞書対応テーブル説明書

More information

JGSS統計分析セミナー2009-傾向スコアを用いた因果分析-

JGSS統計分析セミナー2009-傾向スコアを用いた因果分析- 日本版総合的社会調査共同研究拠点研究論文集 [10] JGSS Research Seres No.7 JGSS 2009 JGSS JGSS Statstcal Analyss Semnar: Causalty Analyss based on the Propensty Score Kana MIWA JGSS Research Center Osaka Unversty of Commerce

More information