グローバルナビゲーションを飛ばして本文へ

グローバルナビゲーションを飛ばしてローカルナビへ

グローバルナビゲーションを飛ばしてフッターナビへ



= 竹ノ山 の タケノコ 通信 =
〔第45号 2017年5月11日〕


今月の話題 「自然言語vs人工言語」

第44回のチャレンジ問題は、「私は昨日学校へ行きました」という文章をコンピュータに理解させたい場合、どのような単語区切りが適切でしょうかという問題でした。

機械翻訳やテキスト音声合成などのコンピュータによる言語処理を行うためには、文中の単語を同定し、その語形変化を解析する処理が必要となります。このように入力された文字を品詞などの文法情報や意味情報を持った最小の言語要素(形態素)に変換する処理は「形態素解析(morphological analysis)」と呼ばれています。

では、「私は昨日学校へ行きました」という文章を「形態素解析ツール(ChaSen)」によって解析してみましょう。すると、以下のように形態素に分割され、「出現形」「読み」「原型」「品詞」「活用」が示されます。チャレンジ問題の答えは、(3)「私/は/昨日/学校/へ/行き/まし/た」になります。


私 ワタクシ 私 名詞‐代名詞‐一般
は ハ は 助詞‐係助詞
昨日 キノウ 昨日 名詞‐副詞可能
学校 ガッコウ 学校 名詞‐一般
へ ヘ へ 助詞‐格助詞‐一般
行き イキ 行く 動詞‐自立 五段・カ行促音便 連用形
まし マシ ます 助動詞 特殊・マス 連用形
た タ た 助動詞 特殊・タ 基本形
. . . 記号‐句点
ChaSen(自然言語処理研究のための無償ソフトウェア)はhttp://chasen-legacy.osdn.jp/を参照。


日本語の形態素解析ツールの開発は、1990年代の初めに奈良先端科学技術大学院大学(NAIST)松本裕治研究室で始まりました。論理型プログラミング言語Prologで書かれた形態素解析器のデモから始まり、その後、JUMAN、ChaSen、MeCabなどの様々な形態素解析ツールが開発され、無償で公開されてきました。
日本語のように語に切れ目のない言語では、単語の境界を明確にする処理、単語分割も形態素解析の一部とされています。したがって、日本語の形態素解析は、かな漢字混じりで「ベタ書き」された日本語文の単語分割を行って、それに語形変化の解析を加えて、読みや品詞を付与する処理も含みます。また、中国語やタイ語も単語を分かち書きしないので、日本語と同様に単語分割が必要となってきます。
これに対して、英語の正書法では単語と単語の間に空白を入れる「分かち書き」という習慣があるため、語形変化の解析を(狭義の)形態素分析と呼びます。空白で区切られた文字列を切り出す処理は字句解析と呼んで区別しています。
各言語では、その特徴(形態的分類、使用文字、正書法)によって、形態素解析が担う役割が異なってきます。しかし、いずれの言語でも、コンピュータによる形態素解析の難しさは、複数の解釈可能性の中から最も妥当な解釈を選択することです。このような複数の解釈の可能性があることを「曖昧性」または「多義性」と呼び、それを解消することが正確な形態素解析を行うための課題と言えます。1980年代までは、複数の解釈の可能性から最も妥当な正解を得るための判断基準として、文法規則を用いました。しかし、1990年代に入ると、コンピュータの処理速度が大幅に向上し、さらに、大量のテキストデータが利用可能になったことから、統計的なアプローチ基づく確率によって最適解を求めるようになりました。
(日本語学科 加藤由香里)

今月のチャレンジ

★ このメルマガでは、毎号、日本語・日本文化、日本語力、国語教育、日本語教育などについての課題を出題します。解答を考えて送ってください。タイトルを「5月のチャレンジ」として、解答のあとに、お名前と所属を書き添えてください。
★ 送り先は、takenoko_re□@nufs.ac.jp(実際の送信時には□を省き、続けて入力してください)です。
★ 次号で、送っていただいた解答のうちおもしろいものと解説を掲載します。

第45回、5月のチャレンジ問題は、「Teacher Talkと Foreigner Talkの共通点と相違点」についてです。
日本語教室では、外国人の学習者と話す時と日本人と話す時とは、ちょっと違う話し方(Teacher Talk)をしている場合がありますが、どんな話し方をしているのでしょうか。また、町などで、日本人が外国人と日本語で話すときの話し方(Foreigner Talk)にも同様にちょっと違うところがありますが、このTeacher Talkと Foreigner Talkの共通点、相違点にはどんな点があるのでしょうか。自分の話し方を客観的に観察して、ちょっと考えてみてください。

★ あなたのお答えをお待ちしています。
★ ご意見、ご希望、ご質問もお寄せください。
★このメルマガでは、毎号、日本語・日本文化、日本語力、国語教育、日本語教育などについての課題を出題し、翌月号で皆様に送っていただいた解答の中のおもしろいものを紹介しながら、解説します。

※メルマガの受信を希望される方は、takenoko_re□@nufs.ac.jp(実際の送信時には□を省き、続けて入力してください)にお申込みください。「メルマガ受信希望」と記して、お名前と学校名または所属をお書きください。クイズの解答も、このアドレスにメールで送ってください。送信できないなどの場合は、「名古屋外国語大学受験生サイト」の「お問い合わせ」https://www.nagoyagaidai.com/mail/index.phpから問い合わせてください。
=======================
名古屋外国語大学外国語学部日本語学科
〒470-0197 愛知県日進市岩崎町竹ノ山57
電話 0561-74-1111(大学代表)
=======================