Language Complexity and Speech Recognition Accuracy: Orthographic Complexity Hurts, Phonological Complexity Doesn't

2024/09/11 (Wed) 12:00 (JST)

田口智大 / Chihiro Taguchi (University of Notre Dame)

[Webサイト]

慶應義塾大学法学部政治学科、奈良先端大自然言語処理学研究室(渡辺研)修士課程、エジンバラ大学言語学研究修士課程を経て、現在は米国のノートルダム大学Computer Science and Engineering研究科博士課程に在籍している。博士課程では、主に人工知能を用いた消滅危機言語の記述をテーマとして研究している。特に、低資源言語に焦点を当てた自動音声認識、機械翻訳、構文解析、Universal Dependenciesに取り組んでいる。また、Kichwa語やタタール語の統語論を中心とした理論言語学の研究も行なっており、言語理論と自然言語処理の関わりあい方にも関心がある。

概要

人間が言語を学習するとき、その言語が複雑な書記体系を持っていると、その学習に多くの労力を要します。この傾向は音声認識モデルの学習にも見られるのでしょうか? 本トークでは、この疑問に取り組んだ私の直近の研究を紹介します。この研究では、複雑な書記体系が学習に悪影響を与えるという傾向が音声認識モデルにも当てはまること、しかし音韻的な複雑さは特に影響を与えない、ということを示します。

※トークは日本語です。

[動画] [スライド] [論文] (ACL 2024)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。

メーリングリスト登録フォーム

[トップページへ戻る]