任意のXY方向を翻訳する多言語機械翻訳モデルの構築――研究からデプロイメントまで

2022/08/24 (Wed) 10:00 (JST)

江里口瑛子 / Akiko Eriguchi (Microsoft)

[Webサイト]

マイクロソフト シニアリサーチャー。2019年より現職。2018年東京大学工学系研究科博士課程修了。博士(工学)。2015年-2018年 日本学術振興会特別研究員 (DC1)。自然言語処理、機械学習に関する研究に従事。

概要

機械翻訳の研究分野では、(十分なパラメータ数のある)1つのモデルで、複数のソース言語から複数のターゲット言語への翻訳を学習できることが知られている。このような多言語翻訳モデルは、2言語のみを扱うバイリンガルモデルと比較すると、デプロイメントコストの大幅な削減に成功しており、Microsoft Translatorのような機械翻訳サービスなどでも実際に用いられている。これまでの多言語機械翻訳研究では、ソース言語あるいはターゲット言語が英語であるような英語中心的な学習設定が多かったが、本研究では、英語のみに限定されない任意のXY方向を翻訳する多言語機械翻訳モデルの構築を目指す。異なるデータ規模の実験設定 1) WMT'21の多言語翻訳タスク、2)プロダクションレベルの大規模データ設定、を通して、研究から実際翻訳サービスシステムのデプロイメントまでの課題などについても触れる。

※トークは日本語です。

[論文] (NAACL 2022)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。

メーリングリスト登録フォーム

[トップページへ戻る]