陣内佑 / Yuu Jinnai (株式会社サイバーエージェント)
[Webサイト]CyberAgent AI Lab所属。専門分野は強化学習とヒューリスティック探索、プランニング。趣味は動物(特に哺乳類、鳥類、爬虫類、両生類)を見ること。
概要
機械学習は学習と推論 (inference) からなります。学習したLLMなどのテキスト生成モデルからテキストを生成する手続きはこの推論にあたるステップです。自然言語処理では特にこれをデコーディングと呼ぶことが多いです。モデルというのは学習してしまえば、それを使って「正しく」推論をする方法は自明なものと思われるかもしれません。しかしながら、「正しい」推論の方法は、テキスト生成問題でも、機械学習問題一般でも非自明です。本チュートリアルでは、デコーディング手法の一つであり、特に機械翻訳タスクで広く使われているMinimum Bayes Riskデコーディングの概要を紹介します。
※トークは日本語です。