Penn State University(ペンシルベニア州立大学)博士課程に在籍。主な研究分野は言語モデルの評価や出力に含まれる誤りの検出。テキサス大学オースティン校にて修士号を取得、慶應義塾大学理工学部数理科学科卒業。
[Webサイト]
概要:GPT-4などの大規模言語モデルは様々なタスクに対して高い性能を示すことが知られている一方で、誤りを含む出力を生成することも少なくありません。例えば、言語モデルが生成した要約文には、元の文書には書かれていない内容が含まれてしまうことがあります。このトークでは、EMNLP2023で発表予定の "WiCE: Real-World Entailment for Claims in Wikipedia" の紹介を中心に、言語モデルの出力に含まれる誤りの検出についての近年の研究を紹介します。
[動画] [スライド] [論文] (EMNLP 2023)
※トークは日本語です。
参加用のZoom URLはメーリングリストで配信しています。
ほかの宣伝投稿はありません。いつでも抜けられます。