Webナビゲーションにおける言語モデルエージェントの展望と課題

2024/05/15 (Wed) 12:00 (JST)

古田拓毅 / Hiroki Furuta (東京大学)

[Webサイト]

東京大学工学系研究科 技術経営戦略学専攻 松尾研究室 博士課程3年。日本学術振興会 特別研究員(DC1)。Forbes JAPAN 30 UNDER 30 2023。専門は深層強化学習と大規模言語モデル(LLM)のエージェント化に関する研究。

概要

大規模言語モデルを活用した言語モデルエージェントは、複数ステップにわたる意思決定問題に取り組むための有望な手法として注目を集めています。その可能性は、複雑な現実世界のタスクのコンテクスト情報を処理するための常識を備えていることと、プログラミングやツールの使用を通じて外部と相互作用できることにあります。本発表では、現実世界のWebナビゲーションにおける有望な兆候と残された課題に焦点を当てます。 まず、役割の異なる複数の言語モデルを組み合わせることで、実際のWebサイトで自律的な操作を可能にした、WebAgentの研究について説明します。次に、既知のWeb上の基本タスクによってプロンプトや学習データが準備された、現在の言語モデルエージェントが、未知の構成的なタスクや順序を入れ替えたタスクの指示文に対して十分に汎化することが難しい、といった課題を紹介します。最後に、応用に向けた、堅牢で汎化可能な言語モデルエージェントを構築するための将来の方向性について意見を述べます。

※トークは日本語です。

[論文1] (ICLR2024) [論文2] (ICLR2024 Workshop)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。

メーリングリスト登録フォーム

[トップページへ戻る]