Unsupervised Abstractive Summarization Based on Tree-Structured Topic Guidance and Rate-Distortion Theory

2022/03/23 (Wed) 12:00 (JST)

磯沼大 / Masaru Isonuma (東京大学)

[Webサイト]

東京大学大学院工学系研究科特任研究員。2021年9月東京大学大学院工学系研究科にて博士(工学)を取得。その後同研究科特任研究員に着任し、現在に至る。自然言語処理、特に教師なし文書要約やトピックモデルに関する研究に従事。

概要

近年の自動要約研究では、大量の見本の要約(参照要約)を用いた教師あり要約により飛躍的な性能向上を遂げている。しかし、実用上参照要約が用意されているケースは少なく、参照要約を用意するコストも大きい。そうした文書の一つとして商品レビューなどの意見文書を取り上げ、それらを対象にした教師なし生成型要約手法を提案する。教師なし生成型要約では、参照要約なしに要約文の潜在表現をいかに獲得するかが鍵となるが、本研究では文書に潜在するトピック木構造を手がかりに要約文の潜在表現を獲得することで、教師なし生成型要約を実現できることを示す。また直近では、要約タスクを歪みありデータ圧縮としてみなすことで、本研究やCentroid-based summarization (Radev et al., 2000)といった一連の教師なし要約手法の一般化を試みており、そうした取り組みについても簡単に紹介する。

※トークは日本語です。

[動画] [スライド] [論文] (TACL 2021)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。

メーリングリスト登録フォーム

[トップページへ戻る]