Compositional Evaluation on Japanese Textual Entailment and Similarity (JSICK:構成的推論・類似度データセットSICK日本語版の紹介)

2022/10/31 (Mon) 12:00 (JST)

谷中瞳 / Hitomi Yanaka (東京大学)

[Webサイト]

東京大学大学院情報理工学系研究科コンピュータ科学専攻講師。2018年東京大学大学院工学系研究科システム創成学専攻博士課程修了、博士(工学)。2018年から2021年まで理化学研究所革新知能統合研究センター特別研究員、2021年東京大学卓越研究員に採択され現職に至る。理化学研究所AIPセンター自然言語理解チーム客員研究員兼任。

概要

語彙と文の構造に基づいて新しい文を構成的に理解し、文間の意味的関係を認識することは、より人間らしい自然言語理解をコンピュータによって実現するために重要な課題の一つである。これまで自然言語理解のデータセットは英語を中心に進められており、日本語のデータセット構築は発展途上である。しかし、日本語には語順を変えても意味内容が変わらないという性質があり、この性質を用いることで、英語とは異なる観点で汎用言語モデルが自然言語の文を構成的に捉えているか分析することができる。本発表では、英語の構成的推論・類似度データセットSICKの日本語版であるJSICKの構築に至るまでの道のりと、JSICKを用いた汎用言語モデルの分析について紹介する。

※トークは日本語です。

[スライド] [論文] (TACL 2022)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。

メーリングリスト登録フォーム

[トップページへ戻る]