NLPコロキウム | 創発言語でもHarrisの分節原理は成り立つのか？ (上田亮)

上田亮 / Ryo Ueda (東京大学)

[Webサイト]

東京大学大学院情報理工学系研究科コンピュータ科学専攻博士課程に在籍中。

概要

本研究では、自然言語の普遍的性質「Harrisの分節原理」の観点から、シグナリングゲームにおいて生じる創発言語が有意味な「単語」をもつかどうかを検証しました。創発言語とは、シミュレーション上の環境においてエージェント間で生じる人工的なコミュニケーション、又はそのプロトコルを指す概念です。しかし、このような疑似的な言語が、自然言語と同じ性質を持つかどうかはそれほど自明ではありません。実際、構成性やZipf短縮などの観点から創発言語と自然言語の乖離が指摘されてきました。私たちは、先行研究からさらに一歩進んで、創発言語がHarrisの分節原理を満たすかどうかを検証してみることにしました。Harrisの分節原理は、単語の意味を参照せずとも、音素列のみから単語境界がある程度推定可能であるという自然言語の性質です。Harrisの分節原理に基づく単語分割手法を用いて、創発言語が有意味な「単語」を持つかどうかを検証しました。その結果、創発言語はHarrisの分節原理を満たすためのいくつかの前提条件を満たしてはいるものの、有意味な「単語」をもたないことが示唆されました。これは、シグナリングゲームという言語創発分野で頻繁に用いられる設定には、自然言語らしい言語が創発するための要素が欠けており、創発言語と自然言語の間にはまだまだ埋めなければならないギャップがあることを暗示しています。

※トークは日本語です。

[動画] [スライド] [論文] (ICLR 2023)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。