Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem

2022/06/08 (Wed) 12:00 (JST)

佐藤竜馬 / Ryoma Sato (京都大学)

[Webサイト]

2021年3月京都大学情報学研究科修士課程卒業。2021年4月京都大学情報学研究科博士課程入学。専門分野はグラフニューラルネットワーク、最適輸送、および情報検索・推薦システム。

概要

単語埋め込みは現代の自然言語処理の中核技術のひとつで、文書分類や類似度測定をはじめとして、さまざまな場面で使用されていることは知っての通りです。しかし、ふつう埋め込み先は何百という高次元であり、使用する時には多くの時間やメモリを消費するうえに、高次元埋め込みを視覚的に表現できないため解釈が難しいことが問題です。そこで本研究では、【一次元】の単語埋め込みを教師なしで得る方法を提案します。とはいえ、単語のあらゆる側面を一次元で捉えるのは不可能であるので、本研究ではまず単語埋め込みが満たすべき性質を健全性と完全性という二つに分解します。提案法の WordTour は、完全性はあきらめ、健全性のみを課すことで一次元埋め込みを可能にし、それでいて、全ての、とまでは言わないまでも、いくつかの応用において有用な一次元埋め込みを得ることに成功しました。

※トークは日本語です。

[動画] [スライド] [論文] (NAACL 2022)

メーリングリストへの登録: 参加用URLなどNLPコロキウムに関するお知らせを受け取りたい方はメーリングリストへのご登録をお願いします。

メーリングリスト登録フォーム

[トップページへ戻る]