萩原正人 / Masato Hagiwara (Earth Species Project)
[Webサイト]Senior AI Research Scientist @ Earth Species Project。名古屋大学大学院情報科学研究科博士課程修了。博士(情報科学)。Google、Microsoft Research、バイドゥ、楽天技術研究所 (ニューヨーク)、Duolingo にて、日本語・中国語解析や自然言語処理の教育応用の研究に携わった後、2021 年 2 月より現職。動物音声処理のための基盤モデルの研究開発に従事。著書に、『自然言語処理の基本と技術』(翔泳社, 2016)、”Real-World Natural Language Processing” (2021) 等がある。
概要
シジュウカラの「文法」、マッコウクジラの「母音」、アフリカゾウの「名前」... 近年、動物の音声コミュニケーションには、人間の言語に似た特徴があることが分かってきました。これら特定の種・タスクに対して、従来の生物音響学の分野では、統計的な手法や教師あり機械学習を用いて問題を解くのが一般的でしたが、教師データの量およびモデルの汎用性の問題がありました。一方、「AI を用いて動物言語を解読する」ことをミッションとする非営利団体の Earth Species Project では、多様な種・タスクの動物言語処理に応用できる汎用・高性能の基盤モデルの開発に取り組んでいます。本トークでは、自己教師あり学習に基づく動物音声用の基盤モデル AVES、音声・言語のマルチモーダルモデル BioLingual、動物音声書き下しシステム ISPA などを紹介し「ImageNet 的瞬間」がまさに起こりつつある動物言語処理の世界を案内したいと思います。
※トークは日本語です。
[動画] [スライド] [論文1] (ICASSP 2023) [論文2] (ICASSP 2023) [論文3] (XAI-SA 2024)