小川奈美 / Nami Ogawa (株式会社サイバーエージェント)
[Webサイト]サイバーエージェントAI Labリサーチサイエンティスト。2020年東京大学大学院工学系研究科博士課程修了、博士(工学)。DMM VR lab主席研究員を経て、2022年より現職。HCI、VRに関する研究に従事。
概要
Pepperに代表されるソーシャルロボット(※1)は社会の多様なシーンで活用されており、ロボットがより自然で説得力のある対話を実現するための手法が求められています。遠隔で人間がロボットをコントロールする遠隔操作はその手法の一つですが、音声対話を人間が担う場合、遠隔操作者には「ロボットになりきって」発話をすることがしばしば求められます。演技やモノマネ、ごっこ遊び等に象徴されるように、人間は「他者になりきる」ことができますが、その巧拙は、人や状況、なりきる対象によってさまざまです。一方で、学術的には、「なりきり」は自己表象の変容という文脈で捉えることが可能です。これまでの研究では、VRでのアバタ利用や変換音声フィードバック(※2)などの多感覚フィードバックによって、自己表象が変容することが示されています。つまり、遠隔操作者の「ロボットへのなりきり」を技術的に支援することは可能であると考えられます。そこで我々は、CHI2024で発表した論文において、接客用ソーシャルロボットの遠隔操作インタフェースへのリアルタイム変換音声フィードバックの導入を提案し、約2ヶ月間に及ぶフィールド実験を実施して、遠隔操作者の接客業務への有効性を検証しました。本トークでは、本論文の紹介を通じて音声対話という視点からNLPとHCI分野の接点を探求し、さらにHCI分野でのユーザー実験の一例を共有することにより、評価のあり方についても議論を深めることを目指しています。
※1: 対話を主体とした、人間とのソーシャルインタラクションが可能なロボット。
※2: 発話音声の音響的特徴を変換し、その変調音声をヘッドホンなどで発話者に聴かせてフィードバックする手法。通常ほぼリアルタイムで用いられ、Altered Auditory Feedback(変調聴覚フィードバック)とも呼ばれる。
※トークは日本語です。