Apple社のELEGNT論文を社員で読んでみた
はじめに
こんにちは!
ユカイ工学の宮﨑です。
今回は、社内技術勉強会でApple社のELEGNT(ELEGNT: Expressive and Functional Movement Design for Non-Anthropomorphic Robot)の論文を読んでみたので、その共有記事です。
対象読者
- 社内技術勉強会の方法に興味がある人
- ロボットのインタラクションに興味がある人
- ユカイ工学に興味があるエンジニア
アイスブレイク~社内勉強会について~
ユカイでは、週1の1時間枠で社内技術勉強会、通称:ハッピーテックアワーを開催しています。
(名前の由来や制度等については、また今度記事にします。)
社内勉強会では、新しいデバイスを使ったり、環境構築RTAをやったりしています。
今回は、Gigazine様の以下の記事が社内で話題になっていたので、みんなで見てみようという流れになりました。
論文について
以下のURLより、閲覧可能です。
タイトル通り、表現的な動きと機能的な動きを持つロボットの研究です。
ユカイではロボットを「心を動かし、人を動機付けすることのできるインターフェース」と定義しています。
そんなユカイにとって、この論文は知っておくべきでは?と思い、みんなで読むことにしました。
勉強会の流れ
今回は、以下の流れで勉強会を実施しました。
- 解説動画を見る。
- 事前に落合陽一式プロンプトChatGPTで、要約してもらったものをみんなで見る。
- 思ったことを議論する。
1時間枠なので、あまり深追いはせずに、会社の技術資産にすることを重視しています。
動画を見た所感
全体的に動きがかわいいですね。
社内で一番沸いていたのは、こちらのお水のリマインダーのシーンです。
画像は上記YouTubeリンク先のスクリーンショットです。
こんなお水の渡され方したら断われないですね。
ユカイでは日々、行動変容について考えているのです、勉強になります。
要約を見た所感
実験結果
ChatGPT O1による結果の要約は、以下のようになりました。
- 全体的に、表現駆動の動作が評価が高い(統計的に有意)。
- 特に社会的なタスク(会話、音楽再生、リマインダー)で表現的動作の効果が大きい。
- 逆に、機能重視のタスク(写真撮影支援、エラー通知)では、表現的動作の影響は限定的。
- 年齢・ロボット経験の違いで好みが変わる(年齢が高いほど表現的動作の評価が低く、ロボット開発者より一般ユーザーの方が好意的)。
- 表現的動作が過剰だと「不要な動作」と感じられることもある。
興味深いのは、とりあえず表現駆動の動作をしておけば評価が高いことですね。
一方でやりすぎは良くないとのことなので、タスクによって出し分けは必要そうです。
コミュニケーションロボットの場合だと、社会的なタスクが多めなので、基本的には表現駆動の動作が多めです。
この論文を鵜呑みにすると、機能重視のタスクは表現駆動の動作を控えた方が良さそうです。
例えば、ネットワーク不通などの何らかのトラブルの表示については、機能駆動にした方が良さそうです。
MDPモデルによる行動選択
ここが一番難しいよね、という話をしていました。
MDP(Markov decision process)は、現在の状態と選択した行動に基づいて次の状態と報酬が決定される、確率的な意思決定モデルです。ロボット工学では、MDPを用いてロボットが環境内で最適な行動を選択し、目標を達成するための経路計画や動作制御を行うことがあります。
タスクをどうやって、機能駆動と表現駆動を分けるのだろうか?は非常に興味があります。
例えば、「音楽をかけて」とユーザが言った場合に、背景情報によって、機能重視のタスクなのか、社会的なタスクなのか変わりますよね。
本論文ではロボットの印象にフォーカスしているので、理論を提示しているだけでした。
パーソナライズなどにより、雰囲気的なものが判断できるようになれば、よりよいロボットとの関係が築くことができそうです。
実験方法
実験の評価軸は以下の通りです。
4.3 Measure
We include six dimension of quantitative metrics to measure the
perception toward the robot (human-likeliness, perceived intelli-
gence, perceived emotion/character), the quality of the interaction
(interaction engagement, the sense of connection), and willingness
to use the robot in real life.
この評価軸(エンゲージメント、知性、ヒューマンライクさ、対話意欲、親近感、キャラクター性)が表現駆動なロボットに有利なのでは?、という意見がありました。
一応、評価軸以外にも自由記述の定性評価も行っているので、カバーできていそうです。
また、Apple社ぐらいの規模の会社でもN=21なのか、という意見もありました。
Theory of Mindについて
Theory of Mindは、他者の心的状態(信念、意図、感情など)を推測し理解する能力です。
例えば、悲しそうな表情をしているのを見て、「何か嫌なことがあったのかもしれない」と推測することです。
ロボットのインタラクションを考える上で、重要な理論です。
本論文では、表現駆動ロボットの方が、「ロボットが考えている」「何かを試そうとしている」という印象を与え、Theory of Mindの影響でより知的に見えたようです。
コミュニケーションロボットのような、インジケーターの限られたロボットでも、ユーザにロボットが何を考えているか、分かりやすくしたいものですね。
RtD(research-through-design)について
本論文の本質ではないのですが、興味があったので、調べました。
こちらのサイトで解説されています。
ユカイでもプロトタイピングをよくやっているので、非常に参考になりました。
若干デザイナー寄りの意味合いが強そうですが、エンジニアリングにも適応していきたいですね。
おわりに
いかがでしたでしょうか?
この論文から学ぶことはたくさんあり、書き足りないことはいっぱいありますが、今日はここまでとします。
なお、落合陽一式プロンプトを使用した論文勉強会はおすすめです!
Discussion