💨

国際トップレベル学会(CHI 2021)で発表されたVtuberの論文に関するメモ

2022/04/13に公開

Vtuberに関して面白そうな論文があったので、メモとして共有させて頂ければ幸いです。これはHuman-Computer Interactionに関するトップ会議であるCHI 2021年に発表されたMore Kawaii than a Real-Person Live Streamer: Understanding How the Otaku Community Engages with and Perceives Virtual YouTubersという論文です。図表は特に断りがない限り、論文中の図を用いています。また、参考文献のインデックスは論文中のインデックスを用いています。

INTRODUCTION

ライブストリーミングに関する先行研究はほとんど実在する人物に焦点を当てており、その「リアルさ」がライブストリーミングの魅力や人気を高める主な要因であるとしている[23,24,44]。
しかし、バーチャルユーチューバー(Vtuber)の出現はこれ(リアルさの追求)と矛盾しているように思われ、なぜどのようにVtuberを視聴しているのかという理解はまだ限定的である。また、Vtuverと実在する人との違いをどのように認識しているか、「中の人」のアイデンティティや存在感をどのように認識しているかも不明だ。このような知見はリアル・バーチャルの将来のライブストリーミングインターフェースに関する設計等に役立つと考えられる。
そこで、VTuberのライブストリーム視聴経験が豊富な21名にインタビューを実施した。その結果、仮想アバターを介することで、現実の姿やアイデンティティを開示することなく、視聴者の関心を引き、コミュニティを形成し、視聴者の支持を得ることができることが明らかになった。

BACKGROUND AND RELATED WORK

BACKGROUND

日本のアイドルは、そのイメージと個性により、大規模で熱狂的なファンがついていた[20]。Vtuberは、これらのトレンドが絡み合うことで文化現象になりつつある。本論文の筆者らも中国において、Vtuberがどのように関わり、どう活用しているかを研究している[44]。

Avatar-Based Virtual Idols and Social Interactions in Virtual Worlds

アバターベースのアイドルのファンを調査し、生身の人間とは違うことでファンとアイドルの間に新しいタイプの関係を培っていると指摘するものもいる[5]。こうしたヴァーチャル・アイドルはファンとのリアルタイムのインタラクティビティを実現したとは言いがたい。このような状況において、VTuberは視聴者とリアルタイムで交流し、ライブの自発性と予測不可能性を利用する。
また、HCIの重要なテーマである仮想世界におけるアバターベースのSocial Interactionにも関連している[16]。このような仮想世界では,ユーザが作成・操作する仮想身体(アバター)を通じてユーザが入室し、アバターを使ってさまざまな社会的活動を行う。

これらの研究について
  • 過去の研究は,World of Warcraft などのゲーム指向の仮想世界(例:[12,46])やSecond Life などの社会指向の仮想世界( 例:[47,48] )におけるユーザの知覚について洞察を提供している。
  • VWでのオンライン・インタラクションを通じて、ユーザは自分のアイデンティティを構築し,理想の自分(=エゴ・イデアル),本当の自分とは異なるもの(=ロールプレイヤー)、あるいは複数のアイデンティティを持つこともある [8,22,48]。
  • 人間のような顔をしたよりリアルなアバターはより積極的な社会的相互作用を可能にする傾向があり[52,66]、人々は共通性を持った他の仮想アバターにより親密に接する [1]。

視聴者はストリーマと同じ仮想空間内にいないため、VTuberの知覚と仮想世界内の仮想キャラクターの知覚は異なっている。

Live Streaming Motivations and Practices

(あまりタイトルどおりの内容は入れれてないです...これらに興味がある人は本論文を読んでみてください!)
HCIにおけるライブストリーミングに関する先行研究は、ライブストリーミングの相互交流性と社会性が、ライブ ストリーミングを魅力的なものにすることを発見している[24,44] 。
ライブストリーミングのアフォーダンス(ライブチャットや絵文字など)は、ComputerMediatedCommunication(CMC)におけるハイパーパーソナルモデル [55,61,62] に関連している。

なぜハイパーパーソナルモデルと関連している?

Vtuberは仮想アバターにより、自己に関する情報を選択して自己提示する送り手、視聴者はその内容を解釈しVtuberの印象を形成する受け手と見ることができる。

その結果、テキストベースのCMCでは、対面でのコミュニケーションに比べて手がかりが限られているため、受信者は送信者の自己呈示に内在する手がかりを過剰に解釈してしまう傾向がある。また、VTuberは「中の人」の外見や非言語的な振る舞いを見ることができないため、手がかりが少なくなってしまう。

METHOD

本研究では、VTuberのライブ配信を視聴しているオタクコミュニティの視聴者の動機と状況的文脈、およびVTuberとの関わり方や捉え方を理解するために、少なくとも週に1回以上、少なくとも1年間、VTuberのライブ配信を視聴している21名の視聴者に対して、定性的インタビュー調査を実施した(表1)。

Background Material Collection

VTuberに対する視野を広げ、インタビュープロトコルの設計を柔軟にするため、インタビューの前と最中に、オンラインリソースから資料を収集した。主な情報源は、NGAフォーラムのVTuber議論ボード[51]から人気VTuberの名前や所属事務所、VTuberや中の人などのキーワードで、フォローすべきスレッドを探した。52のスレッドから1059の投稿を抽出した。このスレッドの投稿を分析するためにストロースのオープンコーディング法[10]を用い、予備的なテーマを特定し、インタビュープロトコルに反映させた。

Interview Protocol

VTuberの熱心な視聴者21名に半構造化インタビューを実施した。インタビューでは、視聴者がVTuberのコンテンツを視聴する動機、視聴したコンテンツの種類や楽しみ方、VTuberのライブ配信の好き嫌い、VTuberや他の視聴者との関わり方などについて質問した。また、VTuberがどのようなパフォーマンスで視聴者を魅了したか、どのような話題でおしゃべりしたか、予想外のドラマチックな瞬間など、彼らが共有したコンテンツに関連した質問をした。

Data Analysis

インタビュー記録は、オープンコーディング法[10]を用いて分析された。親和図を用いて議論し、新たなテーマを発見した。女性嫌悪や性差別の感情は、多くのインタビュイーの回答に見られた。女性嫌悪は、オタク系サブカルチャーとバーチャルアイドル業界の両方に根ざしているのかもしれない。オタク系サブカルチャーでは、かわいらしさが望まれたり、性的な魅力があったりするため、性差別が先行するようである[27]。バーチャルアイドル業界もまた、性差別を積極的に利用し、商業化している[5]。

FINDINGS

Viewer Motivation

VTuberのライブ配信に魅力を感じたのは、VTuberの外見や特殊なデザインの人物に魅力を感じたことと、VTuberのライブ配信によって好きなアニメのキャラクターと交流できることに魅力を感じたためである。その他の動機としては、リラックスやエンターテインメント、娯楽、仲間やコミュニティーの感覚を体験するためなどがあり、先行研究[24, 44, 60]と同様であった。

Streaming Content and Interactions

VTuberのライブ配信を視聴したところ、リアルなライブ配信と同様の内容であった。しかし、先行研究と比較すると、VTuberの提供するコンテンツや視聴者のライブストリームへの関わり方に独自性があることがわかった。

Main Activities: Singing, Chatting, and Gaming

VTuberの活動として、歌、チャット、ゲームの3つがよく見られるとインタビューに答えている。一般に、3Dアバターは全身を使った表現が可能であると評価されていますが、2Dアバターに対する強いこだわりはないようです。
しかし、現在の3Dモーションキャプチャー技術は、経済的に不安定な個人VTuberにとっては高価であるため、2Dアバターは「チャットをするには十分」(P18)であることも認識されています。

Content about the Daily Lives of Nakanohitos

インタビュイーたちは、中の人がライブストリームで自分の日常生活や現実世界の出来事について話してくれたことを喜んでいた。インタビュイーの多くは熱心なアニメ視聴者であり、自分の好きなアニメのキャラクターは空想の世界にしか存在しないことを自覚しています。しかし、VTuberが共有する日常生活のコンテンツは、典型的なアニメのキャラクターよりも視聴者との距離を縮める。

Technological Limitations Affecting Experiences

アバターには、より自然で豊かな表情を求める声が聞かれた。2DのVTuberをアニメーション化する最もポピュラーなツールであるLive2Dは、アバターのさまざまなパーツをあらかじめ録画したアニメーションを再生する。また、VTuberのパフォーマンスは、中の人のデスクトップコンピュータの前にある空間に限定されており、全身を動かしたり、物理的な世界とインタラクションすることはほとんどないことが分かりました。モーションキャプチャー技術は、3Dアバターの全身アニメーションを駆動し、ダンスやモーションセンシングゲームなど、VTuberのコンテンツのレパートリーを広げることができますが、コストがかかり、制約があるのも事実です。バーチャルストリーミングでは、現実の物を手に取って操作するなど、物理世界とのインタラクションが重要な技術課題として残されています。

Perceived Differences between VTuber and Real-Person Streamers

Vuberとリアルのストリーマーとの違いを明示的に尋ねたところ、ほとんどのインタビュー参加者は、まず両者に大きな違いはないと答えた。しかし、よく考えてみると、ほとんどの人が暗黙のうちにいくつかの重要な相違点を挙げている。

Different Expectations for Streamers’ Behaviors

VTuberのアバターが2次元または3次元の「仮想」形態であるため、VTuberが「仮想世界」にいるという意識を無意識に抱いてしまうという指摘があった。VTuberを視聴する際、ゲームやアニメ、マンガの仮想世界への期待と同様に、仮想世界に対して異なる期待規範を持っていることが感じられた(人間のストリーマーが「自分は異空間から来た」と言ったら、「嘘くさい」「変だ」と思う。しかし、VTuberがそう言えば、不思議に思わない)。
視聴者は、仮想世界で何が起こりうるかについて異なる期待を持っているため、実生活では恥ずかしい、受け入れられない、不適切と思われる多くの行動が、VTuberの文脈では普通、許容、適切となりうる(例えば、視聴者は VTuber の汚い言葉や不快な言葉、「バカ」な行動には寛容なようだ。)。

Sense of Distance

インタビューによると、ライブストリームを視聴する際、VTuberとの距離感は、生身の人間よりも遠く感じられるとのことである。この距離感は、P3が「VTuberのライブストリームを見るのは、仮面をつけた俳優の演技を見ているようだ」と述べたように、視聴者がアバターを操作する中の人の実際の表情やその他の非言語的合図を直接見ることができないアバターとの仮想的仲介から生じている。
この距離感は、VTuberのペルソナによって、さらに強調される。多くのVTuberは、特定のアイデンティティを持ったデザインになっています。 多くのVTuber は、エキゾチック、吸血鬼、悪魔、姫、妖精、宇宙人、未来人など、特定のアイデンティティーを持ったデザインであり、これらのアバターの視覚的外観はこれらのアイデンティティーと一致している。これらのユニークなアイデンティティーと外観により、VTuber は人間らしくないと感じられ、したがって視聴者からより離れていると感じられた。

Public Personas and Identities

映像には、バーチャルキャラクターの背景や人物像、特徴などが含まれることが多い。このような動画は、視聴者にとって重要な体験であり、VTuberに対する最初の興味を喚起するものだ。
しかし、ストリーマーの行動がデザインされたペルソナにどの程度合致しているか、またペルソナが時間的に動的であるかについては、多様な慣行があるとインタビュイーは考えている。VTuberが作るペルソナは、アニメやマンガのペルソナのテンプレートに沿ったシンプルでフラットなもので、サブカル・コミュニティーのメンバーが好むとされる性格の要素を組み合わせたものが多いようだ。日本の哲学者である東浩紀がコメントしているように、アニメのペルソナはしばしば「萌え(愛情)データベース」から構築される[18]。
また、デザインされたペルソナと、提示されたVTuberのイメージとの間に齟齬が生じることは、新興のVTuberにとってより顕著になってきている。定期的に配信することで、「中の人」の性格やスタイルが無意識に明らかになり、次第にVTuberの人格に変化していく。

Situational Changes in Persona

公開ペルソナも、視聴者の好みに応じて状況変化する。VTuberの中には、デザインされたペルソナと提示されたペルソナの間の不一致によって最初の人気を得た者もいるが、これは彼らが人気を得始めると課題となる。
また、人気者になると、デザインされたペルソナがニッチな視聴者にしかアピールできなくなり、フォロワーを獲得し続けられなくなる可能性がある。この場合、多くのVTuberは、より幅広い視聴者に対応できるようにペルソナを調整し、フォロワーの減少を防がなければならない。

Perceptions of Nakanohito Disembodimentand Nakanohito’s Labor

この部分はまるごと割愛します。興味が有る方は本論文を見ていただけると幸いです。

DISCUSSION

Multi-Layer Identity and the Line between Virtual and Real in Live Streaming

この結果は,視聴者が仮想アバターを介して中の人のパフォーマンスを視聴するVTuberライブストリーミング において、視聴者のアバターに対する解釈は多くの要因に依存し、必ずしもCMCのハイパーパーソナルモデル[61,62] と一致しないという証拠を最初に提示するものであった。
一方,仮想アバターとそのペルソナに惹かれる視聴者は,VTuberの行動とペルソナの間の整合性についてより厳格になる可能性がある。このような視聴者は、シンプルでわかりやすいペルソナとユニークな外見を持つアバターからの合図を過大に解釈することがある。このように、視聴者はVTuberに対してほぼ完璧な印象を抱き、ファンのように彼女をフォローすることができる(これはハイパーパーソナルモデルと一致する)。このようなファンは、アニメ領域におけるファンダムと同様に、アバターとのユニークな結びつきを維持しているように見える。
一方、VTuberを友人とみなし、VTuberが架空の、あるいは中の人の実生活に基づいた日常生活の詳細を共有することを楽しむ視聴者もいる。このような視聴者にとっては、VTuberの行動とペルソナの一貫性はあまり重要ではなく、バーチャルアバターというアニメの仮面をかぶった「中の人」の人格、あるいは「キャラクター」のほうに関心があるのだ。これはVTuberの意図とは異なる場合が多く、ハイパーパーソナルモデルとも一致しない。
VTuberがライブ配信するコンテンツはバーチャルとリアルが混在しており、VTuberは現実世界でのスキルや経験に基づいたコンテンツを提供することでバーチャル世界の人格を構築し、結果としてVTuberと視聴者の間に距離感が生まれている。このペルソナは,VTuber の仮想的なアイデンティティを構築し、先行研究[39] と呼応する。
VTuberのストリーミングにおけるバーチャルとリアルの境界線は動的で曖昧であるため、視聴者はバーチャルアバターと中の人を別々に考えるのではなく、VTuberをバーチャル世界のキャラクターとして捉え、現実世界の社会規範にあまり左右されないようにすることが多い。しかし、VTuberの仮想と現実の境界がどこにあるかは、視聴者個人によって異なるし、外的な影響によって変化する可能性もある。

VTuber Live Streaming Challenges

Constructing Virtual Identities

VTuberはストーリーやパフォーマンスを通じて、異なる嗜好の視聴者を惹きつけたり、中の人の性格や生活の一部を意図的に露出してコントラストを生み出し、視聴者を楽しませたりしながら、ダイナミックにアイデンティティを構築していると、熱心な視聴者は認識していた。これらの結果は、「仮想の身体は,継続的なアイデンティティの再構築の一断面にすぎない」 [39]という点で、セカンドライフ上のファッションブロガーのアイデンティティ再構築に関する知見を反映するものである。
また、ライブストリーミングの視聴者は、VTuberのアイデンティティに大きな影響を与える。ライブストリーミング中の彼らのコメントは、VTuberの既存の人格を補完し、変容させる瞬間を生み出し、彼らの交流は、ライブストリームを越えて、例えばグループチャットや他のファンコミュニティでライブストリーム中に作られたミームを広めるなどしている。VTuberの個性は、最初はシンプルなデザインですが、視聴者との交流を通じて、より複雑なものに変化していくのが一般的です。このことは、VTuberにとって課題でもあります。このように、VTuberの個性が複雑化し、視聴者の期待値が変化していく中で、中の人は一貫した人物像やイメージを維持することができず、ファンを失う可能性がある。

Content Diversity

VTuberは技術的な制約から、実際のストリーマーのような表現力を発揮することができない。まず、VTuber は、手作りチュートリア[41] や旅行経験の共有[42]などの多くの人気ストリーミング・ジャンルの舞台である実世界との物理的インタラクションを含むコンテンツを提供できない。

Design Implications

AI技術の進歩により、バーチャルアイドルの外見を自動生成し、キャラクターデザインや背景ストーリーを作成したり、声を変えたりすることがより簡単にできるようになる。すでに、機械学習によって実在の司会者の声、表情、ジェスチャーをシミュレートした完全AI搭載のテレビ番組司会者の制作を開始している企業もある[33]。 このように、ライブ・ストリーミング・サービスの設計、実装、調査には、いくつかの設計上の考慮事項が必要です。

Design for Identity Management

VTuberは自分のアイデンティティを動的に構築し、しばしば中人の特徴や視聴者のコミュニティへの参加状況に基づいて、時間と共に進化することが明らかになった。VTuberのアイデンティティを維持することは容易ではありませんが、安定したファン層を維持するためには重要なことです。そこで、VTuberのためのコラボレーション・アイデンティティ管理ツールを提供し、ライブ・ストリーム中に一貫したアイデンティティを維持するためのガイドラインと実行可能な戦略をなかのひとに提供するデザイン機会がある。例えば、ライブ・ストリーム中に視聴者が中の人のアイデンティティを明らかにするようなコメントを送った場合、ツールはそのリスクについて警告し、構築したアイデンティティと整合性のある方法でコメントに応答するよう指導することができるだろう。

Design for both the Virtual and the Real

また、VTuberのライブ配信を通じて、リアルとバーチャルの境界を曖昧にすることで起こりうる機会も明らかになった。 VTuberのライブストリーミングは、現実のライブストリーマーにインスピレーションを与えるような創造的なパフォーマンス形式を示唆している。インタビューでは、複数のVTuberが一つの仮想世界に同居している様子を熱心に見ていた。しかし、現在の現実のライブストリーミングは、複数のVTuberの映像が並列に表示されるだけである。そこで、マーカーレス・モーションキャプチャーなどの技術を使って、地理的な障壁を取り除き、VTuberのco-streaming体験を現実のストリーマーに提供するデザイン上の機会を提案する。
今後の複合現実感技術により、VTuberのライブ配信の視聴体験がより充実する可能性があります。拡張現実は、VTuberの人間サイズの3Dアバターを現実世界に出現させることができる。仮想現実は、VTuberがライブを行う仮想世界に視聴者を没入させることができる。現実とバーチャルを融合させたライブストリーミングは、文化遺産、観光、知識共有など、特定のアプリケーション分野と組み合わせることで、より多くの視聴者の興味を引くことができる可能性があります。

Limitations and Future Work

この研究は、若くて男性に偏った熱心な視聴者のサンプルのインタビューデータから得られたものだ。
今後、より大規模で多様なサンプルを用いてVTuberコミュニティの理解を拡大し、深めるための研究が必要です。本研究の性質上、因果関係の結論や一般化可能性を示すことはできない。VTuberの中の人、そのモデレーター、その他のサポート役、企業の経営者など、異なるステークホルダーへのインタビューにより、この現象についてより多くの知見が得られるだろう。また、特定の VTuberに参加させ、VTuber に対する反応を制御された実験で分析するという別の方法論も、今後の研究で検討されるかもしれない。

Discussion