🍎

Apple Vision Pro のFaceTime/空間ペルソナを配信する

に公開

2025/4/22に開催された、Nu Source Study #2 「XR/空間コンピューティング」で「XR/空間コンピューティングの可能性」というお題で登壇しました。

登壇の内容は下記のnoteに書いたので、そちらを参照してください。

https://note.com/kaoru_nakamura/n/nddb8fbd8f77d

今回の登壇はApple Vision ProのFaceTimeで自分の講演およびヌーラボ代表の橋本さんとのディスカッションを行い、それを配信する形でした。

この記事では、その構成について記録しておきます。

配信構成

次のような構成で配信をしています。

  • Apple Vision Pro 環境
  • 配信環境
    • 配信用 Apple Vision ProからFaceTimeの様子をAirPlayで受信するためのiPad
    • iPad で出力されるHDMIをUSBに変換するHDMIキャプチャー
      • 今回はアイ・オー・データ製 GV-HUVC/Sを使用
    • MDHIキャプチャーから出力される映像をMac/PC上のOBSに取り込み、YouTubeに配信する

Apple Vision Pro の準備

Apple Vision Proは登壇者の人数分。これに加えて配信用のApple Vision Proを1台準備します。これらのApple Vision ProをFaceTimeで接続、空間ペルソナモードをオンにします。

Keynoteなどアプリを共有する場合にはSharePlayを使用します。

https://support.apple.com/ja-jp/guide/apple-vision-pro/tan15b2c7bf9/2.0/visionos/2.0

配信用も同様にFaceTimeに参加し空間ペルソナをオンにします。Apple Vision Proはこのように SHINOBU工房 | 【フルキット】 Apple Vision Pro デモセット v2 を使用し三脚への固定します。合わせて、付属している「KeepON マスク」で Apple Vision Pro を人が装着していない状態でもスリープせず動作可能にします。

配信の準備

次に配信側です。

流れは配信用 Apple Vision Pro の映像をAirPlayで受け取るためのiPadなどへ送信し、iPadからHDMIで出力したものをUSBに変換して、Mac/PCのOBSに入力、YouTubeへ配信となります。

MDHIキャプチャーはアイ・オー・データ製 GV-HUVC/S を使用しています。

配信された動画

配信された動画がどのようになるか。というのは、下記をご覧ください。
2025年1月にMESONさん主催での「Persona新年会」が似た構成になっているので、こちらをご覧いただくと雰囲気がわかります。

https://note.com/meson_tokyo/n/n1471e1ea50ff

やってみた所感

ペルソナ配信について、今回の「Nu Source Study #2」と1月の「Persona新年会」の2回行いました。

それぞれ環境が異なるので、ペルソナ配信の特長もいくつか理解しました。

  • 登壇者が遠隔にいる場合、同じ場所にいるような感覚で会話ができ、その様子が配信される
    • FaceTimeでの通話にペルソナによる各自のアバターが空間上に見えることで、対面での会話のように感じる。これはFaceTimeの遅延が短いこともプラス要因として考えられる。
    • 対面のような構成であるが、音声は各自のApple Vision Proのマイクから送られるので、物理的な対面のように音が混じることもなく、思った以上に快適に聴くことができる。
  • 登壇者が同じ場所にいる場合、それぞれの登壇者の音声が混じらないようにする
    • 今回の「Nu Source Study #2」では橋本さんと自分はヌーラボ東京オフィスにいましたが、それぞれ執務室と個室と別の場所から配信をした。
    • 同じ場所にいた場合の音声の混じり方は未確認だが、対面の会話とFaceTime経由の音声が重複するので、登壇者側は違和感がある可能性。
  • 配信される音声が空間オーディオ
    • 配信用Apple Vision Proが受信する映像と音声を配信するため、音声が空間オーディオ(立体的に聞こえる音声)になっているように感じる。
    • 具体的には、ペルソナの位置によって音声が変わる、左にいるペルソナの人が話すと配信の音声も左から聞こえ、右にいるペルソナの人が話すと配信の音声は右から聞こえる。
    • これは普段のZoomやYouTubeの配信とは異なる(通常のビデオ通話では全ての音が均等に左右から聞こえる)。視聴者によっては「まるで同じ部屋で会話を聞いているような臨場感」と感じる一方、慣れないと「音のバランスがおかしい」と違和感を持つ方もいる可能性。

まとめ

ペルソナ配信は機材の準備(とApple Vision Proを複数台利用するため価格)が難点ではありますが、通常の配信とは異なる面白さがあります。

遠隔配信のパネルディスカッションだと登壇者の空間的な配置、見え方、音声の入り方などを考えると、割とベストなやり方とも感じます。

まずは体験してもらいたいと思いつつ、興味はあるけど機材の準備が難しいという方は、お問い合わせいただければできる範囲で対応します。

ホロラボのテックブログ

Discussion