OpenAI Sora 2 公式発表のまとめ(日本語翻訳)
以下公式ページからのAI翻訳・要約です(2025/10/04 時点の情報です)
📌 Sora 2 の技術的進化
- 動画版 GPT-3.5 の瞬間:物理法則をより忠実に再現できるようになった
- 不自然な挙動(瞬間移動など)が減り、自然な失敗(例:シュートのリバウンド)が再現可能
- マルチショットの複雑な指示に対応し、世界の状態を維持できる
- リアル・シネマ風・アニメ風など幅広いスタイルに対応
- 音声生成(環境音・効果音・音声)も高精度で作成可能
- 実在人物や動物・物体を取り込み、外見や声を反映できる
📌 新アプリ「Sora」
- iOS 向け新アプリ 「Sora」 を公開
- 動画生成・リミックス・発見ができる ソーシャル機能 を搭載
- カメオ機能:本人確認動画を撮影すると、自分や友人をシーンに自然に登場させられる
- 内部テストでは「新しい交流が生まれた」と好評
📌 安全性と利用者保護
- フィード設計は「消費時間」ではなく「創造性」を重視
- 自然言語で操作可能な新しい推薦アルゴリズムを導入
- ティーン向け制限
- 1日の閲覧数に上限を設定
- カメオ機能の権限を厳格化
- 人間モデレーターによる迅速対応
- ChatGPT 経由の ペアレンタルコントロール 提供
- カメオは本人が完全管理可能(削除・使用権取り消し自由)
📌 提供と収益モデル
- 米国・カナダで先行提供、順次拡大予定
- 初期は無料で、十分な生成枠を提供
- ChatGPT Pro ユーザーは高品質版 Sora 2 Pro を利用可能
- 将来的に API 提供も予定
- 収益化は「計算資源不足時の追加課金」のみを想定
📌 意義
- 動画生成は急速に進化中
- 汎用的な世界シミュレーションとロボティクス への重要な一歩
- OpenAI の使命に基づき「人類が利益を得られる形」で開発
- 新しい創造・交流の形を提供し、健全なエンタメ・クリエイティブ体験を目指す
👉 まとめ:
Sora 2 は「物理法則を守る動画生成」が可能になり、それを活かしたソーシャルアプリを公開した。
翻訳全文
Sora 2
本日、私たちはフラッグシップとなる動画・音声生成モデル Sora 2 をリリースします。
2024年2月に登場した初代 Sora モデルは、いわば「動画における GPT-1 の瞬間」でした。初めて動画生成が「動き始めた」と感じられるもので、オブジェクトの永続性といった単純な振る舞いが、大規模な事前学習によって自然に現れました。それ以来、Sora チームは「より高度な世界シミュレーション能力」を持つモデルの研究に取り組んできました。物理世界を深く理解する AI を育成するには、こうしたシステムが不可欠だと考えています。そのための大きなマイルストーンは、言語に比べてまだ初期段階にある「大規模な動画データでの事前学習と事後学習」をマスターすることです。
Sora 2 の進化
Sora 2 は「動画における GPT-3.5 の瞬間」に直接飛び込むような存在です。
従来のモデルでは極めて困難、あるいは不可能だったことが可能になっています。例えば、オリンピックの体操演技、パドルボードの上での正確な浮力・剛性ダイナミクスを伴うバク宙、そして猫を頭に乗せてのトリプルアクセルなどです。
従来の動画モデルは過度に楽観的で、テキストの指示を「実現するために」オブジェクトを変形させたり現実を歪めたりしていました。例えばバスケットボールのシュートを外したら、ボールが瞬間移動してゴールに入ることもありました。しかし Sora 2 では、外したシュートはきちんとバックボードに跳ね返ります。
モデルの「失敗」も、内部で暗黙的にシミュレーションされているエージェントの失敗として自然に見えるのが特徴です。物理法則に従う度合いが従来モデルよりも改善されており、「失敗を再現できること」は有用な世界シミュレーターにとって極めて重要な能力です。
さらに、Sora 2 は複数のショットにわたる複雑な指示をこなしつつ、世界の状態を正確に保持できます。リアル、シネマティック、アニメ風など、幅広いスタイルに対応します。加えて、環境音や効果音、音声を高精度で生成でき、より現実的なビデオ・オーディオ体験を作り出せます。
また、実世界の要素を直接注入できる機能もあります。例えばチームメンバーの動画を観察し、その人物を外見や声も含めて正確に Sora が生成した環境に登場させることが可能です。人・動物・物体を問わず、この機能は汎用的に利用できます。
もちろん完璧ではなく多くの誤りもありますが、大規模な動画データでニューラルネットワークをスケールさせれば、現実に近づくことを実証する結果となっています。
Sora 2 の展開と iOS アプリ
私たちは「一般目的のシミュレーションと物理世界で機能する AI システム」への道のりの中で、Sora 2 を人々が楽しめる形で提供したいと考えています。
数か月前からチーム内で「自分をアップロードして出演する」機能を試しており、大いに盛り上がりました。テキスト → 絵文字 → 音声メモに続く「自然な進化」とも感じました。
そこで本日、Sora 2 を搭載した新しいソーシャル iOS アプリ 「Sora」 をリリースします。アプリ内では生成動画を作成したり、他人の生成物をリミックスしたり、カスタマイズ可能なフィードで新しい動画を発見したりできます。また「カメオ」機能を使えば、アプリで短い本人確認用の動画と音声を一度録るだけで、自分や友達を任意のシーンに高精度で登場させることが可能です。
先週、OpenAI 社内でテストを開始しましたが、社員同士がこの機能を通じて新しい友人関係を築いたという声も届いています。カメオを軸にしたソーシャルアプリこそ、Sora 2 の魔法を体験する最良の方法だと考えています。
責任あるローンチ
「無限スクロール」「依存性」「孤立」などの懸念に対し、私たちは以下の対応をしています。
ユーザーが自然言語で指示できる新しい推薦アルゴリズムを導入。フィードを自分でコントロール可能に。
定期的にユーザーの状態を調査し、フィード調整を提案。
デフォルトでは「フォローしている人」や「自分が生成に使いそうな動画」を優先的に表示。
フィード滞在時間ではなく「創造」を最大化する設計。
また、カメオ機能は「友達と一緒に使う」ことを前提にしています。大手プラットフォームがソーシャルグラフを離れる中、私たちはコミュニティを強める方向を選びました。
特に ティーンの安全 に注力しています:
1日に閲覧できる生成数に制限を設ける。
カメオ機能に厳格な権限管理を導入。
いじめ対策として人間のモデレーターを拡充。
ChatGPT 経由で使える 保護者向けコントロール機能 を搭載。
さらに、カメオの利用は本人が完全に管理できます。いつでも使用権を取り消したり、動画を削除したりできます。
収益モデルと今後
他のアプリが抱える問題の多くは収益モデルに起因します。私たちは透明性を重視し、現時点での唯一の計画は「計算資源が逼迫した場合、追加生成を有料で提供する可能性がある」というものです。
Sora 2 を使った共同創作体験は新しい時代の幕開けです。現在あるエンタメ・クリエイティブ系プラットフォームよりも健全な場となることを目指しています。
利用可能性と次のステップ
iOS アプリ「Sora」を本日より米国とカナダで展開開始。
招待を受け取ると sora.com からも利用可能。
初期は無料提供で、十分に試せる制限枠を用意。
ChatGPT Pro ユーザーは sora.com で Sora 2 Pro モデルを試用可能(将来的にアプリでも提供)。
API 提供も予定。Sora 1 Turbo も引き続き利用可能。
動画モデルは急速に進歩しています。汎用シミュレーターやロボティクスは社会を根本から変え、人類の進歩を加速させるでしょう。Sora 2 はその大きな一歩です。OpenAI の使命に従い、人類が利益を得られる形で開発を進めていきます。
Sora が世界に「喜び・創造性・つながり」をもたらすことを願っています。
— Sora チームより
Discussion