[2024年12月13日] OpenAIとGoogleの大戦争 (週刊AI)
こんにちは、Kaiです。
ついこの間、「嵐の前の静けさ」と表現しましたが、まさにその通りになりましたね。
OpenAIによる連続発表はまだ続いていますが、Googleは固めて出してきました。
いずれも大変大きいインパクトなので、そちらをうまくまとめた記事を中心にご紹介します。
今回はBig Techによる発表が続いているので、他記事少な目ですし、最新情報や使用感がほとんどX経由で流れているのでXのポスト多めです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Big Tech AIサービス
OpenAI: 発表いっぱい
OpenAIは前にもお伝えした通り、12日間に渡る連続発表の真っ最中です。
先週から発表された内容のうち、注目すべき内容をピックアップしてご紹介します。
o1 Pro
最初に発表された月額3万円のo1 Pro。発表時点ではその真価があまり明らかになっていませんでしたが、その後使い倒す人たちによって様々な結果が出ています。一部をご紹介します。
総じて、「各分野の専門家が、簡単に答えが出ない深い思考を手助けさせるのに使うべき。一般人の一般タスクでは過剰性能」といったところでしょうか。
つまりは、ドメイン知識・背景情報などを抜きにした純粋な論理的知性のレベルでは、ほとんどの人類を超えた性能を持っているということだと考えられます。
AIに2本論文を投げつけて間の領域を探索させる
一線の研究者の方が、最新論文2本を提示して、その間にある研究領域を検討させた例です。「博士課程の学生にやらせて1週間程度で出る内容が1時間かからずに得られる」という評価です。
o1 Proが医師国家試験で99.6%の正答率
まだプレプリント前のようですが、Microsoftの研究者の方より報告。この正答率は、恐らく多くの人間よりも高いものでしょう。
難しい概念を説明させる例
数学における圏論、物理学における一般相対性理論などを適切に分かりやすく解説。
Sora
2月にチラ見せされ、期待がずっと高まっていた動画生成のSoraがついに一般公開されました。
正直なところ、確かにモデルとしては凄いものの競合サービスも順調に進化しており、一線を画すとまでは言えないな……という印象です。
どちらかというと、「AI前提の革新的な動画編集UI/UX」に注目すべきで、Sora自体の不完全性を、人間との協働により補完しようとしている印象です。この流れは、恐らく他のAIサービスも模倣してデファクトになっていくように思います。
Advance Voice Modeに動画認識機能
後述するGoogleのGeminiと類似した機能です。Googleの翌日に発表する形になりました。リアルタイムに動画を認識しながら音声対話が可能。画面認識して一緒に作業したり、カメラを「目」として使うことで体験を共有したりできる。
Google: 発表たくさん
量子チップWillow
直接的にはAIではありませんが、AIのスケーリングにも巨大なインパクトだと思われるためこちらでご紹介。
Googleが、新たな量子チップ「Willow」を発表しました。現行のスーパーコンピュータで10の25乗年かかる計算を5分で完了したということです。
量子コンピューティングは、これまでずっと量子誤り訂正と呼ばれる大きな問題を抱えていました。これは、量子ビットを拡張すればするほど、指数関数的に誤りが増え、計算が行えなくなるというもので、30年以上に渡って解決が模索されていました。今回のWillowは、この課題をついに解決したということです。
まだNatureに論文が出ただけで、今後様々な形で追試や汎用性の検証が行われると思われるため、現時点での断定は避けますが、人類の持つ計算力がリープする可能性が見えてきました。
(そして同時に、それは現行の素因数分解を基礎とする暗号アルゴリズムの終わりをも意味します)
Gemini 2.0 Flash
これは1.5 Proよりも強力でありながら、従来のFlashと同等の速度を持っているとのこと。既に1.5 Proの時点でそのマルチモーダル性能から最強の一角とされていましたが、現在のChatbot ArenaでもOpenAIの最新モデルとトップを争っています。
Deep Search
検索の本家本元、GoogleがAIサーチエンジン機能をリリース。Gemini Advancedでのみ利用可能とのこと。Felo、Genspark、Perplexityあたりはどう出てくるか。
Stream Realtime
Gemini 2.0 Flashには、リアルタイムで画面を認識して反応する機能があるとのこと。つまり、ペアプロをAIと一緒にできる可能性が。翌日にはChatGPTも同様の機能を発表。
Android XR
拡張現実に向けた新しいAndroid OSが発表されました。ソニーなど各社が対応デバイスを開発中で、AIとシームレスに統合されるとのこと。上記の「AIの目」としてヘッドセットのカメラを使って、リアルタイムにAIとコミュニケーションする世界を想定しているものと思われます。
Amazon: Bedrockアップデート総まとめ
AWS re:Invent 2024で発表された内容のまとめ。RerankAPI、独自モデル、蒸留機能、マーケットプレイスなどなど。個人的にはRerankとRAG関連のところが気になります。
その他AI系話題
自律型AIソフトウェアエンジニア「Devin」、ついに正式サービス開始。月額500ドルから
自律して動く=エンジニアの仕事を代替できるという触れ込みで話題になっていたDevin、ついに正式サービスになりました。月給7,8万円のアルバイトと考えれば安い……のか……?まだそれほど使用レポートが出ていないので、今後も注目したいと思います。
WEB開発系話題
Github ActonsとKubernetesを使って効率的にデモ環境を作る
デモだと開発環境を流用しちゃうケースが多いと思いますが、確かにクリーンな環境を再現性を持って作るニーズはありますね。
DuckDBを使ったシンプルで安価なデータマネジメント
最近各所で推されていて大変気になっています。次のサービスで導入してみたいな……。
その他一般テック話題
プロダクトの爆速開発を支える、 「作らない・削る・尖らせる」技術
サービスが長く続いていくと、概して全部盛りの総花的サービスになりがち。この姿勢はいつも忘れないようにしたいところです。
ファインディの4年にわたる技術的負債の返済
すごく地味で真っ当で、エンジニア以外には価値が見えづらいことに取り組まれた記録。尊敬します。やっていることの一つ一つは普通なのですが、大きな組織でこれをやり切るのは相当な苦労があったはず。
EGG '24 | ゲーム業界ホワイト化の光と影
ゲーム業界のお話ですが、全ての業界(働き方改革が来る医療でも)に言えることだと思います。労働時間が減ってホワイト化するということは、自己責任の世界が来るということの裏返しであり、自助努力が必要そうだ、というお話。
Discussion