💡

[2024年12月13日] OpenAIとGoogleの大戦争 (週刊AI)

2024/12/13に公開

こんにちは、Kaiです。
ついこの間、「嵐の前の静けさ」と表現しましたが、まさにその通りになりましたね。
OpenAIによる連続発表はまだ続いていますが、Googleは固めて出してきました。

いずれも大変大きいインパクトなので、そちらをうまくまとめた記事を中心にご紹介します。
今回はBig Techによる発表が続いているので、他記事少な目ですし、最新情報や使用感がほとんどX経由で流れているのでXのポスト多めです。

注意事項

  • 直近収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

Big Tech AIサービス

OpenAI: 発表いっぱい

OpenAIは前にもお伝えした通り、12日間に渡る連続発表の真っ最中です。
先週から発表された内容のうち、注目すべき内容をピックアップしてご紹介します。

o1 Pro

最初に発表された月額3万円のo1 Pro。発表時点ではその真価があまり明らかになっていませんでしたが、その後使い倒す人たちによって様々な結果が出ています。一部をご紹介します。
総じて、「各分野の専門家が、簡単に答えが出ない深い思考を手助けさせるのに使うべき。一般人の一般タスクでは過剰性能」といったところでしょうか。
つまりは、ドメイン知識・背景情報などを抜きにした純粋な論理的知性のレベルでは、ほとんどの人類を超えた性能を持っているということだと考えられます。

AIに2本論文を投げつけて間の領域を探索させる
一線の研究者の方が、最新論文2本を提示して、その間にある研究領域を検討させた例です。「博士課程の学生にやらせて1週間程度で出る内容が1時間かからずに得られる」という評価です。
https://scrapbox.io/nishio/o1_ProにPICSY+Birdwatchさせる

o1 Proが医師国家試験で99.6%の正答率
まだプレプリント前のようですが、Microsoftの研究者の方より報告。この正答率は、恐らく多くの人間よりも高いものでしょう。
https://x.com/naotous/status/1865900062121009392

難しい概念を説明させる例
数学における圏論、物理学における一般相対性理論などを適切に分かりやすく解説。
https://x.com/Suzacque/status/1864822909052817637

Sora

2月にチラ見せされ、期待がずっと高まっていた動画生成のSoraがついに一般公開されました。
正直なところ、確かにモデルとしては凄いものの競合サービスも順調に進化しており、一線を画すとまでは言えないな……という印象です。
どちらかというと、「AI前提の革新的な動画編集UI/UX」に注目すべきで、Sora自体の不完全性を、人間との協働により補完しようとしている印象です。この流れは、恐らく他のAIサービスも模倣してデファクトになっていくように思います。
https://chatgpt-lab.com/n/n701e75e796d9

Advance Voice Modeに動画認識機能

後述するGoogleのGeminiと類似した機能です。Googleの翌日に発表する形になりました。リアルタイムに動画を認識しながら音声対話が可能。画面認識して一緒に作業したり、カメラを「目」として使うことで体験を共有したりできる。
https://x.com/ctgptlb/status/1867273710991991063
https://x.com/kajikent/status/1867380498525544875

Google: 発表たくさん

量子チップWillow

直接的にはAIではありませんが、AIのスケーリングにも巨大なインパクトだと思われるためこちらでご紹介。
Googleが、新たな量子チップ「Willow」を発表しました。現行のスーパーコンピュータで10の25乗年かかる計算を5分で完了したということです。
量子コンピューティングは、これまでずっと量子誤り訂正と呼ばれる大きな問題を抱えていました。これは、量子ビットを拡張すればするほど、指数関数的に誤りが増え、計算が行えなくなるというもので、30年以上に渡って解決が模索されていました。今回のWillowは、この課題をついに解決したということです。
まだNatureに論文が出ただけで、今後様々な形で追試や汎用性の検証が行われると思われるため、現時点での断定は避けますが、人類の持つ計算力がリープする可能性が見えてきました。
(そして同時に、それは現行の素因数分解を基礎とする暗号アルゴリズムの終わりをも意味します)
https://blog.google/technology/research/google-willow-quantum-chip/
https://www.itmedia.co.jp/news/articles/2412/10/news106.html

Gemini 2.0 Flash

これは1.5 Proよりも強力でありながら、従来のFlashと同等の速度を持っているとのこと。既に1.5 Proの時点でそのマルチモーダル性能から最強の一角とされていましたが、現在のChatbot ArenaでもOpenAIの最新モデルとトップを争っています。
https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/

検索の本家本元、GoogleがAIサーチエンジン機能をリリース。Gemini Advancedでのみ利用可能とのこと。Felo、Genspark、Perplexityあたりはどう出てくるか。
https://x.com/hAru_mAki_ch/status/1867176447150047529
https://x.com/kajikent/status/1867390282087772347

Stream Realtime

Gemini 2.0 Flashには、リアルタイムで画面を認識して反応する機能があるとのこと。つまり、ペアプロをAIと一緒にできる可能性が。翌日にはChatGPTも同様の機能を発表。
https://x.com/hAru_mAki_ch/status/1867155616642592873

Android XR

拡張現実に向けた新しいAndroid OSが発表されました。ソニーなど各社が対応デバイスを開発中で、AIとシームレスに統合されるとのこと。上記の「AIの目」としてヘッドセットのカメラを使って、リアルタイムにAIとコミュニケーションする世界を想定しているものと思われます。
https://forest.watch.impress.co.jp/docs/news/1647243.html

Amazon: Bedrockアップデート総まとめ

AWS re:Invent 2024で発表された内容のまとめ。RerankAPI、独自モデル、蒸留機能、マーケットプレイスなどなど。個人的にはRerankとRAG関連のところが気になります。
https://speakerdeck.com/minorun365/aws-re-invent-2024-amazon-bedrock-atupudetozong-matome

その他AI系話題

自律型AIソフトウェアエンジニア「Devin」、ついに正式サービス開始。月額500ドルから

自律して動く=エンジニアの仕事を代替できるという触れ込みで話題になっていたDevin、ついに正式サービスになりました。月給7,8万円のアルバイトと考えれば安い……のか……?まだそれほど使用レポートが出ていないので、今後も注目したいと思います。
https://www.publickey1.jp/blog/24/aidevin500.html

WEB開発系話題

Github ActonsとKubernetesを使って効率的にデモ環境を作る

デモだと開発環境を流用しちゃうケースが多いと思いますが、確かにクリーンな環境を再現性を持って作るニーズはありますね。
https://zenn.dev/s_tokutake/articles/8b0512921d4b20

DuckDBを使ったシンプルで安価なデータマネジメント

最近各所で推されていて大変気になっています。次のサービスで導入してみたいな……。
https://speakerdeck.com/chokkoyamada/duckdbwoshi-tutasinpurudean-jia-nadetamanezimento

その他一般テック話題

プロダクトの爆速開発を支える、 「作らない・削る・尖らせる」技術

サービスが長く続いていくと、概して全部盛りの総花的サービスになりがち。この姿勢はいつも忘れないようにしたいところです。
https://speakerdeck.com/applism118/hurotakutonobao-su-kai-fa-wozhi-eru-zuo-ranaixue-rujian-raseru-ji-shu

ファインディの4年にわたる技術的負債の返済

すごく地味で真っ当で、エンジニア以外には価値が見えづらいことに取り組まれた記録。尊敬します。やっていることの一つ一つは普通なのですが、大きな組織でこれをやり切るのは相当な苦労があったはず。
https://speakerdeck.com/ma3tk/repaying-4-years-of-technical-debt-at-findy

EGG '24 | ゲーム業界ホワイト化の光と影

ゲーム業界のお話ですが、全ての業界(働き方改革が来る医療でも)に言えることだと思います。労働時間が減ってホワイト化するということは、自己責任の世界が来るということの裏返しであり、自助努力が必要そうだ、というお話。
https://www.docswell.com/s/EGG/ZYDV8N-KazuhisaMinato

CareNet Engineers

Discussion