[2024年11月1日] Big TechのAI競争が激化の一途 (週刊AI)
こんにちは、Kaiです。
大きな発表はありませんでしたが、細かいサービスアップデートレベルで、Big Tech同士の競争をバチバチに感じる昨今です。
では今週のトピックスです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Big Tech AIサービス
OpenAI: ChatGPT Search
ChatGPTのサーチエンジン機能が、有料ユーザから正式にリリースされました。ちょっと使ってみたところでは、PerplexityやGensparkのような専門AIサーチに比べるとまだラフかな?という感じですが、これからどんどん進化していくのでしょう。
Google: AI StudioにGoogle検索が統合
と思ったらGoogleが対抗してきました。こちらはGemini+Google検索ですね。なんかもうバチバチ。
Claude: Windows/Macアプリをリリース
デスクトップアプリが登場。これもChatGPT対抗ですね。
Github: Github Spark
「パーソナライズされた小規模なアプリ」を「ノーコードで高速に」作ることに特化したプラットフォーム。記事は後述しますが、SaaS(Software as a Service)の時代が終わり、SaaS(Service as a Software)の時代が来るのかもしれません。つまり、万人向けの定型ソフトウェアによってサービスが提供されるのではなく、柔軟なソフトウェアが各ニーズに合わせたサービスを提供する、という世界です。
Github: CopilotがGemini 1.5 Pro、Claude 3.5 Sonnet、GPT-4o、o1-preview、o1-miniに対応
まさに全方位外交。しかしこれだけの提携を一気にまとめるというのは凄いですね。MSが裏で動いているのでしょうか。
その他AI系話題
Generative AI’s Act o1
米国セコイアキャピタルのAIレポート記事。先述の「Service as a Software」の概念が提示されています。o1論文の新規性をレビューした後、この概念はサービス産業そのものをソフトウェア化する、と述べています。
メタ、材料科学向けの最大規模のデータセットとAIモデルを無償公開
Metaは徹底的にオープン戦略でいくつもりですね。
NotebookLlama: An Open Source version of NotebookLM
Meta発LlamaのNotebookLM実装。これまたオープンソース。OpenAIやAnthropicのプロプライエタリなモデルへの対抗として、Llamaを中心としたエコシステム構築に振り切った印象があります。
LLMの思想は中立ではない
学習データの偏り、人間によるアラインメント作業でどうしても偏りが生じるのでしょう。ひょっとしたら、雇用されているメンバーひいては会社のカルチャーによる偏りが反映されているのかも。
「Felo」とその活用法
先日紹介した日本発AIサーチのFelo、使いやすいし速いです。でも紹介noteが有料なのはどうかと思う。
欠損値処理に関する備忘録
安心と信頼のTJOさんの記事。統計と機械学習で欠損値処理に対するスタンスが異なるというのは面白い視点でした。分析し説明することが目的の統計と、ブラックボックスでもいいから精度のよいモデルを作ることが目的の機械学習の差、という感じでしょうか。
RAGの「文脈が消える問題」を解決する「LongRAG」
毎度おなじみナレッジセンスさんのRAGブログ。こういう細かい改善手法の論文がたくさん出てるんですが、なんというかマイナーチェンジの量産に見えちゃうんですよね……。
AIのもたらす深刻なリスクとその歴史的背景概要
いくぶん前の記事ですが、面白かったので。各所で指摘されているAIのリスクについて、平易で直感的な表現で説明しています。「知能」「意識」「目標」は別であり、SFのように超知能が意識を持ち人類を滅ぼすに至らなくとも、「十分に高度な知能を持つAIの目標設計をミスる」ことにより社会が危機にさらされるリスクが大きいという話は分かりやすいです。
o1によるテストデータ生成
これはいいですね、複雑な論理の組み合わせが必要なので、人間でも漏れ抜けが出やすい。o1が得意とするタスクであり、すぐ導入できそう。
LangGraphとAgentを使って最新のトレンドを考慮した広告文生成をやってみる
エージェント実装の入門編としてちょうどいい感じです。タスクの分割やデータの受け渡しなど、基本的なポイントが押さえられるかと。
WEB開発系話題
ElastiCacheでValkeyがサポートされたけど何が良いのか検証してみた
Valkey、寡聞にして知らなったのですが、RedisをforkしたOSSとのこと。Redisがクラウドサービス上での提供を制限したことから、各社がValkeyへの対応を表明しているそうです。Redisに比べて安く、高速になるもよう。
アジャイルを支えるテストアーキテクチャ設計
アジャイルで品質担保のために必須となるテストを、アーキテクチャとして考える基本の紹介。実例というよりは概念のおさらい、という感じでしょうか。
APIテスト自動化の勘所
こちらは実例寄りのポイントを紹介。
その他一般テック話題
ログ出力のための print と import logging はやめてほしい
かなり前の記事ですが、確かになぁと思ったので。Pythonで機械学習やるときにも意識したいところです。
iOS 18 の新機能 Control Widgets 実装時の注意点
正直、最近のiPhoneはアイコンと機能だらけで、かつてのガラケーに近づいている気がしています。
We're forking Flutter. This is why.
GoogleがFlutterのリポジトリをforkしてFlutter+というべきFlockを作ったとのこと。Google自体がAIにリソースを投入しており、Flutterはその開発者コミュニティの規模に対して、Google内部でのリソースが見合っていないそうです。オワコンになるわけではないが、ちょっと先行きが不透明、という感じでしょうか。詳しくは解説記事をご覧ください。
(解説)ある企業がハイブリッドワークの A/B テストを実施
世界で4万人の従業員を抱える企業が、従業員をフル出社とハイブリッドにランダム割り付けしてA/Bテストを実施(フル出社とフルリモートではないことに注意)。その結果、生産性はほぼ変わらず、ハイブリッドワークの離職率が大幅に下がったとのこと。
なぜ、ソフトウェアプロジェクトは人数を増やしても上手くいかないのか
すごく昔の記事ですが、ソフトウェア開発プロセスを数理的に解析したデータを初めて見たのでご紹介。工期は工数の三乗根に比例するのか……。「人を10倍にすれば工期は10分の1になるだろ!」と言われたらこれをぶつけたい気持ち。
Discussion