💡

[2024年11月1日] Big TechのAI競争が激化の一途 (週刊AI)

2024/11/01に公開

こんにちは、Kaiです。
大きな発表はありませんでしたが、細かいサービスアップデートレベルで、Big Tech同士の競争をバチバチに感じる昨今です。

では今週のトピックスです。

注意事項

  • 直近収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

Big Tech AIサービス

ChatGPTのサーチエンジン機能が、有料ユーザから正式にリリースされました。ちょっと使ってみたところでは、PerplexityやGensparkのような専門AIサーチに比べるとまだラフかな?という感じですが、これからどんどん進化していくのでしょう。
https://openai.com/index/introducing-chatgpt-search/
https://x.com/OpenAI/status/1851340615344406781
https://x.com/masahirochaen/status/1852142642207084956
https://x.com/sarukun99/status/1852150987974414355

Google: AI StudioにGoogle検索が統合

と思ったらGoogleが対抗してきました。こちらはGemini+Google検索ですね。なんかもうバチバチ。
https://x.com/taiyo_ai_gakuse/status/1852052951315206373

Claude: Windows/Macアプリをリリース

デスクトップアプリが登場。これもChatGPT対抗ですね。
https://claude.ai/download

Github: Github Spark

「パーソナライズされた小規模なアプリ」を「ノーコードで高速に」作ることに特化したプラットフォーム。記事は後述しますが、SaaS(Software as a Service)の時代が終わり、SaaS(Service as a Software)の時代が来るのかもしれません。つまり、万人向けの定型ソフトウェアによってサービスが提供されるのではなく、柔軟なソフトウェアが各ニーズに合わせたサービスを提供する、という世界です。
https://x.com/GitHubJapan/status/1851307314260894174
https://www.publickey1.jp/blog/24/githubgithub_spark.html

Github: CopilotがGemini 1.5 Pro、Claude 3.5 Sonnet、GPT-4o、o1-preview、o1-miniに対応

まさに全方位外交。しかしこれだけの提携を一気にまとめるというのは凄いですね。MSが裏で動いているのでしょうか。
https://www.anthropic.com/news/github-copilot
https://www.publickey1.jp/blog/24/github_copilotaigemini_15_proclaude_35_sonnetopenaigpt-4oo1-previewo1-mini.html

その他AI系話題

Generative AI’s Act o1

米国セコイアキャピタルのAIレポート記事。先述の「Service as a Software」の概念が提示されています。o1論文の新規性をレビューした後、この概念はサービス産業そのものをソフトウェア化する、と述べています。
https://www.sequoiacap.com/article/generative-ais-act-o1/

メタ、材料科学向けの最大規模のデータセットとAIモデルを無償公開

Metaは徹底的にオープン戦略でいくつもりですね。
https://www.technologyreview.jp/s/348458/the-race-to-find-new-materials-with-ai-needs-more-data-meta-is-giving-massive-amounts-away-for-free/

NotebookLlama: An Open Source version of NotebookLM

Meta発LlamaのNotebookLM実装。これまたオープンソース。OpenAIやAnthropicのプロプライエタリなモデルへの対抗として、Llamaを中心としたエコシステム構築に振り切った印象があります。
https://github.com/meta-llama/llama-recipes/tree/main/recipes/quickstart/NotebookLlama

LLMの思想は中立ではない

学習データの偏り、人間によるアラインメント作業でどうしても偏りが生じるのでしょう。ひょっとしたら、雇用されているメンバーひいては会社のカルチャーによる偏りが反映されているのかも。
https://x.com/K_Ishi_AI/status/1850718600296112437

「Felo」とその活用法

先日紹介した日本発AIサーチのFelo、使いやすいし速いです。でも紹介noteが有料なのはどうかと思う。
https://note.com/petit_hiroto/n/nc2872392568c

欠損値処理に関する備忘録

安心と信頼のTJOさんの記事。統計と機械学習で欠損値処理に対するスタンスが異なるというのは面白い視点でした。分析し説明することが目的の統計と、ブラックボックスでもいいから精度のよいモデルを作ることが目的の機械学習の差、という感じでしょうか。
https://tjo.hatenablog.com/entry/2024/10/28/224714

RAGの「文脈が消える問題」を解決する「LongRAG」

毎度おなじみナレッジセンスさんのRAGブログ。こういう細かい改善手法の論文がたくさん出てるんですが、なんというかマイナーチェンジの量産に見えちゃうんですよね……。
https://zenn.dev/knowledgesense/articles/e0ade68c265200

AIのもたらす深刻なリスクとその歴史的背景概要

いくぶん前の記事ですが、面白かったので。各所で指摘されているAIのリスクについて、平易で直感的な表現で説明しています。「知能」「意識」「目標」は別であり、SFのように超知能が意識を持ち人類を滅ぼすに至らなくとも、「十分に高度な知能を持つAIの目標設計をミスる」ことにより社会が危機にさらされるリスクが大きいという話は分かりやすいです。
https://x.com/AI_Marika1018/status/1851200727131308056

o1によるテストデータ生成

これはいいですね、複雑な論理の組み合わせが必要なので、人間でも漏れ抜けが出やすい。o1が得意とするタスクであり、すぐ導入できそう。
https://x.com/yamazombie1/status/1851933546958721120

LangGraphとAgentを使って最新のトレンドを考慮した広告文生成をやってみる

エージェント実装の入門編としてちょうどいい感じです。タスクの分割やデータの受け渡しなど、基本的なポイントが押さえられるかと。
https://qiita.com/m__k/items/3dcbbf8fa0c84bc32c1f

WEB開発系話題

ElastiCacheでValkeyがサポートされたけど何が良いのか検証してみた

Valkey、寡聞にして知らなったのですが、RedisをforkしたOSSとのこと。Redisがクラウドサービス上での提供を制限したことから、各社がValkeyへの対応を表明しているそうです。Redisに比べて安く、高速になるもよう。
https://ca-srg.dev/6d99a5ff263346cbaebec589ee744db1

アジャイルを支えるテストアーキテクチャ設計

アジャイルで品質担保のために必須となるテストを、アーキテクチャとして考える基本の紹介。実例というよりは概念のおさらい、という感じでしょうか。
https://speakerdeck.com/goyoki/test-architecting-for-agile

APIテスト自動化の勘所

こちらは実例寄りのポイントを紹介。
https://speakerdeck.com/yokawasa/the-key-to-api-test-automation

その他一般テック話題

ログ出力のための print と import logging はやめてほしい

かなり前の記事ですが、確かになぁと思ったので。Pythonで機械学習やるときにも意識したいところです。
https://qiita.com/amedama/items/b856b2f30c2f38665701

iOS 18 の新機能 Control Widgets 実装時の注意点

正直、最近のiPhoneはアイコンと機能だらけで、かつてのガラケーに近づいている気がしています。
https://hack.nikkei.com/blog/ios18-control/

We're forking Flutter. This is why.

GoogleがFlutterのリポジトリをforkしてFlutter+というべきFlockを作ったとのこと。Google自体がAIにリソースを投入しており、Flutterはその開発者コミュニティの規模に対して、Google内部でのリソースが見合っていないそうです。オワコンになるわけではないが、ちょっと先行きが不透明、という感じでしょうか。詳しくは解説記事をご覧ください。
https://flutterfoundation.dev/blog/posts/we-are-forking-flutter-this-is-why/
(解説)
https://zenn.dev/chooyan/articles/c4e27945b7a883

ある企業がハイブリッドワークの A/B テストを実施

世界で4万人の従業員を抱える企業が、従業員をフル出社とハイブリッドにランダム割り付けしてA/Bテストを実施(フル出社とフルリモートではないことに注意)。その結果、生産性はほぼ変わらず、ハイブリッドワークの離職率が大幅に下がったとのこと。
https://hbr.org/2024/10/one-company-a-b-tested-hybrid-work-heres-what-they-found

なぜ、ソフトウェアプロジェクトは人数を増やしても上手くいかないのか

すごく昔の記事ですが、ソフトウェア開発プロセスを数理的に解析したデータを初めて見たのでご紹介。工期は工数の三乗根に比例するのか……。「人を10倍にすれば工期は10分の1になるだろ!」と言われたらこれをぶつけたい気持ち。
https://qiita.com/hirokidaichi/items/7f7f7881acba9302301f

CareNet Engineers

Discussion