[2024年10月3日] OpenAIからリアルタイム音声会話API発表(週刊AI)
こんにちは、Kaiです。
OpenAIがDev Day開催に資金調達と、大きな動きがありました。Dev Dayはリアルタイム音声APIが提供されたのが最大のサプライズですね。o1のフルモデルが発表されるかと思いましたが、持ち越されました。
リアルタイム音声APIは、驚き屋の方々が「ビジネスが全て変わる!破壊される!」というようなことを言っていますが、実世界への導入はコスト面や安全性の検証を経て、年単位になるでしょう。ただ、人間と接する全てのタッチポイントで自動化の可能性が産まれたことは事実であり、大きなインパクトであることは間違いありません。
Anthropic、Googleも大きい発表を控えているという噂もある中、今週の振り返りいってみましょう。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Big Tech AIサービス
OpenAI: Dev Day
リアルタイムAPI(音声)、モデル蒸留(自動評価を含む)などが発表。新モデルはありませんでしたが、しばらく界隈はこれをいじることに集中しそうですね。
(Realtime API) (モデル蒸留)OpenAI: OpenAIが評価額約23兆円で約9700億円の資金調達を完了、Microsoft&NVIDIA&ソフトバンクがラウンドに参加か
ついこの間1兆円の資金調達をしたと思いましたが、またもや。23兆円は既にトヨタを除くすべての日本企業よりも評価額が高いことに。
Google: gemma-2-2b-jpn-it
gemmaの軽量日本語版きました!
その他AI系話題
Vercel v0関連
最近は何かプロトタイピングしたいと思ったらまずv0に作らせることにしています。イメージが一瞬で可視化されるのは大きなメリット。指示も割とちゃんと聞いてくれます。
【生成AI】Vercel V0でコード書かずにアプリ作ってみた
Vercel v0でフロントエンドを試してみた感想—これからの開発はどう変わる?
Hugging FaceのAIモデル数が100万を突破、直近では1ヶ月あたり10万以上
こんなん追えるわけないでしょ!!!
コード生成AI時代のテスト駆動開発
Autifyなどはテストケース、テストシナリオに注目していますが、実際のテストコードレベルでLLMを活用する方向性の示唆。大きい問題を一発生成しようとするのではなく、単一の課題レベルに分解して一つ一つ書かせると品質もカバレッジも高いものが出来るとのこと。
ナレッジグラフとLLMを活用したレコメンドシステム
レコメンドにナレッジグラフとLLMを導入する際、相補的に活用できるというお話。「妊婦用の靴」を検索したユーザの行動を分析することで、「すべりにくい靴」というナレッジグラフを作れるが、その際にLLMの持つ「常識」を加味することで情報の枝刈りができるという例などが挙げられています。
データサイエンスのフルサイクル開発を実現する機械学習パイプライン
ん、Prefectいいかも。確かにSagemakerは重厚長大な割に柔軟性がない印象です。
Evaluating the Effectiveness of LLM-Evaluators (aka LLM-as-Judge)
現時点でのLLM-as-Judgeの総説論文みたいな記事。めちゃくちゃボリュームがある。
富士通、大規模言語モデル「Takane」提供開始 「世界一の日本語性能を持つ」とうたう
富士通のプライベートクラウド上でクローズドなビジネス利用を想定するのでしょうけれど、どうしてもユーザコミュニティや進化速度の問題が付きまとうんですよね。
生成AIを活用したシステム開発の現状と展望 - 生成AI時代を見据えたシステム開発に向けて -
日本総研のレポート。さすがツールの網羅性や使いどころなどもきちんと検討しており、これを読めばとりあえず追いつける的な内容になってます。
Liquid Foundation Models (LFMs)
MITスピンオフ企業から、トランスフォーマーとは異なる独自アーキテクチャの基盤モデル。全てのパラメータ数で従来のモデルを上回ると主張。
Vertex AI Pipelinesを用いた機械学習パイプラインの実装
MLOpsの一部としてパイプライン構築の話が結構出てますね。前の記事とも関連。こちらはVertexを使うパターン。
WEB開発系話題
k6を活用した再現性・拡張性の高い負荷試験基盤の構築
最近は数百万単位の負荷試験からご無沙汰しているので、知識をアップデートする意味でも勉強になりました。
OSSでオブザーバビリティを実現する (Grafana Stack x OpenTelemetry on Kubernetes)
メトリクス、ログ、トレースを統一的に可視化する一つの構築例として。
FastAPIでのasync defとdefの使い分け
Pythonでここまでカリカリのチューニングはしたことないですね……。スレッドセーフにするのちょっと工夫がいりますし、ROIが得られるのは相当な負荷の場合になりそう。
【令和最新版】令和のWebスクレイピング(クロール)【ベストプラクティス】
あーこれはいいです。Amazonの令和最新版は信用できませんがこの記事はいいです。
コードレビューの時に気にしている、べからずTierリスト
Tierリスト形式ってのは一目で分かってゲーム性も感じるので面白いですね。
WEBアプリケーションにおけるAWS Lambdaを用いた大規模な非同期処理の実践
大量のメールを一斉配信する際、Lambda x SQSという構成で分散非同期処理を行った事例です。キューサイズや冪等性などの現実的な問題への対処ノウハウつき。
[要移行] AWS WAF Classic (v1)が2025年9月30日で終了します
うちのチームは問題ありませんが、注意喚起。
開発環境のデータベースでも本番環境相当のデータを使う
その他一般テック話題
エンジニアが長く働ける会社とは
おおむね同意です。ものを作る仕事というのは、作る人が裁量を持って楽しんでいるときに一番成果が出ると思っています。
住所正規化のデモ機能を作ったので、日本のヤバい住所を入力してみた
以前位置情報サービスを手掛けていた際に一端を垣間見ましたが、ヤバいんですよ。でもこちらの住所正規化サービスは存じませんでした。大量データを捌くときに使いどころありそう。
Discussion