[2024年9月6日]週刊AI・WEB開発関連記事まとめ
こんにちは、Kaiです。
今週はBig Techの動きがあまりなかったですね。
先日ご紹介した通り、次世代モデルは安全保障上の問題になっているようですので、これまでのように作った!公開!といかなくなってきているのかもしれません。
Sakana AIはNvidiaからの資金調達を発表。
正直投資したい会社はいくらでもあると思いますが、NvidiaのGPUを買うわけですので、資金が循環しているだけでは……という気もしてきます。
一方、従来のプレイヤー以外から、急にベンチマークスコアの高いモデルが続々と発表されています。競争が激化するとともに、次世代モデルは「できること」の幅を大きく広げないと、差別化が難しいように思われます。
ではトピックまとめいってみましょう。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Big Tech AIサービス
NVIDIA、サカナAIの大株主に AI半導体供給を支援
Nvidiaが出資したお金でNvidiaのGPUを買うというマッチポンプでは……?
OpenAI、次世代モデルは月額30万円程度のサブスクを検討か
まだ噂レベルですが、投資を考えるとそれくらいでないとペイしないのかもしれません。問題は、それで何が出来るか、ってことですね。AGIとして人ひとりを雇うくらいの結果が出るなら、事業活用にはアリ。
その他AI系話題
突如世界最強のオープンLLM「Reflection 70B」が登場
Claude3.5Sonnetに匹敵する、もしくは上回るベンチマークとのこと。本当に???という気持ですが、公開されているのでこれからどんどん検証されるはず。
突如Claude3.5Sonnet越えの「Phind-405B」が登場
いや、前の発表の1時間後ですよ?新モデルラッシュ?
NewsPicksに推薦システムを本番導入する上で一番優先すべきだったこと
めちゃくちゃ参考になりました。「オフライン評価の結果はオンライン評価の結果と相関がない(つまり役に立たない)」「オンライン評価を高速・気軽に回すことが正解」「そのための基盤を整備することが一番重要であった」という内容です。
LightGBMの特徴量が分岐にどう使われているかの可視化
モデルの解釈性は、ビジネス上重要になることもあります。SHAP値などが用いられますが、分岐点での変数活用が見えるのも一助になりますね。
論文中の図を検出するモデル
試してないですが、論文以外のPDFにも汎用的に使えるといいな……。
RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う
流行っているGraphRAGと一般的なベクトルRAGを組み合わせるハイブリッド手法。結局、知識をどういう形で表現し渡すべきかという話で、一つの研究分野になっていますね。
101 Gen AI Cheat Sheets
生成AIに関する膨大な量のチートシート集。初心者向けのものから、かなりの応用編まで。
日本語医療LLM評価ベンチマークの構築と性能分析
NAIST荒牧先生の研究室より。医療に特化したベンチマークタスクと、それに基づくLLM性能評価のまとめ。固有表現抽出のタスクではGPT-4oよりもむしろ軽量ローカルLLMの方が性能が高い場合があるというのは面白いです。院内情報の一部はローカル処理できるかも。
検索に特化した日本語文埋め込みモデル GLuCoSE v2
PKSHAより商用利用可ライセンスで公開。日本語タスクなのにマルチリンガルの重いモデルを使わざるを得なかったので良さそうです。
(解説記事)WEB開発系話題
Prisma TypedSQL をクエリビルダとしてのみ運用する
ORMとして使うのではなく、ナマのクエリとパラメータを出力するミドルウェア的な使い方をすることで、様々な環境でPrismaを導入できるというお話。
技術選定の成功 2年間を振り返る TypeScript,Hono,Nest.js,React,GraphQL
一部で炎上した某記事は消えてしまいましたが、こちらはとても納得感があります。こういう実体験に基づくベストプラクティスはたくさん共有されて欲しい。あと単純に内容が面白いです。
Web 標準と、その限界
Web標準に従うフロントエンド言語であったJavascriptがバックエンド開発に広がっていることで、拡張された方言が乱立しているというお話。
SQLに対するバックエンドのアプローチ比較、そしてSafeQLの紹介
SafeQL、よく分かっていなかったので大変ありがたいまとめでした。
Chrome DevToolsを使いこなしてフロントエンド開発を加速させる
結構使ってるつもりでしたが、知らない機能がたくさんありました……すごく便利。
その他一般テック話題
零細企業を買収した後に行ったDXとは呼べないDX
純粋に記事として面白かったです。そう、日本には中小企業が極めて多く、こういうオペレーションをしているケースが大半なのではないかと思います。
こどおじがAndroidアプリ作ってたらGoogleに子供部屋を追い出された話
タイトルはアレですが、個人開発者として何も考えずに登録すると、住所が全世界に公開されてしまうという恐ろしいお話。
Discussion