💡

[2024年9月6日]週刊AI・WEB開発関連記事まとめ

2024/09/06に公開

こんにちは、Kaiです。
今週はBig Techの動きがあまりなかったですね。
先日ご紹介した通り、次世代モデルは安全保障上の問題になっているようですので、これまでのように作った!公開!といかなくなってきているのかもしれません。

Sakana AIはNvidiaからの資金調達を発表。
正直投資したい会社はいくらでもあると思いますが、NvidiaのGPUを買うわけですので、資金が循環しているだけでは……という気もしてきます。

一方、従来のプレイヤー以外から、急にベンチマークスコアの高いモデルが続々と発表されています。競争が激化するとともに、次世代モデルは「できること」の幅を大きく広げないと、差別化が難しいように思われます。

ではトピックまとめいってみましょう。

注意事項

  • 直近収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

Big Tech AIサービス

NVIDIA、サカナAIの大株主に AI半導体供給を支援

Nvidiaが出資したお金でNvidiaのGPUを買うというマッチポンプでは……?
https://www.nikkei.com/article/DGXZQOUC295HA0Z20C24A8000000/

OpenAI、次世代モデルは月額30万円程度のサブスクを検討か

まだ噂レベルですが、投資を考えるとそれくらいでないとペイしないのかもしれません。問題は、それで何が出来るか、ってことですね。AGIとして人ひとりを雇うくらいの結果が出るなら、事業活用にはアリ。
https://x.com/ctgptlb/status/1831715486641615280

その他AI系話題

突如世界最強のオープンLLM「Reflection 70B」が登場

Claude3.5Sonnetに匹敵する、もしくは上回るベンチマークとのこと。本当に???という気持ですが、公開されているのでこれからどんどん検証されるはず。
https://x.com/mattshumer_/status/1831767014341538166

突如Claude3.5Sonnet越えの「Phind-405B」が登場

いや、前の発表の1時間後ですよ?新モデルラッシュ?
https://x.com/phindsearch/status/1831785318833647824

NewsPicksに推薦システムを本番導入する上で一番優先すべきだったこと

めちゃくちゃ参考になりました。「オフライン評価の結果はオンライン評価の結果と相関がない(つまり役に立たない)」「オンライン評価を高速・気軽に回すことが正解」「そのための基盤を整備することが一番重要であった」という内容です。
https://tech.uzabase.com/entry/2024/08/29/161828

LightGBMの特徴量が分岐にどう使われているかの可視化

モデルの解釈性は、ビジネス上重要になることもあります。SHAP値などが用いられますが、分岐点での変数活用が見えるのも一助になりますね。
https://x.com/abe_tetsu/status/1830165794367664440

論文中の図を検出するモデル

試してないですが、論文以外のPDFにも汎用的に使えるといいな……。
https://x.com/JiroHarapeko/status/1830742550720004256

RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う

流行っているGraphRAGと一般的なベクトルRAGを組み合わせるハイブリッド手法。結局、知識をどういう形で表現し渡すべきかという話で、一つの研究分野になっていますね。
https://zenn.dev/knowledgesense/articles/077ad1ab0f9ff6

101 Gen AI Cheat Sheets

生成AIに関する膨大な量のチートシート集。初心者向けのものから、かなりの応用編まで。
https://medium.com/@anushka.datascoop/101-gen-ai-cheat-sheets-831e17f1e6a7

日本語医療LLM評価ベンチマークの構築と性能分析

NAIST荒牧先生の研究室より。医療に特化したベンチマークタスクと、それに基づくLLM性能評価のまとめ。固有表現抽出のタスクではGPT-4oよりもむしろ軽量ローカルLLMの方が性能が高い場合があるというのは面白いです。院内情報の一部はローカル処理できるかも。
https://speakerdeck.com/fta98/ri-ben-yu-yi-liao-llmping-jia-bentimakunogou-zhu-toxing-neng-fen-xi

検索に特化した日本語文埋め込みモデル GLuCoSE v2

PKSHAより商用利用可ライセンスで公開。日本語タスクなのにマルチリンガルの重いモデルを使わざるを得なかったので良さそうです。
https://huggingface.co/pkshatech/GLuCoSE-base-ja-v2
(解説記事)
https://note.com/schroneko/n/n8e36e2b8cb10

WEB開発系話題

Prisma TypedSQL をクエリビルダとしてのみ運用する

ORMとして使うのではなく、ナマのクエリとパラメータを出力するミドルウェア的な使い方をすることで、様々な環境でPrismaを導入できるというお話。
https://zenn.dev/mizchi/articles/prisma-as-query-builder-only

技術選定の成功 2年間を振り返る TypeScript,Hono,Nest.js,React,GraphQL

一部で炎上した某記事は消えてしまいましたが、こちらはとても納得感があります。こういう実体験に基づくベストプラクティスはたくさん共有されて欲しい。あと単純に内容が面白いです。
https://zenn.dev/uncode_jp/articles/4d2bd36aa03fc8

Web 標準と、その限界

Web標準に従うフロントエンド言語であったJavascriptがバックエンド開発に広がっていることで、拡張された方言が乱立しているというお話。
https://zenn.dev/nakasyou/articles/webstandard_and_runtimes

SQLに対するバックエンドのアプローチ比較、そしてSafeQLの紹介

SafeQL、よく分かっていなかったので大変ありがたいまとめでした。
https://zenn.dev/calloc134/articles/4a8c1af0eb5aae

Chrome DevToolsを使いこなしてフロントエンド開発を加速させる

結構使ってるつもりでしたが、知らない機能がたくさんありました……すごく便利。
https://zenn.dev/praha/articles/1b5097407ee6b4

その他一般テック話題

零細企業を買収した後に行ったDXとは呼べないDX

純粋に記事として面白かったです。そう、日本には中小企業が極めて多く、こういうオペレーションをしているケースが大半なのではないかと思います。
https://note.com/reisaikigyou_ma/n/n052860974e26

こどおじがAndroidアプリ作ってたらGoogleに子供部屋を追い出された話

タイトルはアレですが、個人開発者として何も考えずに登録すると、住所が全世界に公開されてしまうという恐ろしいお話。
https://qiita.com/votepurchase/items/96d83796dd41a59bc93c

CareNet Engineers

Discussion