💡

[2024年5月30日]週刊AI・WEB開発関連記事まとめ

2024/05/30に公開

こんにちは、Kaiです。
破壊的なニュースがないと思ったら、小さ目のニュースがたくさんあった週でした。
それにしても、Microsoftの存在感が日に日に増しているように思います。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

Copilot: Microsoft Build 2024

Build2024の前日に、Copilot中心のMicrosoftのプレスイベントが行われました。
発表内容の概略はこちらに詳しいです。
Microsoftは長らくOSとソフトウェアの会社と認識されていましたが、ナデラCEOのもと、「人類の伴走者(Copilot)」という立ち位置を再定義したように感じています。
これはOS、ソフトウェア、SaaS、IaaSなど全てを包含する概念で、AIがそれに横串の概念として入っていくということなのでしょう。
https://www.watch.impress.co.jp/docs/news/1593239.html

そしてこちらはMicrosoft Build 2024本番のレポートになります。
ちょっと内容が多すぎるので追い切れてません……。
https://memo.tyoshida.me/others/microsoft-build-2024-keynote-japanaese-recap/

Phi3: Phi-3-medium-4k-instruct

Microsoft発のオープンLLM、Phi3がアップデートされました。
評判を見ているとめちゃくちゃ強力なようで、手が空いた時に試してみたいですね。
https://huggingface.co/microsoft/Phi-3-medium-4k-instruct

その他AI系話題

AlphaFold3の中身の日本語解説

先日発表されたタンパク質構造予測モデルAlphaFold3の解説記事です。
専門外なので詳細はさっぱりですが、拡散モデル、Attentionの汎用性を強く感じる内容です。
https://zenn.dev/tonets/articles/dd8c3855eadb2b

最近ローカルLLMがアツいらしい

よくまとまった記事でした。
当社でもOllamaを使ってローカルLLMを試しており、プロプライエタリなモデルとは異なる可能性を感じています。
https://soysoftware.sakura.ne.jp/archives/3903

ベクトルデータの容量を96%削減するBinary Embedding

RAGで使うベクトルデータを1bitに圧縮する手法。
binary embedding with rerankであれば、検証の範囲で精度劣化はなかったとのこと。
確かに基盤モデルならまだしも、RAGの知識ベクトルが32bit floatである必然性はあるのだろうかと思っていたので、今後も研究が行われそうです。
https://zenn.dev/knowledgesense/articles/346183afdf750e

PFE が開発中の基盤モデル PLaMo-100B

先日、Stockmarkが100Bモデルを発表していましたが、こちらも気になる。
https://www.pelements.jp/news/pr20240522/PFE_PLaMo-100B_ja.pdf

コーディング支援AI「GitHub Copilot」を搭載した「Visual Studio 2022」v17.10が一般公開

最近思うんですが、企業のクローズドな環境下での開発と、個人のオープンな環境下での開発で、速度にものすごく差が出てくるのではないでしょうか。
https://forest.watch.impress.co.jp/docs/news/1593475.html

Microsoftが医療特化のAIモデル発表、マルチモーダルをがん診断に応用へ

Microsoft、本当に怒涛の勢いですね。
基盤モデル自体の競争にはそれほど参加していないものの、周辺領域を全て押さえる勢いです。
https://xtech.nikkei.com/atcl/nxt/news/24/00836/

Pandora: A World Model

Pandoraと名付けられた、新しいマルチモーダルモデルの紹介。
Pandoraは「General World Model」とされており、写真に指示を出すことで次のシーンを描くことができるとのこと。これが「世界を理解している」ということで、General World Modelだそうです。
(例えば、写真を与え「爆発を起こせ」と指示したら爆発が起きる動画が生成される)
https://world-model.maitrix.org/

The gap between closed-source and open-weight models is closing in terms of MMLU

オープンな基盤モデルとクローズドな基盤モデルの性能差が急速に接近しているとのこと。
次の破壊的リープが起きなければ、追いついてしまうかもしれません。
https://x.com/maximelabonne/status/1793947985430057288

(関連)Predibase Fine-Tuning Index Ranks Best Open-source LLMs for Common Task Types
オープンモデルを特化タスクでファインチューニングするとGPT-4をパフォーマンスで上回り、コストも安くなる。
https://www.businesswire.com/news/home/20240521521660/en/Predibase-Fine-Tuning-Index-Ranks-Best-Open-source-LLMs-for-Common-Task-Types

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に

作曲AIとして凄まじい完成度を誇っていたSunoがさらに進化。
もう簡単なBGMとかは全部これでいいんじゃないかな……(権利関係の問題はあれど)。
https://www.techno-edge.net/article/2024/05/25/3401.html

NTT開発の生成AI「ツヅミ」、マイクロソフトが提供開始へ…チャットGPT並みの日本語能力

またマイクロソフトか……つよい。
https://www.yomiuri.co.jp/science/20240522-OYT1T50098/

RAGで文書を1トークンに圧縮する「xRAG」について

RAGで関連文書を取ってきたとき、元の形式で与えるとデータ量が膨大になることがあります。
この手法は、関連文書をまとめて1つのベクトルに変換する新しい変換器の提案論文解説で、1トークンでRAGを実現するというものです。
まだ完全なものとは言えませんが、アイデア自体はとても面白いです。
https://zenn.dev/knowledgesense/articles/2b6aa64f27ea89

WEB開発系話題

無料で商用にも使える日本の郵便番号APIをリリースしました

これは嬉しい!データ形式も使いやすそう!
https://zenn.dev/ttskch/articles/309423d26a1aaa

Googleのランキングアルゴリズムが漏洩

事実だとすれば過去最大規模の漏洩だそうです。
これまで公式には否定されていた数々のアルゴリズムに関する言及が。
https://ipullrank.com/google-algo-leak
https://searchengineland.com/google-search-document-leak-ranking-442617
(日本語解説ポスト)
https://x.com/kenn/status/1795500175487832491

その他一般テック話題

NumPy 2.0⁠⁠、6/16にリリース 初のメジャーバージョンアップでABI⁠⁠、APIに大幅な変更

うーん、社内資産がそのまま動けばいいんですが……。
特にNumPy C APIで1系向けにビルドしたバイナリが動かなくなるというのは結構痛いですね。
https://gihyo.jp/article/2024/05/numpy-2.0

CareNet Engineers

Discussion