[2024年5月30日]週刊AI・WEB開発関連記事まとめ
こんにちは、Kaiです。
破壊的なニュースがないと思ったら、小さ目のニュースがたくさんあった週でした。
それにしても、Microsoftの存在感が日に日に増しているように思います。
注意事項
- 先週収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
特定AIサービス
Copilot: Microsoft Build 2024
Build2024の前日に、Copilot中心のMicrosoftのプレスイベントが行われました。
発表内容の概略はこちらに詳しいです。
Microsoftは長らくOSとソフトウェアの会社と認識されていましたが、ナデラCEOのもと、「人類の伴走者(Copilot)」という立ち位置を再定義したように感じています。
これはOS、ソフトウェア、SaaS、IaaSなど全てを包含する概念で、AIがそれに横串の概念として入っていくということなのでしょう。
そしてこちらはMicrosoft Build 2024本番のレポートになります。
ちょっと内容が多すぎるので追い切れてません……。
Phi3: Phi-3-medium-4k-instruct
Microsoft発のオープンLLM、Phi3がアップデートされました。
評判を見ているとめちゃくちゃ強力なようで、手が空いた時に試してみたいですね。
その他AI系話題
AlphaFold3の中身の日本語解説
先日発表されたタンパク質構造予測モデルAlphaFold3の解説記事です。
専門外なので詳細はさっぱりですが、拡散モデル、Attentionの汎用性を強く感じる内容です。
最近ローカルLLMがアツいらしい
よくまとまった記事でした。
当社でもOllamaを使ってローカルLLMを試しており、プロプライエタリなモデルとは異なる可能性を感じています。
ベクトルデータの容量を96%削減するBinary Embedding
RAGで使うベクトルデータを1bitに圧縮する手法。
binary embedding with rerankであれば、検証の範囲で精度劣化はなかったとのこと。
確かに基盤モデルならまだしも、RAGの知識ベクトルが32bit floatである必然性はあるのだろうかと思っていたので、今後も研究が行われそうです。
PFE が開発中の基盤モデル PLaMo-100B
先日、Stockmarkが100Bモデルを発表していましたが、こちらも気になる。
コーディング支援AI「GitHub Copilot」を搭載した「Visual Studio 2022」v17.10が一般公開
最近思うんですが、企業のクローズドな環境下での開発と、個人のオープンな環境下での開発で、速度にものすごく差が出てくるのではないでしょうか。
Microsoftが医療特化のAIモデル発表、マルチモーダルをがん診断に応用へ
Microsoft、本当に怒涛の勢いですね。
基盤モデル自体の競争にはそれほど参加していないものの、周辺領域を全て押さえる勢いです。
Pandora: A World Model
Pandoraと名付けられた、新しいマルチモーダルモデルの紹介。
Pandoraは「General World Model」とされており、写真に指示を出すことで次のシーンを描くことができるとのこと。これが「世界を理解している」ということで、General World Modelだそうです。
(例えば、写真を与え「爆発を起こせ」と指示したら爆発が起きる動画が生成される)
The gap between closed-source and open-weight models is closing in terms of MMLU
オープンな基盤モデルとクローズドな基盤モデルの性能差が急速に接近しているとのこと。
次の破壊的リープが起きなければ、追いついてしまうかもしれません。
(関連)Predibase Fine-Tuning Index Ranks Best Open-source LLMs for Common Task Types
オープンモデルを特化タスクでファインチューニングするとGPT-4をパフォーマンスで上回り、コストも安くなる。
AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に
作曲AIとして凄まじい完成度を誇っていたSunoがさらに進化。
もう簡単なBGMとかは全部これでいいんじゃないかな……(権利関係の問題はあれど)。
NTT開発の生成AI「ツヅミ」、マイクロソフトが提供開始へ…チャットGPT並みの日本語能力
またマイクロソフトか……つよい。
RAGで文書を1トークンに圧縮する「xRAG」について
RAGで関連文書を取ってきたとき、元の形式で与えるとデータ量が膨大になることがあります。
この手法は、関連文書をまとめて1つのベクトルに変換する新しい変換器の提案論文解説で、1トークンでRAGを実現するというものです。
まだ完全なものとは言えませんが、アイデア自体はとても面白いです。
WEB開発系話題
無料で商用にも使える日本の郵便番号APIをリリースしました
これは嬉しい!データ形式も使いやすそう!
Googleのランキングアルゴリズムが漏洩
事実だとすれば過去最大規模の漏洩だそうです。
これまで公式には否定されていた数々のアルゴリズムに関する言及が。
(日本語解説ポスト)
その他一般テック話題
NumPy 2.0、6/16にリリース 初のメジャーバージョンアップでABI、APIに大幅な変更
うーん、社内資産がそのまま動けばいいんですが……。
特にNumPy C APIで1系向けにビルドしたバイナリが動かなくなるというのは結構痛いですね。
Discussion