💡

[2024年10月25日] Claudeが続々新機能を発表 (週刊AI)

Kai

2024/10/25に公開

こんにちは、Kaiです。

Claudeが色々と弾を出してきました。

Computer useは見た目のインパクトは大きいですが、コンセプト自体はマルチモーダルが実現された時点で提案され、初期実装を提示している個人開発者・スタートアップもありました。
驚き屋さんたちは「これで人間は不要に！社会が変わる！」とか言っていますが、セキュリティ対策面でも実用面でも、まだまだ自動車でいうコンセプトモデルの域を出ないものと感じます。
個人的には、むしろその後発表されたAnalysis toolの方が注目ですね。ChatGPTの数少ない優位性であったCode Interpreterに類するものであり、Artifactsの表現力と組み合わさると、これまでよりも使い道の幅が広がると思われます。
では今週のトピックスです。
注意事項
直近収集したAIおよびWeb系の記事やポストが中心になります
私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
業務状況次第でお休みしたり、掲載タイミングが変わったりします

 Big Tech AIサービス
 Anthropic: ClaudeにComputer use機能搭載動画を含めてインパクトは強いです。PC画面を画像として入力し、適切な処理を判断してデバイスへの入力に変換している感じですね。ピクセル単位の制御が出来ているのは確かにすごい。

ただ、先述の通りまだ「コンセプトモデル」の域は出ないかなという印象ではあります。

https://www.anthropic.com/news/developing-computer-use
（解説記事）

https://note.com/it_navi/n/nf09f9f93d3aa

https://note.com/npaka/n/nd78c6b3e8733
（検証記事）

https://note.com/npaka/n/n6d01ec399cb5

https://note.com/yuki_tech/n/n8c37ef724026

 Anthropic: Claudeにコード実行機能搭載ChatGPTのCode Interpreter機能ですね。ChatGPTにもやらせたクラスター分析を実行してみましたが、まだまだ動作精度が低いかな？という印象です。

特に全ての処理を一度に実施しようとして、出力トークンを食いつぶしている気がします。分割処理を適切に指示した方が良さそう。

https://x.com/AnthropicAI/status/1849466471556038752

 Google: Gemini for Google Workspaceが日本語対応おっ！と思いましたが、実際に触っている方の検証を見るとまだ業務を劇的に改善するという段階ではなさそうですね……。

https://www.itmedia.co.jp/aiplus/articles/2410/17/news176.html

https://blog.cloudnative.co.jp/?p=24914

 Perplexity: 社内ナレッジ検索機能が追加最近Gensparkや後述のFeloに追い越されている感がありましたが、こちらに舵を切るならまぁ納得です。ただその戦場はGoogleやMicrosoftが聳え立っているのでどうなることやら……？

https://www.perplexity.ai/ja/hub/blog/introducing-internal-knowledge-search-and-spaces

 その他AI系話題
 gradient accumulation stepsのバグを理解するHugging Faceに上がっていた、GPUメモリを節約するための基本的コードにバグがあったとのこと。Transformerそのものにもバグが紛れ込んでいたことになります。このレベルの基本コードにバグがあったというのはちょっと驚き。全てのモデルの性能が少し上がるかも。

https://zenn.dev/dalab/articles/76c7bf20547c1f

 2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊学習ツリーが可視化されているのがとてもよいです。何冊かは私も読んでいますが、制覇するのはかなり大変そう……。

https://qiita.com/aokikenichi/items/0e064ecd3824fab9424d

 Felo: 日本語ベースのAI検索エンジンPerplexity、Gensparkの対抗馬として突如名前が挙がってきました。日本の企業で、日本語ネイティブの検索が可能。少し使ってみましたが、非常に高速なのが特徴ですね。

https://x.com/felo_ai/status/1847445977424416818

 Bitnetの実装が公開以前記事でも取り上げた、1ビット量子化を行うBitnetのソースコードがMSによりオープン化。この領域の研究が加速しそうです。

https://github.com/microsoft/BitNet

 Differential TransformerMicrosoftから、Transformer自体の新しいアーキテクチャ提案。差分に注目したAttentionを導入することで、ハルシネーションを大幅に減らせるようです。Transformerの次世代アーキテクチャは色々研究されていますがまだ決定版はないと思いますので、注目ですね。

https://www.microsoft.com/en-us/research/publication/differential-transformer/

 LLMOps : ΔMLOpsすごくいいスライド。MLOpsの基本をおさらいしたあと、LLMOpsに拡張する際の差分、どう手を打つべきかの検討までを網羅した内容です。

https://speakerdeck.com/shuntaito/llmops-dmlops

 LLMの重みでなんやかんや試してみる-①埋め込み層編-embeddingsはあまり生データを触ることがないので、こうやって手を動かして検証してみると裏側で動いているロジックが直感的に理解しやすいですね。

https://zenn.dev/yuki127/articles/134f3e12c7d0a6

 Geminiを使ったらKaggle初挑戦、参加期間10日間でも5位入賞できたので手法をすべて書くKaggleでもどんどんLLMが使われていて、昔ほどハードルが高くなくなっているようです。ただ何をしているかが分かる程度の素養は必要そうですが。

https://qiita.com/yukky_memo/items/6e1c7fa08b9b91278886

 商品の補完関係に注目した推薦システムを考えてみませんか？商品には代替関係（iOSのスマホとAndroidのスマホなど）と、補完関係（スマホとスマホケースなど）があり、それぞれレコメンドすべき文脈が異なるため、アルゴリズムに反映させるべきというお話。筆者自身の論文の解説も兼ねています。

https://qiita.com/Kai238/items/840fce6e552814e0c2e4

 生成AIの組織導入成功を阻む「4つの罠」とその対処法実際に導入支援をしている梶谷さんの記事なので説得力があります。確かに、いずれの問題もハードルになりそう。

https://note.com/kajiken0630/n/na617fd31155e

 WEB開発系話題
 10年続くサービスのデータを1日未満のメンテナンスウィンドウで安全に移管する普通にやると数週間かかる膨大なデータのインフラ移行を、1日未満の停止でどう実現するかというお話。段階的移行なわけですが、createdやupdated、論理削除などが整合性を持って分割する際重要だったとのこと。いろいろ議論はありますが、私も付けたい派なんですよね。

https://speakerdeck.com/masawada/10nian-sok-kusabisunodetawo1ri-wei-man-nomentenansuuindoudean-quan-niyi-guan-suru

 長期運用を支えるみてねの継続的なコスト最適化の取り組み主にAWSでコスト最適化を継続的に行うために実施していることのまとめ。

https://speakerdeck.com/kimuson13/chang-qi-yun-yong-wozhi-erumitenenoji-sok-de-nakosutozui-shi-hua-noqu-rizu-mi

 【第1回/初心者向け】初めての負荷テスト！ Distributed Load Testing on AWS を使ってみた初心者の方が書かれたということですが、しっかりまとまっていて復習にも分かりやすいかと思います。

https://blog.serverworks.co.jp/2024/10/17/130541

 KDD論文読み会2024: False Positive in A/B Testsだいぶ難しい……。A/Bテストにおいて、p値の設定がポイントであることは何となく分かりました。

https://speakerdeck.com/ryotoitoi/b-tests

 その他一般テック話題
 ロジカルなUIデザイン 考え方と関わり方UIデザインを論理で説明する、というお話。「左の情報は荒く、右の情報は細かい」「上の情報は荒く、下の情報は細かい」などは端的で非常に分かりやすいです。

https://speakerdeck.com/usagimaru/a-logical-approach-to-ui-design-how-to-think-and-engage

CareNet EngineersPublication

株式会社ケアネットのエンジニアブログです。CareNetサービスの技術情報を中心に記事を投稿しております。各記事の内容は個人の意見であり、企業を代表するものではございません。

[2024年10月25日] Claudeが続々新機能を発表 (週刊AI)

Big Tech AIサービス

Anthropic: ClaudeにComputer use機能搭載

Anthropic: Claudeにコード実行機能搭載

Google: Gemini for Google Workspaceが日本語対応

Perplexity: 社内ナレッジ検索機能が追加

その他AI系話題

gradient accumulation stepsのバグを理解する

2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊

Felo: 日本語ベースのAI検索エンジン

Bitnetの実装が公開

Differential Transformer

LLMOps : ΔMLOps

LLMの重みでなんやかんや試してみる-①埋め込み層編-

Geminiを使ったらKaggle初挑戦、参加期間10日間でも5位入賞できたので手法をすべて書く

商品の補完関係に注目した推薦システムを考えてみませんか？

生成AIの組織導入成功を阻む「4つの罠」とその対処法

WEB開発系話題

10年続くサービスのデータを1日未満のメンテナンスウィンドウで安全に移管する

長期運用を支えるみてねの継続的なコスト最適化の取り組み

【第1回/初心者向け】初めての負荷テスト！ Distributed Load Testing on AWS を使ってみた

KDD論文読み会2024: False Positive in A/B Tests

その他一般テック話題

ロジカルなUIデザイン考え方と関わり方

Discussion

Big Tech AIサービス

Anthropic: ClaudeにComputer use機能搭載

Anthropic: Claudeにコード実行機能搭載

Google: Gemini for Google Workspaceが日本語対応

Perplexity: 社内ナレッジ検索機能が追加

その他AI系話題

gradient accumulation stepsのバグを理解する

2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊

Felo: 日本語ベースのAI検索エンジン

Bitnetの実装が公開

Differential Transformer

LLMOps : ΔMLOps

LLMの重みでなんやかんや試してみる-①埋め込み層編-

Geminiを使ったらKaggle初挑戦、参加期間10日間でも5位入賞できたので手法をすべて書く

商品の補完関係に注目した推薦システムを考えてみませんか？

生成AIの組織導入成功を阻む「4つの罠」とその対処法

WEB開発系話題

10年続くサービスのデータを1日未満のメンテナンスウィンドウで安全に移管する

長期運用を支えるみてねの継続的なコスト最適化の取り組み

【第1回/初心者向け】初めての負荷テスト！ Distributed Load Testing on AWS を使ってみた

KDD論文読み会2024: False Positive in A/B Tests

その他一般テック話題

ロジカルなUIデザイン 考え方と関わり方

Discussion

ロジカルなUIデザイン考え方と関わり方