[2024年4月12日]週刊AI・WEB開発関連記事まとめ
こんにちは、Kaiです。週刊とはいったい。
実はちょっとプライベートがバタバタしておりまして、先週休みを取っておりました。
すっかり時間が空いてしまいましたが、ここ2週間のトピックスいってみたいと思います。
【注】長いです。
注意事項
- 先週収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
特定AIサービス
暗黙的にナーフされたらしい、と話題のClaude3。
そしてGPT-4-turboがアップデートされ、Claude3を上回ったとか。
毎週のようにリーダーボードが更新されるのは、ユーザとしては嬉しいですが
開発者としてはなかなか悩ましいところがあります。
GPT-4: GPT-4-turboのベンチマーク
GPT-4がClaude3からトップを奪還。「王の帰還」とか言ってる人もいましたね。
Claude3: Tool use (function calling)
Claude3にもFunction Calling機能が!用途が広がります。
Claude3: Advanced Data AnalysisをGoogle Colab上で実現したい
独自にコード実行できる、GPT-4の強みであるAdvanced Data Analysisを
Colab+Claude3という組み合わせで疑似的に実現したものです。
ChatGPT: You can now edit DALL·E images in ChatGPT across web, iOS, and Android.
ChatGPTで、DALL-Eの出力画像を再編集できるように!
Bedrock: Bedrockのナレッジベースに今週来たRAG精度向上アプデまとめ
最近はClaude統合によりBedrockの記事が増えてきています。
Anthropicへの投資も発表されましたし、Amazonも本気ですね。
Bedrock: 【速報】Agents for Amazon BedrockがCloudFormationに対応しました(ほぼ一撃)
GeminiがGoogleとの統合に強みがあるなら、BedrockはAWSとの親和性に強みが。
Bedrock: Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する
Bedrock経由でRAGを実装する実例の紹介。
Bedrock: 今さら聞けない!? AWSの生成AIサービス Amazon Bedrock入門!
よくまとまっていてBedrockの全容を理解しやすいスライドでした。
Command R+
ローカルで動くGPT-4に近い性能のLLMが公開されました。
とはいえ最高位のモデルを使うには、大容量ユニファイドメモリを備えたMac Studioが必須。
その他AI系話題
AIで商品名をクレンジングする、Llama2や、Google Cloud Gemini-proとVertex AIを活用した商品名の最適化
情報の正規化はいつも頭を悩ませるポイントです。
ECサイトの商品名という表記ゆれへの実際の対策例が紹介されており、参考になりました。
Generative AI for Everyoneから、古のNLPエンジニアの心に刺さったこと8選
少し前の記事。
全部面白いですが、「Augmentation vs Automation」は、LLMを使う上で全ての人が
読むべきだと思います。
「タスクを実行させる」のが基本中の基本。検索代わりに使うべきではない。
日本語最高性能のRerankerをリリース / そもそも Reranker とは?
文書検索や分類では、コサイン類似度だけで精度が出ないことも正直多いです。
リランク併用は定番手法ですが、日本語の高性能なものが使えるのは大変ありがたいです。
Adapted large language models can outperform medical experts in clinical text summarization
Nature掲載論文。
LLMをドメイン適応させることで、電子カルテの要約において医師ら専門家を上回る精度を達成。
RAGの新しい手法「CRAG」を3分で理解する
RAGはいずれ不要になる手法かもしれませんが、現時点ではそれ単独で分野になるほど
様々な試行錯誤が行われています。
RAGシステムにおいて「無関係な情報」を混ぜると精度が上がるという報告
正例と負例を用意するのは機械学習の定番ですが、RAGでもそうなんですかねぇ。
複数の LLM モデルを扱う上で直面した辛みまとめ
実際にAI企業が直面した「あるある」の実例を紹介してくれています。
WEB開発系話題
XZ Utilsの脆弱性 CVE-2024-3094 についてまとめてみた
WEB界隈ではこれが最大のホットトピックでしたね。
Linux向けの圧縮ユーティリティに、OSS貢献者がバックドアを仕込んでいたというお話です。
数年かけて信頼を築いていたようで、全てのOSSにおいて起きうる問題でしょう。
バックドアのコミット時間が他の活動と異なることから、アカウントごと買収されたのでは?
などという憶測も飛び交っていました。
Cloudflareに移行したら99%コスト削減できた話
CloudFront+S3の構成を移行、やはりAWSは大規模CDNとして使うと転送量がネックですね。
スロークエリを改善したらECSの負荷が爆下がりした話(TypeORM)
TypeORMのjoinまわりでよろしくない処理が行われる場合があるとのこと。
Anthropic Subprocessor List
Anthropicが自社で利用しているサービスのリスト。
最先端企業が導入しているイケてるサービスということで参考になります。
You don't need Node.js
Node.jsの代替先としてDenoとBunを紹介。
【AWS】障害時の調査事項まとめ ~ELB・ECS・RDS~
AWS障害発生時、何をメトリクスとして持っておいてどこから手を付けるべきかの知見。
脱・初心者!脱・マネコン!AWS CDKを使ってみませんか!?
いわゆるInfrastructure as Code (IaC)の実例紹介。
データベースの在庫の持ち方をビットで管理してる話
反応を見ていると、膨大な在庫データなどを扱うサービスでは割と一般的な実装のよう。
ビット演算で処理できるため、高速化・低容量化を実現可能。
その他一般テック話題
MySQL 101 for Developers
MySQLはこれ読めばほぼOK、というくらいよくまとまった資料でした。
ログラスを支える設計標準について
コーディング規約のように、設計思想や手順も標準化することのメリットを紹介。
OpenMetadataとdbtによるデータカタログの構築
不勉強ながらOpenMetadataを知らなかったので大変勉強になりました。
ディメンショナルモデルの実導入と実装について
スタースキーマとの違いがあまりイメージできませんでしたが、ほぼ同じ考え方かな?
これまでのキャリアとこれからMLエンジニアとしてどう動くか
MLエンジニアという職種がここ数年急激に拡大したがゆえに、今後のキャリアが
不透明だというのはご指摘通りですね。
そして、AIにどこまで仕事が代替され、人間はどこにフォーカスすべきか、大きな問題です。
Discussion