💡

[2024年4月12日]週刊AI・WEB開発関連記事まとめ

2024/04/12に公開

こんにちは、Kaiです。週刊とはいったい。
実はちょっとプライベートがバタバタしておりまして、先週休みを取っておりました。
すっかり時間が空いてしまいましたが、ここ2週間のトピックスいってみたいと思います。
【注】長いです。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

暗黙的にナーフされたらしい、と話題のClaude3。
そしてGPT-4-turboがアップデートされ、Claude3を上回ったとか。
毎週のようにリーダーボードが更新されるのは、ユーザとしては嬉しいですが
開発者としてはなかなか悩ましいところがあります。

GPT-4: GPT-4-turboのベンチマーク

GPT-4がClaude3からトップを奪還。「王の帰還」とか言ってる人もいましたね。
https://x.com/hiro_gamo/status/1777970651388948529

Claude3: Tool use (function calling)

Claude3にもFunction Calling機能が!用途が広がります。
https://docs.anthropic.com/claude/docs/tool-use

Claude3: Advanced Data AnalysisをGoogle Colab上で実現したい

独自にコード実行できる、GPT-4の強みであるAdvanced Data Analysisを
Colab+Claude3という組み合わせで疑似的に実現したものです。
https://zenn.dev/karaage0703/articles/f6a1df0b2eabf4

ChatGPT: You can now edit DALL·E images in ChatGPT across web, iOS, and Android.

ChatGPTで、DALL-Eの出力画像を再編集できるように!
https://x.com/OpenAI/status/1775569161759985737

Bedrock: Bedrockのナレッジベースに今週来たRAG精度向上アプデまとめ

最近はClaude統合によりBedrockの記事が増えてきています。
Anthropicへの投資も発表されましたし、Amazonも本気ですね。
https://qiita.com/minorun365/items/be50326d94c25779b22f

Bedrock: 【速報】Agents for Amazon BedrockがCloudFormationに対応しました(ほぼ一撃)

GeminiがGoogleとの統合に強みがあるなら、BedrockはAWSとの親和性に強みが。
https://qiita.com/moritalous/items/4a9b4b7a15dfae9bf3f3

Bedrock: Amazon BedrockのKnowledge BaseでRAGを構築し、RDSのデータを分析するアプリケーションを開発する

Bedrock経由でRAGを実装する実例の紹介。
https://techblog.nhn-techorus.com/archives/30709

Bedrock: 今さら聞けない!? AWSの生成AIサービス Amazon Bedrock入門!

よくまとまっていてBedrockの全容を理解しやすいスライドでした。
https://speakerdeck.com/minorun365/jin-sarawen-kenai-awsnosheng-cheng-aisabisu-amazon-bedrockru-men

Command R+

ローカルで動くGPT-4に近い性能のLLMが公開されました。
とはいえ最高位のモデルを使うには、大容量ユニファイドメモリを備えたMac Studioが必須。
https://gigazine.net/news/20240408-command-r-plus-cohere-llm/

その他AI系話題

AIで商品名をクレンジングする、Llama2や、Google Cloud Gemini-proとVertex AIを活用した商品名の最適化

情報の正規化はいつも頭を悩ませるポイントです。
ECサイトの商品名という表記ゆれへの実際の対策例が紹介されており、参考になりました。
https://zenn.dev/minedia/articles/c018dd09801091

Generative AI for Everyoneから、古のNLPエンジニアの心に刺さったこと8選

少し前の記事。
全部面白いですが、「Augmentation vs Automation」は、LLMを使う上で全ての人が
読むべきだと思います。
「タスクを実行させる」のが基本中の基本。検索代わりに使うべきではない。
https://note.com/csstudyabroad/n/n5aba3a708f3a

日本語最高性能のRerankerをリリース / そもそも Reranker とは?

文書検索や分類では、コサイン類似度だけで精度が出ないことも正直多いです。
リランク併用は定番手法ですが、日本語の高性能なものが使えるのは大変ありがたいです。
https://secon.dev/entry/2024/04/02/070000-japanese-reranker-release/

Adapted large language models can outperform medical experts in clinical text summarization

Nature掲載論文。
LLMをドメイン適応させることで、電子カルテの要約において医師ら専門家を上回る精度を達成。
https://www.nature.com/articles/s41591-024-02855-5

RAGの新しい手法「CRAG」を3分で理解する

RAGはいずれ不要になる手法かもしれませんが、現時点ではそれ単独で分野になるほど
様々な試行錯誤が行われています。
https://zenn.dev/knowledgesense/articles/bb5e15abb3c547

RAGシステムにおいて「無関係な情報」を混ぜると精度が上がるという報告

正例と負例を用意するのは機械学習の定番ですが、RAGでもそうなんですかねぇ。
https://x.com/hAru_mAki_ch/status/1775172171696156982

複数の LLM モデルを扱う上で直面した辛みまとめ

実際にAI企業が直面した「あるある」の実例を紹介してくれています。
https://speakerdeck.com/kazuyaseki/fu-shu-no-llm-moteruwoxi-ushang-tezhi-mian-sitaxin-mimatome

WEB開発系話題

XZ Utilsの脆弱性 CVE-2024-3094 についてまとめてみた

WEB界隈ではこれが最大のホットトピックでしたね。
Linux向けの圧縮ユーティリティに、OSS貢献者がバックドアを仕込んでいたというお話です。
数年かけて信頼を築いていたようで、全てのOSSにおいて起きうる問題でしょう。
バックドアのコミット時間が他の活動と異なることから、アカウントごと買収されたのでは?
などという憶測も飛び交っていました。
https://piyolog.hatenadiary.jp/entry/2024/04/01/035321

Cloudflareに移行したら99%コスト削減できた話

CloudFront+S3の構成を移行、やはりAWSは大規模CDNとして使うと転送量がネックですね。
https://zenn.dev/kazu0617/articles/699ca7d354c4c0

スロークエリを改善したらECSの負荷が爆下がりした話(TypeORM)

TypeORMのjoinまわりでよろしくない処理が行われる場合があるとのこと。
https://zenn.dev/levtech/articles/36531641f019c8

Anthropic Subprocessor List

Anthropicが自社で利用しているサービスのリスト。
最先端企業が導入しているイケてるサービスということで参考になります。
https://www.anthropic.com/subprocessors

You don't need Node.js

Node.jsの代替先としてDenoとBunを紹介。
https://zenn.dev/nakasyou/articles/you_dont_need_node

【AWS】障害時の調査事項まとめ ~ELB・ECS・RDS~

AWS障害発生時、何をメトリクスとして持っておいてどこから手を付けるべきかの知見。
https://qiita.com/Kamibayashi_Mai/items/c2dd000635c49d61326c

脱・初心者!脱・マネコン!AWS CDKを使ってみませんか!?

いわゆるInfrastructure as Code (IaC)の実例紹介。
https://speakerdeck.com/har1101/tuo-chu-xin-zhe-tuo-manekon-aws-cdkwoshi-tutemimasenka

データベースの在庫の持ち方をビットで管理してる話

反応を見ていると、膨大な在庫データなどを扱うサービスでは割と一般的な実装のよう。
ビット演算で処理できるため、高速化・低容量化を実現可能。
https://user-first.ikyu.co.jp/entry/2024/03/28/115631

その他一般テック話題

MySQL 101 for Developers

MySQLはこれ読めばほぼOK、というくらいよくまとまった資料でした。
https://speakerdeck.com/wa6sn/mysql-101-for-developers

ログラスを支える設計標準について

コーディング規約のように、設計思想や手順も標準化することのメリットを紹介。
https://speakerdeck.com/urmot/loglass-design-standards

OpenMetadataとdbtによるデータカタログの構築

不勉強ながらOpenMetadataを知らなかったので大変勉強になりました。
https://speakerdeck.com/trsnium/openmetadatatodbtniyorudetakatarogunogou-zhu

ディメンショナルモデルの実導入と実装について

スタースキーマとの違いがあまりイメージできませんでしたが、ほぼ同じ考え方かな?
https://www.docswell.com/s/DeNA_Tech/5LLL67-dimensionalmodel

これまでのキャリアとこれからMLエンジニアとしてどう動くか

MLエンジニアという職種がここ数年急激に拡大したがゆえに、今後のキャリアが
不透明だというのはご指摘通りですね。
そして、AIにどこまで仕事が代替され、人間はどこにフォーカスすべきか、大きな問題です。
https://speakerdeck.com/masatakashiwagi/koremadenokiyariatokorekaramlenziniatositedoudong-kuka

CareNet Engineers

Discussion