[2024年3月11日]週刊AI・WEB開発関連記事まとめ
こんにちは、Kaiです。
先週から始めている週刊AI・WEB開発関連記事、今週もいってみましょう。
注意事項
- 先週収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Claude3
先週はもうこの話題一色でしたね。
これまでもGPT-4に匹敵、または超えるという触れ込みでいくつかのサービスが現れましたが、
実際に使った人の感触ではチェリーピッキングではなく本当に超えているかもしれないとのこと。
というか、毎週破壊的なサービスや論文が出てくるの本当に勘弁してほしいんですが。
ということで、Claude3の概要や応用について、参考になるものをまとめてみました。
Claude3概要系
Claude 3 の概要
いつものnpakaさんです、情報への反応とアウトプットが異様に早くて助かっています。
GPT-4よりすごいらしいClaude 3が気になったあなたへ
使い方のチュートリアルです。
CaludeはAmazon Bedrockに統合されており、Bedrock経由の利用法があるのが嬉しいですね。
GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた
こうやって出力を並べてみると面白いですね。
非常に難しいタスクというわけではないので、ぱっと見大差はありませんが、モデルの
特徴は見て取れるように思います。
というかGemini Ultra、こんなのでいいんですかね……。
Claude3実用系
Google Colab で Claude 3 の Vision を試す
またまたnpakaさん。
Claude3は画像解釈においても最上という触れ込みで、微妙な誤認識はありますが、おおむね
的確に認識できているようです。
コードサンプルがあるのですぐ試せます。
「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感
Claude3は文章構成力、表現力がGPT-4に比べて優れていると言われています。
ITmediaの記者さんはどう感じたのか。
Claude 3 OpusのGPT4に対するPros/Consをまとめました!
ハルシネーションが多いというのは結構多くの方が指摘していました。
その他AI系話題
サバイバルTypeScriptのGPTsを作成・公開しました
寡聞にしてこのOSSドキュメントの存在を存じ上げなかったのですが、
「マニュアルに解説用GPTsを付ける」というのはとても有効な手段ですね。
深層学習VS決定木:テーブルデータ分析の未来
深層学習と決定木はよく比較されますが、テーブルデータについては比較論文が出ており、
おおむね決定木の方が性能が高いということです。
考えられる理由も提示されていますが、納得感の高いものです。
GPT開発の悩みの種「速度」「精度」「評価」の壁をどう超えるか
Microsoftの方による、GPTをプロダクトに組み込む際の具体的TIPSまとめ。
速度を上げる方法、Fine TuningやRAGを用いた精度向上のノウハウなど。
RAGでの回答精度向上のためのテクニック集(応用編-A)
先週は基礎編を紹介しましたが、応用編が出ていました。
より具体的かつ詳細なRAGのテクニックです。
WEB開発系話題
構造化ログのフォーマット logfmt vs JSON lines
logfmtは標準仕様がなく方言化されており、大手サービスでも直接解釈できないとのこと。
サーバーレスマイクロサービスを構築するための設計アプローチの比較
最近マイクロサービスは賛否両論出ていますが、それでもサーバレスしたいときはあります。
Lambdaの関数に何の責任を持たせるべきかという設計比較資料です。
もちろんケースバイケースではありますが、選択肢が頭にあるだけで少し違いそうですね。
Vue 3.4
2023年末にリリースされたVue3.4に関する解説記事。
マイナーバージョンアップですが、かなりの改善と変更が盛り込まれているとのこと。
当社でも一部Vueを利用しているため、アップデートの検討が必要ですね。
その他一般テック話題
GitHubに大量の悪質リポジトリ、その数“10万超” 感染するとパスワード流出の恐れ
コード資産に直接流し込めるので、そりゃ攻撃対象になりますよね。
業務でOSSのgit cloneする場合は、正規リポジトリであることを念入りに確認すべきです。
Docker ハンズオン
すごくよくまとまってる資料です。このまま社内研修用に使えそう。
ABEMAの効果検証事例〜効果の異質性を考える〜
A/Bテストをした際、A/B群の数字だけ見るのではなく、各ユーザの属する集団によって
受けた効果が異なるかもしれないという検証が必要という実例です。
データマネジメント入門 - DX推進を支えるデータ基盤の重要性
データ基盤を作り、運用する際のノウハウ総まとめ。
Discussion