💡

[2024年3月11日]週刊AI・WEB開発関連記事まとめ

2024/03/11に公開

こんにちは、Kaiです。
先週から始めている週刊AI・WEB開発関連記事、今週もいってみましょう。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

Claude3

先週はもうこの話題一色でしたね。
これまでもGPT-4に匹敵、または超えるという触れ込みでいくつかのサービスが現れましたが、
実際に使った人の感触ではチェリーピッキングではなく本当に超えているかもしれないとのこと。

というか、毎週破壊的なサービスや論文が出てくるの本当に勘弁してほしいんですが。
ということで、Claude3の概要や応用について、参考になるものをまとめてみました。

Claude3概要系

Claude 3 の概要
いつものnpakaさんです、情報への反応とアウトプットが異様に早くて助かっています。
https://note.com/npaka/n/ncf17c1b16a5e

GPT-4よりすごいらしいClaude 3が気になったあなたへ
使い方のチュートリアルです。
CaludeはAmazon Bedrockに統合されており、Bedrock経由の利用法があるのが嬉しいですね。
https://qiita.com/moritalous/items/8266f0c4bea6514713f7

GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた
こうやって出力を並べてみると面白いですね。
非常に難しいタスクというわけではないので、ぱっと見大差はありませんが、モデルの
特徴は見て取れるように思います。
というかGemini Ultra、こんなのでいいんですかね……。
https://qiita.com/tatsuki-tsuchiyama/items/21a77f764ea3a07ab901

Claude3実用系

Google Colab で Claude 3 の Vision を試す
またまたnpakaさん。
Claude3は画像解釈においても最上という触れ込みで、微妙な誤認識はありますが、おおむね
的確に認識できているようです。
コードサンプルがあるのですぐ試せます。
https://note.com/npaka/n/n972d94427dd7

「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感
Claude3は文章構成力、表現力がGPT-4に比べて優れていると言われています。
ITmediaの記者さんはどう感じたのか。
https://www.itmedia.co.jp/news/articles/2403/08/news064.html

Claude 3 OpusのGPT4に対するPros/Consをまとめました!
ハルシネーションが多いというのは結構多くの方が指摘していました。
https://x.com/sayhi2ai_jp/status/1766028407631163741

その他AI系話題

サバイバルTypeScriptのGPTsを作成・公開しました

寡聞にしてこのOSSドキュメントの存在を存じ上げなかったのですが、
「マニュアルに解説用GPTsを付ける」というのはとても有効な手段ですね。
https://zenn.dev/t_yng/articles/5974c46a57fdd0

深層学習VS決定木:テーブルデータ分析の未来

深層学習と決定木はよく比較されますが、テーブルデータについては比較論文が出ており、
おおむね決定木の方が性能が高いということです。
考えられる理由も提示されていますが、納得感の高いものです。
https://voice.pkshatech.com/n/n2f125daeb9da

GPT開発の悩みの種「速度」「精度」「評価」の壁をどう超えるか

Microsoftの方による、GPTをプロダクトに組み込む際の具体的TIPSまとめ。
速度を上げる方法、Fine TuningやRAGを用いた精度向上のノウハウなど。
https://speakerdeck.com/hirosatogamo/gptkai-fa-nonao-minozhong-su-du-jing-du-ping-jia-nobi-wodouchao-eruka

RAGでの回答精度向上のためのテクニック集(応用編-A)

先週は基礎編を紹介しましたが、応用編が出ていました。
より具体的かつ詳細なRAGのテクニックです。
https://zenn.dev/knowledgesense/articles/cec1cd43244524

WEB開発系話題

構造化ログのフォーマット logfmt vs JSON lines

logfmtは標準仕様がなく方言化されており、大手サービスでも直接解釈できないとのこと。
https://methane.hatenablog.jp/entry/2024/03/04/構造化ログのフォーマット_logfmt_vs_JSON_lines

サーバーレスマイクロサービスを構築するための設計アプローチの比較

最近マイクロサービスは賛否両論出ていますが、それでもサーバレスしたいときはあります。
Lambdaの関数に何の責任を持たせるべきかという設計比較資料です。
もちろんケースバイケースではありますが、選択肢が頭にあるだけで少し違いそうですね。
https://aws.amazon.com/jp/blogs/news/comparing-design-approaches-for-building-serverless-microservices/

Vue 3.4

2023年末にリリースされたVue3.4に関する解説記事。
マイナーバージョンアップですが、かなりの改善と変更が盛り込まれているとのこと。
当社でも一部Vueを利用しているため、アップデートの検討が必要ですね。
https://speakerdeck.com/kazupon/vue-3-dot-4

その他一般テック話題

GitHubに大量の悪質リポジトリ、その数“10万超” 感染するとパスワード流出の恐れ

コード資産に直接流し込めるので、そりゃ攻撃対象になりますよね。
業務でOSSのgit cloneする場合は、正規リポジトリであることを念入りに確認すべきです。
https://www.itmedia.co.jp/news/articles/2403/11/news060.html

Docker ハンズオン

すごくよくまとまってる資料です。このまま社内研修用に使えそう。
https://speakerdeck.com/suzukihoge/docker-hands-on-d50e3e1d-e669-4cb8-a143-cd1242a6f103

ABEMAの効果検証事例〜効果の異質性を考える〜

A/Bテストをした際、A/B群の数字だけ見るのではなく、各ユーザの属する集団によって
受けた効果が異なるかもしれないという検証が必要という実例です。
https://speakerdeck.com/s1ok69oo/abemanoxiao-guo-jian-zheng-shi-li-xiao-guo-noyi-zhi-xing-wokao-eru

データマネジメント入門 - DX推進を支えるデータ基盤の重要性

データ基盤を作り、運用する際のノウハウ総まとめ。
https://speakerdeck.com/kazaneya/20240125

CareNet Engineers

Discussion