[2024年3月26日]週刊AI・WEB開発関連記事まとめ
こんにちは、Kaiです。
毎週恒例、週刊AI・WEB開発関連記事のまとめです。
先週は都合によりお休みいたしましたので、今週は二週間分まとめていってみましょう。
注意事項
- 先週収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
Claude3
高い言語能力で衝撃を与えたClaude3、まだまだホットな話題です。
比較記事や使い方ガイドなど、特徴をまとめたものがいくつかありましたので紹介します。
ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ
とてもよくまとまっています。
ChatGPTとの比較もありますし、マルチモーダルでの使用感も実用性のあるものです。
GPT-4とClaude 3 Opusを創作系のタスクで比較し、相互に評価させる
ストーリーなどの創作系で、双方の比較を行った記事です。
AIによる評価と、人間による評価で乖離があるというのは興味深いです。
恐らく、評価ポイントが異なる側面があるのではないかと思われます。
ChatGPTplusを解約してClaude3Proへ乗り換えをする際に検討した事
比較する際、単純なモデルの性能のみならず、エコシステム全体を見ることも重要です。
具体的にはCode InterpreterやDALL-Eの利用などですが、その観点も含めた整理をしています。
その他AI系話題
Grok-1
イーロンが公言した通り、なんと314BのLLMモデルがオープン公開されました。
もはや個人レベルで「試してみた」が出来る規模ではないので、出力例の記事は見当たりませんでした。
BitNetでMNISTを学習させて見えてきた性質
先日話題になったBitNet、なかなか一筋縄ではいかないようです。
従来の浮動小数点ベースの学習アルゴリズムを根本的に見直す必要があるのでは、という
声もSNSで出ていました。
言葉でPCを操れる生成AI「Open Interpreter」をWindowsで使えるようにする方法(Open Interpreterのインストール方法や仮想環境構築までスクショ付き)
ローカルで動作する、OSSのCode Interpreterです。
当然業務で使うのは危なっかしいので、出てすぐに自宅PCで試してみたのですが、
ファイル操作やライブラリインストールなどが自動で処理されていき、魔法を目にしている
感覚があったのを覚えています。
その当時はコンテクストウィンドウなどの都合でまだまだ実用レベルではありませんでしたが、
だいぶ状況が変わってきて、記事も増えてきた印象です。
RAGの実装戦略まとめ
非常に詳細かつ専門的なRAGのノウハウまとめです。
RAGを利用したサービスを開発運用していれば、すぐに導入できそうなものばかりです。
Claude3で膨大なコンテクストウィンドウが手に入ったとはいえ、全社内ドキュメントを
解析するような使い方はまだできませんので、RAG併用は今後も重要ですね。
コサイン類似度はどこまで信用できるのか?
元は論文で、解説ポストがあったのでそちらをご紹介。
RAGなどで頻繁に利用されるコサイン類似度、無条件に使ってしまいがちですが、
学習段階で工夫をしないと信用できない指標になってしまうとのこと。
WEB開発系話題
AWS構成図についてのLT
確かにAWS構成図はよく書く一方で、論理構成なのか物理構成なのかはオンプレに比べると
意識していなかったように思います。
業務でAWSを利用する時に知っておくべきポイント10選
基本レベルですが、復習を兼ねて。
第131回 雲勉【オンライン】AWSを9年触ってきて経験した落とし穴、ハマったポイント
めちゃくちゃ実例。いくつかは「ああ~」という感じ。
AWSの公式QAに載せて欲しい。
マルチテナントの実現におけるDB設計とRLS / Utilizing RSL in multi-tenancy
PostgreSQLから離れてもうだいぶ経ってしまい、寡聞にして知らなかったのですが
RSLという概念は面白いですね。
ただ権限管理でのやらかしは別のリスクを生みそうなので、ケースバイケースですかね。
Feature Flag Deep Dive
Feature Flagは、ざっくり「コード変更なく機能を切り替える手法」と考えていいと思います。
最近注目されていますが、Deep Diveの通り非常に詳細かつ実用レベルの解説です。
その他一般テック話題
たった72文字でMD5が同じになる1文字しか変わらない文字列が発見されたらしい
MD5は既にハッシュとしては死んでいますが、リプレイスできないまま残っているサービスも
世の中には多く残っているはず。
これを使うことで、「MD5実装が残っている脆弱なサービスか否か」が簡単に外から
検証出来てしまいます。
Discussion