💡

[2024年7月12日]週刊AI・WEB開発関連記事まとめ

2024/07/12に公開

こんにちは、Kaiです。
最近、OpenAIがちょっと迷走しているように見えますね。
イリヤ氏を始めとする中核サイエンティストが離れ、取締役会からMicrosoft、Appleが降りて、GPT-4o以降あまり革新的な動きもないように思えます。
一方、Anthropicは次々と手を打っているように見え、地殻変動のようなものすら感じます。
全体としては、エージェントシステム、ワークフロー周りに関する注目が高まった週のように思います。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

Claude: コンソールにプロンプト生成機能と、出力の比較機能が搭載

LLMがプロンプトを考えて比較して改善するなら……人間は何を……。
https://x.com/AnthropicAI/status/1810747792807342395

Dify: 地図データの処理、URLスクレイピング→Markdownなど新機能の追加

スクレイピングはありがたいですね。
https://x.com/DifyJapan/status/1810353285444108673

その他AI系話題

Mac + ollamaでShaberi3ベンチマーク評価をする

日本語LLMベンチの一つ、Shaberi3をローカルで動かした記録。GoogleのGemma-2-9B、日本語性能でLlama-3-70BやClaude-3-sonnetに匹敵するというのは割と驚き。
https://zenn.dev/robustonian/articles/shaberi_benchmark

XGBoostとLightGBMの理論の解説

Scikit-learnにあるので何も考えずに使ってしまいがちですが、理論も改めて復習しておきたい。
https://tomtom58.hatenablog.com/entry/2024/07/07/192903

話題のLLMローコード構築ツールDifyをAWSのマネージドサービスで構築してみた

Difyは一般的に公式マネージド、ローカルの選択肢がありますが、AWSに展開するのはスケーラビリティが出ていいですね。ただ後述の通りAWSは独自にワークフローに参入しつつあるので、選択する際には要注意かもしれません。
https://www.m3tech.blog/entry/dify-aws

イラストのペン入れと色塗り、AI使えばわずか1分

賛否両論を巻き起こしたcopainterの解説記事。こういう技術が産まれつつあります、というご紹介に留めます。
https://ascii.jp/elem/000/004/208/4208519/

GENIAC: 172B 事前学習知見

事前学習に関する実際のコードレベルの知見は、多くがBig Techの社内で行われているため意外と少ないです。日本語でこの内容が読めるのは素晴らしいです。
https://zenn.dev/tokyotech_lm/articles/deb8012251bb68

RAG vs ファインチューニング(コーディング性能で比較)

論文解説。ドメイン固有言語における比較であることが特徴的です。これはコーディングの例ですが、専門用語や特殊略語が多用されるケースでも応用できそう。結論としては、RAGとファインチューニングはほぼ同じ性能であり、RAGのサンプル数は20件などある程度渡した方がいいという形です。
https://zenn.dev/knowledgesense/articles/110a81646806e6

CL 字幕の自動生成

AWSとGCPをめちゃくちゃ使い分けて構築しています。うううーん、転送量とか障害点とか考えると、不利なようにも思うのですが、きっと深い理由があるのでしょう。
https://developers.cyberagent.co.jp/blog/archives/48313/

独自の日本語LLM(大規模言語モデル)のバージョン3を一般公開 ―225億パラメータの商用利用可能なモデルを提供―

サイバーエージェントも独自AIを公開。しかも22Bが商用利用可能ですぐに使えます。日本語モデルへの投資が継続されているのはありがたいことです。
https://www.cyberagent.co.jp/news/detail/id=30463

【自動タイムラプス製造!?】Paints-UNDO技術解説

これまた賛否両論が激しかった技術。こちらもご紹介のみに留めます。
https://zenn.dev/mattyamonaca/articles/7a26aafa5adb8a

Difyを使ってノーコードでAIエージェントを作成する

Difyの登場により「もう、これでいいじゃん」という気持ち

これは感じ始めており、現実世界のタスクをいかに細かく定格的に分割してLLMを介して繋ぎ合わせるか、みたいな世界に移りつつあるように思います。
https://acro-engineer.hatenablog.com/entry/2024/07/09/120000

時系列データのための大規模言語モデル

時系列データはまだ全てのもとになる銀の弾丸的なモデルがないですね。サーベイ論文を通じた現状総覧の記事です。
https://zenn.dev/tsurubee/articles/00446669b6c83a

micro-agent

従来のLLMが、タスクに対してコードを生成するのに対して、「タスクを満たすテスト」を先に生成し、コードがテストをパスするまで修正し続けるエージェント。LLMでTDDやる感じですね。語呂がいいな、LLMでTDD。
https://github.com/BuilderIO/micro-agent

AIプログラミングにリミックス文化が? Claude Artifacts生成物がページ公開できて自由な改変も可能に(CloseBox)

先日Claude Artifactsに追加されたPublish/Remix機能によって、「LLMで作ったものを公開して、LLMで他の人がさらに改良を加える」という体験についてのレポ。
https://www.techno-edge.net/article/2024/07/10/3520.html

Bedrockの新機能「Prompt flows for Amazon Bedrock」

先の記事でも触れましたが、AWS謹製のマネージドワークフローです。これはDifyとガチ競合ですね。機能的にはまだDifyが強そうですが、AWSリソースとシームレスに接続できるのは強い。
https://qiita.com/moritalous/items/a902f61093b112ba1bd7

医療分野におけるLLMの現状と応用可能性について

医療情報学の先生による現状総括スライド。
https://speakerdeck.com/kento1109/yi-liao-fen-ye-niokerullmnoxian-zhuang-toying-yong-ke-neng-xing-nituite

WEB開発系話題

Github Actionsで複数環境のterraform planを自動化する

Github ActionsでCIするときのノウハウ。
https://zenn.dev/makoto1995/articles/65de69bdaa34b3

Node.jsでTypeScriptのコードを実行できるようになるかも

まだ「なるかも?」段階なのでご注意ください。技術的バックグラウンドも解説されています。
https://hiroppy.me/blog/nodejs-strip-type/

トロイの木馬化したjQueryがGitHubやCDN経由で拡散 米セキュリティ企業が警告

npm経由のパッケージの一部に、不正なjQueryのコピーが含まれていたとのこと。パッケージマネージャーを使う際には、出所に注意しないとですね。
https://www.itmedia.co.jp/news/articles/2407/09/news188.html

S3のフォルダ構造とプレフィックスの話

GUIから作成しているフォルダは、実はフォルダのプレフィックスをした0バイトのオブジェクトなのです。

えええ!?これは不勉強ながら知りませんでした……。そして負荷分散のためにプレフィックスを変えるというのは面白いです。大規模アクセスを想定するなら考慮してもよさそうです。
https://tech.nri-net.com/entry/s3_folder_structure_and_prefix

Cloudflare、すべての生成AIによるクローラーをワンクリックでブロックする機能を無料で提供開始

AI学習リソースの枯渇が加速しそう。
https://www.publickey1.jp/blog/24/cloudflareai.html

Python Lambdaのコールドスタートが遅いときの対処法

Lambdaのコールドスタート問題はご存知の通りですが、特にPythonに特化したノウハウをまとめてくださってます。
https://tmokmss.hatenablog.com/entry/analyze-and-improve-lambda-python-coldstart

CareNet Engineers

Discussion