💡

[2024年7月19日]週刊AI・WEB開発関連記事まとめ

2024/07/19に公開

こんにちは、Kaiです。
OpenAIからよく分からん文書が出てましたが、本当ですかね……。
いわく、最近のAIは賢くなりすぎて、出力結果が人類の理解を超えてきたため、人間レベルに合わせた翻訳AIを作る必要があったとか何とか。
正直、最近のOpenAIはかなーり誇張した表現を使う印象で懐疑的なんですよね。

とか言ってたら、GPT-4o miniが来ましたね。
高性能アピールがずっと続いてきたので、4oといいminiといい、中性能低価格路線に切り替えているのは、ひょっとして性能が頭打ちになってきているから……?という邪推もできてしまいます。
結局、学術的な領域ではなく、人類の一般的・日常的なタスクを代替するという意味では、どこかで性能が頭打ちになり、学習投入コストが見合わなくなるのは納得感があります。

さて、では今週の話題いってみましょう。

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

OpenAI: GPT-4o mini

いつものnpakaさんが速いのでこちらでご紹介。ヒエラルキー概念を導入した初のモデルということです。ヒエラルキー概念はOpenAIから論文も出てましたね。
https://note.com/npaka/n/nd985687d6cb1?sub_rt=share_h

(参考論文)
https://arxiv.org/abs/2404.13208

Claude: ハルシネーション減少のためのプロンプトテクニック

Anthropicのドキュメントは度々更新されていて、最近のこの辺りのノウハウは今からでも取り込む価値がありそうです。
https://docs.anthropic.com/en/docs/test-and-evaluate/strengthen-guardrails/reduce-hallucinations

その他AI系話題

Boosting Hotel Profits: The Power of Enhanced Cancellation Predictions

リクルートの学会発表。ホテルの動的プライシングにおいて、キャンセル率の予測が重要。キャンセル率の予測精度が10%上がると、収益が2%上がるという分析結果が得られたとのこと。大きいですね。
https://speakerdeck.com/recruitengineers/euro-2024-kimura

Using Agents for Amazon Bedrock to interactively generate infrastructure as code

インフラ構成図を渡すと、AmazonのBedrockエージェントが必要事項を質問して、最終的にIaaSコードを起こしてくれるそうです。
https://aws.amazon.com/jp/blogs/machine-learning/using-agents-for-amazon-bedrock-to-interactively-generate-infrastructure-as-code/

Improve RAG accuracy with fine-tuned embedding models on Amazon SageMaker

SageMakerを使って、RAGで使う埋め込みモデルをファインチューニングするユースケースの紹介。ドメイン特化させることでRAG精度が上がるとのこと。
https://aws.amazon.com/jp/blogs/machine-learning/improve-rag-accuracy-with-fine-tuned-embedding-models-on-amazon-sagemaker/

AWS、開発スキルがなくても生成AIへのプロンプトで業務アプリが作れる「AWS App Studio」プレビュー公開

ノーコード開発ツールは多数世に出ていましたが、正直業務利用できるレベルのものはなかった印象です。ただ、生成AIやワークフロー、エージェントとシームレスに連携していくと、ひょっとすると完璧なノーコード開発ツールが出来るかもしれません。
https://www.publickey1.jp/blog/24/awsaiaws_app_studio.html

決定木におけるNull importance手法

勾配ブースティングと決定木の組み合わせはMLの第一選択肢になっており、こんな手法も覚えておくと使えるかも。
https://x.com/abe_tetsu/status/1811373979632107850

UXデザイナーがClaude3.5で生成したReactアプリをエンジニアが修正し2時間でリリース!両者の作業と感想を語ります

領域の異なるプロの間にAIが入って作業、というのはとてもいい事例ですね。実際のプロセスや感想がリアルに書かれていて面白いです。Artifactsは紙芝居作るには滅茶苦茶便利なんですが、アプリケーションと考えるとやはりエンジニアの手が必要。
https://qiita.com/ynmc0214/items/7ed95ff455cd8b522071

GraphRAG関係

MSが発表したGraphRAG、一部で話題になっています。RAGに知識グラフの概念を導入したもので、直感的にも単なる埋め込みモデルよりも良さそうです。
https://hamaruki.com/analyzing-christmas-carol-with-local-llm-graphrag-2/
https://zenn.dev/robustonian/articles/graphrag_local_llm

20240711_RAGを用いたシンプルな 社内情報検索システムを導入した話とつらみ

ノウハウもさることながら、最後の「つらみ」がいいです。リアルです。わかります。
https://speakerdeck.com/shunta27/20240711-ragwoyong-itasinhuruna-she-nei-qing-bao-jian-suo-sisutemuwodao-ru-sitahua-toturami

事業会社でレコメンドエンジンを作る際のいくつかの壁

総論的な内容ですが、技術面というより実際に組織でビジネスに組み込む際のハードルを挙げていて、うなずける部分が多かったです。
https://analytics.leverages.jp/entry/2024/07/16/180000

Microsoftがスプレッドシートを理解できる言語モデル「SpreadsheetLLM」を発表、Excelの仕事もAIがこなす時代に

LLMにおいて表形式データの取り扱いは結構難しく、GPTなどでは直接理解ではなくPythonを介した解析を行っていました。直接LLMが取り扱えるようになればすごく効率化できそうです。
https://gigazine.net/news/20240716-microsofts-ai-spreadsheetllm/

WEB開発系話題

20以上のサービスを同時に支えるCAMのプラットフォーム戦略の実践

サイバーエージェントグループ会社での、複数サービスの共通インフラのお話。最初から全てを備えたものを目指さないというのは納得感があります。
https://speakerdeck.com/ishikawa_pro/20yi-shang-nosabisuwotong-shi-nizhi-erucamnopuratutohuomuzhan-lue-noshi-jian

セキュアなAWS環境の設計についての解説【2024年版】

基本的なところですが、漏れ抜けがつい起きてしまいがち。まとまっているとチェックリスト化もしやすいです。
https://blog.serverworks.co.jp/design-secure-aws-environment

ヒートマップとClaudeでLPカイゼンしてみました

すごい。ヒートマップ画像そのものをポイっと渡して改善案→実装もAIとCursorの1日、で翌日にはコンバージョン率が大きく向上したという事例です。
https://note.com/napps/n/naf00f7358726

その他一般テック話題

開発部に不満を持っていたCSがエンジニアにジョブチェンしてわかった「勝手に諦めない」ことの大切さ

二つの立場を経験して初めて見えてくることがある。これはエンジニアにも言えることだと思います。敵ではないはずですから、共通の目標を忘れずに経緯を持って接したいものです。
https://speakerdeck.com/sakuraikotone/kai-fa-bu-nibu-man-wochi-tuteitacsgaenzinianiziyobutiensitewakatuta-sheng-shou-nidi-menai-kotonoda-qie-sa

CareNet Engineers

Discussion