[2024年7月19日]週刊AI・WEB開発関連記事まとめ
こんにちは、Kaiです。
OpenAIからよく分からん文書が出てましたが、本当ですかね……。
いわく、最近のAIは賢くなりすぎて、出力結果が人類の理解を超えてきたため、人間レベルに合わせた翻訳AIを作る必要があったとか何とか。
正直、最近のOpenAIはかなーり誇張した表現を使う印象で懐疑的なんですよね。
とか言ってたら、GPT-4o miniが来ましたね。
高性能アピールがずっと続いてきたので、4oといいminiといい、中性能低価格路線に切り替えているのは、ひょっとして性能が頭打ちになってきているから……?という邪推もできてしまいます。
結局、学術的な領域ではなく、人類の一般的・日常的なタスクを代替するという意味では、どこかで性能が頭打ちになり、学習投入コストが見合わなくなるのは納得感があります。
さて、では今週の話題いってみましょう。
注意事項
- 先週収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
特定AIサービス
OpenAI: GPT-4o mini
いつものnpakaさんが速いのでこちらでご紹介。ヒエラルキー概念を導入した初のモデルということです。ヒエラルキー概念はOpenAIから論文も出てましたね。
(参考論文)
Claude: ハルシネーション減少のためのプロンプトテクニック
Anthropicのドキュメントは度々更新されていて、最近のこの辺りのノウハウは今からでも取り込む価値がありそうです。
その他AI系話題
Boosting Hotel Profits: The Power of Enhanced Cancellation Predictions
リクルートの学会発表。ホテルの動的プライシングにおいて、キャンセル率の予測が重要。キャンセル率の予測精度が10%上がると、収益が2%上がるという分析結果が得られたとのこと。大きいですね。
Using Agents for Amazon Bedrock to interactively generate infrastructure as code
インフラ構成図を渡すと、AmazonのBedrockエージェントが必要事項を質問して、最終的にIaaSコードを起こしてくれるそうです。
Improve RAG accuracy with fine-tuned embedding models on Amazon SageMaker
SageMakerを使って、RAGで使う埋め込みモデルをファインチューニングするユースケースの紹介。ドメイン特化させることでRAG精度が上がるとのこと。
AWS、開発スキルがなくても生成AIへのプロンプトで業務アプリが作れる「AWS App Studio」プレビュー公開
ノーコード開発ツールは多数世に出ていましたが、正直業務利用できるレベルのものはなかった印象です。ただ、生成AIやワークフロー、エージェントとシームレスに連携していくと、ひょっとすると完璧なノーコード開発ツールが出来るかもしれません。
決定木におけるNull importance手法
勾配ブースティングと決定木の組み合わせはMLの第一選択肢になっており、こんな手法も覚えておくと使えるかも。
UXデザイナーがClaude3.5で生成したReactアプリをエンジニアが修正し2時間でリリース!両者の作業と感想を語ります
領域の異なるプロの間にAIが入って作業、というのはとてもいい事例ですね。実際のプロセスや感想がリアルに書かれていて面白いです。Artifactsは紙芝居作るには滅茶苦茶便利なんですが、アプリケーションと考えるとやはりエンジニアの手が必要。
GraphRAG関係
MSが発表したGraphRAG、一部で話題になっています。RAGに知識グラフの概念を導入したもので、直感的にも単なる埋め込みモデルよりも良さそうです。
20240711_RAGを用いたシンプルな 社内情報検索システムを導入した話とつらみ
ノウハウもさることながら、最後の「つらみ」がいいです。リアルです。わかります。
事業会社でレコメンドエンジンを作る際のいくつかの壁
総論的な内容ですが、技術面というより実際に組織でビジネスに組み込む際のハードルを挙げていて、うなずける部分が多かったです。
Microsoftがスプレッドシートを理解できる言語モデル「SpreadsheetLLM」を発表、Excelの仕事もAIがこなす時代に
LLMにおいて表形式データの取り扱いは結構難しく、GPTなどでは直接理解ではなくPythonを介した解析を行っていました。直接LLMが取り扱えるようになればすごく効率化できそうです。
WEB開発系話題
20以上のサービスを同時に支えるCAMのプラットフォーム戦略の実践
サイバーエージェントグループ会社での、複数サービスの共通インフラのお話。最初から全てを備えたものを目指さないというのは納得感があります。
セキュアなAWS環境の設計についての解説【2024年版】
基本的なところですが、漏れ抜けがつい起きてしまいがち。まとまっているとチェックリスト化もしやすいです。
ヒートマップとClaudeでLPカイゼンしてみました
すごい。ヒートマップ画像そのものをポイっと渡して改善案→実装もAIとCursorの1日、で翌日にはコンバージョン率が大きく向上したという事例です。
その他一般テック話題
開発部に不満を持っていたCSがエンジニアにジョブチェンしてわかった「勝手に諦めない」ことの大切さ
二つの立場を経験して初めて見えてくることがある。これはエンジニアにも言えることだと思います。敵ではないはずですから、共通の目標を忘れずに経緯を持って接したいものです。
Discussion