💡

[2024年7月5日]週刊AI・WEB開発関連記事まとめ

2024/07/05に公開

こんにちは、Kaiです。
6月後半はカンファレンスやMeetupが多かったせいか、面白いスライドがめちゃくちゃ多く放流されて正直まだ全部追い切れていません……。
読み込めていないものも多々ありますが、とりあえずざざっとご紹介します!

注意事項

  • 先週収集したAIおよびWeb系の記事やポストが中心になります
  • 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
  • 業務状況次第でお休みしたり、掲載タイミングが変わったりします

特定AIサービス

ChatGPT: ChatGPTのミスを見つけることに特化した「CriticGPT」

https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
LLM-as-a-Judgeは既に一般的になっていますので、さらに推し進めて修正まで視野に入れるのは当然の流れですね。これもすぐに一般化しそう。

Claude: Claude の Projects にライブラリのリファレンスを丸ごと入れてみる

https://qiita.com/kunishou/items/ed097b46cd78030e0b29
Projectsの特徴はTeamで共有できることなので、ナレッジベース(もう死語かも)として使っていくのはよさそうです。

その他AI系話題

全社的な生成AI活用プラットフォームとしての Difyの導入事例紹介

https://speakerdeck.com/tokita_kakaku/quan-she-de-nasheng-cheng-aihuo-yong-puratutohuomutositeno-difynodao-ru-shi-li-shao-jie
カカクコムのDify導入事例。かなり具体的で参考になります。実際に業務で使っていても、単独LLMよりもタスクを細分化したワークフローの方が利便性を感じるため、この使われ方が主流になる予感がします。

デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場

https://ai-scholar.tech/articles/large-language-models/LLM4Decompile
既に多くのマルチモーダルLLMでスクリーンショットからHTML/CSSをデコンパイルする使い方が行われていますが、バイナリファイルに対しての検討です。自然な流れとはいえ、リバースエンジニアリングがより一般的になってしまいそう。

乳がんをほぼ100%の精度で画像診断するAI

https://medicalxpress.com/news/2024-06-ai-breast-cancer-accuracy.html
原論文を見ると臨床現場にそのまま投入するにはまだ課題がありそうですが、着実に進歩していると感じます。

大規模言語モデル (LLM) の技術と最新動向

https://speakerdeck.com/ikuyamada/da-gui-mo-yan-yu-moderu-llm-noji-shu-tozui-xin-dong-xiang
改めて総覧しつつ復習するのにちょうどいいまとめスライドです。

AI検索最強のPerplexityに強力なライバルが登場「Genspark」

https://drmagician.exblog.jp/32530119/
無料なのが強い。Perplexityはなんだかんだ有料版でないと使い物にならない印象ですので、ユーザの移動が起きるかも。

Microsoft Azure上でNTT版LLM「tsuzumi」の提供開始

https://www.nttdata.com/global/ja/news/release/2024/062700/
ついに国産LLMがAzureに乗りました。

機械学習とビジネスゴールのはざまで

https://tech.layerx.co.jp/entry/2024/06/30/140352
エンジニアリングとビジネスゴールのすり合わせは、機械学習のみならず常に発生していると思います。この記事では機械学習にフォーカスし、OCRで実際に発生した事象と対策の例を挙げています。

効果検証のための因果推論手法のチートシート

https://qiita.com/_jinta/items/98ac5bbe9ba5bfff1c8a
少し前の記事ですが、ちょうど社内で因果推論について話題になっていたので備忘を兼ねて。

LLMを用いた学習不要のレコメンドエンジン概念

https://zenn.dev/knowledgesense/articles/91100706b38213
元記事では「実現」となっていますが、概念提唱のレベルだと感じました。ただ、面白いです。
これまでのレコメンデーションは、ユーザのアイテム選好性を対象にしていましたが、アイテムの概念を拡張して「どういう質問がユーザの興味を惹起するか」という意識そのものをアイテムとして取り扱うようです。
例えば、環境意識の高いペルソナがスプレーを買う際に「ボトルの再利用方法を知りたいですか?」という質問が刺さる、といったデータを生成することができるようです。
一方、これは既存のレコメンデーションと全く異なるため、サービスに組み込むには新しいノウハウが必要そうです。

「ゴミを食べ、ゴミを吐く」、ベゾスも出資するAI検索エンジンの品質問題

https://forbesjapan.com/articles/detail/72055
Perplexityは私も使っていますが、確かに外部リソースの精度に依存します。ただこれはGoogle検索でも同じであって、生成AIにより膨大なコンテンツが生成されるようになった昨今、さらに問題になると思われます。

アマゾン、RAGを実装したAIの性能を比較する新しいベンチマークを提案

https://japan.zdnet.com/article/35220895/
RAGは主流の手法になりつつある一方、「本当に改善しているのか?」の検証は確かに難しい問題でした。気軽に使えるようになるといいのですが。

Fish Speech: Brand new TTS Solution

https://github.com/fishaudio/fish-speech
Text to Speech(テキストから音声発話生成)の新しいモデルが来ました。手元ではまだ試せていませんが、デモを見る限りフリーで使えるものとしては最高レベルでは?

RAGのSurvey論文からRAG関連技術を俯瞰する

https://sue124.hatenablog.com/entry/2024/07/02/233616
RAG関連について非常によくまとまっています。以前紹介したサーベイ論文の翻訳も参考になりますが、こちらはさらに情報が付加されています。

Figmaが一度リリースしたAIデザイン機能を非公開に

https://techcrunch.com/2024/07/02/figma-disables-its-ai-design-feature-that-appeared-to-be-ripping-off-apples-weather-app/
これ、めちゃくちゃ凄いと話題になっていたのですが一瞬で非公開になりました。Appleの天気予報アプリに酷似したデザインが出力されたことによるものです。仮にAppleのデザインを学習していなかったとしても、結果的に似たものが出てくることはありえるわけで、人間によるリスクマネジメントはまだまだ必要なのでしょう。

WEB開発系話題

タクシーアプリ『GO』におけるプラットフォームエンジニアリングの実践

https://speakerdeck.com/mot_techtalk/takusiapuri-go-niokerupuratutohuomuenziniaringunoshi-jian
GOの裏側と、プラットフォーム構築の考え方についての説明。標準化への取組の重要性を強調しています。

20分で分かるIAM全機能

https://speakerdeck.com/opelab/20240621-aws-summit-iam
AWS自身によるIAM説明。日常的に使っていますが、網羅的に理解しているかというと怪しいのでこういう資料はありがたいです。

OpenSSHの脆弱性 CVE-2024-6387についてまとめてみた

https://piyolog.hatenadiary.jp/entry/2024/07/02/032122
最近話題になった脆弱性です。既に対策バージョンが公開されていますので、該当する方は早めにアップデートを。

悪戦苦闘! PCI DSS準拠の社内システムをCognitoで認証する

https://blog.smartbank.co.jp/entry/2024/07/01/120000
Cognitoは当社でも利用している部分があります。簡易に認証基盤を作れる一方、このように要件が厳しい場合にはフィットしない場合も。(PCI DSSとはクレジットカード業界のセキュリティ基準のことだそうです)

大規模サービスの負荷試験を改善していった話

https://zenn.dev/qubena/articles/2ad3f468a7c70f
負荷試験、昔はJmeterを使っていましたが、すっかり浦島太郎になってしまいました。比較的モダンなやり方と継続的な改善について説明されています。

LeanとDevOpsのためにE2Eテストができること

https://speakerdeck.com/magicpod/leantodevopsnotamenie2etesutogadekirukoto
E2Eテストについては賛否含めて色々な意見があります。E2Eサービス提供者側の経験とノウハウをまとめたスライドです。

その他一般テック話題

高品質と高スピードを両立させるテストアプローチ

https://speakerdeck.com/goyoki/test-approach-that-improves-quality-and-agility-together
テスト一般について、考え方を整理したスライドです。頭の整理になります。

ビズリーチが目指す「開発生産性」ダッシュボード 〜 データ収集の壁と乗り越え方 〜

https://speakerdeck.com/visional_engineering_and_design/dev-productivity-con2024
開発生産性も、よくトピックに上がる話題ですね。ビズリーチにおける指標の例をかなり具体的に提示しています。

いまAI組織が求める企画開発エンジニアとは?

https://speakerdeck.com/roadroller/imaaizu-zhi-gaqiu-meruqi-hua-kai-fa-enziniatoha
R&Dと製品化の間を埋めるポジション、という説明です。ちょうど、当社のAIチームが担っている役割に近いですね。
(ちなみに当社はAIエンジニア募集中です!)

CareNet Engineers

Discussion