💭

最近読んでいて興味深かった記事紹介 Vol.3

に公開

今回は読んでいて良かった記事を紹介するシリーズの第3弾になります。過去のシリーズは以下にまとめていますのでぜひご覧ください。

https://zenn.dev/akasan/scraps/97b063540d2372

Open Source for Developers

こちらはNVIDIAのエンジニアの方がコントリビュートしているOSSのリストが載っています。世界最高峰レベルのエンジニアがどのようなOSSに関わっておられるのか興味がありみていました。

https://developer.nvidia.com/open-source?sortBy=open_source_projects%2Fsort%2Ftitle%3Aasc

What Are Multi-Agent Systems?

マルチエージェントからなるシステムに関して、その構成の種類であったりどのように稼働するのかが説明されていて参考になります。

https://www.nvidia.com/en-us/glossary/multi-agent-systems/

LLM Testing in 2025: Top Methods and Strategies

LLMを利用しているアプリケーションのテスト方法についてまとめられています。従来のアプリケーションと比較してLLMを利用しているアプリケーションの裏側はその挙動の完全な予測が難しく、テストの作り方も独特な部分があると思いま部分があると思います。そのような内容についてキャッチアップできるのでおすすめです。

https://www.confident-ai.com/blog/llm-testing-in-2024-top-methods-and-strategies

Benchmarking Single Agent Performance

エージェントはさまざまなコンテキストや外部ツールを利用しながら複雑なタスクをこなしますが、さまざまなコンポーネントと連携しているが故連携しているがゆえにパフォーマンスっを測定する方法が重要になります。利用するモデルやコンテキストウィンドウ、ツールなどさまざまな要因が絡んでいるので、ぜひご覧いただきエージェントのパフォーマンスについて意識していただければと思います。

https://blog.langchain.com/react-agent-benchmarking/

まとめ

今回は主にAIエージェント関係の記事の紹介でした。特にエージェントが普及している今だからこそ、基礎から固めていければと思っていますので、ぜひみなさんのおすすめのドキュメントなどあればコメントお願いします!

Discussion