🔔 あなたへのおすすめ記事「For you(β)」をリリースしました
Zenn
Log in
evaluation
このトピックを指定するには
evaluation
と入力
フォロー
Articles
9
Scraps
16
articles
Trending
Alltime
Latest
🧠
GAIA Benchmark解説:AIエージェント評価の最前線
taku_sid
in
Accenture Japan (有志)
4日前
1
📝
LLMによるLLMの評価とその評価の評価について
seya
in
Gaudiy Engineers' Blog
2024/05/06
74
📚
LLMにまつわる"評価"を整理する
seya
in
Gaudiy Engineers' Blog
2024/06/06
62
🐧
RAGシステム評価の落とし穴と、改善への道標【RAGAS使用】
Matsu Shin
in
any株式会社
4ヶ月前
14
🐦
あらゆる分野のRAGの性能を評価する手法RAGEval
sasakuna
in
ナレッジセンス - AI知見共有ブログ
2024/08/13
50
🐃
Mac M2 チップで lm-evaluation-harness
Tsutomuuu
9日前
3
🪄
Amazon BedrockのLLM as a Judgeを使って回答の精度を上げる
yoshida
in
株式会社システムゼウス
27日前
3
📝
W&B Weave を使ってLLMを評価してみる
sj
2024/10/04
💯
Promptfooを使った生成AIの評価フレームワーク入門
yukinagae
in
CureApp テックブログ
2024/09/10
8