Zenn
LLM-as-a-Judge
このトピックを指定するには
llmasajudge
と入力
Articles
3
articles
Trending
Alltime
Latest
📚
DatabricksのAIエージェント評価機能の実力を検証してみた
Tatsuya Maruyama
in
NTT DATA TECH
2ヶ月前
36
🛰️
Langfuse で LLM の出力を評価し、その信頼度を測る
クラウドエース株式会社
2ヶ月前
18
⚓
LLM-as-a-judge (暫定)
Saito
1ヶ月前