Zenn
LLM-as-a-Judge
このトピックを指定するには
llmasajudge
と入力
Articles
3
articles
Trending
Alltime
Latest
📚
DatabricksのAIエージェント評価機能の実力を検証してみた
Tatsuya Maruyama
in
NTT DATA TECH
3ヶ月前
36
🛰️
Langfuse で LLM の出力を評価し、その信頼度を測る
クラウドエース株式会社
3ヶ月前
20
⚓
LLM-as-a-judge (暫定)
Saito
2ヶ月前