Zenn
evaluation
このトピックを指定するには
evaluation
と入力
RSS
表示を修正
Articles
1
Scraps
11
scraps
Trending
Alltime
Latest
LLM/RAGの評価ツール「UpTrain」を試す
Open
kun432
4日前にコメント追加
#
evaluation
#
uptrain
#
rag
#
LLM
1
"Multi-Needle In A Haystack" でLLMのロングコンテキストの評価を試す
Closed
kun432
2ヶ月前にクローズ
#
evaluation
#
needleinahaystack
#
LLM
8
検索の評価指標をranxを使いながら理解する
Closed
kun432
3ヶ月前にクローズ
#
evaluation
#
retrieval
#
search
#
ranx
21
ranxを試す
Closed
kun432
6ヶ月前にクローズ
#
ranx
#
evaluation
#
search
9
RAGASを試す
Closed
kun432
4ヶ月前にクローズ
#
ragas
#
OpenAI
#
evaluation
#
LLM
11
LangChainのTruLens Integrationを試してみる
Closed
kun432
2023/07/11にクローズ
#
evaluation
#
trulens
#
AI
#
LLM
#
LangChain
9
haystackのAnnotation Toolを試す
Closed
kun432
4ヶ月前にクローズ
#
rag
#
evaluation
#
LLM
#
retrieval
#
haystack
4
ELYZA-tasks-100を使ったローカルLLMの評価
Open
kun432
16日前にコメント追加
#
elyza
#
evaluation
#
LLM
1
RAGの評価ツール"ARES"を試す
Open
kun432
2ヶ月前にコメント追加
#
ares
#
evaluation
#
LLM
#
rag
1
DeepEvalを試す
Open
kun432
3ヶ月前にコメント追加
#
DeepEval
#
evaluation
#
LLM
2
TruBricksを使ったユーザーフィードバック機能のデモを試してみる
Closed
kun432
2023/07/11にクローズ
#
evaluation
#
trubricks
#
LLM
4