Closed4ヶ月前にクローズ2ELYZA-tasks-100を使ったローカルLLMの評価LLMevaluationelyzakun4322024/05/01https://huggingface.co/datasets/elyza/ELYZA-tasks-100 ここで紹介されているスクリプトで使うのがまとまってて良さそう https://qiita.com/wayama_ryousuke/items/105a164e5c80c150caf1#リンク スクリプトはここ https://github.com/Northern-System-Service/gpt4-autoeval kun4324ヶ月前こっちでまるっとできるようになった https://zenn.dev/kun432/scraps/adab1a19170e68 このスクラップは4ヶ月前にクローズされました
kun4322024/05/01https://huggingface.co/datasets/elyza/ELYZA-tasks-100 ここで紹介されているスクリプトで使うのがまとまってて良さそう https://qiita.com/wayama_ryousuke/items/105a164e5c80c150caf1#リンク スクリプトはここ https://github.com/Northern-System-Service/gpt4-autoeval