Closed2024/07/13にクローズ2ELYZA-tasks-100を使ったローカルLLMの評価LLMevaluationELYZAkun4322024/05/01https://huggingface.co/datasets/elyza/ELYZA-tasks-100 ここで紹介されているスクリプトで使うのがまとまってて良さそう https://qiita.com/wayama_ryousuke/items/105a164e5c80c150caf1#リンク スクリプトはここ https://github.com/Northern-System-Service/gpt4-autoeval 返信を追加kun4322024/07/13こっちでまるっとできるようになった https://zenn.dev/kun432/scraps/adab1a19170e68 返信を追加このスクラップは2024/07/13にクローズされました
kun4322024/05/01https://huggingface.co/datasets/elyza/ELYZA-tasks-100 ここで紹介されているスクリプトで使うのがまとまってて良さそう https://qiita.com/wayama_ryousuke/items/105a164e5c80c150caf1#リンク スクリプトはここ https://github.com/Northern-System-Service/gpt4-autoeval 返信を追加