Open1ヶ月前にコメント追加4クイズ用データセットについてmorioka2ヶ月前に更新hpprcさんが、いくつかhugingface dataset形式で整理されている https://huggingface.co/datasets/hpprc/quiz-no-mori https://huggingface.co/datasets/hpprc/quiz-works https://huggingface.co/datasets/hpprc/auto-wikinews-qa https://huggingface.co/datasets/hpprc/auto-wiki-qa-rels "quiz" で探すとhuggingface datasets にはそれ以外にもいくつかある https://huggingface.co/datasets/fauzanrrizky/generate-quiz-dataset 当然、AI王の https://huggingface.co/datasets/tohoku-nlp/quiz-datasets https://github.com/cl-tohoku/quiz-datasets https://huggingface.co/datasets/llm-book/aio-passages-bpr-bert-base-japanese-v3 https://huggingface.co/datasets/llm-book/aio-passages https://huggingface.co/datasets/llm-book/aio_from_tohoku https://huggingface.co/datasets/llm-book/aio https://huggingface.co/datasets/llm-book/aio-retriever https://huggingface.co/datasets/sbintuitions/aio-extended-answers https://huggingface.co/datasets/sbintuitions/niilc-qa morioka2ヶ月前https://zenn.dev/ymdkit/articles/6ab0b2e6e34e68 morioka2ヶ月前記事ソースをどうするか、wikipediaか、hpprcさんの場合はwikinewsを使っている。品質や量はどんなものか。 新鮮さは不要で、記事のスタイルと、wikipedia記事との対応が取れればよいのかも。 https://ja.wikinews.org/wiki/メインページ#new morioka1ヶ月前hpprcさんは、所属名義で以下も相次いでデータセット公開されている。 https://huggingface.co/datasets/cl-nagoya/auto-wiki-qa https://huggingface.co/datasets/cl-nagoya/auto-wiki-nli-reward https://huggingface.co/datasets/cl-nagoya/auto-wiki-qa-nemotron
morioka2ヶ月前に更新hpprcさんが、いくつかhugingface dataset形式で整理されている https://huggingface.co/datasets/hpprc/quiz-no-mori https://huggingface.co/datasets/hpprc/quiz-works https://huggingface.co/datasets/hpprc/auto-wikinews-qa https://huggingface.co/datasets/hpprc/auto-wiki-qa-rels "quiz" で探すとhuggingface datasets にはそれ以外にもいくつかある https://huggingface.co/datasets/fauzanrrizky/generate-quiz-dataset 当然、AI王の https://huggingface.co/datasets/tohoku-nlp/quiz-datasets https://github.com/cl-tohoku/quiz-datasets https://huggingface.co/datasets/llm-book/aio-passages-bpr-bert-base-japanese-v3 https://huggingface.co/datasets/llm-book/aio-passages https://huggingface.co/datasets/llm-book/aio_from_tohoku https://huggingface.co/datasets/llm-book/aio https://huggingface.co/datasets/llm-book/aio-retriever https://huggingface.co/datasets/sbintuitions/aio-extended-answers https://huggingface.co/datasets/sbintuitions/niilc-qa
morioka2ヶ月前記事ソースをどうするか、wikipediaか、hpprcさんの場合はwikinewsを使っている。品質や量はどんなものか。 新鮮さは不要で、記事のスタイルと、wikipedia記事との対応が取れればよいのかも。 https://ja.wikinews.org/wiki/メインページ#new
morioka1ヶ月前hpprcさんは、所属名義で以下も相次いでデータセット公開されている。 https://huggingface.co/datasets/cl-nagoya/auto-wiki-qa https://huggingface.co/datasets/cl-nagoya/auto-wiki-nli-reward https://huggingface.co/datasets/cl-nagoya/auto-wiki-qa-nemotron