🤖大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてーKan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]3ヶ月前 61
🦦Team「たぬき」開発振り返りメモ3: 10bクラスの大規模言語モデルを実際に開発して想定外だったこと5選Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]6ヶ月前 32
📚国会図書館データをGoogle Colab で取得し、Hugging Face へアップロードする方法Yasutaka Nishiiin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2ヶ月前 18
🦊ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語モデルの日本語性能を評価する(2024年8月)Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]3ヶ月前 11
🍣Tanukiモデルが全角数字・記号を認識出来ない問題とその解決(LLM学習コーパスの正規化の落とし穴)Aratakoin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2ヶ月前 13
💼【第1回】松尾研GENIACプロジェクト「チームビジネス」の取り組み 〜ビジネス利用を見据えたLLM開発の裏側を公開〜福田 渉in東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/05/16 10
🦝Tanuki-8B,8x8Bの開発完了までに考えていたことと、「科学の基盤モデル」の構築に向けた考えKan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]3ヶ月前 8
🎥【特別企画】松尾研GENIACプロジェクト「チームビジネス」メンバーにインタビュー!その熱意と挑戦の裏側に迫る(その1)福田 渉in東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]6ヶ月前 7
🦝フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]3ヶ月前 5
📑【Team JINIAC】官公庁データセットの収集(Webスクレイピングによる事後学習用データセット作成)daichi_tin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]3ヶ月前 6