🤖大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてーKan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]4ヶ月前 73
🦦Team「たぬき」開発振り返りメモ3: 10bクラスの大規模言語モデルを実際に開発して想定外だったこと5選Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/05/28 34
🧸LLM学習データのキュレーションに関する取り組みまとめ【松尾研 GENIAC Team天元突破】Koki Itaiin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/07/06 18
🦥Team「たぬき」開発振り返りメモ2: Scaling lawの壁は高かったという話Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/05/23 16
🦦Team「たぬき」開発振り返りメモ1: Scaling Lawに挑戦しようと準備する話Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/05/22 19
📚国会図書館データをGoogle Colab で取得し、Hugging Face へアップロードする方法Yasutaka Nishiiin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]4ヶ月前 18
🦊ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語モデルの日本語性能を評価する(2024年8月)Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]4ヶ月前 11
🍣Tanukiモデルが全角数字・記号を認識出来ない問題とその解決(LLM学習コーパスの正規化の落とし穴)Aratakoin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]4ヶ月前 14
🐙100万件超えデータセットでのInstruction-Tuning ~より良い出力を求めて~Ruuchamiin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/07/08 16
💼【第1回】松尾研GENIACプロジェクト「チームビジネス」の取り組み 〜ビジネス利用を見据えたLLM開発の裏側を公開〜福田 渉in東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/05/16 10
🦝Tanuki-8B,8x8Bの開発完了までに考えていたことと、「科学の基盤モデル」の構築に向けた考えKan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]4ヶ月前 9
🎥【特別企画】松尾研GENIACプロジェクト「チームビジネス」メンバーにインタビュー!その熱意と挑戦の裏側に迫る(その1)福田 渉in東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]2024/05/28 7
🦝フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細Kan Hatakeyamain東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]4ヶ月前 7
📑【Team JINIAC】官公庁データセットの収集(Webスクレイピングによる事後学習用データセット作成)daichi_tin東大松尾・岩澤研究室 | LLM開発 プロジェクト[GENIAC]5ヶ月前 6