📑
ゼロからLLMをつくりたくなったときに参考になりそうなサイト
はじめに
「ゼロからLLMつくりたいなー」と思っていますが、なかなか時間がとれないので、いざというとき(?)のために、参考になりそうなサイトをまとめておきます。
個人的な備忘録です。まだ全然作れていないので、どれが良いという評価もできません。
NLP2024チュートリアル
良さそう。
NLP2024-チュートリアル3-作って学ぶ 日本語大規模言語モデル
Neural Networks: Zero to Hero
Andrej Karpathyさんの動画。英語ですが、すごい良さそう
Karparthyさんのリポジトリ
同じくKarpathyさんのnanoGPT
Llama
Llamaの情報
GENIAC
小型LlamaモデルのMegatron-LMを用いた事前学習と継続事前学習
Attention
Attentionをスクラッチで作るリポジトリ
必要な知識や環境構築
LLMを作るために必要な知識
環境構築
実装例は画像認識ではありますが、フレームワークをつくるためのコーディングという点で参考になると思います。
ゼロから作るDeep Learning ❸ ―フレームワーク編
その他
LLaVA(画像系)
モデルマージ
まとめ
LLMに限らず、何かをゼロから小さく作ってみるのは、回り道のようで理解を深める最短経路と思っています。すぐ効果があるようなものではないですが、こういうのはまとめて取り組んでいきたいですね。
日本語の良い書籍が出ないかなーと期待もしています。
参考リンク
LLM関係の最初に読むべき論文リスト
変更履歴
- 2024/07/09 アップデート
Discussion