nagamatznagamatz
Open2024/05/20にコメント追加7

llm

LLM
nagamatznagamatz2024/05/20

https://drive.google.com/file/d/1wvdeia1qSLij9QjVbR-qE2JY3001HMWa/view
loss spikeの原因・対策

nagamatznagamatz2024/05/20に更新

https://github.com/jquesnelle/yarn
LLMコンテキスト長の拡大

https://openreview.net/forum?id=wHBfxhZu1u
その論文

https://www.brainpad.co.jp/doors/contents/01_tech_2023-09-28-170010/#YaRN_Efficient_Context_Window_Extension_of_Large_Language_Models
その論文の概要紹介

https://arxiv.org/pdf/2309.12307
LongLoRA

nagamatznagamatz2024/05/20

https://llm-jp.nii.ac.jp/llm/2024/03/26/meeting-8.html
第8回 LLM 勉強会

nagamatznagamatz2024/05/20

https://drive.google.com/file/d/1OHmS6O62TBNNm_Y8Lu226PMIS0tx-EUQ/view
法的

nagamatznagamatz2024/05/20に更新

https://note.com/eurekachan/n/n6e439ca20920

https://note.com/kan_hatakeyama/n/naf44ad92d8e5

nagamatznagamatz2024/05/20

https://note.com/npaka/n/nc9ca523d5cd5

nagamatznagamatz2024/05/20

https://huggingface.co/blog/hf-bitsandbytes-integration
LLM.int8のHuggingFace統合

ポスト
nagamatz
nagamatz

nagamatz

エンジニアのための
情報共有コミュニティ

About

  • Zennについて
  • 運営会社
  • お知らせ・リリース
  • イベント

Guides

  • 使い方
  • 法人向けメニューNew
  • Publication / Pro
  • よくある質問

Links

  • X(Twitter)
  • GitHub
  • メディアキット

Legal

  • 利用規約
  • プライバシーポリシー
  • 特商法表記