Zenn
bilzardpaper
このトピックを指定するには
bilzardpaper
と入力
Articles
10
Scraps
25
scraps
Trending
Alltime
Latest
GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers (Mar 2023)
Open
bilzard
2025/02/11にコメント追加
#
bilzardpaper
7
MLA vs GQA
Open
bilzard
2025/02/14にコメント追加
#
bilzardpaper
5
ランダムな文書をプロンプトに追加するとRAGの性能が改善する
Open
bilzard
2025/02/10にコメント追加
#
bilzardpaper
2
Warmup-Stable-Decay (WSD)
Open
bilzard
2025/02/09にコメント追加
#
bilzardpaper
1
AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration (Jun 2023)
Open
bilzard
2025/02/08にコメント追加
#
bilzardpaper
2
Alphazero-like Tree-Search can Guide Large Language Model Decoding and Training (Feb 2024)
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions (Nov 2024)
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
Phi-4: 14Bと小規模ながらGPT-4oレベルの性能のモデル
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
ORM vs PRM: 十分な学習データがあればPRMの方が有望
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (Jan 2025)
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek-R1
#
bilzardpaper
1
LoRAはfull-finetuningより顕著に性能が劣る
Open
bilzard
2025/02/05にコメント追加
#
lora
#
bilzardpaper
5
7BモデルでDeepSeek-R1のRLを再現する
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
2
DeepSeek-R1の学習コスト
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek v3
#
DeepSeek-R1
#
bilzardpaper
1
SFT vs RL: RLの方が汎化性能が高い
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
FP4量子化学習のシミュレーション
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
FP8精度によるモデル学習
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
生成データの品質と数のトレードオフ
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
強化学習によりinference scalingは生じているか?
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
PagedAttention: vLLMにおけるメモリ削減手法
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
AI and Memory Wall (Mar 2024)
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
2
投機的デコーディング(Speculative Decoding)
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
1
YaRN: RoPEの特性を考慮に入れたコンテクスト長の拡張手法
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
2
MLA(Multi-head Latent Attention)
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek v3
#
DeepSeek-V2
#
DeepSeek-R1
#
bilzardpaper
1
MTP(Multi-Token Prediction)
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek v3
#
DeepSeek-R1
#
bilzardpaper
1
N-gramによる語彙数のスケーリング
Open
bilzard
2025/02/05にコメント追加
#
bilzardpaper
2