Zenn
DeepSeek-R1
このトピックを指定するには
deepseekr1
と入力
Articles
25
Scraps
4
scraps
Trending
Alltime
Latest
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning (Jan 2025)
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek-R1
#
bilzardpaper
1
DeepSeek-R1の学習コスト
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek v3
#
DeepSeek-R1
#
bilzardpaper
1
MLA(Multi-head Latent Attention)
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek v3
#
DeepSeek-V2
#
DeepSeek-R1
#
bilzardpaper
1
MTP(Multi-Token Prediction)
Open
bilzard
2025/02/05にコメント追加
#
DeepSeek v3
#
DeepSeek-R1
#
bilzardpaper
1