Gemcook Tech Blog
🐳

DeepSeekが米国制裁下で伸びまくる理由を考えてみた

2025/02/07に公開

こんにちは、株式会社 Gemcook のじゅんです!🙋

最近、DeepSeek の論文を読んでいて、すごく面白い発見があったんです。

実は米国の制裁下にある彼らが、その制約をむしろチャンスに変えている。この話、なんだかワクワクしませんか?

クリティカルシンキングと制約の関係

心理学では、人間は制約があるときこそ、最も「クリティカルシンキング(批判的思考)」が活性化されると言われています。
実は、この現象が DeepSeek の急成長の鍵を握っているように思えるんです。
例えば、皆さんは「ブレインストーミング」をしたことがありますよね。何の制限もない状態で「自由に発想してください」と言われても、意外とアイデアが出てこない。でも「予算は 100 万円以内」「期間は 1 ヶ月」という制約を設けると、むしろ創造的なアイデアが湧いてくる。
これと同じことが、AI 開発の世界でも起きているんです。

制約がもたらす意外な利点

米国企業は最新の H100 GPU を自由に使えます。一方、DeepSeek は制裁により、性能を制限された H800 しか使えません。
一見すると、これは大きなハンディキャップに思えます。
しかし、この「制約」が、逆に革新的なアプローチを生み出しているんです。

シンプルな発想の強さ

DeepSeek の論文を読んでいて、一番驚いたのは彼らが行っている革新が意外とシンプルだということです。

まるで、私たちが普段やっているような「リソースが限られているなら、賢く使おう」という発想の延長線上にあるんです。

DeepSeek-V3 の賢い工夫

特に面白いのが、MoE(Mixture of Experts)アーキテクチャという仕組みです。この技術の考え方は、私たちの身近にあるものと意外な共通点があるんです。

例えば、皆さんは普段 AWS を使う時、Amazon S3 や DynamoDB でデータを効率よく分割して処理していますよね。これは「パーティショニング」という基本的な考え方です。MoE もある意味で似たような「分割と効率化」の発想を持っています。

具体的には、モデル全体で 6710 億という膨大なパラメータを持ちながら、実際の処理では状況に応じて 370 億のパラメータだけを選択的に活性化させます。まるでプロフェッショナルチームが案件に応じて最適な専門家を選ぶように、必要な「専門家」モデルだけを効率的に活用するんです。

それから、もう一つ面白い工夫があります。H800 GPU の制限に対応するため、FP8 混合精度トレーニングという手法を導入しています。

これって、人間の脳の仕組みに似ているんです。例えば、私たちの脳は日常的な感覚情報は大まかにサクッと処理して、重要な判断が必要な時は前頭葉でじっくり考えますよね?

AI の学習でも同じアプローチを取っています。普段の計算は 8 ビットの低精度でサクッと処理して、重要な計算だけ 16 ビットや 32 ビットの高精度で慎重にやります。

この「メリハリをつけた」やり方で、すごい結果が出たんです。具体的な数字を挙げると

  • メモリの使用量が 4 分の 1 になって
  • 計算速度は 2 倍以上になって
  • しかも、学習の精度はほとんど落ちていない

というわけです。めちゃくちゃ効率的じゃないですか?

気づきと希望

論文を読んでいて、正直すごくワクワクしました。

なぜって、こんなシンプルな発想の転換で、これだけの成長ができるんだと気づいたからです。

私たちの前にある「制約」も、実は大きなチャンスかもしれない。
シンプルな工夫が、時として最大の革新を生むのかもしれません。

結局のところ、DeepSeek の事例は、まさに"Keep It Simple, Stupid"(KISS の原則)を体現しているように思えるんです。既存の優れた考え方を、新しい文脈で活用する知恵。それこそが、真のイノベーションを生み出すのかもしれません。

このシンプルさに気づいたとき、なんだかすごく希望が湧いてきました。私たちにも、まだまだ成長の可能性があるんじゃないかって。

まとめ

本記事で紹介した DeepSeek の事例は、私個人の解釈と考察に基づくものです。しかし制約下でのシンプルな工夫と発想の転換が、時として大きな革新をもたらす可能性があることを、この事例から強く感じました。

参考資料

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

Gemcook Tech Blog
Gemcook Tech Blog

Discussion