DeepSeek-R1-0528 をご自身のコンピューターで実行できます

2025-05-29

要約: 最新の DeepSeek R1 モデルの小型版を、わずか約 6GB の RAM でご自身のコンピューターで実行できます。モデルはこちらからダウンロード してください。 LM Studio 0.3.16 以降が必要です。

undefined

DeepSeek-R1-0528-Qwen3-8B、新しい DeepSeek R1 の CoT から蒸留された 8B モデル

新しい DeepSeek R1: DeepSeek-R1-0528

昨日(2025年5月28日)、DeepSeek は R1 モデルの新しいイテレーションである DeepSeek-R1-0528 をリリースしました。より多くの計算リソースと改良されたポストトレーニングアルゴリズムを活用することで、このバージョンはモデルの推論および演繹能力を大幅に向上させています。

数学からプログラミング、一般的な論理に至るまで、幅広いベンチマークで高いスコアを記録し、O3 や Gemini 2.5 Pro のようなモデルの結果に迫っています。

undefined

リリース発表からの DeepSeek-R1-0528 ベンチマーク

蒸留された 8B モデル: DeepSeek-R1-0528-Qwen3-8B

R1-0528 のリリースの一環として、DeepSeek は DeepSeek-R1-0528-Qwen3-8B も公開しました。これは、DeepSeek-R1-0528 のチェーン・オブ・ソート(CoT)トレースを使用して Qwen3 8B Base のポストトレーニングを継続して作成された「蒸留」モデルです。この小型モデルも、ツールの使用と推論の両方をサポートします。

DeepSeek チームによると、AIME 2024 で最先端の結果を達成し、Qwen3 8B を約 10% 上回り、はるかに大きな Qwen3-235B-thinking に匹敵します。

AIME 24AIME 25HMMT 25年2月GPQA ダイヤモンドLiveCodeBench (2408-2505)
Qwen3-235B-A22B85.781.562.571.166.5
Qwen3-32B81.472.9-68.4-
Qwen3-8B76.067.3-62.0-
Phi-4-Reasoning-Plus-14B81.378.053.669.3-
Gemini-2.5-Flash-Thinking-052082.372.064.282.862.3
o3-mini (medium)79.676.753.376.865.9
DeepSeek-R1-0528-Qwen3-8B86.076.361.561.160.5
出典: Hugging Face の DeepSeek-R1-0528

この蒸留モデルは、4GB の RAM から実行できます。ツールと高度な推論をすぐにサポートします。

このモデルは MLXGGUF の両方の形式で利用可能で、LM Studio 0.3.16 以降が必要です。LM Studio で開くと、Mac、Windows、Linux マシンにダウンロードできます。




👾 参加しませんか

ローカル AI をすべての人にとってアクセス可能で有用なものにする仕事に興味がありますか?

空きポジションを見る: https://lmstudio.dokyumento.jp/careers