251.1K ダウンロード
DeepSeek-R1-0528モデルの蒸留版。DeepSeek-R1-0528のChain-of-Thought(CoT)を使用して、Qwen3 8B Baseモデルのポストトレーニングを継続して作成されました。
TTool useool use
推論
これは、DeepSeek-R1-0528のChain-of-Thought(CoT)を使用して、Qwen3 8B Baseモデルのポストトレーニングを継続して作成されたDeepSeek-R1-0528モデルの蒸留版です。
このモデルは、より大きなモデルよりも効率的でありながら、推論タスクで最先端のパフォーマンスを達成するように設計されています。
このモデルについて、彼らはこう言っています
DeepSeek-R1-0528のChain-of-Thoughtを蒸留してQwen3 8B Baseをポストトレーニングし、DeepSeek-R1-0528-Qwen3-8Bを取得しました。このモデルは、AIME 2024においてオープンソースモデルの中で最先端(SOTA)のパフォーマンスを達成し、Qwen3 8Bを+10.0%上回り、Qwen3-235B-thinkingのパフォーマンスに匹敵します。DeepSeek-R1-0528のChain-of-Thoughtは、推論モデルの学術研究と小規模モデルに焦点を当てた産業開発の両方にとって重要な意味を持つと信じています。
DeepSeekは、DeepSeek-R1-0528という新しいR1モデルのイテレーションをリリースしました。最新のアップデートでは、ポストトレーニング中の計算リソースの増加とアルゴリズム最適化メカニズムの導入を活用することにより、DeepSeek R1は推論と推論能力の深度を大幅に向上させました。このモデルは、数学、プログラミング、一般的な論理を含む様々なベンチマーク評価で優れたパフォーマンスを示しました。その全体的なパフォーマンスは、O3やGemini 2.5 Proなどの主要モデルに迫るものとなっています。
このモデルが使用する基盤となるモデルファイル
このモデルをダウンロードすると、LM Studioはお使いのマシンに最適なソースを選択します(これは上書きできます)。
このモデルに含まれるカスタム設定オプション