67.5K ダウンロード数

deepseek/
deepseek-r1-05...
8B
qwen3

DeepSeek-R1-0528モデルの蒸留版で、DeepSeek-R1-0528のChain-of-Thought (CoT) を使用してQwen3 8B Baseモデルのポストトレーニングプロセスを継続することで作成されました。

推論

最終更新日   15日前

最低4GB
README

DeepSeek-R1-0528-Qwen3-8B

これはDeepSeek-R1-0528モデルの蒸留版であり、DeepSeek-R1-0528のChain-of-Thought (CoT) を使用してQwen3 8B Baseモデルのポストトレーニングプロセスを継続することで作成されました。

このモデルは、より大規模なモデルよりも効率的でありながら、推論タスクにおいて最先端のパフォーマンスを達成するように設計されています。

このモデルについて、彼らは次のように述べています。

私たちはDeepSeek-R1-0528の思考連鎖(chain-of-thought)を蒸留し、Qwen3 8B BaseをポストトレーニングしてDeepSeek-R1-0528-Qwen3-8Bを得ました。このモデルは、AIME 2024においてオープンソースモデルの中で最先端(SOTA)のパフォーマンスを達成し、Qwen3 8Bを+10.0%上回り、Qwen3-235B-thinkingのパフォーマンスに匹敵します。DeepSeek-R1-0528の思考連鎖は、推論モデルに関する学術研究と小規模モデルに焦点を当てた産業開発の両方にとって非常に重要であると信じています。

DeepSeek-R1-0528概要

DeepSeekは、DeepSeek-R1-0528と名付けられたR1モデルの新しいイテレーションをリリースしました。最新のアップデートでは、DeepSeek R1は、ポストトレーニング中に計算リソースの増加を活用し、アルゴリズム最適化メカニズムを導入することで、推論と推測能力の深さを大幅に向上させました。このモデルは、数学、プログラミング、一般論理を含む様々なベンチマーク評価において優れたパフォーマンスを示しています。その全体的なパフォーマンスは、O3やGemini 2.5 Proなどの主要モデルに近づいています。

ソース

このモデルが使用する基盤モデルファイル

このモデルをダウンロードすると、LM Studioはあなたのマシンに最適なソースを選択します(これは上書き可能です)

設定

このモデルに含まれるカスタム設定オプション

カスタム設定はありません。