LM Studio 0.3.7
DeepSeek R1 Distilledモデルとllama.cppモデルのKVキャッシュ量子化のサポートを含むLM Studio 0.3.7を共有できることを嬉しく思います。
DeepSeekの待望のR1モデルは、OpenAIのo1と同等のパフォーマンスを達成することを目指した、SOTA(最先端)のオープンソース推論モデルです。
1.5B、7B、8B、13B、14B、32B、70Bの各バリアントの「蒸留された」モデルが、LM Studio内でダウンロード可能です。蒸留モデルは、より大きく高性能なモデル(この場合はDeepSeekの完全なR1モデル)の出力を用いて、より小さなモデルをファインチューニングすることで作成されます。興味があれば、DeepSeekの技術レポートをこちらでご確認ください。
DeepSeek R1を使用すると、<think>
</think>
トークンで囲まれた「思考プロセス」が出力されることに気づくでしょう。これらは現在、通常の応答と同じようにチャットウィンドウに表示されるため、扱いにくい状況です。思考プロセスを折りたたんだり展開したりできるように、UIのアップグレードに取り組んでいます。0.3.8アップデートにご期待ください。
ビルド 2
ビルド 1
Cmd/Ctrl + Shift + H
で開きます。