qwen/qwen3-4b-thinking-2507 • LM Studio

53.2K ダウンロード

qwen/qwen3-4b-thinking-2507

qwen/

qwen3-4b-thinking-2507

4B

qwen3moe

思考能力を継続的にスケーリングし、推論の質と深さを向上させたQwen3 4Bの思考バージョンです。

TTool useool use

推論

最終更新27日前

最低最小2GB

README

Qwen3 4B Thinking 2507 by qwen

思考能力を継続的にスケーリングし、推論の質と深さを向上させたQwen3-4Bの思考バージョンです。Qwen3-4B-Thinking-2507には以下の主な改善点が含まれています。

論理推論、数学、科学、コーディング、および通常は人間の専門知識を必要とする学術ベンチマークを含む推論タスクでのパフォーマンスが大幅に向上しました。指示追従、ツール使用、テキスト生成、人間の好みとの整合性などの一般的な機能が顕著に改善されました。256Kの長文コンテキスト理解能力が強化されました。

最大262,144トークンのコンテキスト長をサポートします。

注：このモデルは思考モードのみをサポートします。enable_thinking=Trueを指定する必要はありません。

ソース

このモデルが使用する基盤となるモデルファイル

ベース

GGUF

MLX

MLX

MLX

このモデルをダウンロードすると、LM Studioはお使いのマシンに最適なソースを選択します（これは上書きできます）。

設定

このモデルに含まれるカスタム設定オプション

最小Pサンプリング

0

繰り返しペナルティ

無効

温度

0.6

トップKサンプリング

20

トップPサンプリング

0.95