53.2K ダウンロード

qwen/
qwen3-4b-thinking-2507
4B
qwen3moe

思考能力を継続的にスケーリングし、推論の質と深さを向上させたQwen3 4Bの思考バージョンです。

T ool use

推論

最終更新27日前
README

Qwen3 4B Thinking 2507 by qwen

思考能力を継続的にスケーリングし、推論の質と深さを向上させたQwen3-4Bの思考バージョンです。Qwen3-4B-Thinking-2507には以下の主な改善点が含まれています。

論理推論、数学、科学、コーディング、および通常は人間の専門知識を必要とする学術ベンチマークを含む推論タスクでのパフォーマンスが大幅に向上しました。指示追従、ツール使用、テキスト生成、人間の好みとの整合性などの一般的な機能が顕著に改善されました。256Kの長文コンテキスト理解能力が強化されました。

最大262,144トークンのコンテキスト長をサポートします。

注:このモデルは思考モードのみをサポートします。enable_thinking=Trueを指定する必要はありません。

ソース

このモデルが使用する基盤となるモデルファイル

このモデルをダウンロードすると、LM Studioはお使いのマシンに最適なソースを選択します(これは上書きできます)。

設定

このモデルに含まれるカスタム設定オプション

最小Pサンプリング
0
繰り返しペナルティ
無効
温度
0.6
トップKサンプリング
20
トップPサンプリング
0.95