13.4K ダウンロード
ByteDance社製の高度な推論モデル。柔軟な「思考予算」制御と、自身の推論の長さを内省する能力を備えています。
TTool useool use
推論
柔軟な思考予算制御とネイティブ512Kコンテキストをサポートする高度な推論モデル
GQAアテンションアーキテクチャを備えた36Bパラメータで、強力な長文脈推論、エージェントタスク、および汎用的な機能のために設計されています。
動的な推論長制御機能を備え、タスクの複雑さに応じて思考予算を512トークンから無制限に調整できます。
数学的推論、コーディングタスク、ツールの使用、およびSWE-Benchや問題解決を含むエージェントワークフローに優れています。
MATH (81.7%)、LiveCodeBench (67.4%)、RULER長文脈 (94.6%) を含む複数のベンチマークで最先端のパフォーマンスを達成しています。
Apache 2.0ライセンスと研究フレンドリーな設計で、国際的なユースケースに最適化されています。
モデル作成者によって定義された特別な機能
思考予算
: 選択
(デフォルト=-1)
モデルが内部推論に使用できる最大トークン数を設定します。
このモデルが使用する基盤となるモデルファイル
このモデルをダウンロードすると、LM Studioはお使いのマシンに最適なソースを選択します(これは上書きできます)。
このモデルに含まれるカスタム設定オプション