ログインまたはサインアップ
ホーム
ログイン
モデルカタログ
業務利用
ドキュメント
ブログ
ダウンロード
採用情報
プライバシーポリシー
利用規約
10
54.2K ダウンロード
Google の最新の画像+テキスト入力モデル。Gemini モデルの作成に使用されたのと同じ研究と技術で構築されています。
ビジョン入力
コンテキスト長は128kトークン、最大出力は8192です。
マルチモーダルは、896 x 896 解像度に正規化された画像をサポートします。
Gemma 3 モデルは、質問応答、要約、推論など、さまざまなテキスト生成および画像理解タスクに適しています。
最新の(現在ベータ版の)llama.cppランタイムが必要です。
このモデルが使用する基盤となるモデルファイル
ベース
GGUF
このモデルをダウンロードすると、LM Studioはお使いのマシンに最適なソースを選択します(これは上書きできます)。
このモデルに含まれるカスタム設定オプション