Gemma 4 31B
Googles leistungsfähigstes Dense Open Model
Frontier-Klasse-Reasoning, native multimodale Fähigkeiten und produktionsreife Coding-Leistung. Auf derselben Forschungsbasis wie Gemini 3 aufgebaut, jetzt auf EU-souveräner Infrastruktur.
Warum Gemma 4 31B
Google DeepMinds leistungsfähigstes Dense Open Model kombiniert fortgeschrittenes Reasoning mit multimodalem Verständnis. Ideal für agentische Workflows, die sowohl Geschwindigkeit als auch Intelligenz erfordern.
Fortgeschrittenes Reasoning
Konfigurierbarer Denkmodus für mehrstufige Planung und komplexe Problemlösung. Wechseln Sie die Reasoning-Tiefe basierend darauf, ob Ihre Arbeitslast tiefe Überlegung oder schnelle Durchlaufzeit erfordert.
Native Multimodal
Verarbeiten Sie Text und Bilder gemeinsam für Dokumentenverständnis, visuelle Analyse, Diagrammextraktion und strukturierte Datenausgabe. Perfekt für Vision-plus-Reasoning-Workflows.
Agentische Workflows
Native Funktionsaufrufe, strukturierte JSON-Ausgabe und System-Prompt-Unterstützung. Erstellen Sie autonome Agenten, die zuverlässig mit Tools und APIs interagieren, mithilfe von Frameworks wie OpenClaw und CrewAI.
Konfigurierbares Denken
Schalten Sie den Denkmodus je nach Aufgabenanforderungen ein oder aus. Aktivieren Sie ihn für komplexes Reasoning, deaktivieren Sie ihn für latenzempfindliche Anwendungen, die schnelle Antworten benötigen.
31B
Parameter (Dense)
128K
Kontextfenster
30%+
Schneller auf Infercom
vs. nächstschnellster Anbieter (Artificial Analysis)
Benchmark-Leistung
Frontier-Klasse-Ergebnisse in Reasoning-, Coding- und Wissens-Benchmarks. Alle Ergebnisse aus Google DeepMind-Evaluierung.
MMLU Pro
85.2%
Advanced knowledge reasoning
AIME 2026
89.2%
Mathematical reasoning (no tools)
LiveCodeBench v6
80.0%
Production coding tasks
GPQA Diamond
84.3%
Graduate-level science QA
Codeforces ELO
2150
Competitive programming
Wann Gemma 4 31B verwenden
Gemma 4 glänzt bei Aufgaben, die Reasoning, Vision oder agentische Fähigkeiten erfordern. Die Dense-Architektur ermöglicht effizientes Fine-Tuning und Deployment.
Code-Assistent
Produktionsreifes Coding
Verwandeln Sie jede Workstation in einen Frontier-Klasse-Code-Assistenten. Starke Leistung bei LiveCodeBench und Codeforces-Benchmarks macht Gemma 4 ideal für agentische Coding-Workflows mit Claude Code oder ähnlichen Tools.
Mehr erfahrenDokumentenverarbeitung
Vision + Reasoning
Extrahieren Sie strukturierte Daten aus Diagrammen, Dokumenten und Screenshots. Kombinieren Sie visuelles Verständnis mit Reasoning, um saubere JSON-Ausgabe für automatisierte Workflows zu liefern.
Agentische KI
Autonome Agenten
Native Funktionsaufrufe und Tool-Nutzung ermöglichen den Aufbau autonomer Agenten, die mit APIs und externen Diensten interagieren. Kompatibel mit OpenClaw, CrewAI und anderen Multi-Agent-Frameworks.
Komplexe Aufgaben
Mathematisches und wissenschaftliches Reasoning
89,2% bei AIME 2026 mathematischem Reasoning und 84,3% bei GPQA Diamond wissenschaftlichem QA. Aktivieren Sie den Denkmodus für komplexe mehrstufige Probleme, die tiefe Überlegung erfordern.
Denkmodus: Wann aktivieren
Denken Ein
Komplexe Reasoning-Aufgaben, mathematische Probleme, mehrstufige Planung, Code-Architekturentscheidungen. Die zusätzliche Latenz lohnt sich für Genauigkeit.
Denken Aus
Latenzempfindliche Anwendungen, einfache Anfragen, Hochdurchsatz-Pipelines, Echtzeit-Interaktionen. Schnelle Durchlaufzeit ohne Überlegungs-Overhead.
Denkmodus aktivieren
response = client.chat.completions.create(
model="gemma-4-31B-it",
messages=[{"role": "user", "content": "Your prompt"}],
extra_body={"chat_template_kwargs": {"enable_thinking": True}},
)Setzen Sie enable_thinking über chat_template_kwargs auf true. Mit dem OpenAI SDK übergeben Sie es in extra_body; bei direkten API-Aufrufen auf oberster Ebene. Reasoning-Dokumentation
Preise
Apache 2.0 lizenziert mit transparenter, nutzungsbasierter Preisgestaltung. Keine versteckten Gebühren.
| Modell | Eingabe (pro 1M) | Ausgabe (pro 1M) | Kontext |
|---|---|---|---|
| Gemma 4 31B (Infercom) | €0.20 | €0.35 | 128K |
Preise in EUR zzgl. MwSt. EU-souveränes Deployment mit voller DSGVO-Compliance.
EU-souveränes Deployment
Gemma 4 31B läuft auf Infercoms dedizierter EU-Infrastruktur. Ihre Daten verlassen niemals die europäische Gerichtsbarkeit.
- Gehostet in Deutschland (Equinix München 4)
- Volle DSGVO-Compliance mit EU-basiertem DSB
- Keine US CLOUD Act-Exposition
- ISO 27001-zertifizierte Infrastruktur
- Auftragsverarbeitungsvertrag verfügbar
Mit Gemma 4 starten
from openai import OpenAI
client = OpenAI(
api_key="your-infercom-key",
base_url="https://api.infercom.ai/v1"
)
response = client.chat.completions.create(
model="gemma-4-31B-it",
messages=[{"role": "user", "content": "Your prompt here"}],
max_tokens=4096
)
print(response.choices[0].message.content)Häufig gestellte Fragen
Was ist Gemma 4 31B?
Gemma 4 31B ist Google DeepMinds leistungsfähigstes Dense Open Model, aufgebaut auf derselben Forschungsbasis wie Gemini 3. Es verfügt über 31 Milliarden Parameter, ein 128K-Kontextfenster, native multimodale Fähigkeiten (Text und Vision) und konfigurierbaren Denkmodus für komplexe Reasoning-Aufgaben.
Wie vergleicht sich Gemma 4 mit Gemma 3?
Gemma 4 stellt einen bedeutenden Sprung gegenüber Gemma 3 dar mit Frontier-Klasse-Benchmark-Ergebnissen: 85,2% bei MMLU Pro, 89,2% bei AIME 2026 mathematischem Reasoning und 80% bei LiveCodeBench v6. Es fügt native multimodale Fähigkeiten, konfigurierbaren Denkmodus und verbesserte agentische Workflow-Unterstützung mit nativen Funktionsaufrufen hinzu.
Ist Gemma 4 multimodal?
Ja. Gemma 4 31B verarbeitet nativ sowohl Text als auch Bilder im selben Kontext. Dies ermöglicht Dokumentenverständnis, visuelle Analyse, Diagrammextraktion und strukturierte Datenausgabe aus Bildern ohne separate Vision-Modelle.
Was ist der Denkmodus und wie aktiviere ich ihn?
Der Denkmodus ist eine konfigurierbare Funktion, die tieferes Reasoning für komplexe Aufgaben ermöglicht. Wenn aktiviert, überlegt Gemma 4 vor der Antwort bei mehrstufigen Problemen, mathematischem Reasoning und Code-Architekturentscheidungen. Aktivieren Sie ihn, indem Sie enable_thinking: true über chat_template_kwargs übergeben (in extra_body beim OpenAI SDK, oder auf oberster Ebene bei direkten API-Aufrufen). Für latenzempfindliche Anwendungen lassen Sie ihn für schnellere Antworten deaktiviert.
Werden meine Daten in der EU gespeichert?
Ja. Infercom betreibt Gemma 4 31B auf dedizierter Infrastruktur in Deutschland (Equinix München 4). Ihre Daten verlassen niemals die europäische Gerichtsbarkeit, mit voller DSGVO-Compliance, ohne US CLOUD Act-Exposition und ISO 27001-zertifizierter Infrastruktur. Ein Auftragsverarbeitungsvertrag ist auf Anfrage verfügbar.