Gemma 4 31B

Googles leistungsfähigstes Dense Open Model

Frontier-Klasse-Reasoning, native multimodale Fähigkeiten und produktionsreife Coding-Leistung. Auf derselben Forschungsbasis wie Gemini 3 aufgebaut, jetzt auf EU-souveräner Infrastruktur.

Warum Gemma 4 31B

Google DeepMinds leistungsfähigstes Dense Open Model kombiniert fortgeschrittenes Reasoning mit multimodalem Verständnis. Ideal für agentische Workflows, die sowohl Geschwindigkeit als auch Intelligenz erfordern.

Fortgeschrittenes Reasoning

Konfigurierbarer Denkmodus für mehrstufige Planung und komplexe Problemlösung. Wechseln Sie die Reasoning-Tiefe basierend darauf, ob Ihre Arbeitslast tiefe Überlegung oder schnelle Durchlaufzeit erfordert.

Native Multimodal

Verarbeiten Sie Text und Bilder gemeinsam für Dokumentenverständnis, visuelle Analyse, Diagrammextraktion und strukturierte Datenausgabe. Perfekt für Vision-plus-Reasoning-Workflows.

Agentische Workflows

Native Funktionsaufrufe, strukturierte JSON-Ausgabe und System-Prompt-Unterstützung. Erstellen Sie autonome Agenten, die zuverlässig mit Tools und APIs interagieren, mithilfe von Frameworks wie OpenClaw und CrewAI.

Konfigurierbares Denken

Schalten Sie den Denkmodus je nach Aufgabenanforderungen ein oder aus. Aktivieren Sie ihn für komplexes Reasoning, deaktivieren Sie ihn für latenzempfindliche Anwendungen, die schnelle Antworten benötigen.

31B

Parameter (Dense)

128K

Kontextfenster

30%+

Schneller auf Infercom

vs. nächstschnellster Anbieter (Artificial Analysis)

Benchmark-Leistung

Frontier-Klasse-Ergebnisse in Reasoning-, Coding- und Wissens-Benchmarks. Alle Ergebnisse aus Google DeepMind-Evaluierung.

MMLU Pro

85.2%

Advanced knowledge reasoning

AIME 2026

89.2%

Mathematical reasoning (no tools)

LiveCodeBench v6

80.0%

Production coding tasks

GPQA Diamond

84.3%

Graduate-level science QA

Codeforces ELO

2150

Competitive programming

Vollständige Benchmark-Details anzeigen

Wann Gemma 4 31B verwenden

Gemma 4 glänzt bei Aufgaben, die Reasoning, Vision oder agentische Fähigkeiten erfordern. Die Dense-Architektur ermöglicht effizientes Fine-Tuning und Deployment.

Code-Assistent

Produktionsreifes Coding

Verwandeln Sie jede Workstation in einen Frontier-Klasse-Code-Assistenten. Starke Leistung bei LiveCodeBench und Codeforces-Benchmarks macht Gemma 4 ideal für agentische Coding-Workflows mit Claude Code oder ähnlichen Tools.

Mehr erfahren

Dokumentenverarbeitung

Vision + Reasoning

Extrahieren Sie strukturierte Daten aus Diagrammen, Dokumenten und Screenshots. Kombinieren Sie visuelles Verständnis mit Reasoning, um saubere JSON-Ausgabe für automatisierte Workflows zu liefern.

Agentische KI

Autonome Agenten

Native Funktionsaufrufe und Tool-Nutzung ermöglichen den Aufbau autonomer Agenten, die mit APIs und externen Diensten interagieren. Kompatibel mit OpenClaw, CrewAI und anderen Multi-Agent-Frameworks.

Komplexe Aufgaben

Mathematisches und wissenschaftliches Reasoning

89,2% bei AIME 2026 mathematischem Reasoning und 84,3% bei GPQA Diamond wissenschaftlichem QA. Aktivieren Sie den Denkmodus für komplexe mehrstufige Probleme, die tiefe Überlegung erfordern.

Denkmodus: Wann aktivieren

Denken Ein

Komplexe Reasoning-Aufgaben, mathematische Probleme, mehrstufige Planung, Code-Architekturentscheidungen. Die zusätzliche Latenz lohnt sich für Genauigkeit.

Denken Aus

Latenzempfindliche Anwendungen, einfache Anfragen, Hochdurchsatz-Pipelines, Echtzeit-Interaktionen. Schnelle Durchlaufzeit ohne Überlegungs-Overhead.

Denkmodus aktivieren

response = client.chat.completions.create(
    model="gemma-4-31B-it",
    messages=[{"role": "user", "content": "Your prompt"}],
    extra_body={"chat_template_kwargs": {"enable_thinking": True}},
)

Setzen Sie enable_thinking über chat_template_kwargs auf true. Mit dem OpenAI SDK übergeben Sie es in extra_body; bei direkten API-Aufrufen auf oberster Ebene. Reasoning-Dokumentation

Preise

Apache 2.0 lizenziert mit transparenter, nutzungsbasierter Preisgestaltung. Keine versteckten Gebühren.

Modell	Eingabe (pro 1M)	Ausgabe (pro 1M)	Kontext
Gemma 4 31B (Infercom)	€0.20	€0.35	128K

Preise in EUR zzgl. MwSt. EU-souveränes Deployment mit voller DSGVO-Compliance.

EU-souveränes Deployment

Gemma 4 31B läuft auf Infercoms dedizierter EU-Infrastruktur. Ihre Daten verlassen niemals die europäische Gerichtsbarkeit.

Gehostet in Deutschland (Equinix München 4)
Volle DSGVO-Compliance mit EU-basiertem DSB
Keine US CLOUD Act-Exposition
ISO 27001-zertifizierte Infrastruktur
Auftragsverarbeitungsvertrag verfügbar

ISO 27001

DSGVO-konform

Deutschland

SambaNova RDUs

Mit Gemma 4 starten

quickstart.py

from openai import OpenAI

client = OpenAI(
    api_key="your-infercom-key",
    base_url="https://api.infercom.ai/v1"
)

response = client.chat.completions.create(
    model="gemma-4-31B-it",
    messages=[{"role": "user", "content": "Your prompt here"}],
    max_tokens=4096
)

print(response.choices[0].message.content)

Drop-in OpenAI API-Kompatibilität. Ändern Sie Ihre Base URL und nutzen Sie Gemma 4 in wenigen Minuten. Keine Codeänderungen erforderlich.

Kostenlose Stufe verfügbar. Pay-as-you-go ohne Verpflichtungen.

Häufig gestellte Fragen

Was ist Gemma 4 31B?

Gemma 4 31B ist Google DeepMinds leistungsfähigstes Dense Open Model, aufgebaut auf derselben Forschungsbasis wie Gemini 3. Es verfügt über 31 Milliarden Parameter, ein 128K-Kontextfenster, native multimodale Fähigkeiten (Text und Vision) und konfigurierbaren Denkmodus für komplexe Reasoning-Aufgaben.

Wie vergleicht sich Gemma 4 mit Gemma 3?

Gemma 4 stellt einen bedeutenden Sprung gegenüber Gemma 3 dar mit Frontier-Klasse-Benchmark-Ergebnissen: 85,2% bei MMLU Pro, 89,2% bei AIME 2026 mathematischem Reasoning und 80% bei LiveCodeBench v6. Es fügt native multimodale Fähigkeiten, konfigurierbaren Denkmodus und verbesserte agentische Workflow-Unterstützung mit nativen Funktionsaufrufen hinzu.

Ist Gemma 4 multimodal?

Ja. Gemma 4 31B verarbeitet nativ sowohl Text als auch Bilder im selben Kontext. Dies ermöglicht Dokumentenverständnis, visuelle Analyse, Diagrammextraktion und strukturierte Datenausgabe aus Bildern ohne separate Vision-Modelle.

Was ist der Denkmodus und wie aktiviere ich ihn?

Der Denkmodus ist eine konfigurierbare Funktion, die tieferes Reasoning für komplexe Aufgaben ermöglicht. Wenn aktiviert, überlegt Gemma 4 vor der Antwort bei mehrstufigen Problemen, mathematischem Reasoning und Code-Architekturentscheidungen. Aktivieren Sie ihn, indem Sie enable_thinking: true über chat_template_kwargs übergeben (in extra_body beim OpenAI SDK, oder auf oberster Ebene bei direkten API-Aufrufen). Für latenzempfindliche Anwendungen lassen Sie ihn für schnellere Antworten deaktiviert.

Werden meine Daten in der EU gespeichert?

Ja. Infercom betreibt Gemma 4 31B auf dedizierter Infrastruktur in Deutschland (Equinix München 4). Ihre Daten verlassen niemals die europäische Gerichtsbarkeit, mit voller DSGVO-Compliance, ohne US CLOUD Act-Exposition und ISO 27001-zertifizierter Infrastruktur. Ein Auftragsverarbeitungsvertrag ist auf Anfrage verfügbar.

Gemma 4 31B

Warum Gemma 4 31B

Fortgeschrittenes Reasoning

Native Multimodal

Agentische Workflows

Konfigurierbares Denken

Benchmark-Leistung

Wann Gemma 4 31B verwenden

Denkmodus: Wann aktivieren

Preise

EU-souveränes Deployment

Mit Gemma 4 starten

Häufig gestellte Fragen

Verwandte Ressourcen

Leistungs-Benchmarks

Agentischer Coding-Guide

API-Dokumentation

Preisdetails

Bereit, die Zukunft der AI in Europa zu gestalten?