Gemma 4 31B
Googles mest kapable dense open model
Frontier-klasse ræsonnement, native multimodale funktioner og produktionsklar kodningsydelse. Bygget på samme forskningsfundament som Gemini 3, nu kørende på EU-suveræn infrastruktur.
Hvorfor Gemma 4 31B
Google DeepMinds mest kapable dense open model kombinerer avanceret ræsonnement med multimodal forståelse. Ideel til agentiske arbejdsflows, der kræver både hastighed og intelligens.
Avanceret ræsonnement
Konfigurerbar tænketilstand til flertrinplanlægning og kompleks problemløsning. Skift ræsonnementsdybde baseret på, om din arbejdsbyrde kræver dyb overvejelse eller hurtig respons.
Native multimodal
Behandl tekst og billeder sammen til dokumentforståelse, visuel analyse, diagramudtrækning og struktureret dataoutput. Perfekt til vision-plus-ræsonnement arbejdsflows.
Agentiske workflows
Native funktionskald, struktureret JSON-output og system-prompt support. Byg autonome agenter, der pålideligt interagerer med værktøjer og API'er ved hjælp af frameworks som OpenClaw og CrewAI.
Konfigurerbar tænkning
Slå tænketilstand til eller fra afhængigt af opgavekravene. Aktiver for kompleks ræsonnement, deaktiver for latency-sensitive applikationer, der kræver hurtige svar.
31B
Parametre (Dense)
128K
Kontekstvindue
30%+
Hurtigere på Infercom
vs. næsthurtigste udbyder (Artificial Analysis)
Benchmark-ydelse
Frontier-klasse scorer på tværs af ræsonnement, kodning og vidensbenchmarks. Alle scorer fra Google DeepMind-evaluering.
MMLU Pro
85.2%
Advanced knowledge reasoning
AIME 2026
89.2%
Mathematical reasoning (no tools)
LiveCodeBench v6
80.0%
Production coding tasks
GPQA Diamond
84.3%
Graduate-level science QA
Codeforces ELO
2150
Competitive programming
Hvornår skal man bruge Gemma 4 31B
Gemma 4 udmærker sig ved opgaver, der kræver ræsonnement, vision eller agentiske evner. Den dense arkitektur muliggør effektiv finjustering og deployment.
Kodeassistent
Produktionsklar kodning
Forvandl enhver arbejdsstation til en frontier-klasse kodeassistent. Stærk præstation på LiveCodeBench og Codeforces benchmarks gør Gemma 4 ideel til agentiske kodnings-workflows med Claude Code eller lignende værktøjer.
Læs mereDokumentbehandling
Vision + Ræsonnement
Udtræk strukturerede data fra diagrammer, dokumenter og skærmbilleder. Kombiner visuel forståelse med ræsonnement for at returnere rent JSON-output til automatiserede workflows.
Agentisk AI
Autonome agenter
Native funktionskald og værktøjsbrug gør det muligt at bygge autonome agenter, der interagerer med API'er og eksterne tjenester. Kompatibel med OpenClaw, CrewAI og andre multi-agent frameworks.
Komplekse opgaver
Matematisk og videnskabeligt ræsonnement
89,2% på AIME 2026 matematisk ræsonnement og 84,3% på GPQA Diamond videnskabelig QA. Aktiver tænketilstand for komplekse flertrinsproblemer, der kræver dyb overvejelse.
Tænketilstand: Hvornår aktiveres
Tænkning til
Komplekse ræsonneringsopgaver, matematiske problemer, flertrinplanlægning, kodearkitekturbeslutninger. Værd at tage den ekstra latency for nøjagtighed.
Tænkning fra
Latency-sensitive applikationer, simple forespørgsler, højgennemløbs-pipelines, real-time interaktioner. Hurtig respons uden overvejelsesoverhead.
Sådan aktiverer du tænketilstand
response = client.chat.completions.create(
model="gemma-4-31B-it",
messages=[{"role": "user", "content": "Your prompt"}],
extra_body={"chat_template_kwargs": {"enable_thinking": True}},
)Sæt enable_thinking til true via chat_template_kwargs. Med OpenAI SDK'et angiver du det i extra_body; ved direkte API-kald placeres det på øverste niveau. Reasoning-dokumentation
Prissætning
Apache 2.0 licenseret med transparent, forbrugsbaseret prissætning. Ingen skjulte gebyrer.
| Model | Input (pr. 1M) | Output (pr. 1M) | Kontekst |
|---|---|---|---|
| Gemma 4 31B (Infercom) | €0.20 | €0.35 | 128K |
Priser i EUR ekskl. moms. EU-suveræn deployment med fuld GDPR-overholdelse.
EU-suveræn deployment
Gemma 4 31B kører på Infercoms dedikerede EU-infrastruktur. Dine data forlader aldrig europæisk jurisdiktion.
- Hostet i Tyskland (Equinix München 4)
- Fuld GDPR-overholdelse med EU-baseret DPO
- Ingen US CLOUD Act-eksponering
- ISO 27001-certificeret infrastruktur
- Databehandlingsaftale tilgængelig
Kom i gang med Gemma 4
from openai import OpenAI
client = OpenAI(
api_key="your-infercom-key",
base_url="https://api.infercom.ai/v1"
)
response = client.chat.completions.create(
model="gemma-4-31B-it",
messages=[{"role": "user", "content": "Your prompt here"}],
max_tokens=4096
)
print(response.choices[0].message.content)Ofte stillede spørgsmål
Hvad er Gemma 4 31B?
Gemma 4 31B er Google DeepMinds mest kapable dense open model, bygget på samme forskningsfundament som Gemini 3. Den har 31 milliarder parametre, 128K kontekstvindue, native multimodale funktioner (tekst og vision) og konfigurerbar tænketilstand til komplekse ræsonneringsopgaver.
Hvordan sammenligner Gemma 4 sig med Gemma 3?
Gemma 4 repræsenterer et betydeligt spring fra Gemma 3 med frontier-klasse benchmark-scorer: 85,2% på MMLU Pro, 89,2% på AIME 2026 matematisk ræsonnement og 80% på LiveCodeBench v6. Den tilføjer native multimodale funktioner, konfigurerbar tænketilstand og forbedret agentisk workflow-support med native funktionskald.
Er Gemma 4 multimodal?
Ja. Gemma 4 31B behandler native både tekst og billeder i samme kontekst. Dette muliggør dokumentforståelse, visuel analyse, diagramudtrækning og struktureret dataoutput fra billeder uden at kræve separate vision-modeller.
Hvad er tænketilstand, og hvordan aktiverer jeg den?
Tænketilstand er en konfigurerbar funktion, der muliggør dybere ræsonnement for komplekse opgaver. Når den er aktiveret, overvejer Gemma 4 før den svarer på flertrinsproblemer, matematisk ræsonnement og kodearkitekturbeslutninger. Aktivér den ved at sende enable_thinking: true via chat_template_kwargs (i extra_body med OpenAI SDK'et, eller på øverste niveau ved direkte API-kald). For latency-sensitive applikationer lader du den være slået fra for hurtigere svar.
Gemmes mine data i EU?
Ja. Infercom kører Gemma 4 31B på dedikeret infrastruktur i Tyskland (Equinix München 4). Dine data forlader aldrig europæisk jurisdiktion, med fuld GDPR-overholdelse, ingen US CLOUD Act-eksponering og ISO 27001-certificeret infrastruktur. En databehandlingsaftale er tilgængelig på forespørgsel.