Gemma 4 31B

Googles mest kapable dense open model

Frontier-klasse ræsonnement, native multimodale funktioner og produktionsklar kodningsydelse. Bygget på samme forskningsfundament som Gemini 3, nu kørende på EU-suveræn infrastruktur.

Hvorfor Gemma 4 31B

Google DeepMinds mest kapable dense open model kombinerer avanceret ræsonnement med multimodal forståelse. Ideel til agentiske arbejdsflows, der kræver både hastighed og intelligens.

Avanceret ræsonnement

Konfigurerbar tænketilstand til flertrinplanlægning og kompleks problemløsning. Skift ræsonnementsdybde baseret på, om din arbejdsbyrde kræver dyb overvejelse eller hurtig respons.

Native multimodal

Behandl tekst og billeder sammen til dokumentforståelse, visuel analyse, diagramudtrækning og struktureret dataoutput. Perfekt til vision-plus-ræsonnement arbejdsflows.

Agentiske workflows

Native funktionskald, struktureret JSON-output og system-prompt support. Byg autonome agenter, der pålideligt interagerer med værktøjer og API'er ved hjælp af frameworks som OpenClaw og CrewAI.

Konfigurerbar tænkning

Slå tænketilstand til eller fra afhængigt af opgavekravene. Aktiver for kompleks ræsonnement, deaktiver for latency-sensitive applikationer, der kræver hurtige svar.

31B

Parametre (Dense)

128K

Kontekstvindue

30%+

Hurtigere på Infercom

vs. næsthurtigste udbyder (Artificial Analysis)

Benchmark-ydelse

Frontier-klasse scorer på tværs af ræsonnement, kodning og vidensbenchmarks. Alle scorer fra Google DeepMind-evaluering.

MMLU Pro

85.2%

Advanced knowledge reasoning

AIME 2026

89.2%

Mathematical reasoning (no tools)

LiveCodeBench v6

80.0%

Production coding tasks

GPQA Diamond

84.3%

Graduate-level science QA

Codeforces ELO

2150

Competitive programming

Se fulde benchmark-detaljer

Hvornår skal man bruge Gemma 4 31B

Gemma 4 udmærker sig ved opgaver, der kræver ræsonnement, vision eller agentiske evner. Den dense arkitektur muliggør effektiv finjustering og deployment.

Kodeassistent

Produktionsklar kodning

Forvandl enhver arbejdsstation til en frontier-klasse kodeassistent. Stærk præstation på LiveCodeBench og Codeforces benchmarks gør Gemma 4 ideel til agentiske kodnings-workflows med Claude Code eller lignende værktøjer.

Læs mere

Dokumentbehandling

Vision + Ræsonnement

Udtræk strukturerede data fra diagrammer, dokumenter og skærmbilleder. Kombiner visuel forståelse med ræsonnement for at returnere rent JSON-output til automatiserede workflows.

Agentisk AI

Autonome agenter

Native funktionskald og værktøjsbrug gør det muligt at bygge autonome agenter, der interagerer med API'er og eksterne tjenester. Kompatibel med OpenClaw, CrewAI og andre multi-agent frameworks.

Komplekse opgaver

Matematisk og videnskabeligt ræsonnement

89,2% på AIME 2026 matematisk ræsonnement og 84,3% på GPQA Diamond videnskabelig QA. Aktiver tænketilstand for komplekse flertrinsproblemer, der kræver dyb overvejelse.

Tænketilstand: Hvornår aktiveres

Tænkning til

Komplekse ræsonneringsopgaver, matematiske problemer, flertrinplanlægning, kodearkitekturbeslutninger. Værd at tage den ekstra latency for nøjagtighed.

Tænkning fra

Latency-sensitive applikationer, simple forespørgsler, højgennemløbs-pipelines, real-time interaktioner. Hurtig respons uden overvejelsesoverhead.

Sådan aktiverer du tænketilstand

response = client.chat.completions.create(
    model="gemma-4-31B-it",
    messages=[{"role": "user", "content": "Your prompt"}],
    extra_body={"chat_template_kwargs": {"enable_thinking": True}},
)

Sæt enable_thinking til true via chat_template_kwargs. Med OpenAI SDK'et angiver du det i extra_body; ved direkte API-kald placeres det på øverste niveau. Reasoning-dokumentation

Prissætning

Apache 2.0 licenseret med transparent, forbrugsbaseret prissætning. Ingen skjulte gebyrer.

Model	Input (pr. 1M)	Output (pr. 1M)	Kontekst
Gemma 4 31B (Infercom)	€0.20	€0.35	128K

Priser i EUR ekskl. moms. EU-suveræn deployment med fuld GDPR-overholdelse.

EU-suveræn deployment

Gemma 4 31B kører på Infercoms dedikerede EU-infrastruktur. Dine data forlader aldrig europæisk jurisdiktion.

Hostet i Tyskland (Equinix München 4)
Fuld GDPR-overholdelse med EU-baseret DPO
Ingen US CLOUD Act-eksponering
ISO 27001-certificeret infrastruktur
Databehandlingsaftale tilgængelig

ISO 27001

GDPR-kompatibel

Tyskland

SambaNova RDU'er

Kom i gang med Gemma 4

quickstart.py

from openai import OpenAI

client = OpenAI(
    api_key="your-infercom-key",
    base_url="https://api.infercom.ai/v1"
)

response = client.chat.completions.create(
    model="gemma-4-31B-it",
    messages=[{"role": "user", "content": "Your prompt here"}],
    max_tokens=4096
)

print(response.choices[0].message.content)

Drop-in OpenAI API-kompatibilitet. Skift din base URL og begynd at bruge Gemma 4 på få minutter. Ingen kodeændringer nødvendige.

Gratis niveau tilgængeligt. Betal efter forbrug uden forpligtelser.

Ofte stillede spørgsmål

Hvad er Gemma 4 31B?

Gemma 4 31B er Google DeepMinds mest kapable dense open model, bygget på samme forskningsfundament som Gemini 3. Den har 31 milliarder parametre, 128K kontekstvindue, native multimodale funktioner (tekst og vision) og konfigurerbar tænketilstand til komplekse ræsonneringsopgaver.

Hvordan sammenligner Gemma 4 sig med Gemma 3?

Gemma 4 repræsenterer et betydeligt spring fra Gemma 3 med frontier-klasse benchmark-scorer: 85,2% på MMLU Pro, 89,2% på AIME 2026 matematisk ræsonnement og 80% på LiveCodeBench v6. Den tilføjer native multimodale funktioner, konfigurerbar tænketilstand og forbedret agentisk workflow-support med native funktionskald.

Er Gemma 4 multimodal?

Ja. Gemma 4 31B behandler native både tekst og billeder i samme kontekst. Dette muliggør dokumentforståelse, visuel analyse, diagramudtrækning og struktureret dataoutput fra billeder uden at kræve separate vision-modeller.

Hvad er tænketilstand, og hvordan aktiverer jeg den?

Tænketilstand er en konfigurerbar funktion, der muliggør dybere ræsonnement for komplekse opgaver. Når den er aktiveret, overvejer Gemma 4 før den svarer på flertrinsproblemer, matematisk ræsonnement og kodearkitekturbeslutninger. Aktivér den ved at sende enable_thinking: true via chat_template_kwargs (i extra_body med OpenAI SDK'et, eller på øverste niveau ved direkte API-kald). For latency-sensitive applikationer lader du den være slået fra for hurtigere svar.

Gemmes mine data i EU?

Ja. Infercom kører Gemma 4 31B på dedikeret infrastruktur i Tyskland (Equinix München 4). Dine data forlader aldrig europæisk jurisdiktion, med fuld GDPR-overholdelse, ingen US CLOUD Act-eksponering og ISO 27001-certificeret infrastruktur. En databehandlingsaftale er tilgængelig på forespørgsel.

Gemma 4 31B

Hvorfor Gemma 4 31B

Avanceret ræsonnement

Native multimodal

Agentiske workflows

Konfigurerbar tænkning

Benchmark-ydelse

Hvornår skal man bruge Gemma 4 31B

Tænketilstand: Hvornår aktiveres

Prissætning

EU-suveræn deployment

Kom i gang med Gemma 4

Ofte stillede spørgsmål

Relaterede ressourcer

Ydelsestest

Agentisk kodningsguide

API-dokumentation

Prisdetaljer

Klar til at bygge fremtidens AI i Europa?