MiniMax-Modelle sind auf Infercom vollständig OpenAI-kompatibel. Verwenden Sie Base-URL api.infercom.ai/v1 mit Ihrem bestehenden OpenAI SDK - keine Code-Änderungen nötig. MiniMax-M2.7 Ultraspeed und M2.5 sind mit 400+ Tokens/Sekunde verfügbar, EU-gehostet in München für volle GDPR-Konformität.
Verfügbare Modelle
All MiniMax models available on Infercom. Use the model ID in your API requests.
| Modell | Model ID | Parameter | Kontext | Geschwindigkeit | Ideal für | |
|---|---|---|---|---|---|---|
| MiniMax-M2.7 Ultraspeed | MiniMax-M2.7 | 230B MoE | 192K tokens | 400+ tok/s | Selbst-Kritik, Multi-Agent, 30% besser bei Code | Details anzeigen → |
| MiniMax-M2.5 | MiniMax-M2.5 | 230B MoE | 160K tokens | 400+ tok/s | Agentic Coding, kostengünstig | Details anzeigen → |
Model-IDs sind case-sensitive. Exakt wie angegeben verwenden.
Schnellstart
Funktioniert mit jedem OpenAI-kompatiblen SDK. Einfach auf unseren Endpoint zeigen.
Die Integration erfolgt in drei Schritten: Erstens, registrieren Sie sich bei cloud.infercom.ai für Ihren API-Key. Zweitens, ändern Sie Ihre Base-URL von api.openai.com zu api.infercom.ai/v1. Drittens, setzen Sie Ihr Modell auf MiniMax-M2.7 oder MiniMax-M2.5. Ihr bestehender Code, Prompts und Tools funktionieren unverändert.
from openai import OpenAI
client = OpenAI(
base_url="https://api.infercom.ai/v1",
api_key="your-api-key"
)
response = client.chat.completions.create(
model="MiniMax-M2.7",
messages=[{"role": "user", "content": "Hello"}],
stream=True
)
for chunk in response:
print(chunk.choices[0].delta.content, end="")Unterstützte Endpoints
POST /v1/chat/completionsOpenAI Chat Completions (Streaming unterstützt)
POST /v1/messagesAnthropic Messages API
POST /v1/responsesOpenAI Responses API
GET /v1/modelsVerfügbare Modelle auflisten
Warum Infercom für MiniMax nutzen
EU-gehostet
Rechenzentrum in München. Volle GDPR-Konformität. Keine US CLOUD Act-Exposition.
Bis zu 10x schneller
SambaNovas Dataflow-Architektur liefert Weltrekord-Inferenzgeschwindigkeiten.
Null Datenspeicherung
Ihre Prompts und Outputs werden niemals gespeichert oder für Training verwendet.
Drop-in-kompatibel
Funktioniert mit OpenAI SDK, Anthropic SDK, LangChain, LlamaIndex und jedem OpenAI-kompatiblen Tool.
Häufig gestellte Fragen
Ist die MiniMax API mit OpenAI kompatibel?
Ja. MiniMax-Modelle auf Infercom sind vollständig OpenAI-kompatibel. Verwenden Sie Base-URL api.infercom.ai/v1 mit Ihrem bestehenden OpenAI SDK, LangChain, LlamaIndex oder jedem OpenAI-kompatiblen Tool. Keine Code-Änderungen nötig außer der Base-URL.
Was ist die Base-URL für die MiniMax API?
Die Base-URL ist https://api.infercom.ai/v1. Setzen Sie diese als base_url im OpenAI SDK oder baseURL in JavaScript. Unterstützte Endpoints: /chat/completions (OpenAI), /messages (Anthropic), /responses (OpenAI Responses API) und /models.
Kann ich LangChain mit MiniMax verwenden?
Ja. Verwenden Sie ChatOpenAI von langchain_openai mit base_url='https://api.infercom.ai/v1' und model='MiniMax-M2.7' oder 'MiniMax-M2.5'. LlamaIndex, CrewAI und andere Frameworks, die OpenAI unterstützen, funktionieren ebenfalls.
Was ist der Unterschied zwischen MiniMax M2.7 und M2.5?
Beide sind 230B MoE-Modelle (10B aktive Parameter). M2.7 Ultraspeed ist die neuere Version mit eingebauter Selbst-Kritik, nativem Multi-Agent-Support, 192K Kontext und 30% besserer Coding-Performance. M2.5 hat 160K Kontext und bietet exzellentes Agentic Coding zu niedrigeren Kosten. Beide laufen mit 400+ Tokens/Sekunde auf Infercom.
Ist die MiniMax API GDPR-konform?
Ja. MiniMax-Modelle auf Infercom laufen auf EU-gehosteter Infrastruktur in München, Deutschland. Volle GDPR-Konformität mit null Datenspeicherung - Prompts und Outputs werden niemals gespeichert oder für Training verwendet. Keine US CLOUD Act-Exposition.