I modelli MiniMax sono completamente compatibili con OpenAI su Infercom. Usa base URL api.infercom.ai/v1 con il tuo SDK OpenAI esistente - nessuna modifica al codice necessaria. MiniMax-M2.7 Ultraspeed e M2.5 sono disponibili con velocità di inferenza di 400+ token/secondo, ospitati nell'UE a Monaco per piena conformità GDPR.
Modelli disponibili
All MiniMax models available on Infercom. Use the model ID in your API requests.
| Modello | Model ID | Parametri | Contesto | Velocità | Ideale per | |
|---|---|---|---|---|---|---|
| MiniMax-M2.7 Ultraspeed | MiniMax-M2.7 | 230B MoE | 192K tokens | 400+ tok/s | Auto-critica, multi-agent, 30% migliore nel codice | Vedi dettagli → |
| MiniMax-M2.5 | MiniMax-M2.5 | 230B MoE | 160K tokens | 400+ tok/s | Agentic coding, conveniente | Vedi dettagli → |
I Model ID sono case-sensitive. Usa esattamente come mostrato.
Avvio rapido
Funziona con qualsiasi SDK compatibile con OpenAI. Basta puntare al nostro endpoint.
L'integrazione richiede tre passaggi: Primo, registrati su cloud.infercom.ai per ottenere la tua API key. Secondo, cambia la tua base URL da api.openai.com a api.infercom.ai/v1. Terzo, imposta il tuo modello su MiniMax-M2.7 o MiniMax-M2.5. Il tuo codice esistente, prompt e strumenti funzionano senza modifiche.
from openai import OpenAI
client = OpenAI(
base_url="https://api.infercom.ai/v1",
api_key="your-api-key"
)
response = client.chat.completions.create(
model="MiniMax-M2.7",
messages=[{"role": "user", "content": "Hello"}],
stream=True
)
for chunk in response:
print(chunk.choices[0].delta.content, end="")Endpoint supportati
POST /v1/chat/completionsOpenAI Chat Completions (streaming supportato)
POST /v1/messagesAnthropic Messages API
POST /v1/responsesOpenAI Responses API
GET /v1/modelsElenco modelli disponibili
Perché usare Infercom per MiniMax
Ospitato nell'UE
Datacenter a Monaco. Piena conformità GDPR. Nessuna esposizione al US CLOUD Act.
Fino a 10x più veloce
L'architettura dataflow di SambaNova offre velocità di inferenza da record mondiale.
Zero conservazione dati
I tuoi prompt e output non vengono mai archiviati o utilizzati per l'addestramento.
Drop-in compatibile
Funziona con OpenAI SDK, Anthropic SDK, LangChain, LlamaIndex e qualsiasi strumento compatibile con OpenAI.
Domande frequenti
MiniMax API è compatibile con OpenAI?
Sì. I modelli MiniMax su Infercom sono completamente compatibili con OpenAI. Usa base URL api.infercom.ai/v1 con il tuo SDK OpenAI esistente, LangChain, LlamaIndex o qualsiasi strumento compatibile con OpenAI. Nessuna modifica al codice necessaria oltre alla base URL.
Qual è la base URL per MiniMax API?
La base URL è https://api.infercom.ai/v1. Impostala come base_url nell'SDK OpenAI o baseURL in JavaScript. Endpoint supportati: /chat/completions (OpenAI), /messages (Anthropic), /responses (OpenAI Responses API) e /models.
Posso usare LangChain con MiniMax?
Sì. Usa ChatOpenAI da langchain_openai con base_url='https://api.infercom.ai/v1' e model='MiniMax-M2.7' o 'MiniMax-M2.5'. Anche LlamaIndex, CrewAI e altri framework che supportano OpenAI funzionano.
Qual è la differenza tra MiniMax M2.7 e M2.5?
Entrambi sono modelli MoE da 230B (10B parametri attivi). M2.7 Ultraspeed è la versione più recente con auto-critica integrata, supporto multi-agent nativo, 192K di contesto e prestazioni di coding migliori del 30%. M2.5 ha 160K di contesto e offre eccellente agentic coding a costi inferiori. Entrambi funzionano a 400+ token/secondo su Infercom.
MiniMax API è conforme al GDPR?
Sì. I modelli MiniMax su Infercom funzionano su infrastruttura ospitata nell'UE a Monaco, Germania. Piena conformità GDPR con zero conservazione dati - prompt e output non vengono mai archiviati o utilizzati per l'addestramento. Nessuna esposizione al US CLOUD Act.