MiMo V2.5 disponible
Entrada multimodal completa — imagen, audio y texto como input, texto como output — en un solo modelo, con la misma API compatible con OpenAI.
- Llámalo con model id mimo-v2.5
- 310B MoE · 1M de contexto · visión + audio
// changelog
Registro de lo que sale a producción — modelos, API, rendimiento y plataforma. Sin marketing, solo los diffs.
Entrada multimodal completa — imagen, audio y texto como input, texto como output — en un solo modelo, con la misma API compatible con OpenAI.
Decodificación especulativa activada por defecto en qwen3.6 — el doble de tokens por segundo a la misma latencia, sin tocar nada.
Endpoint dedicado /v1/rerank para reranking semántico multilingüe — la pieza que faltaba en el pipeline RAG (embedding → rerank → LLM).
Cada API key muestra una atestación en vivo de que no se almacena contenido de prompts ni respuestas — algo que el equipo de compliance puede capturar directamente.
Hardware exclusivo NVIDIA B200 en infraestructura europea de Helmcode — throughput garantizado, aislamiento de red completo y modelos personalizados.
Carga de modelos y enrutado del control plane rediseñados. Arranques en frío sensiblemente más rápidos y latencia p95 a la baja en todos los modelos.
Text-to-speech con Kokoro (latencia inferior a un segundo, 67 voces) y speech-to-text con Whisper Large v3 (99+ idiomas) — ambos con la misma key.
Resuelto un caso límite donde las respuestas en streaming podían truncarse al intercalar tool calls con contenido. Streaming estable en todos los modelos de chat.
Eso es todo de momento — se actualiza con cada release.
// cookies
Usamos cookies estrictamente necesarias para que el sitio funcione y, solo con consentimiento explícito, Google Analytics para entender el uso. Nada de publicidad, nunca — consulta la Política de cookies.
// preferencias