// changelog

Cada cambio
publicado.

Registro de lo que sale a producción — modelos, API, rendimiento y plataforma. Sin marketing, solo los diffs.

platform
NuevoModelo

MiMo V2.5 disponible

Entrada multimodal completa — imagen, audio y texto como input, texto como output — en un solo modelo, con la misma API compatible con OpenAI.

  • Llámalo con model id mimo-v2.5
  • 310B MoE · 1M de contexto · visión + audio
platform
Mejorado

2× throughput en Qwen 3.6

Decodificación especulativa activada por defecto en qwen3.6 — el doble de tokens por segundo a la misma latencia, sin tocar nada.

api
NuevoAPI

Endpoint de reranking

Endpoint dedicado /v1/rerank para reranking semántico multilingüe — la pieza que faltaba en el pipeline RAG (embedding → rerank → LLM).

  • Con Qwen3-Reranker-8B
  • Más de 100 idiomas
console
Seguridad

Atestación sin logs en la consola

Cada API key muestra una atestación en vivo de que no se almacena contenido de prompts ni respuestas — algo que el equipo de compliance puede capturar directamente.

platform
Nuevo

Planes de GPU dedicada

Hardware exclusivo NVIDIA B200 en infraestructura europea de Helmcode — throughput garantizado, aislamiento de red completo y modelos personalizados.

  • Modelos personalizados y fine-tuning
  • SLA personalizado
platform
Mejorado

Arranques en frío más rápidos, p95 más bajo

Carga de modelos y enrutado del control plane rediseñados. Arranques en frío sensiblemente más rápidos y latencia p95 a la baja en todos los modelos.

api
NuevoAPI

Voz: TTS y STT

Text-to-speech con Kokoro (latencia inferior a un segundo, 67 voces) y speech-to-text con Whisper Large v3 (99+ idiomas) — ambos con la misma key.

  • /v1/audio/speech y /v1/audio/transcriptions
api
Corregido

Streaming con tool calls

Resuelto un caso límite donde las respuestas en streaming podían truncarse al intercalar tool calls con contenido. Streaming estable en todos los modelos de chat.

Eso es todo de momento — se actualiza con cada release.