// precios

Precios

Paga por API key, no por token. Tokens ilimitados en todos los planes — sin permanencia, cancela cuando quieras.

Starter

€399/mes

Para equipos pequeños que empiezan a integrar IA en sus flujos de trabajo.


  • 5 API Keys
  • Tokens ilimitados · modelos open
  • 2.5B tokens/mes · modelos SOTA
  • Compatible con la API de OpenAI
  • Sin logs · datos en la UE
  • Soporte por email

Scale

€3,199/mes

Para organizaciones con uso intensivo de IA y necesidades avanzadas.


  • 40 API Keys
  • Tokens ilimitados · modelos open
  • 20B tokens/mes · modelos SOTA
  • Compatible con la API de OpenAI
  • Sin logs · datos en la UE
  • Soporte prioritario
  • SLA 99.9%
  • Acceso anticipado a nuevos modelos

Enterprise

A medida

Para organizaciones que necesitan GPUs dedicadas y configuración a medida.


  • +60 API Keys
  • Tokens ilimitados · modelos open
  • Cap a medida · modelos SOTA
  • GPUs dedicadas
  • Modelos a medida
  • Sin logs · datos en la UE
  • SLA a medida
  • Onboarding dedicado

Todos los planes incluyen límites de RPM y concurrencia por API Key para garantizar la calidad del servicio.

infraestructura dedicada

El stack de inferencia,
en tu datacenter.

Si el caso de uso requiere soberanía total del dato, desplegamos y operamos el stack de inferencia completo dentro de la infraestructura del cliente. Modelos, datos y prompts que nunca salen de la red.

hablemos →
Despliegue on-premise Instalamos y operamos el stack completo en los servidores del cliente, con la misma API compatible con OpenAI.
Asesoría de hardware Ayudamos a elegir las GPUs, memoria y red adecuadas para cada caso de uso y presupuesto.
Soberanía total del dato Datos y prompts que nunca salen de la red. Pensado para banca, salud y defensa.
En producción en

// faq de precios

Precios, explicados.

Todo sobre planes, límites y facturación — antes de que preguntes.

¿Pago por API key o por token?

Por API key — precio mensual fijo. Los tokens en modelos open son ilimitados, sin cargos por token ni sorpresas. Una partida fija en la cuenta de resultados.

¿Cuál es la diferencia entre "tokens ilimitados" y el cap mensual de SOTA?

Los modelos open (Qwen, Gemma, DeepSeek…) son ilimitados en todos los planes. El cap mensual solo aplica a los modelos frontera/SOTA, donde el cómputo es más caro. Siempre avisamos antes de cualquier exceso — nunca llega una factura sorpresa.

¿Hay permanencia o lock-in?

No. Los planes son mes a mes y se cancela en cualquier momento. Todo corre sobre modelos open-weight accesibles siempre — ningún proveedor puede deprecar la API ni cambiar el precio de un día para otro.

¿Puedo cambiar de plan más adelante?

Sí. Se sube o baja de plan en cualquier momento y los cambios se prorratean. Cuando crece el uso, se sube de tier — la API y el código se quedan exactamente igual.

¿Cómo funcionan los rate limits?

Los límites van por API key: peticiones por minuto y concurrencia, para garantizar calidad de servicio — no por tokens procesados. Una sola key mueve cientos de millones de tokens al mes.

¿Ofrecéis GPUs dedicadas u on-premise?

Sí, en Enterprise: hardware dedicado NVIDIA Blackwell, modelos custom con fine-tuning, y despliegue on-premise completo dentro del datacenter del cliente. Contacta para un presupuesto a medida.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.