Pricing simple y transparente

Tokens ilimitados en todos los planes. Paga por numero de API Keys, no por tokens consumidos. Sin permanencia.

Starter

399€ /mes

Para equipos pequeños que empiezan a integrar IA en sus flujos de trabajo.

5 API Keys (usuarios/agentes)
Tokens ilimitados en modelos open-source
2,5B tokens/mes en Open SOTA Models
API compatible con OpenAI
Privacidad total. Zero logs
Datos en la UE
Soporte por email

Comenzar

Mas popular

Growth

1.299€ /mes

Para empresas que necesitan IA a escala con multiples equipos o agentes.

15 API Keys (usuarios/agentes)
Tokens ilimitados en modelos open-source
7,5B tokens/mes en Open SOTA Models
API compatible con OpenAI
Privacidad total. Zero logs
Datos en la UE
Soporte prioritario
SLA 99.5%

Comenzar

Scale

3.199€ /mes

Para organizaciones con uso intensivo de IA y necesidades avanzadas.

40 API Keys (usuarios/agentes)
Tokens ilimitados en modelos open-source
20B tokens/mes en Open SOTA Models
API compatible con OpenAI
Privacidad total. Zero logs
Datos en la UE
Soporte prioritario
SLA 99.9%
Acceso anticipado a nuevos modelos

Comenzar

Enterprise

Custom

Para organizaciones que necesitan GPUs dedicadas y configuracion a medida.

+60 API Keys (usuarios/agentes)
Tokens ilimitados en modelos open-source
Cap a medida en Open SOTA Models
GPUs dedicadas
Modelos custom
API compatible con OpenAI
Privacidad total. Zero logs
Datos en la UE
SLA personalizado
Onboarding dedicado

Contactar

Todos los planes incluyen limites de RPM (requests per minute) y concurrencia por API Key para garantizar la calidad del servicio.

Infraestructura dedicada

Tu propio stack de inferencia, en tu datacenter

Si tu caso de uso requiere soberania total del dato, desplegamos y operamos el stack de inferencia completo dentro de la infraestructura de tu propia empresa. Tus modelos, tus datos y tus prompts nunca salen de tu red.

Ademas, te asesoramos en la compra del hardware adecuado — GPUs, memoria y red — dimensionado segun el caso de uso, el volumen de inferencia y el presupuesto que manejes.

Hablar con el equipo

Despliegue on-premise

Instalamos y operamos el stack llave en mano en tus servidores, con la misma API compatible con OpenAI.

Asesoramiento de hardware

Elegimos contigo las GPUs, memoria y red optimas segun tu caso de uso y presupuesto.

Soberania total del dato

Tus datos y prompts nunca salen de tu red. Ideal para sectores regulados: banca, salud o defensa.

Preguntas frecuentes

¿Que modelos estan disponibles?

Los mejores modelos open-source del momento: LLMs, embeddings, TTS y STT. Los modelos se actualizan regularmente para ofrecer siempre lo ultimo del ecosistema open-source.

¿Puedo usar el servicio con mis herramientas actuales?

Si. El acceso es via una API 100% compatible con OpenAI. Funciona con OpenCode, Zed, OpenClaw, Hermes, SDKs y cualquier cliente que acepte un base URL + API key.

¿Mis datos se usan para entrenar modelos?

No. Tu codigo y tus prompts no entrenan ningun modelo. No hay logs de prompts. No hay fine-tuning con datos de clientes. Privacidad total por diseño.

¿Hay limites de tokens?

En los modelos open-source no hay caps de tokens. Los unicos limites son de RPM y concurrencia por API Key, diseñados para proteger la experiencia colectiva del cluster pero no te preocupes, por ponerte un ejemplo: tenemos usuarios quemando +500 millones de tokens con 1 sola API Key en menos de 24h. En los Open SOTA Models (como DeepSeek V4-Flash) si hay un cap mensual a nivel de organizacion: 2,5B en Starter, 7,5B en Growth, 20B en Scale. El contador se resetea el dia 1 de cada mes (UTC).

¿Que SLA ofrecen?

Depende del plan. Growth incluye SLA 99.5%, Scale 99.9%, y Enterprise un SLA personalizado. Starter no incluye SLA contractual.

¿Puedo cancelar cuando quiera?

Si. Todos los planes son mes a mes, sin permanencia. Cancela cuando quieras sin penalizacion.

¿Necesitas algo diferente?

Si tu empresa necesita GPUs dedicadas, modelos custom o una configuracion especifica, hablemos.

Hablar con el equipo