Shared
Gestionado · cluster compartido UEInfraestructura compartida en la UE.
La forma más rápida de poner inferencia privada en producción. Un cluster gestionado en la UE, sin logs y nativo en GDPR — sin provisionar una sola GPU.
// despliegue
Inferencia privada en un cluster compartido de la UE, en hardware Blackwell dedicado o íntegramente dentro del datacenter del cliente. Misma API, mismo código — se elige hasta dónde llega la soberanía.
// el espectro
El mismo stack de inferencia gestionado, acercándose progresivamente al cliente — desde un cluster compartido en la UE hasta hardware que no sale del edificio. Se puede empezar en cualquier punto y escalar.
// modelos de despliegue
Tres formas de desplegar exactamente el mismo stack de inferencia. El código es idéntico — lo que cambia es quién posee el hardware y dónde se procesa el dato.
Shared
Gestionado · cluster compartido UELa forma más rápida de poner inferencia privada en producción. Un cluster gestionado en la UE, sin logs y nativo en GDPR — sin provisionar una sola GPU.
Dedicated
Hardware exclusivo · Helmcode UEHardware NVIDIA Blackwell reservado en exclusiva dentro de la infraestructura europea de Helmcode — throughput garantizado, aislamiento de red completo y soporte para modelos custom o fine-tuned.
On-premise
El datacenter del cliente · operado por nosotrosDesplegamos y operamos todo el stack de inferencia dentro del datacenter — o el de un partner. Los datos no se mueven. Ni un solo token sale de la red.
// lado a lado
Todo es igual salvo soberanía, hardware y SLA. Aquí es donde los tres divergen.
| Shared | Dedicated | On-premise | |
|---|---|---|---|
| Dónde se procesa el dato | Cluster Helmcode UE | Helmcode UE · aislado | Datacenter del cliente |
| Hardware | GPUs compartidas | B200, exclusiva | Hardware propio o nuestro |
| Aislamiento de red | Lógico (por key) | Aislamiento de red completo | Air-gappable |
| Modelos custom / fine-tuned | — | Sí | Sí |
| Tiempo de setup | Minutos | Días | Semanas · llave en mano |
| SLA de uptime | 99,5% en Growth | A medida | A medida |
| Precio de inicio | 399€ / mes | A medida | A medida |
// totalmente gestionado
El despliegue cambia dónde corre la inferencia — nunca quién la mantiene viva. En los tres modelos, Helmcode provisiona, monitoriza y opera todo el stack para que el equipo no toque una GPU.
// sectores regulados
Dónde puede vivir legalmente el dato decide cómo se despliega. Un punto de partida para las industrias más reguladas que servimos.
DORA, GDPR y residencia del dato con aislamiento de red completo.
Los datos de pacientes no salen de un perímetro controlado y auditable.
Documentos privilegiados procesados solo en la UE, sin logs.
Soberano y air-gappable — ningún token sale de la red.
// migración
Como los tres hablan la misma API compatible con OpenAI, pasar de shared a dedicated a on-premise no toca el código de aplicación.
Obtener una API key, apuntar el SDK a la base URL de Helmcode, desplegar el mismo día.
¿Compliance más estricto o más carga? Se pasa a Dedicated u On-premise — lo provisionamos nosotros.
Reapuntar la base URL y la key al nuevo despliegue. Mismos modelos, mismo código, cero reescritura.
// faq de despliegue
Lo que preguntan los equipos antes de elegir dónde corre la inferencia.
Sí — ese es el objetivo. Los tres corren el mismo stack tras la misma API compatible con OpenAI. Subir de nivel es cambiar la base URL y la key; el código de aplicación no cambia.
Shared y Dedicated corren en infraestructura de Helmcode dentro de la UE — nunca en hyperscalers estadounidenses sujetos al Cloud Act. La inferencia se procesa en la región sin logs, nativa en GDPR y AI Act desde la arquitectura.
NVIDIA B200 — 192GB VRAM, 256GB DDR5 — reservado en exclusiva. Lo provisionamos, monitorizamos y actualizamos; el cliente no toca una GPU.
Nosotros. Helmcode despliega y opera todo el stack de inferencia dentro del datacenter del cliente o el de un partner — llave en mano. El cliente se queda el dato y la red; nosotros mantenemos sanas las GPUs, vLLM y los modelos.
Sí. Para los entornos más estrictos, el despliegue puede funcionar totalmente aislado, sin conectividad saliente — ni un solo token sale de la red.
Nunca, en ningún modelo de despliegue. La ausencia de logs es una propiedad de la arquitectura: prompts y completions no se almacenan, y nada de lo que se envía entrena un modelo.
// empezar
Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.
Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.
// cookies
Usamos cookies estrictamente necesarias para que el sitio funcione y, solo con consentimiento explícito, Google Analytics para entender el uso. Nada de publicidad, nunca — consulta la Política de cookies.
// preferencias