// despliegue

Mismo stack.
El nivel de soberanía que necesites.

Inferencia privada en un cluster compartido de la UE, en hardware Blackwell dedicado o íntegramente dentro del datacenter del cliente. Misma API, mismo código — se elige hasta dónde llega la soberanía.

hablemos

// el espectro

Un stack, tres niveles de control.

El mismo stack de inferencia gestionado, acercándose progresivamente al cliente — desde un cluster compartido en la UE hasta hardware que no sale del edificio. Se puede empezar en cualquier punto y escalar.

// modelos de despliegue

Elige dónde corre.

Tres formas de desplegar exactamente el mismo stack de inferencia. El código es idéntico — lo que cambia es quién posee el hardware y dónde se procesa el dato.

Shared

Gestionado · cluster compartido UE

Infraestructura compartida en la UE.

La forma más rápida de poner inferencia privada en producción. Un cluster gestionado en la UE, sin logs y nativo en GDPR — sin provisionar una sola GPU.

Mejor para: Equipos pequeños/medianos que van rápido
Dónde corre: Cluster Helmcode UE
Aislamiento: Rate limits por API key
Setup: Minutos
SLA: 99,5% en Growth
Desde: 399€ / mes

Dedicated

Hardware exclusivo · Helmcode UE

Hardware Blackwell exclusivo.

Hardware NVIDIA Blackwell reservado en exclusiva dentro de la infraestructura europea de Helmcode — throughput garantizado, aislamiento de red completo y soporte para modelos custom o fine-tuned.

Mejor para: Uso intensivo, compliance estricto
Dónde corre: Helmcode UE · aislado
Aislamiento: Aislamiento de red completo
Setup: Días
SLA: A medida
Desde: Precio a medida

On-premise

El datacenter del cliente · operado por nosotros

Se ejecuta en el datacenter del cliente.

Desplegamos y operamos todo el stack de inferencia dentro del datacenter — o el de un partner. Los datos no se mueven. Ni un solo token sale de la red.

Mejor para: Banca, defensa, sector público
Dónde corre: Datacenter del cliente o el nuestro
Aislamiento: Air-gappable
Setup: Semanas · llave en mano
SLA: A medida
Desde: Precio a medida

Listo para banca, salud, defensa y sector público.

// lado a lado

Las diferencias que importan.

Todo es igual salvo soberanía, hardware y SLA. Aquí es donde los tres divergen.

	Shared	Dedicated	On-premise
Dónde se procesa el dato	Cluster Helmcode UE	Helmcode UE · aislado	Datacenter del cliente
Hardware	GPUs compartidas	B200, exclusiva	Hardware propio o nuestro
Aislamiento de red	Lógico (por key)	Aislamiento de red completo	Air-gappable
Modelos custom / fine-tuned	—	Sí	Sí
Tiempo de setup	Minutos	Días	Semanas · llave en mano
SLA de uptime	99,5% en Growth	A medida	A medida
Precio de inicio	399€ / mes	A medida	A medida

// totalmente gestionado

Sea de quien sea el hardware, nosotros llevamos el stack.

El despliegue cambia dónde corre la inferencia — nunca quién la mantiene viva. En los tres modelos, Helmcode provisiona, monitoriza y opera todo el stack para que el equipo no toque una GPU.

Provisioning y monitorización de GPU
Instalación y config de vLLM
Gestión de versiones de modelo
Rate limiting y concurrencia
Upgrades de hardware
Gestión de SLA

// sectores regulados

Adaptado al compliance de cada sector.

Dónde puede vivir legalmente el dato decide cómo se despliega. Un punto de partida para las industrias más reguladas que servimos.

Banca y fintech

Dedicated / On-premise

DORA, GDPR y residencia del dato con aislamiento de red completo.

Salud

Dedicated / On-premise

Los datos de pacientes no salen de un perímetro controlado y auditable.

Legal y legaltech

Shared / Dedicated

Documentos privilegiados procesados solo en la UE, sin logs.

Sector público y defensa

On-premise

Soberano y air-gappable — ningún token sale de la red.

// migración

Subir de nivel es un cambio de config.

Como los tres hablan la misma API compatible con OpenAI, pasar de shared a dedicated a on-premise no toca el código de aplicación.

01

Empezar en Shared

Obtener una API key, apuntar el SDK a la base URL de Helmcode, desplegar el mismo día.
02

Escalar cuando haga falta

¿Compliance más estricto o más carga? Se pasa a Dedicated u On-premise — lo provisionamos nosotros.
03

Cambiar la base URL

Reapuntar la base URL y la key al nuevo despliegue. Mismos modelos, mismo código, cero reescritura.

// faq de despliegue

Despliegue, respondido.

Lo que preguntan los equipos antes de elegir dónde corre la inferencia.

¿Se puede empezar en Shared y pasar a Dedicated u On-premise después?

Sí — ese es el objetivo. Los tres corren el mismo stack tras la misma API compatible con OpenAI. Subir de nivel es cambiar la base URL y la key; el código de aplicación no cambia.

¿Dónde está exactamente la infraestructura de la UE?

Shared y Dedicated corren en infraestructura de Helmcode dentro de la UE — nunca en hyperscalers estadounidenses sujetos al Cloud Act. La inferencia se procesa en la región sin logs, nativa en GDPR y AI Act desde la arquitectura.

¿Qué hardware usa Dedicated?

NVIDIA B200 — 192GB VRAM, 256GB DDR5 — reservado en exclusiva. Lo provisionamos, monitorizamos y actualizamos; el cliente no toca una GPU.

¿Quién opera un despliegue On-premise?

Nosotros. Helmcode despliega y opera todo el stack de inferencia dentro del datacenter del cliente o el de un partner — llave en mano. El cliente se queda el dato y la red; nosotros mantenemos sanas las GPUs, vLLM y los modelos.

¿Se puede air-gappear el On-premise?

Sí. Para los entornos más estrictos, el despliegue puede funcionar totalmente aislado, sin conectividad saliente — ni un solo token sale de la red.

¿Se usan datos de cliente para entrenar un modelo?

Nunca, en ningún modelo de despliegue. La ausencia de logs es una propiedad de la arquitectura: prompts y completions no se almacenan, y nada de lo que se envía entrena un modelo.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.

reservar_llamada

Mismo stack.El nivel de soberanía que necesites.