// despliegue

Mismo stack.
El nivel de soberanía que necesites.

Inferencia privada en un cluster compartido de la UE, en hardware Blackwell dedicado o íntegramente dentro del datacenter del cliente. Misma API, mismo código — se elige hasta dónde llega la soberanía.

// el espectro

Un stack, tres niveles de control.

El mismo stack de inferencia gestionado, acercándose progresivamente al cliente — desde un cluster compartido en la UE hasta hardware que no sale del edificio. Se puede empezar en cualquier punto y escalar.

// modelos de despliegue

Elige dónde corre.

Tres formas de desplegar exactamente el mismo stack de inferencia. El código es idéntico — lo que cambia es quién posee el hardware y dónde se procesa el dato.

Shared

Gestionado · cluster compartido UE

Infraestructura compartida en la UE.

La forma más rápida de poner inferencia privada en producción. Un cluster gestionado en la UE, sin logs y nativo en GDPR — sin provisionar una sola GPU.

Mejor para
Equipos pequeños/medianos que van rápido
Dónde corre
Cluster Helmcode UE
Aislamiento
Rate limits por API key
Setup
Minutos
SLA
99,5% en Growth
Desde
399€ / mes

Dedicated

Hardware exclusivo · Helmcode UE

Hardware Blackwell exclusivo.

Hardware NVIDIA Blackwell reservado en exclusiva dentro de la infraestructura europea de Helmcode — throughput garantizado, aislamiento de red completo y soporte para modelos custom o fine-tuned.

Mejor para
Uso intensivo, compliance estricto
Dónde corre
Helmcode UE · aislado
Aislamiento
Aislamiento de red completo
Setup
Días
SLA
A medida
Desde
Precio a medida

On-premise

El datacenter del cliente · operado por nosotros

Se ejecuta en el datacenter del cliente.

Desplegamos y operamos todo el stack de inferencia dentro del datacenter — o el de un partner. Los datos no se mueven. Ni un solo token sale de la red.

Mejor para
Banca, defensa, sector público
Dónde corre
Datacenter del cliente o el nuestro
Aislamiento
Air-gappable
Setup
Semanas · llave en mano
SLA
A medida
Desde
Precio a medida
Listo para banca, salud, defensa y sector público.

// lado a lado

Las diferencias que importan.

Todo es igual salvo soberanía, hardware y SLA. Aquí es donde los tres divergen.

Shared Dedicated On-premise
Dónde se procesa el dato Cluster Helmcode UE Helmcode UE · aislado Datacenter del cliente
Hardware GPUs compartidas B200, exclusiva Hardware propio o nuestro
Aislamiento de red Lógico (por key) Aislamiento de red completo Air-gappable
Modelos custom / fine-tuned
Tiempo de setup Minutos Días Semanas · llave en mano
SLA de uptime 99,5% en Growth A medida A medida
Precio de inicio 399€ / mes A medida A medida

// totalmente gestionado

Sea de quien sea el hardware, nosotros llevamos el stack.

El despliegue cambia dónde corre la inferencia — nunca quién la mantiene viva. En los tres modelos, Helmcode provisiona, monitoriza y opera todo el stack para que el equipo no toque una GPU.

  • Provisioning y monitorización de GPU
  • Instalación y config de vLLM
  • Gestión de versiones de modelo
  • Rate limiting y concurrencia
  • Upgrades de hardware
  • Gestión de SLA

// sectores regulados

Adaptado al compliance de cada sector.

Dónde puede vivir legalmente el dato decide cómo se despliega. Un punto de partida para las industrias más reguladas que servimos.

Banca y fintech

Dedicated / On-premise

DORA, GDPR y residencia del dato con aislamiento de red completo.

Salud

Dedicated / On-premise

Los datos de pacientes no salen de un perímetro controlado y auditable.

Legal y legaltech

Shared / Dedicated

Documentos privilegiados procesados solo en la UE, sin logs.

Sector público y defensa

On-premise

Soberano y air-gappable — ningún token sale de la red.

// migración

Subir de nivel es un cambio de config.

Como los tres hablan la misma API compatible con OpenAI, pasar de shared a dedicated a on-premise no toca el código de aplicación.

  1. 01

    Empezar en Shared

    Obtener una API key, apuntar el SDK a la base URL de Helmcode, desplegar el mismo día.

  2. 02

    Escalar cuando haga falta

    ¿Compliance más estricto o más carga? Se pasa a Dedicated u On-premise — lo provisionamos nosotros.

  3. 03

    Cambiar la base URL

    Reapuntar la base URL y la key al nuevo despliegue. Mismos modelos, mismo código, cero reescritura.

// faq de despliegue

Despliegue, respondido.

Lo que preguntan los equipos antes de elegir dónde corre la inferencia.

¿Se puede empezar en Shared y pasar a Dedicated u On-premise después?

Sí — ese es el objetivo. Los tres corren el mismo stack tras la misma API compatible con OpenAI. Subir de nivel es cambiar la base URL y la key; el código de aplicación no cambia.

¿Dónde está exactamente la infraestructura de la UE?

Shared y Dedicated corren en infraestructura de Helmcode dentro de la UE — nunca en hyperscalers estadounidenses sujetos al Cloud Act. La inferencia se procesa en la región sin logs, nativa en GDPR y AI Act desde la arquitectura.

¿Qué hardware usa Dedicated?

NVIDIA B200 — 192GB VRAM, 256GB DDR5 — reservado en exclusiva. Lo provisionamos, monitorizamos y actualizamos; el cliente no toca una GPU.

¿Quién opera un despliegue On-premise?

Nosotros. Helmcode despliega y opera todo el stack de inferencia dentro del datacenter del cliente o el de un partner — llave en mano. El cliente se queda el dato y la red; nosotros mantenemos sanas las GPUs, vLLM y los modelos.

¿Se puede air-gappear el On-premise?

Sí. Para los entornos más estrictos, el despliegue puede funcionar totalmente aislado, sin conectividad saliente — ni un solo token sale de la red.

¿Se usan datos de cliente para entrenar un modelo?

Nunca, en ningún modelo de despliegue. La ausencia de logs es una propiedad de la arquitectura: prompts y completions no se almacenan, y nada de lo que se envía entrena un modelo.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.