paso 01
Transcribe
whisper-large-v3 Convierte llamadas y audio en texto — 99+ idiomas, 3,2% de WER en espanol, hasta 25MB por archivo. Las grabaciones se procesan solo en infraestructura de la UE.
// casos de uso · voz
Voz a texto, voicebots y texto a voz con un solo proveedor, en infraestructura de la UE, 99+ idiomas, síntesis por debajo del segundo.
// como funciona
Transcripcion, un LLM y sintesis de voz en un unico endpoint compatible con OpenAI — el audio hace un solo trayecto corto, y solo dentro de la UE.
paso 01
whisper-large-v3 Convierte llamadas y audio en texto — 99+ idiomas, 3,2% de WER en espanol, hasta 25MB por archivo. Las grabaciones se procesan solo en infraestructura de la UE.
paso 02
deepseek-v4-flash Resume, enruta, responde o dirige un voicebot con un LLM sobre la transcripcion — con tool calling incluido, para que la conversacion haga algo de verdad.
paso 03
kokoro Sintetiza voz natural en menos de un segundo — 67 voces, espanol incluido — para voicebots en tiempo real, IVR y accesibilidad.
// drop-in
Los endpoints de audio de OpenAI — transcripciones y voz — funcionan tal cual. Se cambia la base URL y la key y el codigo de voz existente corre sobre modelos privados de la UE.
leer_los_docsfrom openai import OpenAI client = OpenAI( api_key="sk-...", base_url="https://api.helmcode.com/v1", # one line changes ) # 1 · transcribe a call — 99+ languages, stays in the EU text = client.audio.transcriptions.create( model="whisper-large-v3", file=open("call.mp3", "rb"), ) # 2 · synthesize the reply — sub-second, 67 voices speech = client.audio.speech.create( model="kokoro", voice="alba", input=reply, )
// por que helmcode
Las grabaciones son el dato mas sensible que existe en una empresa — lleno de PII y el favorito de cualquier regulador. Con Helmcode, todo se queda en la UE.
Llamadas, transcripciones y audio sintetizado no se almacenan nunca ni entrenan ningun modelo. La PII de una grabacion no se convierte en problema de nadie.
Voz a texto, LLM y texto a voz se ejecutan en infraestructura de la UE — no en hyperscalers de EE. UU. sujetos al Cloud Act. GDPR y AI Act nativos.
El stack de voz completo — transcripcion, razonamiento y sintesis — tras un unico endpoint compatible con OpenAI. Un proveedor, una factura, un salto de red.
Sintesis por debajo del segundo y transcripcion rapida en GPUs dedicadas — latencia suficientemente baja para voicebots e IVR en vivo, no solo procesamiento por lotes.
Cada minuto de audio de entrada y salida esta incluido. Los limites son RPM y concurrencia por key — nunca el total de tokens. Un volumen alto de llamadas no dispara la factura.
// faq de voz
Lo que preguntan los equipos de CX, operaciones e ingenieria antes de internalizar la voz.
whisper-large-v3 para transcripcion (99+ idiomas, 3,2% de WER en espanol, hasta 25MB / ~2 min por archivo) y kokoro para texto a voz (82M parametros, latencia por debajo del segundo, 67 voces incluido espanol).
No. Sin logs — el audio, las transcripciones y la voz sintetizada no se persisten nunca ni entrenan ningun modelo. Transcribir grabaciones deja de ser un problema de privacidad.
Si. En GPUs dedicadas, kokoro sintetiza en menos de un segundo y la transcripcion se ejecuta con baja latencia — suficiente para voicebots e IVR en tiempo real, no solo transcripcion por lotes.
Si, con un solo proveedor. Se transcribe con whisper-large-v3, se razona y responde con un LLM (deepseek-v4-flash, con tool calling), y despues se habla con kokoro — todo tras una API compatible con OpenAI.
Si. Los endpoints audio.transcriptions y audio.speech son compatibles con OpenAI — se cambia la base URL y la key y el codigo existente funciona.
Se ejecuta en una GPU dedicada o totalmente on-premise dentro del datacenter del cliente — la misma API y el mismo codigo, con audio que no sale de la red. Pensado para contact centers, salud y sector publico.
// empezar
Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.
Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.
// cookies
Usamos cookies estrictamente necesarias para que el sitio funcione y, solo con consentimiento explícito, Google Analytics para entender el uso. Nada de publicidad, nunca — consulta la Política de cookies.
// preferencias