paso 01
Lee cualquier documento
gemma4 PDFs, escaneos y formularios — texto, tablas y maquetación, incluidas imágenes — procesados con un modelo con visión. Sin pipeline de OCR que mantener.
// casos de uso · extracción de documentos
Siniestros, facturas, contratos y formularios, texto, tablas y escaneos, convertidos en JSON limpio. En infraestructura de la UE, totalmente auditable.
// cómo funciona
Visión, extracción y clasificación desde un único endpoint compatible con OpenAI — a volumen y exclusivamente dentro de la UE.
paso 01
gemma4 PDFs, escaneos y formularios — texto, tablas y maquetación, incluidas imágenes — procesados con un modelo con visión. Sin pipeline de OCR que mantener.
paso 02
deepseek-v4-flash Los campos se extraen directamente al JSON schema propio con salidas estructuradas — cada valor donde se espera, siempre, listo para validar.
paso 03
qwen3-embedding Se clasifica el tipo de documento y se enruta al flujo correcto con embeddings auditables — coincidencias seguras primero, casos límite marcados.
// drop-in
La entrada de visión y las salidas estructuradas funcionan al estilo OpenAI. Se cambia la base URL y la key, se apunta a gemma4, y el schema vuelve completo — de forma privada.
leer_los_docsfrom openai import OpenAI client = OpenAI( api_key="sk-...", base_url="https://api.helmcode.com/v1", # one line changes ) # vision in, structured JSON out — straight into your schema result = client.chat.completions.create( model="gemma4", messages=[{ "role": "user", "content": [ {"type": "text", "text": "Extract the invoice fields."}, {"type": "image_url", "image_url": {"url": invoice_png}}, ], }], response_format={"type": "json_schema", "json_schema": invoice_schema}, )
// por qué helmcode
Los documentos que se procesan están llenos de PII y datos financieros. Las APIs cerradas exigen subirlo todo — y lo registran.
Los documentos procesados — y los datos que contienen — no se almacenan nunca ni entrenan ningún modelo.
Facturas, siniestros y contratos permanecen en infraestructura europea — no en hyperscalers de EE. UU. sujetos al Cloud Act. Cumplimiento nativo con GDPR y AI Act.
Se lee un escaneo y se devuelve JSON validado desde un único endpoint compatible con OpenAI — sin proveedor de OCR aparte, sin código de pegamento.
Se procesan millones de documentos al mes. Los límites son RPM y concurrencia por key, nunca el total de tokens — un mes intenso no se convierte en una factura sorpresa.
DeepSeek V4-Flash, Qwen 3.6, Gemma 4. Los campos y el JSON los define el equipo — sin formatos de extracción propietarios que generen dependencia.
Salidas estructuradas y visión compatibles con OpenAI. Se cambia la base URL y la key, y el código de extracción sigue funcionando.
// faq de extracción
Lo que preguntan los equipos de operaciones e ingeniería antes de automatizar flujos documentales.
Sí. gemma4 tiene visión (y mimo-v2.5 es totalmente multimodal), así que lee escaneos, fotos y formularios — texto, tablas y maquetación — sin un pipeline de OCR aparte.
Sí. Con salidas estructuradas compatibles con OpenAI (response_format json_schema) los campos llegan en la forma JSON exacta que se defina — listos para validar y almacenar.
No. Sin logs — los documentos y los datos extraídos no se persisten nunca ni entrenan ningún modelo. La extracción deja de ser un riesgo de privacidad.
Las salidas estructuradas restringen la respuesta al schema, así que los campos están siempre presentes y tipados. Se valida por campo y se marcan los casos de baja confianza para revisión.
Sí. No hay límites de tokens — los límites son RPM y concurrencia por API key — así que se pueden procesar millones de documentos al mes con precio plano y predecible.
Se ejecuta en una GPU dedicada o totalmente on-premise dentro del propio datacenter — la misma API y el mismo código, con documentos que nunca salen de la red.
// empezar
Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.
Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.
// cookies
Usamos cookies estrictamente necesarias para que el sitio funcione y, solo con consentimiento explícito, Google Analytics para entender el uso. Nada de publicidad, nunca — consulta la Política de cookies.
// preferencias