// casos de uso · extracción de documentos

De documentos a
datos estructurados.

Siniestros, facturas, contratos y formularios, texto, tablas y escaneos, convertidos en JSON limpio. En infraestructura de la UE, totalmente auditable.

reservar_llamada

// cómo funciona

De documentos desordenados a campos limpios.

Visión, extracción y clasificación desde un único endpoint compatible con OpenAI — a volumen y exclusivamente dentro de la UE.

paso 01

Lee cualquier documento

gemma4

PDFs, escaneos y formularios — texto, tablas y maquetación, incluidas imágenes — procesados con un modelo con visión. Sin pipeline de OCR que mantener.

paso 02

Extrae al schema definido

deepseek-v4-flash

Los campos se extraen directamente al JSON schema propio con salidas estructuradas — cada valor donde se espera, siempre, listo para validar.

paso 03

Clasifica y enruta

qwen3-embedding

Se clasifica el tipo de documento y se enruta al flujo correcto con embeddings auditables — coincidencias seguras primero, casos límite marcados.

// drop-in

Cambia una línea. Conserva el pipeline.

La entrada de visión y las salidas estructuradas funcionan al estilo OpenAI. Se cambia la base URL y la key, se apunta a gemma4, y el schema vuelve completo — de forma privada.

leer_los_docs

extract.py

from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.helmcode.com/v1",  # one line changes
)

# vision in, structured JSON out — straight into your schema
result = client.chat.completions.create(
    model="gemma4",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "Extract the invoice fields."},
            {"type": "image_url", "image_url": {"url": invoice_png}},
        ],
    }],
    response_format={"type": "json_schema", "json_schema": invoice_schema},
)

// por qué helmcode

Extracción lista para producción.

Los documentos que se procesan están llenos de PII y datos financieros. Las APIs cerradas exigen subirlo todo — y lo registran.

Sin logs, desde la arquitectura.

Los documentos procesados — y los datos que contienen — no se almacenan nunca ni entrenan ningún modelo.

Procesado en la UE.

Facturas, siniestros y contratos permanecen en infraestructura europea — no en hyperscalers de EE. UU. sujetos al Cloud Act. Cumplimiento nativo con GDPR y AI Act.

Visión + JSON, una API.

Se lee un escaneo y se devuelve JSON validado desde un único endpoint compatible con OpenAI — sin proveedor de OCR aparte, sin código de pegamento.

Sin límites a volumen.

Se procesan millones de documentos al mes. Los límites son RPM y concurrencia por key, nunca el total de tokens — un mes intenso no se convierte en una factura sorpresa.

Modelos abiertos, schema propio.

DeepSeek V4-Flash, Qwen 3.6, Gemma 4. Los campos y el JSON los define el equipo — sin formatos de extracción propietarios que generen dependencia.

Se integra en el pipeline existente.

Salidas estructuradas y visión compatibles con OpenAI. Se cambia la base URL y la key, y el código de extracción sigue funcionando.

En producción en

Banca y fintech
Seguros
B2B SaaS
Sector público
Energía y utilities
Industria
Legal

En producción en

// faq de extracción

Extracción, respondida.

Lo que preguntan los equipos de operaciones e ingeniería antes de automatizar flujos documentales.

¿Puede leer PDFs escaneados e imágenes, no solo texto digital?

Sí. gemma4 tiene visión (y mimo-v2.5 es totalmente multimodal), así que lee escaneos, fotos y formularios — texto, tablas y maquetación — sin un pipeline de OCR aparte.

¿Se puede obtener la salida en un schema propio?

Sí. Con salidas estructuradas compatibles con OpenAI (response_format json_schema) los campos llegan en la forma JSON exacta que se defina — listos para validar y almacenar.

¿Se almacenan los documentos enviados?

No. Sin logs — los documentos y los datos extraídos no se persisten nunca ni entrenan ningún modelo. La extracción deja de ser un riesgo de privacidad.

¿Cómo se valida la salida?

Las salidas estructuradas restringen la respuesta al schema, así que los campos están siempre presentes y tipados. Se valida por campo y se marcan los casos de baja confianza para revisión.

¿Soporta alto volumen?

Sí. No hay límites de tokens — los límites son RPM y concurrencia por API key — así que se pueden procesar millones de documentos al mes con precio plano y predecible.

¿Y con documentos altamente sensibles?

Se ejecuta en una GPU dedicada o totalmente on-premise dentro del propio datacenter — la misma API y el mismo código, con documentos que nunca salen de la red.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.