OCR para documentos argentinos: desafíos y soluciones

El OCR (reconocimiento óptico de caracteres) existe hace décadas. Pero si alguna vez intentaste usar un servicio genérico para procesar facturas argentinas, probablemente te hayas encontrado con resultados mediocres. No es casualidad: los documentos argentinos tienen particularidades que la mayoría de las soluciones internacionales no manejan bien.

En este artículo vamos a hablar de cuáles son esos desafíos específicos y cómo los resolvemos con Luvant Lens.

Los desafíos específicos de Argentina

1. Facturas electrónicas AFIP

Las facturas electrónicas argentinas tienen un formato regulado por AFIP, pero eso no significa que sean uniformes. Cada software de facturación genera un PDF con diseño propio. Lo que sí comparten son campos obligatorios: CUIT del emisor y receptor, tipo de comprobante (A, B, C, M, E), punto de venta, número de comprobante, CAE, fecha de vencimiento del CAE, condición frente al IVA, y el detalle de conceptos con sus alícuotas.

El problema para un OCR genérico es que estos campos pueden aparecer en cualquier posición del documento, con distintas etiquetas (“CUIT”, “C.U.I.T.”, “CUIT/CUIL”) y en formatos variables (20-12345678-9 vs 20123456789). Un sistema que no fue entrenado con documentos argentinos no entiende estas variaciones.

2. Remitos y notas de entrega

A diferencia de las facturas electrónicas, los remitos no tienen un formato regulado. Cada empresa diseña el suyo. Algunos son impresos, otros manuscritos, y muchos son una combinación de ambos. Extraer datos de un remito manuscrito escaneado es un desafío significativamente mayor que procesar una factura electrónica.

Lo que buscamos extraer de un remito suele ser: número de remito, fecha, productos o ítems entregados con cantidades, destinatario y firma de conformidad. Cuando el documento es manuscrito o tiene baja calidad de escaneo, la precisión depende directamente de la calidad del modelo de OCR.

3. Recibos y comprobantes varios

Tickets de caja, recibos de pago, comprobantes de transferencia bancaria, comprobantes de tarjeta. Cada uno tiene su propia estructura y nivel de complejidad. Los tickets térmicos, por ejemplo, suelen tener baja resolución y se degradan con el tiempo, lo que hace que el procesamiento sea más difícil cuanto más viejo es el documento.

4. El idioma y las convenciones locales

Puede parecer menor, pero el idioma importa. Los OCR entrenados con documentos en inglés pueden tener problemas con:

Acentos y eñes: “facturación” puede leerse como “facturacion” o “facturaci6n”.
Formato de números: en Argentina usamos punto como separador de miles y coma para decimales (1.234,56), al revés que en EEUU. Un OCR que no distingue esto puede interpretar $1.234,56 como $1234.56 o como $1.234.
Formato de fechas: DD/MM/AAAA vs MM/DD/YYYY. Una fecha como 03/02/2026 puede ser 3 de febrero o 2 de marzo, dependiendo de la convención que asuma el sistema.
Direcciones: el formato de direcciones argentinas (calle + número + piso + depto + localidad + provincia + CP) no se parece al formato norteamericano.

Cómo funciona un OCR especializado

Un OCR moderno no es solo “leer texto de una imagen”. Es un proceso de múltiples etapas:

Pre-procesamiento: el documento se limpia digitalmente. Se corrige la rotación, se mejora el contraste, se eliminan sombras y artefactos del escaneo.
Detección de texto: se identifican las regiones del documento que contienen texto, separándolas de logos, firmas, sellos y espacios vacíos.
Reconocimiento: se convierte cada región de texto en caracteres digitales. Acá es donde la calidad del modelo marca la diferencia.
Extracción estructurada: no alcanza con leer el texto; hay que entender qué significa. El sistema identifica que “20-12345678-9” al lado de “CUIT” es un número de identificación fiscal, no un número de teléfono.
Validación: los datos extraídos se verifican contra reglas de negocio. ¿El CUIT tiene el dígito verificador correcto? ¿El CAE tiene el formato válido? ¿Los importes suman correctamente?

La diferencia entre un OCR genérico y uno especializado está principalmente en las etapas 4 y 5. Un OCR genérico te da texto plano. Uno especializado te da datos estructurados y validados.

Qué hace Luvant Lens diferente

Luvant Lens es nuestra plataforma de procesamiento de documentos, diseñada desde el inicio para documentos en español y con foco en el mercado argentino. Estas son las decisiones técnicas que tomamos para resolver los desafíos que describimos:

Modelos entrenados con documentos locales: nuestros modelos fueron entrenados con miles de facturas AFIP, remitos y comprobantes argentinos. Reconocen las convenciones locales de formato de números, fechas y direcciones.
Diccionario de campos AFIP: el sistema conoce la estructura de una factura electrónica argentina y sabe buscar los campos obligatorios aunque cambien de posición entre un proveedor y otro.
Validación integrada: cada CUIT extraído se valida con el algoritmo de dígito verificador. Cada CAE se verifica en formato y longitud. Los importes se cruzan para detectar inconsistencias.
API REST simple: Lens se integra con cualquier sistema mediante una API REST estándar. Enviás el documento, recibís los datos estructurados en JSON. Sin SDKs complicados ni dependencias pesadas.
Mejora continua: el sistema aprende de las correcciones. Cuando un operador marca un campo como incorrecto, esa corrección se usa para mejorar el modelo en futuras ejecuciones.

Resultados reales

Seamos transparentes con lo que podés esperar:

Facturas electrónicas AFIP: precisión superior al 97% en campos estructurados (CUIT, importes, fechas, CAE). El 3% restante suele ser por PDFs con problemas de generación o formatos muy atípicos.
Remitos impresos: precisión del 90-95% en campos principales. Los remitos manuscritos o de muy baja calidad de escaneo tienen menor precisión.
Tickets térmicos: precisión del 85-95%, dependiendo del estado del ticket y la resolución del escaneo.

Estos números no son del primer día. Son los que se alcanzan después del período de calibración inicial, donde el sistema se ajusta a los documentos específicos de cada cliente.

Cuándo tiene sentido usar OCR especializado

No toda empresa necesita OCR. Tiene sentido invertir en procesamiento automático de documentos cuando:

Procesás más de 20-30 documentos por día manualmente.
Los errores de carga manual te generan problemas contables o de gestión.
Necesitás que los datos estén en tu sistema en tiempo real, no al final del día.
Tu equipo administrativo dedica una parte significativa de su tiempo a carga de datos.

Si procesás menos de 10 documentos por día, la carga manual probablemente sea suficiente. El ROI de automatizar aparece cuando el volumen justifica la inversión inicial en integración y calibración.

Cómo empezar

Si querés evaluar cómo funcionaría Lens con tus documentos, el proceso es simple:

Nos enviás 10-20 documentos representativos (facturas de tus principales proveedores, remitos que recibís habitualmente).
Los procesamos con Lens y te mostramos los resultados: qué datos extrajo, con qué precisión, y dónde hay oportunidades de mejora.
Si los resultados tienen sentido para tu operación, diseñamos la integración con tus sistemas existentes.

No hay compromiso en la evaluación inicial. Si los resultados no te convencen, no avanzamos. Escribinos y coordinamos una prueba con tus documentos.