Upload
athento
View
935
Download
8
Embed Size (px)
Citation preview
Extracción de Información con Athento
Enero/2014
Índice!Buenas Prácticas !Método 1: Análisis de Imágenes !Método 2: Expresiones Regulares !Ejemplo práctico !!!
Buenas Prácticas!!!Calidad de la imagen: mínimo 300 DPI (puntos por pulgada !!!!!
Buenas Prácticas!!!Calidad de los documentos (manchas, dobleces, mal escaneo) !!!!!!
Buenas Prácticas!!!Formatos estándares de Imagen PDF, TIFF, PNG24, JPEG etc. !!!!!!
Análisis de los datos
Tenemos que saber que datos son relevantes para el usuario !No solo es relevantes el texto (imágenes, códigos de Barra)
Trabajar con Datos
Obtener datos y aplicarle reglas !Apoyarse en el ciclo de vida de Athento para agilizar el trabajo
Tipos de Datos a Extraer
Tipo de Dato Técnica Método de Extracción
Texto OCR Extracción por Expresiones regulares
Imágen Recorte de Imágenes Localización de los datos
Código de Barras Búsqueda de patrones Autodetección
Why?
There is a better way to do document management”