14
Autoclasificación de documentos. Buenas Prácticas y Trucos para Obtener el Mayor Rendimiento Enero/2014

Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

  • Upload
    athento

  • View
    984

  • Download
    1

Embed Size (px)

DESCRIPTION

En esta presentación aprenderás: * Qué características de los documentos nos ayudarán a obtener mejores resultados de clasificación. * Qué mecanismos de clasificación utiliza Athento para la autoclasificación de documentos. * Qué son modelos de clasificación. * Como utilizar palabras clave para obtener mejores resultados de clasificación.

Citation preview

Page 1: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Autoclasificación de documentos. Buenas Prácticas y Trucos para Obtener el Mayor Rendimiento

Enero/2014

Page 2: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Índice

Buenas Prácticas

Método 1: Análisis de Imágenes

Método 2: Expresiones Regulares

Ejemplo práctico

Page 3: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Buenas Prácticas

Calidad de la imagen: mínimo 300 DPI (puntos por pulgada

Page 4: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Buenas Prácticas

Calidad de los documentos(manchas, dobleces, mal escaneo)

Page 5: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Buenas Prácticas

Formatos estándares de ImagenPDF, TIFF, PNG24, JPEG etc.

Page 6: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de Imágenes

Utilizando imágenes: Histograma

Page 7: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de Imágenes

Histograma de la imagen previa

Page 8: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de la Imagen

Usando el tamaño (ancho y alto)

Page 9: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de Imágenes

Redes Neuronales

Page 10: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Expresiones Regulares

Buscamos patrones en el documento(También útil para la keyword extraction)

Page 11: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Cómo clasificar documentos?

Nombre de Empresa (Telefónica, Walt-Disney)Tipo de Documento (Factura, Contrato)RUT ↔ C.I.F.

Page 12: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Cómo definir modelos?

Modelo = Plantilla = Tipo de DocumentoEjemplo: Tickets Starbucks, Tarjeta Embarque American Airlines

Page 13: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Why?

There is a better way to do document

management”

Page 14: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Gracias

Preguntas?