Upload
omar-cespedes
View
1.584
Download
2
Embed Size (px)
Citation preview
HTTP://ORANGE.BIOLAB.SI/FEATURES/
OMAR CÉSPEDES ESPINOANGEL ALEJANDRO MANRIQUE RAMIREZ
INTRODUCCIÓN
programa informático para realizar minería de datos y análisis predictivo
desarrollado en la facultad de informática de la Universidad de Ljubljana (Eslovenia).
Consta de una serie de componentes desarrollados en C++ que implementan algoritmos de minería de datos, así como operaciones de preprocesamiento y representación gráfica de datos.
Los componentes pueden ser accedidos:
por medio de scripts desde Python
por medio de widgets (componentes GUI), desde el Canvas
Se distribuye bajo licencia GPL.
MULTIPLATAFORMA
COMPONENTES
Orange provee componentes para: Entrada/salida de datos, soporta los formatos C4.5, assistant, retis y tab(nativo).
Preprocesamiento de datos: selección, discretización, etc.
Modelado predictivo: árboles de clasificación, regresión logística, clasificador de Bayes, reglas de asociación, etc.
Métodos de descripción de datos: mapas autoorganizados, k-means clustering, etc.
Técnicas de validación del modelo: como validación cruzada.
INSTALACIÓN
REQUERIMIENTOS:
Python, para scripting.
Los paquetes Qt,PyQt, PyQwt, para usar Canvas y widgets.
El paquete GraphViz, para algunos widgets.
Para utilizar el Canvas puede ser necesario el modulo NumPy (paquete de funciones matemáticas).
FORMATOS
• C4.5 (.dat)
• ASSISTANT FILES (.dat)
• RETIS FILES (.rda .rdo)
• BASKET FILES (.basket)
• WEKA(.arff)
• MULAN (.xml)
• LIBSVM(.svm)
ACCESO POR CANVAS
ACCESO POR SCRIPT PYTHON
EJEMPLO