View
30
Download
3
Category
Preview:
DESCRIPTION
PARA EXPO
Citation preview
ROSSANA DAYSI FERNANDEZ YUCRA
WEKA
Universidad José Carlos Mariátegui
Sistemas de Información II
INTRODUCCION
2 04/08/23
WEKA se distribuye como software de libre distribución desarrollado en Java.
Está constituido por una serie de paquetes de código abierto con diferentes técnicas de preprocesado, clasificación, agrupamiento, asociación, y visualización, así como facilidades para su aplicación y análisis de prestaciones cuando son aplicadas a los datos de entrada seleccionados.
Estos paquetes pueden ser integrados en cualquier proyecto de análisis de datos, e incluso pueden extenderse con contribuciones de los usuarios que desarrollen nuevos algoritmos. Con objeto de facilitar su uso por un mayor número de usuarios, WEKA además incluye una interfaz gráfica de usuario para acceder y configurar las diferentes herramientas integradas.
Sistemas de Información II
WEKA (Waikato Enviroment for Knowledge Analysis)
3 04/08/23
Explorer: Entorno visual que ofrece una interfaz gráfica para el uso de los paquetes.Experimenter: Entorno centrado en la automatización de tareas de manera que se facilite la realización de experimentos a gran escala. KnowledgeFlow: Permite generar proyectos de minería de datos mediante la generación de flujos de información.Simple CLI: Entorno consola para invocar directamente con java a los paquetes de weka.
Sistemas de Información II
Explorer
4 04/08/23
El modo Explorador es el modo más usado y más descriptivo.El explorador permite tareas de:
Preprocesado de los datos y aplicación de filtros.Clasificación.Clustering.Búsqueda de Asociaciones.Selección de atributos.Visualización de datos.
Sistemas de Información II 04/08/235
FICHEROS .arff
Nativamente Weka trabaja con un formato denominado arff , acrónimo de Attribute-Relation File Format. Este formato está compuesto por una estructura claramente diferenciada en tres partes:
CABECERA. Se define el nombre de la relación. Su formato es el siguiente:
@relation <nombre-de-la-relación>
Donde <nombre-de-la-relación> es de tipo String*. Si dicho nombre contiene algún espacio será necesario expresarlo entrecomillado.
Sistemas de Información II 04/08/236
FICHEROS .arffDECLARACIONES DE ATRIBUTOS. En esta sección se declaran los atributos que compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente:@attribute <nombre-del-atributo> <tipo>
Donde <nombre-del-atributo> es de tipo String teniendo las mismas restricciones que el caso anterior. Weka acepta diversos tipos, estos son:NUMERIC, INTEGER, DATE, STRING, ENUMERADO
SECCIÓN DE DATOS. Declaramos los datos que componen la relación separando entre comas los atributos y con saltos de línea las relaciones.
@data4,3.2
Sistemas de Información II
% sobrevivientes del Titanic@RELATION relation@ATTRIBUTE class {"1st","2nd","3rd","crew"}@ATTRIBUTE age {"adult","child"}@ATTRIBUTE sex {"male","female"}@ATTRIBUTE survived {"yes","no"}@DATA1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes1st,adult,male,yes
04/08/237
Ejemplo de un archivo de prueba
titanic.arff
Sistemas de Información II 04/08/238
Sistemas de Información II 04/08/239
Sistemas de Información II 04/08/2310
Sistemas de Información II 04/08/2311
Sistemas de Información II 04/08/23University of Waikato12
Arboles
Sistemas de Información II 04/08/2313
Aprendizaje por todos los registrosPermite cargar un archivo arff para ser
implemetadoAprendizaje a partir de camposQue porcentaje de registros seran
utilizados
Confiabilidad
Sistemas de Información II 04/08/2314
Sistemas de Información II 04/08/2315
Sistemas de Información II 04/08/2316
Sistemas de Información II 04/08/2317
Sistemas de Información II 04/08/2318
Conf=aciertos
Sistemas de Información II 04/08/2319
Sistemas de Información II 04/08/2320
Sistemas de Información II 04/08/2321
Sistemas de Información II
Bibliografía
Referencias:WEKA website:
http://www.cs.waikato.ac.nz/~ml/weka/index.html
WEKA Tutorial:
WEKA Wiki: http://weka.sourceforge.net/wiki/index.php/Main_Page
Otros:http://scalab.uc3m.es/~docweb/ad/practicas/ficherosWeka/titanic.arff
http://scalab.uc3m.es/~docweb/ad/practicas.html/tutorialWEKA.pdf
http://users.dsic.upv.es/~jorallo/docent/doctorat/weka
Recommended