73
Proyecto de Mineria de datos con Analysis Services Minería de datos

Proyecto de Mineria de Datos Con Analysis Services v 3

Embed Size (px)

Citation preview

Page 1: Proyecto de Mineria de Datos Con Analysis Services v 3

Proyecto de Mineria de datos con Analysis Services

Minería de datos

Page 2: Proyecto de Mineria de Datos Con Analysis Services v 3

Trabajo

• Subir el archivo con sus imágenes en una archivo de texto.

• Guarde el proyecto de Analysis Services con su apellido y Nombre Ejemplo (RuizCarlos.).

• Suba ambos archivos al aula virtual.• NOTA: Guarde periodicamente su proyecto,

para no perder el avance realizado.• El trabajo es individual

Page 3: Proyecto de Mineria de Datos Con Analysis Services v 3

Creación del proyecto• Para crear un proyecto de Analysis Services• Abra Business Intelligence Development Studio.• En el menú Archivo, seleccione Nuevo y haga clic en Proyecto.• Compruebe que la opción Proyectos de Business Intelligence está seleccionado en el panel Tipos

de proyecto.• Compruebe que Proyecto de Analysis Services está seleccionado en el panel Plantillas.• En el cuadro Nombre, escriba ASDataMining2008 como nombre del nuevo proyecto.• Haga clic en Aceptar. • Para cambiar la instancia donde se almacenan los objetos de minería de datos• En Business Intelligence Development Studio, en el menú Proyecto, seleccione Propiedades.• En el lado izquierdo del panel Páginas de propiedades, en Propiedades de configuración, haga clic

en Implementación.• En el lado derecho del panel Páginas de propiedades, en Destino, compruebe que el nombre de

Servidor es localhost. Si usa una instancia diferente, escriba el nombre de la instancia. Haga clic en Aceptar.

Page 4: Proyecto de Mineria de Datos Con Analysis Services v 3

Creando proyecto

Page 5: Proyecto de Mineria de Datos Con Analysis Services v 3

Menú Proyecto – Propiedades -Destino

Page 6: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear origen de datos• Para crear un origen de datos• En el Explorador de soluciones, haga clic con el botón secundario en la

carpeta Orígenes de datos y seleccione Nuevo origen de datos.• En la página de inicio del Asistente para orígenes de datos, haga clic en

Siguiente.• En la página Seleccionar cómo definir la conexión, haga clic en Nueva para

agregar una conexión a la base de datos de AdventureWorksDW2008.• En la lista Proveedor del Administrador de conexiones, seleccione OLE DB

nativo\SQL Server Native Client 10.0. • En el cuadro Nombre del servidor, escriba o seleccione el nombre del

servidor en el que instaló AdventureWorksDW2008. • Por ejemplo, escriba localhost , si la base de datos se hospeda en el

servidor local.• En el grupo Iniciar sesión en el servidor, seleccione Utilizar autenticación

de Windows.

Page 7: Proyecto de Mineria de Datos Con Analysis Services v 3

Conexión

Page 8: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear origen de datos (Cont.)• En la lista Seleccionar o escribir un nombre de base de datos,

seleccione AdventureWorksDW2008 y haga clic en Aceptar. • Haga clic en Siguiente.• En la página Información de suplantación, haga clic en Utilizar la

cuenta de servicio y, a continuación, haga clic en Siguiente.• En la página Finalización del asistente, observe que, de forma

predeterminada, el origen de datos se denomina Adventure Works DW2008R2.

• Haga clic en Finalizar.• El nuevo origen de datos, Adventure Works DW2008R2, aparece en

la carpeta Orígenes de datos del Explorador de soluciones.

Page 9: Proyecto de Mineria de Datos Con Analysis Services v 3

Cuenta de servicio (Analysis Services)

Page 10: Proyecto de Mineria de Datos Con Analysis Services v 3

Fin del asistente

Page 11: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear la vista de origen de datos

• Para crear una vista de origen de datos• En el Explorador de soluciones, haga clic con el

botón secundario en Vistas del origen de datos y seleccione Nueva vista del origen de datos.

• En la página Asistente para vistas del origen de datos, haga clic en Siguiente.

• En la página Seleccionar un origen de datos, en Orígenes de datos relacionales, seleccione el origen de datos Adventure Works DW2008R2 que creó en la última tarea. Haga clic en Siguiente.

Page 12: Proyecto de Mineria de Datos Con Analysis Services v 3

Asistente de vista de origen de datos

Page 13: Proyecto de Mineria de Datos Con Analysis Services v 3

Seleccionar el origen de datos

Page 14: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear la vista de origen de datos (cont.)

• En la página Seleccionar tablas y vistas, seleccione los objetos siguientes y, a continuación, haga clic en la flecha derecha para incluirlos en la nueva vista del origen de datos:– ProspectiveBuyer (dbo): la tabla de compradores probables de una

bicicleta– vTargetMail (dbo): la vista de datos históricos sobre los compradores

de una bicicleta en el pasado• Haga clic en Siguiente.• En la página Finalizando el asistente, la vista del origen de datos

tendrá el nombre Adventure Works DW2008R2, de forma predeterminada. Cambie el nombre por Targeted Mailing y, a continuación, haga clic en Finalizar.

• La nueva vista del origen de datos se abre en la ficha Targeted Mailing.dsv [Design].

Page 15: Proyecto de Mineria de Datos Con Analysis Services v 3

Seleccione las tablas

Page 16: Proyecto de Mineria de Datos Con Analysis Services v 3

Cambiar nombre

Page 17: Proyecto de Mineria de Datos Con Analysis Services v 3

Vista de diseño

Page 18: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de Modelo de Minería de datos

• Para crear una estructura de minería de datos para un escenario de distribución de correo directo

• En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos para iniciar el Asistente para minería de datos.

• En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.

• En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o un almacén de datos se ha seleccionado y, a continuación, haga clic en Siguiente.

• En la página Crear la estructura de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft.

Page 19: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de MD

Page 20: Proyecto de Mineria de Datos Con Analysis Services v 3

Asistente

Page 21: Proyecto de Mineria de Datos Con Analysis Services v 3

A partir de una BD relacional

Page 22: Proyecto de Mineria de Datos Con Analysis Services v 3

Definir la técnica

Page 23: Proyecto de Mineria de Datos Con Analysis Services v 3

Defina la vista

Page 24: Proyecto de Mineria de Datos Con Analysis Services v 3

Definir el caso (escenario)

Page 25: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de Modelo de Minería de datos (Cont.)

• Haga clic en Siguiente.• En la página Seleccionar vista del origen de datos, en el panel Vistas

del origen de datos disponibles, seleccione Targeted Mailing. Puede hacer clic en Explorar para ver las tablas de la vista del origen de datos y, a continuación, hacer clic en Cerrar para volver al asistente.

• Haga clic en Siguiente.• En la página Especificar tipos de tablas, active la casilla de la

columna Caso, correspondiente a vTargetMail para usarla como tabla de casos y, a continuación, haga clic en Siguiente. Utilizará la tabla ProspectiveBuyer posteriormente para pruebas; pásela por alto por ahora.

• En la página Especificar los datos de aprendizaje, identificará al menos una columna de predicción, una columna de clave y una columna de entrada para el modelo. Active la casilla de la columna De predicción en la fila BikeBuyer.

Page 26: Proyecto de Mineria de Datos Con Analysis Services v 3

Datos de aprendizaje

Page 27: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de Modelo de Minería de datos (Cont.)

• Haga clic en Sugerir para abrir el cuadro de diálogo Sugerir columnas relacionadas.

• El botón Sugerir está habilitado siempre que se haya seleccionado al menos un atributo predecible. El cuadro de diálogo Sugerir columnas relacionadas enumera en una lista las columnas más relacionadas con la columna predecible y ordena los atributos por su correlación con el atributo predecible. Las columnas con una correlación significativa (con una confianza mayor del 95%) se seleccionan automáticamente para incluirse en el modelo.

• Revise las sugerencias y, a continuación, haga clic en Cancelar para omitirlas.

Page 28: Proyecto de Mineria de Datos Con Analysis Services v 3

Boton SUGERIR

Page 29: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de Modelo de Minería de datos (Cont.)

• Compruebe que la casilla de la columna Key está seleccionada en la fila CustomerKey.

Page 30: Proyecto de Mineria de Datos Con Analysis Services v 3

Datos de aprendizaje (actualizado)

Page 31: Proyecto de Mineria de Datos Con Analysis Services v 3

Datos de aprendizaje (actualizado)

Page 32: Proyecto de Mineria de Datos Con Analysis Services v 3

Datos de aprendizaje (actualizado)

Page 33: Proyecto de Mineria de Datos Con Analysis Services v 3

Datos de aprendizaje (actualizado)

Page 34: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de Modelo de Minería de datos (Cont.)

• Active las casillas de la columna Entrada en las filas siguientes. Puede activar varias columnas resaltando un rango de celdas y presionando CTRL mientras activa una casilla.– Age – CommuteDistance – EnglishEducation – EnglishOccupation – Gender – GeographyKey – HouseOwnerFlag – MaritalStatus – NumberCarsOwned – NumberChildrenAtHome – Region – TotalChildren – YearlyIncome

Page 35: Proyecto de Mineria de Datos Con Analysis Services v 3

Crear estructura de Modelo de Minería de datos (Cont.)

• En la columna izquierda de la página, active las casillas de las filas siguientes.– AddressLine1 – AddressLine2 – DateFirstPurchase – EmailAddress – FirstName – LastName.

• Asegúrese de que estas filas sólo tienen marcas en la columna izquierda. Estas columnas se agregarán a la estructura pero no se incluirán en el modelo. Sin embargo, una vez generado el modelo, estarán disponibles para la obtención de detalles y las pruebas.

Page 36: Proyecto de Mineria de Datos Con Analysis Services v 3

Especificar el tipo de datos y el tipo de contenido

• Revisar y modificar el tipo de contenido y el tipo de datos de cada columna

• En la página Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectar para ejecutar un algoritmo que determine los tipos de contenido y los datos predeterminados de cada columna.

• Revise las entradas de las columnas Tipo de contenido y Tipo de datos, y cámbielas si es necesario para asegurarse de que la configuración es igual que la que se muestra en la tabla siguiente.

• Normalmente, el asistente detectará números y asignará un tipo de datos numérico adecuado, pero hay varias situaciones en las que podría desear tratar un número como texto. Por ejemplo, GeographyKey se debería tratar como texto, porque no sería apropiado realizar operaciones matemáticas en este identificador.

Page 37: Proyecto de Mineria de Datos Con Analysis Services v 3

Revisar las entradasColumna Tipo de contenido Tipo de datosAddress Line1 Discrete TextAddress Line2 Discrete TextAge Continuous LongBike Buyer Discrete LongCommute Distance Discrete TextCustomerKey Key LongDateLastPurchase Continuous DateEmail Address Discrete TextEnglish Education Discrete TextEnglish Occupation Discrete TextFirstName Discrete TextGender Discrete TextGeography Key Discrete TextHouse Owner Flag Discrete TextLast Name Discrete TextMarital Status Discrete TextNumber Cars Owned Discrete LongNumber Children At Home Discrete LongRegion Discrete TextTotal Children Discrete LongYearly Income Continuous Double

Page 38: Proyecto de Mineria de Datos Con Analysis Services v 3

Contenido y Tipo de Datos

Page 39: Proyecto de Mineria de Datos Con Analysis Services v 3

Contenido y Tipo de Datos (Cont.)

Page 40: Proyecto de Mineria de Datos Con Analysis Services v 3

Especificar un conjunto de datos de pruebas

• Para especificar el conjunto de pruebas• En la página Crear conjunto de pruebas, en

Porcentaje de datos para pruebas, deje el valor predeterminado 30.

• En Número máximo de casos en el conjunto de datos de prueba, escriba 1000.

• Haga clic en Siguiente.

Page 41: Proyecto de Mineria de Datos Con Analysis Services v 3

Definir porcentaje

Page 42: Proyecto de Mineria de Datos Con Analysis Services v 3

Especificar un conjunto de datos de pruebas (cont.)

• Para denominar el modelo y la estructura, y especificar la obtención de detalles

• En la página Finalización del asistente, en Nombre de la estructura de minería de datos, escriba Targeted Mailing.

• En Nombre del modelo de minería de datos, escriba TM_Decision_Tree.

• Active la casilla Permitir obtención de detalles. • Revise el panel Vista previa. Observe que se muestran sólo las

columnas seleccionadas como Clave, Entrada o De predicción. Las otras columnas que seleccionó (por ejemplo, AddressLine1) no se usan para generar el modelo, pero estarán disponibles en la estructura subyacente y se pueden consultar una vez procesado e implementado el modelo.

• Haga clic en Finalizar.

Page 43: Proyecto de Mineria de Datos Con Analysis Services v 3

Asistente

Page 44: Proyecto de Mineria de Datos Con Analysis Services v 3

Vista del proyecto

Page 45: Proyecto de Mineria de Datos Con Analysis Services v 3

Agregar y Procesar Modelos• Para crear un modelo de minería de datos de agrupación en

clústeres• Cambie a la ficha Modelos de minería de datos del Diseñador de

minería de datos en Business Intelligence Development Studio.• Observe que el diseñador muestra dos columnas: una para la

estructura de minería de datos y otra para el modelo de minería de datos TM_Decision_Tree, que creó en la tarea anterior de esta lección.

• Haga clic con el botón secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos.

• En el cuadro de diálogo Nuevo modelo de minería de datos, en Nombre del modelo, escriba TM_Clustering.

• En Nombre del algoritmo, seleccione Agrupación en clústeres de Microsoft.

• Haga clic en Aceptar.

Page 46: Proyecto de Mineria de Datos Con Analysis Services v 3

Vista de Modelo de Minería

Page 47: Proyecto de Mineria de Datos Con Analysis Services v 3

Nuevo modelo

Page 48: Proyecto de Mineria de Datos Con Analysis Services v 3

Nuevo modelo Clustering

Page 49: Proyecto de Mineria de Datos Con Analysis Services v 3

Ahora existe una nueva columna

Page 50: Proyecto de Mineria de Datos Con Analysis Services v 3

Nuevo Modelo

• Ahora aparece el modelo nuevo en la ficha Modelos de minería de datos del Diseñador de minería de datos. Este modelo, integrado con el algoritmo de clústeres de Microsoft, agrupa los clientes con características similares en clústeres y predice la compra de una bicicleta en cada clúster. Aunque puede modificar el uso y las propiedades de la columna para el modelo nuevo, en este tutorial no es necesario hacer cambios en el modelo TM_Clustering.

Page 51: Proyecto de Mineria de Datos Con Analysis Services v 3

Agregar y Procesar Modelos (Cont.)

• Para crear un modelo de minería de datos Bayes naive• En la ficha Modelos de minería de datos del Diseñador de minería de

datos, haga clic con el botón secundario enla columna Estructura y seleccione Nuevo modelo de minería de datos.

• En el cuadro de diálogo Nuevo modelo de minería de datos, en Nombre del modelo, escriba TM_NaiveBayes.

• En Nombre del algoritmo, seleccione Bayes naive de Microsoft y haga clic en Aceptar.

• Aparece un mensaje que indica que el algoritmo Bayes naive de Microsoft no admite las columnas Age y Yearly Income, que son continuas.

• Haga clic en Sí para confirmar el mensaje y continuar.• Aparece un modelo nuevo en la ficha Modelos de minería de datos del

Diseñador de minería de datos. Aunque puede modificar el uso y las propiedades de las columnas para todos los modelos de la ficha, en este tutorial no es necesario hacer cambios en el modelo TM_NaiveBayes.

Page 52: Proyecto de Mineria de Datos Con Analysis Services v 3

Modelo Naive Bayes

Page 53: Proyecto de Mineria de Datos Con Analysis Services v 3

Advertencia

Page 54: Proyecto de Mineria de Datos Con Analysis Services v 3

Nuevo Modelo Naive Bayes

Page 55: Proyecto de Mineria de Datos Con Analysis Services v 3

Procesar los modelos• Para establecer el valor de inicialización de exclusión• Haga clic en la ficha Estructuras de minería de datos o

Modelos de minería de datos en el Diseñador de minería de datos de Business Intelligence Development Studio.

• Estructura de minería de datos Targeted Mailing aparece en el panel Propiedades.

• Asegúrese de que el panel Propiedades está abierto presionando F4.

• Asegúrese de que CacheMode está establecido en KeepTrainingCases.

• Escriba 12 en HoldoutSeed.

Page 56: Proyecto de Mineria de Datos Con Analysis Services v 3

Propiedades

Page 57: Proyecto de Mineria de Datos Con Analysis Services v 3

Implementar y Procesar los Modelos

• En el menú Modelo de minería de datos , seleccione Procesar estructura de minería de datos y todos los modelos.

• Si ha realizado cambios en la estructura, se le pedirá que genere e implemente el proyecto antes de procesar los modelos. Haga clic en Sí.

• En el cuadro de diálogo Procesando estructura de minería de datos: Targeted Mailing, haga clic en Ejecutar.

• Se abre el cuadro de diálogo Progreso del proceso para mostrar los detalles del procesamiento del modelo. El procesamiento del modelo podría tardar algún tiempo, según el equipo.

• Haga clic en Cerrar en el cuadro de diálogo Progreso del proceso cuando el procesamiento de los modelos se haya completado.

• Haga clic en Cerrar en el cuadro de diálogo Procesando estructura de minería de datos - <estructura>.

Page 58: Proyecto de Mineria de Datos Con Analysis Services v 3

Menu Módelo de Minería de datos

Page 59: Proyecto de Mineria de Datos Con Analysis Services v 3

Elija Procesar y vera la ventana

Page 60: Proyecto de Mineria de Datos Con Analysis Services v 3

Termina la implementación

Page 61: Proyecto de Mineria de Datos Con Analysis Services v 3

Procesando la estructura

Page 62: Proyecto de Mineria de Datos Con Analysis Services v 3

Procesando la estructura (Cont.)

Page 63: Proyecto de Mineria de Datos Con Analysis Services v 3

Explorar los modelos

• Cada modelo se muestra en la ficha Visor de modelos de minería de datos

• En caso que se presente la ventana de actualizar responda SI.

Page 64: Proyecto de Mineria de Datos Con Analysis Services v 3

Visor de Modelos

Page 65: Proyecto de Mineria de Datos Con Analysis Services v 3

Red de dependencias

Page 66: Proyecto de Mineria de Datos Con Analysis Services v 3

Clustering

Page 67: Proyecto de Mineria de Datos Con Analysis Services v 3

Perfiles de Cluster

Page 68: Proyecto de Mineria de Datos Con Analysis Services v 3

Características del cluster

Page 69: Proyecto de Mineria de Datos Con Analysis Services v 3

Distinción del Cluster

Page 70: Proyecto de Mineria de Datos Con Analysis Services v 3

NaiveBayes – Red de dependencias

Page 71: Proyecto de Mineria de Datos Con Analysis Services v 3

Perfiles de Atributo

Page 72: Proyecto de Mineria de Datos Con Analysis Services v 3

Características del atributo

Page 73: Proyecto de Mineria de Datos Con Analysis Services v 3

Distinción del atributo