16
Minería de Datos PRESENTADO POR GRUPO 2: DANNY RAMIREZ 20061006296 DENIS ROSALES 20070000844 CRISTHIAN MILLA20070002865 JOSHUA BONILLA 20081011437 KENIA VALLADARES 20091900412 SHIRLEY MARTINEZ 20131008717 JOSHUA BENITEZ 20131000342

Minería de Datos

  • Upload
    darkdan

  • View
    12

  • Download
    0

Embed Size (px)

DESCRIPTION

mineria de datos sql

Citation preview

Minera de Datos

Minera de DatosPRESENTADO POR GRUPO 2:DANNY RAMIREZ20061006296DENIS ROSALES20070000844CRISTHIAN MILLA20070002865JOSHUA BONILLA20081011437KENIA VALLADARES20091900412SHIRLEY MARTINEZ20131008717JOSHUA BENITEZ20131000342

La minera de datos funge un rol importantsimo en las grandes industrias y mercados alrededor del mundo para poder encontrar la forma de saber qu es lo que sus clientes necesitan, en que gastan ms dinero y en que se puede obtener una ventaja competitiva.

Existen multitud de reas que han integrado en su actividad las tcnicas de la Minera de Datos para Recuperar Informacin Destacan, entre las reas que utilizan la Minera de Datos para recuperar informacin, las siguientes:

Clculo deindicadores financierosAnlisis deriesgos de crditoEducacinProcesos IndustrialesModelos de calidadExtraccin demodelos de costePrediccin de fallos y accidentesRecomendacin de frmacosTelecomunicacionesEstablecimiento de patrones de llamadasTurismoTrficoPoltica

Objetivo General: Aprender a utilizar los mtodos de minera de datos aplicados a una base de datos con grandes volmenes de informacin para obtener informacin til en el proceso de toma de decisiones.

Objetivos Especficos: Identificar mediante algoritmos especficos:las prendas ms utilizadas por los deportistas, as como el tiempo promedio de uso.Predecir en que pocas del ao son ms vendidos los accesorios y repuestos de ciclismo y a que compaas pertenecen.Identificar a los clientes que muestran mayor crecimiento anual.

SOFTWARE A UTILIZARLa base de datos que se utilizar para este proyecto est creada con el SGBD SQL Server; y por lo tanto este es el sistema gestor del que haremos uso a lo largo del proyecto.Visual Studio es un conjunto completo de herramientas de desarrollo para la generacin de aplicaciones web ASP.NET, Servicios Web XML, aplicaciones de escritorio y aplicaciones mviles. Visual Basic, Visual C# y Visual C++ utilizan todos el mismo entorno de desarrollo integrado C# es un lenguaje orientado a objetos elegante y con seguridad de tipos que permite a los desarrolladores compilar diversas aplicaciones slidas y seguras que se ejecutan en .NET Framework.

MUESTRA Y EXPLICACIN DE LA BASE DE DATOS A UTILIZARAdventureWorks se utiliza en los ejemplos de cdigo de los Libros en pantalla de SQL Server y en los ejemplos complementarios que se pueden descargar de la pgina principal deMicrosoft SQL Server Samples. El esquema de la base de datos se ha diseado para mostrar las caractersticas de SQL Server. Los nombres de esquema se incluyen con los nombres de tabla y deben especificarse al realizar consultas en las tablas.

Estructura de AdventureWorks:Tabla Address Tabla ProductModelIllustrationTabla AddressType Tabla ProductModelProductDescriptionCultureTabla AWBuildVersion Tabla ProductPhotoTabla BillOfMaterials Tabla ProductProductPhotoTabla Contact Tabla ProductReviewTabla ContactCreditCard Tabla ProductSubcategoryTabla ContactType Tabla ProductVendorTabla CountryRegion Tabla PurchaseOrderDetailTabla CountryRegionCurrency Tabla PurchaseOrderHeaderTabla CreditCard Tabla SalesOrderDetailTabla Culture Tabla SalesOrderHeaderTabla Currency Tabla SalesOrderHeaderSalesReasonTabla CurrencyRate Tabla SalesPersonTabla Customer Tabla SalesPersonQuotaHistoryTabla CustomerAddress Tabla SalesReasonTabla DatabaseLog Tabla SalesTaxRateTabla Department Tabla SalesTerritoryTabla Document Tabla SalesTerritoryHistoryTabla Employee Tabla ScrapReason

Tabla EmployeeAddress Tabla ShiftTabla EmployeeDepartmentHistoryTabla ShipMethodTabla EmployeePayHistory Tabla ShoppingCartItemTabla ErrorLog Tabla SpecialOfferTabla Illustration Tabla SpecialOfferProductTabla Individual Tabla StateProvinceTabla JobCandidate Tabla StoreTabla Location Tabla StoreContactTabla Product Tabla TransactionHistoryTabla ProductCategory TablaTransactionHistoryArchiveTabla ProductCostHistory Tabla UnitMeasureTabla ProductDescription Tabla VendorTabla ProductDocument Tabla VendorAddressTabla ProductInventory Tabla VendorContactTabla ProductListPriceHistory Tabla WorkOrderTabla ProductModel Tabla WorkOrderRouting

Algoritmo de rboles de decisin El algoritmo de rboles de decisin es un algoritmo de clasificacin y regresin proporcionado por Microsoft SQL Server Analysis Services para el modelado de prediccin de atributos discretos y continuos.Para los atributos discretos, el algoritmo hace predicciones basndose en las relaciones entre las columnas de entrada de un conjunto de datos. Utiliza los valores, conocidos como estados, de estas columnas para predecir los estados de una columna que se designa como elemento de prediccin. Especficamente, el algoritmo identifica las columnas de entrada que se correlacionan con la columna de prediccin. La tcnica de minera de datos cuenta con una variedad de algoritmos para implementar a la hora de manipular datos en la bsqueda de informacin especfica como relaciones patrones, coincidencias etc.

Algoritmo de clsteres de MicrosoftEl algoritmo de clsteres es un algoritmo de segmentacin suministrado por Analysis Services. El algoritmo utiliza tcnicas iterativas para agrupar los casos de un conjunto de datos dentro de clsteres que contienen caractersticas similares. Estas agrupaciones son tiles para la exploracin de datos, la identificacin de anomalas en los datos y la creacin de predicciones.Los modelos de agrupacin en clsteres identifican las relaciones en un conjunto de datos que no se podran derivar lgicamente a travs de la observacin casual

La transformacin de los datos la hemos realizado mediante una interface grfica de usuarios elaborada a travs del lenguaje de programacin C#, esta interface interacta de modo que los usuarios seleccionen el tipo de tcnica o algoritmo deseado para extraer informacin representada a travs de mtodos grficos.

Conclusiones

La minera de datos automatiza el proceso de encontrar informacin predecible en grandes bases de datos.

La diferencia fundamental entre las aplicaciones clsicas de la estadstica y la minera de datos es el tamao del conjunto de datos ya que para un proceso estadstico, un conjunto grande de datos contendr cientos o miles de datos, mientras que para un proceso de minera de datos, millones o incluso miles de millones no es algo inesperado.

Las tcnicas de minera de datos pueden redituar los beneficios de automatizacin en las plataformas de hardware y software existentes y pueden ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean desarrollados.

El campo de uso de la minera de datos cada vez es ms amplio, debido a que esta tcnica permite la manipulacin de considerables volmenes de datos, con el fin de buscar patrones o relaciones sus usos van desde: el gobierno, empresas, universidades etc.

Existe una variedad de algoritmos implementados en la minera de datos, los cuales no suponen mayor complejidad de entendimiento, y pueden adaptarse segn las necesidades del usuario/cliente.Gracias por su atencin!!!