Excel Tratamiento de Datos

Embed Size (px)

Citation preview

MDULO 2: TRATAMIENTO DE DATOS CON HOJA DE CLCULO

Tema 6: Anlisis Estadstico de Datos

Leire Aldaz, Begoa Egua y Leire Urcola

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos

ndice del tema Introduccin Herramientas para Anlisis Complemento EZAnalyze

INTRODUCCINLas aplicaciones que permiten manejar hojas de clculo, como Microsoft Excel u OpenOffice.org Calc, ofrecen funciones que ayudan a realizar anlisis estadsticos de los datos mediante promedios, modas, medianas, mximos, varianzas El clculo de cada uno de estos estadsticos implica, sin embargo, una tarea un tanto laboriosa, por cuanto debe realizarse de forma individual para cada una de las funciones de inters. No obstante, en la actualidad existen complementos que disponen de herramientas que pueden facilitar en gran medida la obtencin inmediata de todos estos estadsticos. Ejemplos son: Para Microsoft Excel: el complemento Herramientas para Anlisis desarrollado por Microsoft o el complementos EZAnalyze desarrollado por Tim Poynton en 2004-2005, que permiten ampliar las prestaciones del programa para el anlisis estadstico de datos. Para OpenOffice.org Calc: la macro OOo Statistics descargable de la pgina http://sourceforge.net/projects/ooomacros/files/OOo%20Statistics/ A continuacin se van a describir brevemente los citados dos complementos que pueden emplearse en Microsoft Excel: Herramientas para Anlisis y EZAnalyze.

HERRAMIENTAS PARA ANLISISMicrosoft Excel ofrece un conjunto de herramientas que facilitan el anlisis estadstico de datos. Estas herramientas estn disponibles cuando se instala el programa, aunque para usarlas deben ser previamente cargadas. El procedimiento es muy sencillo:Aldaz, L., Egua, B. y Urcola, L. (2009) 2

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos Hacer clic en el botn Opciones de Excel que se encuentra al desplegar el Botn de Office

De entre las opciones, elegir Complementos. En el cuadro Administrar que se encuentra en la parte inferior, seleccionar Complementos de Excel, y hacer un clic en Ir.

Aparece un nuevo cuadro que muestra los complementos disponibles que pueden ser cargados: debe activarse la casilla de verificacin Herramientas para anlisis. Finalmente debe hacerse un clic en Aceptar.

Aldaz, L., Egua, B. y Urcola, L. (2009) 3

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos

De esta manera el complemento Herramientas para anlisis queda cargado y est disponible para ser utilizado en el comando Anlisis de datos del grupo Anlisis de la ficha Datos de la cinta de opciones. Al seleccionarlo aparece la ventana:

donde se encuentran todas las opciones disponibles. En particular, las herramientas de anlisis estadstico que proporciona este complemento son las siguientes: Anlisis de Varianza o Varianza de un factor o Varianza de dos factores con varias muestras por grupo o Varianza de dos factores con una sola muestra por grupo Correlacin Covarianza Estadstica descriptiva Suavizacin exponencial Prueba t para varianzas de dos muestras Anlisis de Fourier Histograma Media mvil Generacin de nmeros aleatoriosAldaz, L., Egua, B. y Urcola, L. (2009) 4

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos Jerarqua y percentil Regresin Muestreo Prueba t o Prueba t para medias de dos muestras emparejadas o Prueba t para dos muestras suponiendo varianzas iguales o Prueba t para dos muestras suponiendo varianzas desiguales Prueba z Una breve descripcin de cada una de estas herramientas de anlisis se puede encontrar aqu.

Ejemplo: Se dispone de observaciones relativas al consumo y renta semanal de diez familias. Se pretende, primero, realizar un anlisis descriptivo de las series. Y, segundo, estimar un modelo de regresin donde se trate de explicar el consumo en funcin de la renta. Haciendo uso del comando Anlisis de datos del grupo Anlisis de la ficha Datos de la cinta de opciones, aparece una ventana:

donde habra que elegir Estadstica Descriptiva:

Aldaz, L., Egua, B. y Urcola, L. (2009) 5

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos

Seleccionando el rango de celdas que ocupan las series, indicando su disposicin (en columnas), mostrando dnde colocar los resultados y eligiendo las opciones que se quieren ver mostradas, aparece:

que muestra un conjunto de estadsticos para ambas series de datos.

Si adems interesase la correlacin entre ambas variables, se elegira Coeficiente de Correlacin de las funciones de Anlisis de datos:

Aldaz, L., Egua, B. y Urcola, L. (2009) 6

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos

y, tras indicarle el rango de entrada y de salida:

arrojara como resultado:

Finalmente, la estimacin MCO de un modelo que explique el consumo en funcin de la renta se podra obtener directamente eligiendo la funcin Regresin de la ventana de Anlisis de datos:

Aldaz, L., Egua, B. y Urcola, L. (2009) 7

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos donde habra que seleccionar el rango que ocupa la variable a explicar (consumo) y la variable explicativa (renta) e indicar si el modelo debe o no incluir una constante. Adems da la posibilidad de que en los resultados aparezcan listados los residuos, mostrado el grfico de stos, representada la recta de regresin muestral

Tras elegir las opciones deseadas se obtiene como output:

Aldaz, L., Egua, B. y Urcola, L. (2009) 8

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos Este ha sido un ejemplo de uso de tres herramientas de anlisis que proporciona este complemento. Sin embargo, la forma de proceder en todas ellas es similar: proporcionando una serie de datos y parmetros para cada anlisis y eligiendo una serie de opciones, la herramienta realiza los clculos y muestra los resultados en una tabla que, en algunas ocasiones, viene acompaada de grficos.

COMPLEMENTO EZAnalyzeEZAnalyze es un complemento de Microsoft Excel, desarrollado por Tim Poynton en 2004-2005, que permite ampliar las prestaciones del programa para el anlisis estadstico de datos y la creacin de grficos. Este complemento puede descargarse e instalarse directamente de la pgina de EZAnalyze http://www.ezanalyze.com/download/:

Una vez instalado aparece el mensaje:

Aldaz, L., Egua, B. y Urcola, L. (2009) 9

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos

Cuando se abra de nuevo Microsoft Excel aparecer una nueva ficha en la cinta de opciones rotulada como Complementos:

En esta ficha aparece el comando que da acceso a todas las prestaciones que ofrece EZAnalyze:

Para poder trabajar con este complemento los datos tienen que tener una distribucin concreta: en la primera fila de la hoja deben aparecer los nombres de lasAldaz, L., Egua, B. y Urcola, L. (2009) 10

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos variables a analizar; y los datos asociados a tales variables para cada elemento analizado se deben encontrar en las filas siguientes. Ejemplo:

Una vez que los datos estn bien estructurados, se puede proceder a efectuar el anlisis estadstico utilizando una de las funciones que ofrece EZAnalyze:

Describe: proporciona porcentajes y estadsticos descriptivos. Disaggregate: permite clasificar los resultados en categoras. Graph: crea grficos bsicos. New Variable: permite crear nuevas variables a partir de las ya existentes (como suma o promedio, diferencias entre ellas). Advanced: proporciona opciones ms avanzadas de estadstica, como el clculo de correlaciones entre las variables, el anlisis de varianza o el anlisis de regresin lineal, entre otros. Delete Extra Sheets: borra todas las hojas creadas por EZAnalyze que se han ido creando al analizar los datos. Por defecto, el nombre de estas hojas empieza por EZA.

Aldaz, L., Egua, B. y Urcola, L. (2009) 11

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos Help: da acceso a la ayuda online de EZAnalyze, que se encuentra disponible en http://www.ezanalyze.com/help/ About: contiene informacin sobre la versin de EZAnalyze que se est utilizando y sobre los trminos del acuerdo de licencia. Options: da la posibilidad de desinstalar EZAnalyze y de cambiar la forma de desplegar las opciones de los mens (en cascada o de forma tradicional). Other Tools: contiene funciones que permiten fusionar datos y transponer datos.

Elegida la funcin ms idnea para el tema tratado, se debe seleccionar la variable o variables implicadas en el anlisis. Los resultados de cada funcin elegida aparecern en hojas de clculo nuevas e independientes.

Informacin detallada sobre este complemento de Microsoft Excel puede obtenerse en el manual de usuario y tutoriales de Tim Poynton (clic aqu).

Ejemplo: Se dispone de observaciones relativas al consumo y renta semanal de diez familias. Se pretende, primero, realizar un anlisis descriptivo de las series. Y, segundo, estimar un modelo de regresin donde se trate de explicar el consumo en funcin de la renta. Haciendo uso del comando Descriptives Statistics del grupo EZAnalyze de la ficha Complementos de la cinta de opciones:

Aldaz, L., Egua, B. y Urcola, L. (2009) 12

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos aparece una ventana:

donde se debe indicar las variables que intervienen en el anlisis y los estadsticos que se desean calcular para esas variables. Seleccionado esto, aparece una nueva hoja, denominada EZA1 con los resultados:

Si adems interesase la correlacin entre ambas variables, se elegira Correlation de la Opcin Advanced del complemento EZAnalyze:

Aldaz, L., Egua, B. y Urcola, L. (2009) 13

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos

Obteniendo como resultado:

Finalmente, la estimacin MCO de un modelo que explique el consumo en funcin de la renta se podra obtener directamente eligiendo Linear Regresin del comando Advanced del complemento EZAnalyze:

Aldaz, L., Egua, B. y Urcola, L. (2009) 14

Mdulo 2: Tratamiento de Datos con Hoja de Clculo Tema 6: Anlisis Estadstico de Datos donde se debe indicar cul es la variable a explicar (criterion) y cuales las variables explicativas (predictor):

Y como hoja de resultados se obtiene:

Aldaz, L., Egua, B. y Urcola, L. (2009) 15