23
Inferencia Estimaci ´ on (computacional) mediante intervalos de confianza y contrastes de hip ´ otesis – 1 / 23 An ´ alisis computacional Inferencia Estad´ ıstica: intervalos de confianza y contrastes de hip ´ otesis Rom ´ an Salmer ´ on G ´ omez 29 de abril de 2014

Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

  • Upload
    doannhu

  • View
    244

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 1 / 23

Analisis computacionalInferencia Estadıstica: intervalos de confianza y

contrastes de hip otesis

Roman Salmeron Gomez

29 de abril de 2014

Page 2: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Contenidos

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 2 / 23

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Page 3: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Ejercicios

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 3 / 23

Page 4: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Ejercicios

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 4 / 23

En el archivo encuesta.xls (http://www.ugr.es/local/romansg/material/encuesta.xls)se dispone de la informacion para las siguientes variables de 148 estudiantes:

Edad: edad del estudiante medida en anos.Genero: variable dicotomica que toma los valores Hombre y Mujer.Titulaci on: titulacion a la que pertenece el estudiante (GECO, GADE, GADE+D

y GFICO).Grupo: grupo al que pertenece el estudiante (grupos A y B de manana, el resto

de tarde).Peso: peso del estudiante medido en kg.Pareja: variable dicotomica que toma el valor Si si el estudiante tiene pareja y

No en caso contrario.Sueno: numero de horas de sueno al dıa del estudiante.Fuma: variable dicotomica que toma el valor Si si el estudiante fuma y No en

caso contrario.Estudio: numero de horas de estudio al dıa del estudiante.TV: numero de horas que ve la TV al dıa el estudiante.Radio: numero de horas que escucha la radio el estudiante.Alcohol: variable cualitativa que toma los valores Nada, Poco y Bastante.

Page 5: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Ejercicios

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 5 / 23

1. Calcular la media (mediana, desviacion tıpica, varianza, asimetrıa y curtosis)de las variables Edad y Peso en funcion del Genero y Titulaci on .

2. ¿Es la edad media de los estudiantes de GFICO de 22 anos? ¿Se puede decirque el peso medio es de 66 kg?

3. ¿Son las medias de las horas de estudio, de TV y radio iguales entre hombresy mujeres? ¿Es el peso medio distinto entre los que tienen y no tienen pareja?¿Y entre los fumadores y no fumadores?

4. ¿Son las horas medias de sueno iguales en los estudiantes de todas las titu-laciones?

5. ¿Son las muestras obtenidas para Edad , Peso , Sueno , Estudio , TV y Radioaleatorias? ¿Se distribuyen normalmente?

Page 6: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Paquete estadıstico SPSS

Contenidos

Ejercicios

SPSS

Opciones disponiblesen Comparar medias

Contraste denormalidad

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 6 / 23

Page 7: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Paquete estadıstico SPSS

Contenidos

Ejercicios

SPSS

Opciones disponiblesen Comparar medias

Contraste denormalidad

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 7 / 23

SPSS es uno de los programas estadısticos informaticos mas usados debido asu capacidad de trabajo y su sencillo interfaz. Entre las (muchas) opciones quepresenta existe un modulo que permite realizar inferencia estadıstica con una ydos muestras.

Dicho modulo se encuentra en la rutaAnalizar → Comparar mediasLas opciones disponibles son:

Medias...Prueba T para una muestra...Prueba T para muestras independientes...Prueba T para muestras relacionadas...ANOVA de un factor...

Describimos a continuacion brevemente cada una de ellas.

Page 8: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Opciones disponibles en Comparar medias

Contenidos

Ejercicios

SPSS

Opciones disponiblesen Comparar medias

Contraste denormalidad

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 8 / 23

Medias... calcula medias (y otros muchos estadısticos univariados) en subgrupos(categorıas de una o mas variables independientes).

Prueba T para una muestra... contrasta si la media de una sola variable difiere deuna constante especificada.

Prueba T para muestras independientes... compara las medias de dos grupos(especificados en la variable de agrupacion). En este caso, mediante la pruebade Levene, ademas se contrasta la igualdad de varianzas.

Prueba T para muestras relacionadas... compara las medias de dos variables deun solo grupo: se trata de una unica muestra a la cual se le miden variables antesy despues de un evento.

ANOVA de un factor se utiliza para contrastar la hipotesis de que varias mediasson iguales. Esta tecnica es una extension de la prueba t para dos muestras.

Adviertase que las pruebas devuelven el p-valor del contraste realizado y el inter-valo de confianza asociado.

Page 9: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Contraste de normalidad

Contenidos

Ejercicios

SPSS

Opciones disponiblesen Comparar medias

Contraste denormalidad

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 9 / 23

Las pruebas anteriormente realizadas se pueden realizar siempre y cuando lasmuestras sean aleatorias y se distribuyan segun una normal.

Estas hipotesis se pueden contrastar en SPSS mediante la ruta Analizar → Prue-bas no parametricas → Una muestra...En Campo se seleccionan las variables a analizar y en Configuracion las pruebasa realizar, en este caso, Kolmogorov-Smirnov y Rachas.

Page 10: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Paquete estadıstico PSPP

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 10 / 23

Page 11: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Paquete estadıstico PSPP

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 11 / 23

PSPP es un una aplicacion de software libre para el analisis de datos y unreemplazo libre para el software propietario SPSS. Puesto que es un clon de estetodo lo expuesto anteriormente es valido para PSPP.

Mas informacion en la web: http://www.gnu.org/software/pspp/.

Page 12: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Software econom etrico Gretl

Contenidos

Ejercicios

SPSS

PSPP

Gretl

Contrastes

Hipotesis

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 12 / 23

Page 13: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Software econom etrico Gretl

Contenidos

Ejercicios

SPSS

PSPP

Gretl

Contrastes

Hipotesis

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 13 / 23

Si bien Gretl es un software enfocado al analisis econometrico, tambien permiterealizar inferencia estadıstica sobre una y dos muestras mediante contrastes dehipotesis.

Esta opcion se encuentra en la Calculadora de estadısticos de contraste delmenu Herramientas, siendo las opciones disponibles las siguientes:

Contraste para la media de una poblacion normal.Contraste para la varianza de una poblacion normal.Contraste para la proporcion.Contraste para la diferencia de medias procedentes de sendas poblacionesnormales.Contraste para el cociente de varianzas procedentes de sendas poblacionesnormales.Contraste de hipotesis para la diferencia de proporciones.

Page 14: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Calculadora de estadısticos de contraste

Contenidos

Ejercicios

SPSS

PSPP

Gretl

Contrastes

Hipotesis

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 14 / 23

En todos los casos me permite introducir los valores muestrales a usar1 obien seleccionar una variable del conjunto de datos de manera que de formaautomatica calcula toda la informacion necesaria.

Si se desea comparar dos subgrupos de una misma variable, por ejemplo,comparar el peso de alumnos en dos titulaciones distintas se ha de especificar encada pestana Peso (Grado=1) y Peso (Grado=3) y pulsar enter para que calculelos valores muestrales correspondientes.

Como resultado se obtiene tanto el valor del estadıstico experimental (que habrıaque comparar con el teorico2) como el p-valor asociado al contraste.

1Estos se pueden obtener seleccionando la variable correspondiente y pulsando elboton derecho del raton, dentro de las opciones que aparecen seleccionar Estadısticosprincipales.

2Este puede ser calculado en la ruta Herramientas → Tablas estadısticas.

Page 15: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Hipotesis de partida

Contenidos

Ejercicios

SPSS

PSPP

Gretl

Contrastes

Hipotesis

R

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 15 / 23

Para contrastar la hipotesis de partida de que la variable ha de ser normal,teniendo seleccionada la variable en cuestion, hay que seguir la ruta Variable →

Contraste de normalidad. Como resultado se obtienen 4 contrastes (en version1.9.13). En funcion del p-valor se rechazara o no la hipotesis nula de normalidad.

En la ruta Herramientas → Contrastes no parametricos se puede contrastar lahipotesis nula de aleatoriedad de la muestra en la pestana Contraste de rachas.

Page 16: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Entorno de programaci on R

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Contrastes

Codigo

Hipotesis

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 16 / 23

Page 17: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Entorno de programaci on R

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Contrastes

Codigo

Hipotesis

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 17 / 23

R es un conjunto integrado de programas para manipulacion de datos, calculo ygraficos que esta disponible como software libre en http://www.r-project.org/.

Para comparar medias y varianzas se disponen de los comandos t.test y var.test,respectivamente:

t.test(var1, var2=NULL, alternative="two.sided", mu = 0,

paired=FALSE, var.equal=FALSE, conf.level=0.95)

var.test(var1, var2, ratio=1, alternative = "two.sided",

conf.level=0.95)

Las opciones indicadas son las ofrecidas por defecto.

Page 18: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Opciones de de los comandos t.test y var.test

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Contrastes

Codigo

Hipotesis

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 18 / 23

Si para t.test no se especifica el segundo conjunto de datos se trabajara conuna unica muestra.El argumento alternative indica el tipo de contraste: bilateral si se especificatwo.sided, unilateral con hipotesis alternativa del tipo mayor para greater ymenor para less.En el argumento mu se especifica el valor de la hipotesis nula en el caso decomparacion de medias, mientras que para la comparacion de varianzas sehace con el argumento ratio.En el argumento paired se especifica si los datos estan relacionados (parea-dos), True, o no, False.En el argumento var.equal se especifica, en caso de dos muestras, si las va-rianzas son iguales (True) o no (False).Con el argumento conf.level se indica el nivel de confianza a usar.

Para trabajar con proporciones se tiene el comando prop.test (de similar uso).

Para resolver algunos de los problemas planteados al inicio del documento sepuede usar el siguiente codigo (se obtienen p-valores e intervalos de confianzaasociados).

Page 19: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

# leo los datos

datos = read.table(file="Datos.txt", header=TRUE, dec=",", sep="\t")

attach(datos)

# algunos descriptivos

list(summary(Edad), summary(Peso), summary(sueno), summary(estudio),

summary(tv), summary(radio))

# ejercicios

t.test(Edad, mu=22)

t.test(Peso, mu=66)

var.test(tv~Sexo)

t.test(tv~Sexo)

t.test(tv~Sexo,var.equal=T))

var.test(Peso~Pareja)

t.test(Peso~Pareja)

t.test(Peso~Pareja,var.equal=T)

var.test(Peso~Fuma)

t.test(Peso~Fuma)

t.test(Peso~Fuma,var.equal=T)

Page 20: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Hipotesis de partida

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Contrastes

Codigo

Hipotesis

Stata

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 20 / 23

Para contrastar la normalidad de las variables se tiene el comando shapiro.test :

shapiro.test(Peso)

shapiro.test(Edad)

Page 21: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Paquete estadıstico Stata

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Contrastes

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 21 / 23

Page 22: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Paquete estadıstico Stata

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Contrastes

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 22 / 23

Stata es un software estadıstico que permite una eficiente gestion de datos y deanalisis estadısticos.

Los datos en Stata se introducen directamente pulsando el boton correspondien-te a Data Editor (edit) o importandolos, por ejemplo desde Excel, sin mas quecopiarlos en la hoja de calculo y pegandolos en la de Stata (si el nombre de lasvariables esta escrito en la primera fila de la hoja de calculo aparecera un mensajepreguntando si dicha fila ha de tratarla como los nombres de las variables o comodatos).

Adviertase que el delimitador decimal es el punto (al igual que en Gretl y R).

Page 23: Analisis computacional´ Inferencia Estad´ıstica ... · Contenidos Contenidos Ejercicios SPSS PSPP Gretl R Stata Inferencia Estimacion (computacional) mediante intervalos de confianza

Comandos ttest, sdtest y swilk

Contenidos

Ejercicios

SPSS

PSPP

Gretl

R

Stata

Contrastes

Inferencia Estimacion (computacional) mediante intervalos de confianza y contrastes de hipotesis – 23 / 23

Para hacer inferencia en Stata hay que usar el comando ttest para contrastessobre la media, ya sea para una unica muestra o para dos (con varianzas igualeso distintas), o el comando sdtest para la comparacion de varianzas:

ttest peso = 66 ttest peso, by(fuma)

ttest TV = Radio, unpaired

ttest TV = Radio, unpaired unequal

sdtest TV = Radio

En todos los casos se obtienen la media y varianzas muestrales, intervalos yp-valores asociados a los contrastes de hipotesis realizados.

Para contrastar la normalidad de las variables se dispone del comando swilk :

swilk edad peso TV Radio Sueno

by fuma, sort: swilk edad peso TV Radio Sueno