8
1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b) Ho compuesta (Multinomi al) (Poisson, Normal)

1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

Embed Size (px)

Citation preview

Page 1: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

1

TEMA 6: CONTRASTES NO PARAMÉTRICOS

1.- CONTRASTES DE BONDAD DE AJUSTE

1) Con Datos CategóricosHo simple

2) Con Datos No Categóricosa) Ho simple

b) Ho compuesta

(Multinomial)

(Poisson, Normal)

Page 2: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

2

1.1 Contraste de Bondad de Ajuste para Datos Categóricos

Universo clasificado respecto a k alternativas o categorías: A1,A2,…Ai,…,Ak . La Población representaría la categoría en que estaría clasificada una unidad del universo. Su distribución de probabilidad sería una Multinomial. Es decir:

categorías A1 …. Ai …. Ak

probabili-dades p1 …. pi …. pk

k

ii=1

p =1Estas probabilidades de estar clasificado en cada una de las k categorías son desconocidas y

por tanto, se pueden formular hipótesis acerca de los valores que pueden tomar:

00 i i

01 i i

i 1,2,...k H : p p

H : p p para alguna

Para resolver el contraste de hipótesis:

muestra: m.a.s. de tamaño n clasificada según las k categorías:categorías A1 …. Ai …. Ak

frecuencias observadas n1 …. ni …. nk

k

ii=1

n = n

Page 3: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

3

Test de la Chi-Cuadrado:Si la Ho fuera cierta, las frecuencias que se esperaría que estuvieran en cada una de las k

categorías serían:

categorías A1 …. Ai …. Ak

frec. observ. ni n1 …. ni …. nk nfrec. esper. …. …. n

0inp0

inp 01np 0

knp

Este test se basa en un estadístico que calcula, para cada categoría, las diferencias entre ambos tipos de frecuencias (observadas y esperadas):

20Ki i

0i 1 i

n npQ

np

Interpretación valor del estadístico Q:•Q valor pequeño → diferencias pequeñas → Aceptar Ho•Q valor grande → diferencias grandes → Rechazar Ho

Condición que establece el Test: Rechazar H0 si: Q > c

Para determinar el valor c: Se fija nivel de significación

P (rechazar H0 / Ho cierta) = 0i iP(Q > c / p =p )=

Para resolver esta ecuación es necesario conocer la distribución del estadístico Q cuando Ho es cierta:

Page 4: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

4

Bajo Ho cierta, Pearson demostró que cuando n es grande la distribución de Q se aproxima a una con k-1 grados de libertad. 2

Luego:

Rechazar H0 si:

Aceptar H0 si:

kQ c= 2-1,

kQ c= 2-1,

Para poder aplicar este test se exige:

- Tamaño de la muestra grande

- Todas las frecuencias esperadas

(si alguna no lo cumple hay que agrupar categorías).

0inp 5

Page 5: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

5

EJEMPLO 1

En un municipio hay 3 partidos políticos mayoritarios. De cara a las próximas elecciones, el periódico local ha efectuado una encuesta sobre las preferencias por los 3 partidos políticos: A, B y C entre 80 votantes seleccionados al azar. Los resultados han sido:

partido A B Cvotantes 26 31 23

¿Se puede considerar que las preferencias electorales de los votantes por los 3 partidos políticos son las mismas para un nivel de significación del 5%?

Page 6: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

6

1.2 Contraste de Bondad de Ajuste para Datos No Categóricos

Ahora el universo no está clasificado respecto a k categorías. La Población está representada por una variable aleatoria X que puede ser discreta o continua.

0 0

1 0

H : F(x) F (x)

H : F(x) F (x)

Para resolver el contraste de hipótesis, el procedimiento a seguir consiste en:

El objetivo es contrastar si los datos de la muestra proceden de una distribución particular (Poisson, Normal). Es un contraste para la distribución de probabilidad de la población. Las hipótesis a contrastar son:

0 0

0 0

H simple: F (x) especifica el valor de sus parámetros

H compuesta: F (x) no especifica el valor de sus parámetros

Disponemos de una muestra: (x1, x2, …,xn) m.a.s. de tamaño n grande

1) Se divide el conjunto de todos los posibles valores que puede tomar la v.a. poblacional X en k intervalos numéricos: I1, I2, …,Ik

2) Se calcula el nº de observaciones de la muestra que estarían dentro de cada intervalo → se obtienen las frecuencias observadas ni .

Page 7: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

7

3) Se calculan las probabilidades que la distribución propuesta en la Ho asignaría a la probabilidad de que X pertenezca a cada uno de los k intervalos creados.

0ip

0i ip =P(X I ) para i=1,2,...,k

4) Se calculan las frecuencias esperadas para los k intervalos: 0inp

En el caso de que la Ho fuera compuesta, previamente se estimarían los parámetros desconocidos de la distribución de la Ho.

intervalos I1 …. Ii …. Ik

frec. observ. ni n1 …. ni …. nk nfrec. esper. …. …. n

0inp 0

1np 0inp 0

knp

5) Como tenemos las frecuencias observadas y las frecuencias esperadas, se puede aplicar el test de la Chi-cuadrado y calcular el estadístico Q. El contraste se resolvería como en el caso anterior 1.1.

Rechazar H0 si: k m-Q c= 2- 1,

Aceptar H0 si: k m-Q c= 2- 1,

La única diferencia: grados de libertad se calculan como k-m-1, donde m es el nº de parámetros estimados.

Page 8: 1 TEMA 6: CONTRASTES NO PARAMÉTRICOS 1.- CONTRASTES DE BONDAD DE AJUSTE 1) Con Datos Categóricos Ho simple 2) Con Datos No Categóricos a) Ho simple b)

8

EJEMPLO 2

En una encuesta a una muestra aleatoria de 90 fumadores que manifestaron su intención de dejar de fumar, se les preguntó por el número de veces que hasta el momento lo habían intentado. Los resultados fueron los siguientes:

¿Se puede aceptar un modelo Poisson de media igual a 2 para la variable aleatoria “número de intentos para dejar de fumar”?

nº de intentos fumadores

0 12

1 27

2 21

≥3 30