17
USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA ”, PARA: Contrastar la hipótesis sobre, la diferencia de más de dos medias poblacionales. Guía Anova Una Vía: No.4: Formalización del Modelo (GAUV_04) Caracas, Julio 2010 Amarilis García . Caracas, Julio 2010 UCV/FACES/EECA/ Curso: Estadística II Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”, PARA: Contrastar la hipótesis sobre,

  • Upload
    varick

  • View
    52

  • Download
    0

Embed Size (px)

DESCRIPTION

UCV/FACES/EECA/. Curso: Estadística II. Amarilis García . Caracas, Julio 2010. Guía Anova Una Vía : Formalización del Modelo (GAUV_04). USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”, PARA: Contrastar la hipótesis sobre, la diferencia de más de dos medias poblacionales. - PowerPoint PPT Presentation

Citation preview

Page 1: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”,

PARA:

Contrastar la hipótesis sobre,

la diferencia de más de dos medias

poblacionales.

Guía Anova Una Vía: No.4: Formalización del

Modelo

(GAUV_04)

Caracas, Julio 2010Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 2: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Formalización del Modelo Anova Una Vía. Planteamiento del Problema:

aleatoria cuyo tamaño puede ser igual o diferente, con lo que se tienen k muestras independientes con un determinado número de observaciones. Sea ; el número de elementos en la j-ésima muestra.

k ,,, 21 kH 210 :

:1H

, 1, 2, ,jn j k

Se tienen k poblaciones estadísticas, con medias ; y se trata

poblacionales, contra la hipótesis alternativa: por lo menos dos de las medias poblacionales son diferentes. Se toma de cada población una muestra

de contrastar la hipótesis nula: ; de igualdad de medias,

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 3: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

ijX

53X

Sea la i-ésima observación de la variable en la j-ésima muestra,

es la quinta observación de la variable en la tercera muestra.

La nomenclatura a ser utilizada será:

nknn

k

k

XXX

XXX

XXX

kMuestraMuestraMuestra

21

22221

11211

21

donde i=1,2,…,n ; j=1,2,…,k Así, por ejemplo:

Formalización del Modelo Anova Una Vía. PLANTEAMIENTO DEL PROBLEMA:

Nota: Con respecto al tamaño de las muestras, se pueden presentar dos situaciones: Caso 1: Muestras con igual tamaño; Caso 2: Muestras con al menos un tamaño distinto. Se sigue el análisis para cada uno de los casos.

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 4: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

1 21 1 1

1 21 1 1

1 2

2 21 1

2 2 21 11

2 21 1 1 1

2 2 21 11

( ) ( )ˆ ˆ ˆ

1 1

( ) ( )

n n n

i i iki i i

n n n

i i iki i i

j k

n n

i ik ki i

j k

n n

i ii i

j k

SUMAS X X X

X X XX X X X

n n n

X X X XS S S

n n

X X X XS S S

n n

GRAN MEDIA GLOBAL O MEDIA GLOBAL: 1 1 1

k n k

ij jj i j

X X

Xkn k

Formalización del Modelo Anova Una Vía. PLANTEAMIENTO DEL PROBLEMA:

Caso 1: Muestras con igual tamaño;

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 5: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

EJEMPLO:

En una industria se escogen 3 grupos de 5 obreros cada uno, y se les da entrenamiento con base a 3 diferentes métodos. Las productividades de los obreros después del entrenamiento fueron las siguientes:

METODO 1 METODO 2 METODO 3

20 25 16

25 26 18

23 20 15

18 29 20

19 30 21

Pr

1, 2,3, 4,5

1, 2,3

ijX oductividad del i ésimo obrero que

recibió el j ésimo método de entrenamiento

i

j

1 1 1 21 26 18 6521,67

3 3

Pr Pr 15

k n k

ij jj i j

X X

Xkn k

oductividad omedio de los obreros en la muestra

1. Unidades Experimentales: Obreros

2. Factor: Método de entrenamiento.

3. 3. Tratamiento: tipos de entrenamiento (1,2 y 3)-

4. Variable Respuesta: productividad del obrero.

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 6: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

11

1

21

2

21

3

20 25 23 18 1921 Pr Pr

5.1

26

18

n

ii

n

ii

n

ii

XX oductividad omedio de los obreros

nque recibieron el método de entrenamiento No

XX

n

XX

n

MEDIAS MUESTRALES

Formalización del Modelo Anova Una Vía

CUASIVARIANZAS MUESTRALES

2 21 1 1

2 1 11

2 22 2 2 2

2 1 12

2 23 3 3 3

2 1 13

( ) ( 21)34ˆ 8,5

1 4 4

( ) ( )62ˆ 15,5

1 1 4

( ) ( )26ˆ 6,5

1 1 4

n n

i ii i

n n

i ii i

n n

i ii i

X X XS

n

X X X XS

n n

X X X XS

n n

VARIANZAS MUESTRALES

21 1

2 11

22 2

2 112

23 3

2 13

( )34

6,85

( )62

12,45

( )26

5,25

n

ii

n

ii

n

ii

X XS

n

X XS

n

X XS

n

Caso 1: Muestras con igual tamaño;

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 7: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Formalización del modelo ANOVA una vía. Descomposición de la Suma de Cuadrados (SCT)

Consideremos la variable, SCT= SUMA DE CUADRADOS TOTALES, donde

2

1 1

k n

ijj i

SCT X X

SCT, es la suma de los cuadrados de las diferencias entre todos los elementos de la muestra y la gran media. Es una medida de dispersión de todas las observaciones con respecto a la media global.

Operando convenientemente, se puede descomponer la Variación Total medida por la Suma de Cuadrados Totales en dos componentes. Esta partición de la SCT en dos partes es la relación básica en el método de Análisis de Varianza (ANOVA).

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 8: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

SCD= Suma de cuadrados dentro de las muestras (variabilidad o dispersión dentro de cada una de las muestras).

Se demuestra que SCT (Suma de cuadrados totales) puede ser expresada de la siguiente manera:

2 2

2

1 1 1 1 1

( )k n k n k

ij ij j jj i j i j

SCT X X X X n X X

La variación o dispersión total de los datos se ha dividido en dos componentes, cada una de las cuales refleja la variación debida a diferentes causas o fuentes de variación.

SCT = SCD + SCE

donde:

SCE= Suma de cuadrados entre las muestras (variabilidad o dispersión entre las muestras).

Formalización del modelo ANOVA una vía. Descomposición de la Suma de Cuadrados (SCT)

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 9: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Medias      

Método 1 Xij 21 Métodos Medias  

1 20   2,78 1,00 1 21 0,44

2 25   11,11 16,00 2 26 18,78

3 23   1,78 4,00 3 18 13,44

4 18   13,44 9,00  

5 19   7,11 4,00 163,33

Método 2   26    

1 25   11,11 1,00  

2 26   18,78 0,00  

3 20   2,78 36,00  

4 29   53,78 9,00  

5 30   69,44 16,00  

Método 3   18    

1 16   32,11 4,00  

2 18   13,44 0,00  

3 15   44,44 9,00  

4 20   2,78 4,00  

5 21   0,44 9,00  

             

  325   285,33   122,00  

21,67  

Gran Media Global

Medias de los Grupos

Luego,SCT= 122+163,33= 285,33

METODO 1

METODO 2

METODO 3

20 25 16

25 26 18

23 20 15

18 29 20

19 30 21

Ejemplo 3: Ilustrando los cálculos utilizando Excel.

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 10: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Formalización del Modelo Anova Una Vía

luego SCT= 122+163,33= 285,33

2

1 1

34 62 26 122k n

ij jj i

SCD X X

En nuestro ejemplo, tenemos que:

dispersión dentro de cada una de las muestras

22 2 2

1

( ) 5 21 21,67 (26 21,67) (18 21,67) 163,33k

jj

SCE n X X

dispersión entre las muestras

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 11: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

ESTADÍSTICO DE CONTRASTE

gdlFunacomodistribuyeseSCD

SCE

k

nk

nk

SCDk

SCE

F nkkc )1();1(1

)1(

)1(

1

Caso 1: Muestras con igual tamaño;

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 12: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

PROCEDIMIENTO DEL CONTRASTE

gdlFunacomodistribuyeseSCD

SCE

k

nk

nk

SCDk

SCE

F nkkc )1();1(1

)1(

)1(

1

2. Estadístico de contraste

kH 210 :

1 :H

1. Formulación de hipótesis:

Hipótesis alternativa al menos dos medias son diferentesHipótesis nula

3. Criterio de decisión:

Entonces Rechzar H0Si

A continuación se presenta un resumen de los elementos necesarios para realizar el contraste de hipótesis para la diferencia de mas de dos medias poblacionales:

nnnn k 21

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 13: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

kH 210 :

1 :H

1. Formulación de hipótesis:

al menos dos medias son diferentes

Ejemplo: Prueba de Hipótesis para el contraste de para la diferencia de mas de dos medias poblacionales

2. Cálculo del estadístico de contraste:

3 (15 -1) * 163,33

(3 -1) * 122= =

8,033

Para un alfa = 0.05; tenemos una

= 3,89F1-0.05; (3-1),(3(15-

1)

3. Criterio de decisión:

Entonces Rechzar H0Si

Como, 8,033 > 3,89 ; entonces rechazamos H0

Decisión:

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 14: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Tabla de ANOVA : (ANOVA una-vía: un solo factor en múltiples niveles)

Presentando los cálculos e información en una Tabla Anova Una Vía

2

1

( ) 163,33k

jj

n X X

81,6671

SCE

k

CME

CMD

2

1 1

122k n

ij jj i

X X

10,167( 1)

SCD

k n

2

1 1

285,33k n

ijj i

X X

Fuente DeVariación

Suma DeCuadrados

GradosDe

Libertad

CuadradosMedios

RazónF

(Fc)

Entre Las Muestras

(Inter-Grupos)

K-1=2 8,033

Dentro De Las

Muestras(Intra-

Grupos)

K(N-1)=12

TotalKn-1=14

A continuación presentamos una

salida del SPSS (versión 11.0) ,

que muestra la tabla Anova.Compare ambas tablas y ubique en la Salida del SPSS los elementos del contraste de hipótesis para la diferencia de más de dos medias.

ANOVA

PRODUCTI

163,333 2 81,667 8,033 ,006

122,000 12 10,167

285,333 14

Inter-grupos

Intra-grupos

Total

Suma decuadrados gl

Mediacuadrática F Sig.

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 15: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Gran Media Global o Media Global:

Formalización del Modelo Anova Una Vía. PLANTEAMIENTO DEL PROBLEMA:

Caso 2: Al menos una de las muestras es de tamaño diferente. En este caso, el procedimiento es análogo al caso anterior; solo que se producen algunas modificaciones en las expresiones utilizadas.

1 1 1

( )

jnk k

ij j jj i j

X n X

XN N

Media Ponderada

1

k

jj

N n

1 1,2, ,

n

iji

jj

XX j k

n

2

2 1

( )ˆ

1

jn

ij ji

jj

X XS

n

Medias muestrales

2

2 1

( )

1

jn

ij ji

jj

X XS

n

Varianzas muestrales

Cuasivarianzas muestrales

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 16: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

Fuente de Variación

Suma de Cuadrados

Grados De

Libertad

Cuadrados Medios

Razon F

(fc) Entre las muestras

(inter-grupos)

2

1

( )k

j jj

SCE n X X

K-1

1

SCECME

k

Dentro de las

muestras (intra-grupos)

2

1 1

jnk

ij jj i

SCD X X

N-k

SCDCMD

N k

CME

CMD

Total

2

1 1

k n

ijj i

SCT X X

N-1

Presentando los cálculos e información en una Tabla Anova

Caso 2: Al menos una de las muestras es de tamaño diferente. En este caso, el procedimiento es análogo al caso anterior; solo que se producen algunas modificaciones en las expresiones utilizadas.

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)

Page 17: USO DEL “ ANÁLISIS DE VARIANZA UNA-VÍA ”,  PARA:  Contrastar la hipótesis sobre,

PROCEDIMIENTO DEL CONTRASTE

kH 210 :

1 :H

1. Formulación de hipótesis:

Hipótesis alternativa al menos dos medias son diferentesHipótesis nula

A continuación se presenta un resumen de los elementos necesarios para realizar el contraste de hipótesis para la diferencia de mas de dos medias poblacionales:

Caso 2: Al menos una de las muestras es de distinto tamaño.

2. Estadístico de contraste

libertaddegradosFunacomodistribuyeseCMD

CMEF kNkc ;1

3. Criterio de decisión:

Entonces Rechzar H0Si

1 ; ( 1),c k N kF F grados de libertad

Amarilis García . Caracas, Julio 2010

UCV/FACES/EECA/Curso: Estadística II

Guía Anova Una Vía: Formalización del Modelo (GAUV_04)