Upload
danielbox21
View
14
Download
3
Embed Size (px)
DESCRIPTION
Estadistica
Citation preview
TEMAS
PRUEBAS DE BONDAD DE AJUSTE
PRUEBA DE INDEPENDENCIA
LOGRO DEL TEMA
Al finalizar la sesión,
el estudiante será capaz de:Aplicar los diferentes usos de la distribución chi – cuadrado para Bondad de ajuste de una variable e independencia de dos variables categóricas
Pruebas Chi cuadradoPrueba de bondad de ajuste a la Poisson
Observemos la variable:
X= Número de defectos por mayólica de 30x30
¿Qué distribución presenta esta variable?
¿Cómo probar que posee esa distribución?
Mayólica
Número
defectos: X
i 1 02 03 14 25 36 17 08 2
….. 100 3
Comparamos valores observados con valores esperados.
Tabla resumen
Xi o i
0 45
1 30
2 15
3 10
100
0 1 2 305
101520253035404550 45
30
1510
40.736.6
16.5
6.3
Comparaciones entre valores observados y valores esperados
o ie i
Número de defectos
Núm
ero
de m
ayólicas
¿Qué tan buen ajuste logramos?
Prueba de bondad de ajuste a la Poisson
Sirve para probar si una variable sigue una distribución determinada en este caso Poisson Hipótesis:
H0: X sigue una distribución de Poisson
H1: X no sigue una distribución de Poisson
Estadístico de prueba:
22 2( 1)
1
~k
i ic k m
i i
o e
e
i ie np
Criterio de rechazo:2
)1,(2
mkc
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
X
Density
0
Distribution PlotF; df1=15; df2=23
Z.R.Z.N.R α
2)1,( mk
EJEMPLO Pág. 96
Número de rayos
gamma: X
Frecuencia
observada: Probabilida
dFrecuencia esperada:
0 20 1 48 2 65 0,239505 71,8514 0,653323 75 0,222207 66,6622 1,042874 45 0,154619 46,3858 0,041405 34 0,086071 25,8214 2,590476 9 0,039928 11,9783 0,74051
7 o más 4 Total 300
ioie
2i i
i
o e
e
Se desea probar si el número de rayos gamma emitidos por segundo por cierta sustancia radiactiva es una variable aleatoria que tiene distribución de Poisson. Utilice los siguientes datos obtenidos en 300 intervalos de segundo para probar dicha hipótesis a un nivel de significación 0,05.
Prueba de bondad de ajuste para distribución de Poisson Columna Datos: Número de rayos gammaColumna Frecuencia: Frecuencia observada Media de Poisson para Número de rayos gamma = 2,78333 Númerode rayos Probabilidad Contribucióngamma Obs de Poisson Esperado a Chi-cuad.0 20 0,061832 18,5496 0,113401 48 0,172099 51,6298 0,255192 65 0,239505 71,8514 0,653323 75 0,222207 66,6622 1,042874 45 0,154619 46,3858 0,041405 34 0,086071 25,8214 2,590476 9 0,039928 11,9783 0,74051>=7 4 0,023739 7,1216 1,36830 N N* GL Chi-cuad. Valor P300 0 6 6,80545 0,339
Pruebas de normalidad Shapiro Wilks y Anderson Darling
Prueba de normalidad
Sirve para probar si una muestra de datos sigue una distribución normal Hipótesis:
H0: X sigue una distribución normal
H1: X no sigue una distribución normal
Existen dos pruebas muy conocidas para probar la normalidad de una muestra de datos.
Prueba de normalidad de Shapiro WilksSe considera una de las pruebas más potentes para el contraste de normalidad, sobre todo para muestras pequeñas (n<30)
12 15 16 18 19 14 10 15 16 14
Pruebe que si las siguientes edades provienen de una distribución normal. Use un nivel de significación del 1%.
22,520,017,515,012,510,0
99
95
90
80
70
605040
30
20
10
5
1
Edades
Porc
enta
je
Media 14,9Desv.Est. 2,644N 10RJ 0,990Valor P >0,100
Gráfica de probabilidad de EdadesNormal
EJEMPLOPág.99
Prueba de normalidad de Anderson Darling
Esta prueba se aplica para evaluar el ajuste a cualquier distribución de probabilidades.
Cuando se aplica para probar si se ajusta un conjunto de datos a una distribución normal, es una herramienta poderosa para la detección de la mayoría de las desviaciones de la normalidad.
Es una prueba de normalidad considerada como una modificación de la prueba de Kolmogorov.
Durante un periodo de tres semanas se observó el número de averías de una máquina. Contrastar la hipótesis de que los datos provienen de una distribución normal. Use un nivel de significación del 1%.
EJEMPLO Pág 101
Prueba de independencia
RendimientoAlto
MedioBajo
Tipo de música Rock Pop Clásica
¿Están relacionadas estas variables?
Debido a la cercanía de los exámenes finales, se hizo una encuesta a los alumnos de la UPC para saber si su rendimiento en los exámenes esta relacionado con el tipo de música que escuchan en sus horas de estudio.
Prueba de independencia
Hipótesis:
Estadístico de prueba:
Criterio de rechazo:
n
nne ji
ij
2
111 1
2
2 ~
cr
r
i
c
j ij
ijijc e
eo
H0: X e Y son independientes (no están relacionados)
H1: X e Y no son independientes (están relacionados)
2
11,2
crc
Sirve para probar si dos variables categóricas son independientes entre sí.
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
X
Density
0
Distribution PlotF; df1=15; df2=23
Z.R.Z.N.R.
α
2
11, cr
Tabla de contingencia
Variable 2TotalColumn
a 1Columna
2 . . Columna c
Variable 1
Fila 1
Fila 2
.
.
Fila r
Total n
La tabla se construye con la información de una muestra.
La variable 1 con r categorías se ordena en las filas (tendremos r filas)La variable 2 con c categorías se ordena en las columnas (tendremos c columnas)
EJEMPLOPág. 103Para determinar si en realidad existe una relación entre el aprovechamiento de un empleado en el programa de capacitación y su rendimiento real en el trabajo, consideramos una muestra de 400 casos de sus archivos y obtenemos las frecuencias observadas que se presentan en la siguiente tabla
Calificación en el programa de capacitación
TotalDebajo del
promedio
Promedio
Sobre el promedi
o
Rendimiento real en el trabajo (calificación del empleador)
Deficiente 23 60 29 112
Promedio 28 79 60 167
Muy bueno 9 49 63 121
Total 60 188 152 400Con un nivel de significación del 0.01, ¿la calificación del rendimiento del trabajador está asociada a la calificación en el programa de capacitación?
Debajo
del pro
medio
Pro
medio
Sobre
el pro
medio
Calificación en el programa de capacitación
0
20
40
60
80
23
60
2928
79
60
9
49
63
Distribución del rendimiento real en el traba-jo con respecto a la calificación en el pro-
grama
Rendimiento real en el trabajo (calificación del empleador) DeficienteRendimiento real en el trabajo (calificación del empleador) PromedioRendimiento real en el trabajo (calificación del empleador) Muy bueno
Núm
ero
de t
rabaja
dore
s
¿Qué aprendimos hoy?