Upload
eleuterio-verdin
View
226
Download
0
Embed Size (px)
Citation preview
MUESTREO E INSTRUMENTOS DE MUESTREO E INSTRUMENTOS DE MEDICIÓN, TABULACIÓN, ANÁLISIS E MEDICIÓN, TABULACIÓN, ANÁLISIS E INTERPRETACIÓN DE RESULTADOSINTERPRETACIÓN DE RESULTADOS
Mag. Renán Quispe Ll.
UNIVERSIDAD INCA GARCILASO DE LA VEGAUNIVERSIDAD INCA GARCILASO DE LA VEGAVicerrectorado Académico Vicerrectorado Académico
Instituto de Capacitación DocenteInstituto de Capacitación Docente
Lima, enero 2005Lima, enero 2005
EJEMPLOEJEMPLOSe desea estimar, con 95% de confianza, el tiempo promedio para la fabricación de cierto producto. En un estudio piloto se encontró que S=1.2 horas. El investigador asume una precisión de 0.25 horas.
Entonces, se tiene que:
Confianza 1-α=0.95 Z=1.96
S=1.2 horas, E=0.25 horas
895.8825.0
2.196.1E
SZn 2
22
2
222/α1
895.8825.0
2.196.1E
SZn 2
22
2
222/α1
Si se desea mejorar la precisión, asumiendo a E=0.2
1383.13825.0
2.196.1E
SZn 2
22
2
222/α1
1383.13825.0
2.196.1E
SZn 2
22
2
222/α1
Deducción del tamaño de la muestra Deducción del tamaño de la muestra utilizando los errores de muestreo relativoutilizando los errores de muestreo relativo
2
22
2
22
100xuE
100xuσ
Z
)población la de media la de % como E()población la de media la de % como (σZ
n
2
22
2
22
100xuE
100xuσ
Z
)población la de media la de % como E()población la de media la de % como (σZ
n
EJEMPLOEJEMPLOSe desea conocer tamaño de la muestra para estimar el porcentaje de hogares pobres en una provincia, si se sabe que la desviación standart de la población es cerca del 20% de la proporción de hogares pobres y se desea estar seguro en un 95% que la proporción muestral se halle dentro del 5% de la proporción poblacional (Z2 = 1.96)
Resolviendo, tenemos lo siguiente:
625
2096.1
100xuE
100xuσ
Zn 2
22
2
22
62
5
2096.1
100xuE
100xuσ
Zn 2
22
2
22
Si se escoge el tamaño de la muestra igual a 62, tenemos la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional
Si se escoge el tamaño de la muestra igual a 62, tenemos la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional
EJEMPLOEJEMPLO¿Que pasaría, si la desviación standart de la población aumenta al 40% de la proporción de hogares pobres?
2465
4096.1n 2
22
246
5
4096.1n 2
22
El tamaño de la muestra debe ser 246 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional
El tamaño de la muestra debe ser 246 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional
¿Que pasaría, si se desea estar seguro en un 95% que la proporción muestral se halle dentro del 10% de la proporción poblacional ?
1510
2096.1n 2
22
15
10
2096.1n 2
22
El tamaño de la muestra debe ser 15 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional
El tamaño de la muestra debe ser 15 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional
PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS
HIPOTESIS Son supuestos o enunciados que pueden o no ser verdaderas, relativas a una o más poblaciones y pueden ser:
Contrastar una Hipótesis Estadísticamente
Es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella.
PRUEBAS DE HIPOTESIS
HIPOTESIS ALTERNATIVASPueden ser:
Hipótesis nula : HO,Determina supuestos o conjeturas de la población o poblaciones bajo estudio, con el propósito de rechazar.
Hipótesis alternativa : H1, Determina supuestos o conjeturas de la población o poblaciones bajo estudio con el propósito de no rechazarla.
Tipos de Hipótesis:Tipos de Hipótesis:
Alternativas: Hipótesis A v/s Hipótesis B, donde A y B no pueden cumplirse simultáneamente.
Anidadas: Hipótesis A y B, donde A es un caso especial de B.
HIPOTESIS A CONTRASTAR
datos de la muestra
Se definen:
Las hipótesis nula y alternativa con una distribución de probabilidad conocida
Regla de decisión(nivel de significación )
Valor crítico o tabulado
Se calcula una medidaasociada a la hipótesis
que se desea docimar
Se comparan los valores calculado con tabulado
¿se rechaza Ho?
NOSIH1
Se extraen conclusiones
Utilizar prueba de ZSi
No
Si
Utilizar prueba de Z
No
¿Se conoce ?
¿Se conoce ?
Utilizar prueba de Z
Utilizar prueba de t
¿Se conoce?
¿Se conoce?
Si
No
Es n ≥ 30? Es n ≥ 30?
No
Si
Utilizar prueba de Z (por el teorema central del límite)
¿Se conoce?¿Se conoce?
Utilizar prueba de Z (por el teorema central del límite)
Si
¿Se sabe q la población es normal?
¿Se sabe q la población es normal?
No
Si
Es n ≥ 30?Es n ≥ 30?Utilizar una prueba no paramétrica
Hipótesis simples: Da valores exactos para todos los parámetros desconocidos de la ley de probabilidad asumida.
CLASES DE HIPOTESIS
Hipótesis compuesta: Es la hipótesis que no da valores exactos, sino tiene un conjunto de valores para todos los parámetros desconocidos de la ley de probabilidad asumida. Se refiere a regiones de valores.
Prueba de hipótesis: Es un procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable y no debe ser rechazada, o si es irrazonable y debe ser rechazada.
PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPOTESIS
Paso 1: Plantear Hipótesis nula y Alternativa
Paso 2: Seleccionar un Nivel de significación
Paso 3: Identificar el Valor estadístico de prueba
Paso 4: Formular una regla de decisión
Paso 5: Tomar una muestra y llegar a una decisión
Finalmente: Aceptar H0, o bien rechazar H0 y aceptar H1
Nivel de significación: El riesgo que se asume acerca de rechazar la hipótesis nula cuando en realidad debe aceptarse por ser verdadera.
TIPOS DE ERROR
Error Tipo I: Se refiere a la probabilidad de rechazar la hipótesis nula, H0, cuando en realidad es verdadera. Se busca minimizar este tipo de error.
Error Tipo I: Se refiere a la probabilidad de rechazar la hipótesis nula, H0, cuando en realidad es verdadera. Se busca minimizar este tipo de error.
1- : Se refiere a la probabilidad de no rechazar la hipótesis nula, H0, cuando en realidad es verdadera. Se busca maximizar este tipo de error.
1- : Se refiere a la probabilidad de no rechazar la hipótesis nula, H0, cuando en realidad es verdadera. Se busca maximizar este tipo de error.
Error tipo II: Se refiere a la probabilidad de aceptar la hipótesis nula, H0 cuando en realidad es falsa. Este tipo de error busca aceptar lo que espero que no se acepte.
Error tipo II: Se refiere a la probabilidad de aceptar la hipótesis nula, H0 cuando en realidad es falsa. Este tipo de error busca aceptar lo que espero que no se acepte.
1- : Se refiere a la probabilidad de rechazar la hipótesis nula, H0, cuando en realidad es falsa. No se busca maximizarlo por que nunca se va aceptar la H0.
1- : Se refiere a la probabilidad de rechazar la hipótesis nula, H0, cuando en realidad es falsa. No se busca maximizarlo por que nunca se va aceptar la H0.
HipótesisNula
El investigador
No RechazarHO
RechazaHO
Si HO es verdadera DecisiónCorrecta = (1-)
Error Tipo I = NIVEL DE SIGNIFIC.
Si HO es falsa Error Tipo II = DecisiónCorrecta = 1- POTENCIA
Valor estadístico de prueba: Un valor, determinado a partir de la información muestral, que se utiliza para aceptar o rechazar la hipótesis nula.
Valor estadístico de prueba: Un valor, determinado a partir de la información muestral, que se utiliza para aceptar o rechazar la hipótesis nula.La regla de decisiónUna regla de decisión es simplemente la condiciones bajo las que se acepta o rechaza la hipótesis nula. El área de rechazo define la ubicación de todos los valores que son demasiado grandes o demasiado pequeños, por lo que la probabilidad de que se rechace la hipótesis nula es alta.
La regla de decisiónUna regla de decisión es simplemente la condiciones bajo las que se acepta o rechaza la hipótesis nula. El área de rechazo define la ubicación de todos los valores que son demasiado grandes o demasiado pequeños, por lo que la probabilidad de que se rechace la hipótesis nula es alta.
Región de rechazo
Probabilidad 0.95
Escala de Z1.645
Probabilidad 0.05
Valor Crítico
Distribución muestral del valor estadístico z, regiones de aceptación y de rechazo para una prueba de una cola, nivel de significación de 0.05.
Distribución muestral del valor estadístico z, regiones de aceptación y de rechazo para una prueba de una cola, nivel de significación de 0.05.
Toma de una decisión: Es la de afirmar que no hay evidencias suficientes para rechazar o no la hipótesis nula.
Toma de una decisión: Es la de afirmar que no hay evidencias suficientes para rechazar o no la hipótesis nula.
PRUEBA DE UNA COLAPRUEBA DE UNA COLA
PRUEBAS DE SIGNIFICACION DE UNA COLA Y DOS COLAS
PRUEBA DE UNA COLAPRUEBA DE UNA COLA
Región de rechazo
Escala de Z
0-1.645
Valor crítico
Región de aceptación H0
Valor critico del estadístico de la prueba
Área = nivel deseado de significancia
Se rechaza la hipótesis nula
Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región
PRUEBAS PARA LA MEDIA DE LA POBLACIONPRUEBAS PARA LA MEDIA DE LA POBLACION
N(0.1) ~
n
Xz
N(0.1) ~
n
Xz
MUESTRA GRANDE Y SE CONOCE LA DESVIACION ESTANDAR DE LA POBLACIONSe utiliza la siguiente estadística de prueba:
Las pruebas de hipótesis que se desean probar Las pruebas de hipótesis que se desean probar son:son:
HH00 HH11 RRcc
=o =1 ( <o) Z<-z1-
1 (>o) Z> z1-
o
Z<-z1-/2 ó Z> z1-/2
| Z|< z1-
o <o
Z<-z1-
o >o Z> z1-
PRUEBA DE DOS COLASPRUEBA DE DOS COLAS
Región de rechazo
0.025
Escala de Z0
-1.96Valor crítico
Región de rechazo
0.025
-1.96Valor crítico
0.95
Región de aceptación H0
MUESTRA GRANDE Y SE DESCONOCE LA DESVIACION ESTANDAR DE LA POBLACIONSe utiliza la siguiente estadística de prueba:
1)- t(n~
n
sX
T 1)- t(n~
n
sX
T
Las pruebas de hipótesis que se desean probar son:
HH00 HH11 RRcc
=o =1 ( <o) T<-t1-
=1 (>o)T> t1-
o T<-t1-/2 o T> t1-/2
o <oT<-t1-
o >o T> t1-
PRUEBA DE DOS COLASPRUEBA DE DOS COLAS
Región de rechazo
0.025
Escala de t0
-1.96Valor crítico
Región de rechazo
0.025
-1.96Valor crítico
0.95
Región de aceptación H0
PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIASMEDIAS
PRUEBA DE DIFERENCIA DE MEDIAS CON 21 = 22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑASSe utiliza la siguiente estadística de prueba:
Donde:
2) - n2(n1
21p
o21 t~
n1
n1
s
dXXT
2) - n2(n1
21p
o21 t~
n1
n1
s
dXXT
2nn
S1nS1nS
21
22
212
1p
2
2nn
S1nS1nS
21
22
212
1p
2
H0 H1 Rc
1- 2= do 1 - 2<do
1 - 2>do
1 - 2 do
T<-t1-
T> t1-
T<-t1-/2 o T> t1-/2
Las pruebas de hipótesis que se desean probar son:
Si se quiere probar la hipótesis sobre la diferencia de medias, cuando los tamaños de las muestras son pequeños y las poblaciones tienen distribuciones normales, con varianzas diferentes, se utiliza la siguiente estadística de prueba:
Que tiene una distribución t con K grados de libertad.
(K)
2
22
1
12
o21 t~
ns
ns
dXXT
(K)
2
22
1
12
o21 t~
ns
ns
dXXT
PRUEBA DE DIFERENCIA DE MEDIAS CON 21 22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑAS
Intervalo para la diferencia de medias cuando se conoce la varianza poblacional
-.1220.3Valor critico
+.1220.3Valor critico
+1050 = diferencia observada entre las medias muestrales.
millas 6.622.XX 21S
0XX 21
Z= -1.96 Z= +1.96Área =.025Área =.025
Se Rechaza Se Rechaza
Se acepta la hipótesis nula
Ejemplo 3 Se desea medir la diferencia entre dos categorías de empleados en la
actividad de seguros. Una está formada por personas con título superior y la otra por personas que sólo tienen estudios secundarios. Tomamos una muestra de 45 empleados entre los primeros y la media de venta resulta ser 32. Tomamos 60 empleados del segundo grupo y la media es 25. Suponga que las ventas de los dos grupos se distribuyen normalmente con varianzas de 48 para los titulados y 56 para los de estudios secundarios.
a.Calcule e interprete un intervalo del 90% de confianza para la verdadera diferencia de las medias.
b.De acuerdo con el intervalo hallado, ¿hay evidencia de que las medias sean iguales?.
Solución:
a. Intervalo: (x – y) + z α/2 √ σ 2x/nx + σ 2y /ny )
Reemplazando datos:
(32-25) + (1.645) √ 48/45 + 56/60 ) [ 4.67, 9.33]
b. Interpretación: La verdadera diferencia de medias se halla entre 4.67 y 9.33 con una certeza del 90%.
b. Si las dos medias son iguales, la diferencia entre ambas es cero. Por lo tanto, para que la igualdad entre las medias no pueda descartarse el cero debe estar en el intervalo calculado. Como en este caso no sucede, no hay evidencia de la igualdad entre las medias.
PRUEBA DE HIPOTESIS PARA UNA PROPORCIONPRUEBA DE HIPOTESIS PARA UNA PROPORCION
Las pruebas de hipótesis con relación a proporciones son básicamente iguales a las relativas con medias. Para probar la hipótesis de la proporción se usa la siguiente estadística de prueba:
N(0.1) ~
nqp
PP̂Z
oo
O N(0.1) ~
nqp
PP̂Z
oo
O
Las pruebas de hipótesis que se desean probar son:
H0 H1 Rc
p = p0
p po
p p
p=p1 ( <pO)
p=p1 (>po )
p po
p<po
p>po
Z<-z1-
Z> z1-
Z<-z1-/2 o Z> z1-/2
Z<-z1-
Z> z1-
Intervalo de confianza para una proporción
Intervalo de confianza para la diferencia de 2 proporciones
Consultoría Virgen del Carmen S.A.
P ∊ ( p + Z α/2 √ pq/n)
P1 – P2 ∊ ( (p1 – p2) + Z α/2 √ p1q1/n1 + p2q2/n2 )
Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región.
Se rechaza la hipótesis nula
Se rechaza la hipótesis nula
Area A = área B y (A+B) = el nivel deseado de significancia
Valor critico
Valor teórico de la diferencia
+ Valor critico
Area A Area B
Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales
Se acepta la hipótesis nula
Se rechaza Se rechaza
Z= -1.96 Z= +1.96Área =.025Área =.025
0PP 21
0362.PP 21S
-.071Valor critico
+.071Valor critico
Diferencia observada entre las proporciones muestrales = (.40-.50) =-.10
37
Ejemplo 4
Una fábrica desea saber la proporción de amas de casa que preferirían una aspiradora de su marca. Se toma al azar una muestra de 100 amas de casa y 20 dicen que les gustaría la máquina. Calcule e interprete un intervalo del 95% de confianza para la verdadera proporción de amas de casa que preferirían dicha aspiradora.
Solución:
Intervalo: p + Z α/2 √ pq/n
Reemplazando datos: [0.2 + √ (0.2)(0.8)/100 ] [0.122, 0.278 ]
Consultoría Virgen del Carmen S.A.
Interpretación: Tenemos una certeza del 95% de que la verdadera proporción de amas de casa que preferirían la aspiradora está entre 12.2% y 27.8%.
Interpretación: Tenemos una certeza del 95% de que la verdadera proporción de amas de casa que preferirían la aspiradora está entre 12.2% y 27.8%.
Ejemplo 5
Se está considerando cambiar el procedimiento de manufactura de partes. Se toman muestras del procedimiento actual así como del nuevo para determinar si este último resulta mejor. Si 75 de 1000 artículos del procedimiento actual presentaron defectos y lo mismo sucedió con 80 de 2500 partes del nuevo, determine un intervalo de confianza del 90% para la verdadera diferencia de proporciones de partes defectuosas.
Solución:
Intervalo: [(p1 – p2) + Z α/2 √ p1q1/n1 + p2q2/n2 ]
Reemplazando datos:
(0.075 – 0.032) + (1.645) √ (0.075)(0.925)/1000 + (0.032)(0.968)/2500
[0.0281 , 0.0579 ]
Consultoría Virgen del Carmen S.A.
Interpretación: Tenemos una certeza del 90% de que la diferencia de proporciones está entre 0.0281 y 0.0579.
Interpretación: Tenemos una certeza del 90% de que la diferencia de proporciones está entre 0.0281 y 0.0579.
Se hizo una encuesta a 212 altos ejecutivos de grandes compañías de un país, para estudiar problemas de comunicación y moral en las grandes compañías de ese país. Uno de los problemas que se estudiaron fue si los altos ejecutivos encontraban útiles las encuestas regulares de opiniones de empleados.
Queremos usar los resultados de la encuesta para apoyar la aseveración de que más del 90% de los altos ejecutivos encuentran útiles dichas encuestas. Se encontró ( en la encuesta) que el 93% la encontraban útil.
Consultoría Virgen del Carmen S.A.
Consultoría Virgen del Carmen S.A.
ESTIMACION PUNTUALLa muestra proporciona el estimador. Las muestras repetidas proporciona valores alrededor del parámetro .
Parámetro Poblacional Estimador
Media: n
xxu
n
i 1ˆ
1
)(
ˆ 1
2
22
n
xxS
n
i
pP ˆ
Varianza: 2
Proporción: P
ESTIMACION INTERVALICAPara una estimación interválica, usamos los datos de la muestra para obtener los límites del intervalo de manera que tengamos una probabilidad (1-) de que el intervalo contiene al parámetro poblacional, así por ejemplo
x 96.1x 96.1
x
El 95% de todas las muestras tiene en este intervalo x
Al considerar la distribución de la media muestral x
95 %
ESTIMACION INTERVALICA
x 96.1 x x
x xx 96.1xx 96.1
x 96.1
nZxL
2/1
Luego para el 95% de las muestras el intervalo obtenido con límites
incluirá entre sus valores el valor de la media poblacional
Intervalo de confianza para la media poblacional
A) Si la varianza poblacional (2) es conocida
Para todo tamaño de muestra de población normal o Para muestra grande (n 30) de cualquier población
nZxL
2/1
donde Z1- es la cuantila 1- de la normal estándar
Intervalo de confianza para la media poblacional
B) Si la varianza poblacional (2) es desconocida, para muestra grande (n 30)
n
SZxL
21
Intervalo de confianza para la media poblacional
En un experimento diseñado para estimar el número promedio de latidos por minuto del corazón para cierta población, se encontró que el número promedio de latidos por minuto de 49 personas fue de 90 con una desviación estándar de 10. Obtenga un intervalo de 90% de confianza para estimar el número promedio de latidos por minuto.
Intervalo de confianza para la media poblacional
C) Si la varianza poblacional (2) es desconocida, para muestra pequeña de población normal
n
StxL
21
Donde t1- es la cuantila 1- de la distribución t-Studentcon n-1 grados de libertad (g.l.)
Distribución t-Student
0 t1-
t(v)
Si v = 15 y = 0.10, entonces t1- = t0.95 = 1.753
)1(/
ntóndistribucitiene
nS
xT
Para muestras pequeñas de población normal
Intervalo de confianza para la diferencia de medias
a) Si las varianzas 12 y 2
2 son conocidas
Para muestras grandes
212/121 )( xxZxxL
2
22
1
21
21 nnxx
donde
Intervalo de confianza para la diferencia de medias
b) Si las varianzas 12 y 2
2 son desconocidas
Para muestras grandes
donde
212/121 )( xxSZxxL
2
22
1
21
21 ns
ns
S xx
Intervalo de confianza para la diferencia de medias
c) Si las varianzas son desconocidas, pero semejantes (1
2 = 22), entonces para muestras pequeñas de poblaciones
normales
t1- es la cuantila 1- de la distribución t-Studentcon (n1 + n2 – 2) grados de libertad
21 xx2/121 St)xx(L
2121
222
211 11
2)1()1(
21 nnnnSnSn
S xx
donde
Ejemplo 1
Los siguientes datos corresponden a los pesos (en kgs) de 15 hombres escogidos al azar y que trabajan en una empresa: 72, 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69. Estime el peso promedio y la desviación estándar. Luego estime el error del peso promedio.
Solución:
Sea X = peso promedio de los hombres en kgs.
x = Σ xi / n = (72+68+63+......+69)/ 15 = 75.67
S =√ Σ (xi – x)2 / (n-1) = √ [ (72-75.67)2 +....+(69-75.67)2] /(15-1) = 9.77
Sx = error del peso promedio.
Sx = S/ √n = 9.77/ √ 15 = 2.52
Ejemplo 2
Entre los miembros de una comunidad se escogieron 150 personas al azar y se les preguntó si estaban de acuerdo con los programas que el gobierno estaba desarrollando para prevenir el consumo de drogas. La encuesta dio como resultado que 130 sí estaban de acuerdo. Estime la proporción de los que estaban de acuerdo y el error estándar.
Solución:
p = (individuos que tienen la característica)/ total
p = 130/150 = 0.87.
S p = √ p(1-p)/n = √ (0.87)(0.13)/ 150 = 0.027.
Ejemplo 3
De las 50 aulas que tiene un edificio de la facultad de matemáticas de una Universidad, se escogieron al azar 5 y se determinó el número de alumnos que había en cada una de ellas en la primera hora de clases. Estime el número de alumnos que hay en el edificio si todas las aulas se encuentran ocupadas a esa hora y si el número de alumnos en cada una de las aulas inspeccionadas fue: 24, 35, 16, 30, 28.Luego estime el error del número total de estudiantes.
Solución:x = promedio de alumnos en las 5 aulas inspeccionadas.
x = Σ xi / n = (24+35+16+30+28)/5 = 26.6T = total de alumnos estimados en las 50 aulas.N = número total de aulas = 50.T = Nx = 50x26.6 = 1330 alumnos.S = =√ Σ (xi – x)2 / (n-1) = √ (24-26.6)2+....+(28-26.6)2/(5-1) = 7.13
SNx = NS / √ n = (50)(7.13)/ √5 = 159.43