Upload
solymarysol
View
82
Download
5
Embed Size (px)
Citation preview
Universidad Peruana Unión
Facultad de Ingeniería y Arquitectura
EAP Ingeniería de Ambiental
MEINV
MÉTODOS ESTADÍSTICOS
PARA LA INVESTIGACIÓN
Docente
Mg. María Vallejos Atalaya
I Semestre 2009
Métodos Estadísticos para la investigación
2
Presentación
El presente módulo ha sido preparado con el propósito de servir al estudiante de la Escuela Académica Profesional de Ingeniería de Alimentos - Facultad de Ingeniería - Universidad Peruana Unión, en la formación inicial del amplio campo que constituye la teoría de los métodos estadísticos aplicados a la investigación. El propósito del módulo, es presentar una introducción en el marco de estudio de la estadística de manera que el estudiante de nuestra escuela conozca las múltiples aplicaciones, no solamente en los campos de ciencias naturales, ingeniería, sino también en ciencias sociales y, especialmente, en ingeniería de alimentos. Como se demostrará mas adelante el conocimiento del comportamiento de los parámetros es vital para extraer conclusiones respecto a la población. El presente módulo está organizado en tres unidades, en las cuales se enfoca el aprendizaje de los métodos estadísticos para la aplicación en actividades de especialización profesional como de investigación y en la vida misma. La primera unidad consta de conceptos fundamentales, estimación de parámetros y pruebas de hipótesis paramétricas. La segunda unidad estudia la construcción de diseños experimentales, el análisis de varianza y pruebas de comparaciones múltiples. La tercera unidad centra su atención en el análisis de regresión, covarianza, superficie de respuesta y pruebas no paramétricas. Es el anhelo de la tutora que este módulo contribuya al logro de los objetivos de la asignatura.
Métodos Estadísticos para la investigación
3
INDICE GENERAL PRIMERA UNIDAD ........................................................................................................................................ 4 ESTIMACIONES Y PRUEBAS DE HIPÓTESIS ............................................................................................ 4 1. ESTIMACIÓN DE PARÁMETROS ........................................................................................................ 4
1.1. ESTIMACIÓN PUNTUAL. ........................................................................................................... 4 1.1.1. Estimación Puntual para la media poblacional. ......................................................................... 5 1.1.2. Estimación Puntual para la varianza poblacional. ..................................................................... 5 1.1.3. Estimación de parámetros de dos poblaciones........................................................................... 5 1.1.4. Estimación puntual de una población de variable cualitativa .................................................... 6 1.1.5. Estimación puntual de dos poblaciones de variables cualitativas. ............................................. 6
1.2. ESTIMACIÓN INTERVÁLICA .................................................................................................... 6 1.2.1. Intervalo confidencial para la media poblacional ...................................................................... 6 1.2.2. Intervalo confidencial para la diferencia de medias poblacionales ............................................ 7 1.2.3. Intervalo confidencial para la proporción poblacional .............................................................. 8 1.2.4. Intervalo confidencial para la diferencia de proporciones poblacionales .................................. 8
2. SELECCIÓN DEL TAMAÑO DE MUESTRA en m.a.s........................................................................ 15 3. PRUEBAS DE HIPÓTESIS .................................................................................................................... 20
3.1. PRUEBA DE NORMALIDAD DE DATOS ............................................................................... 23 3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL ................................. 29 3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL ......................... 32 3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL ..................... 35 3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES ............... 38 3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES ........................ 42 3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES POBLACIONALES ......... 45
Métodos Estadísticos para la investigación
4
PRIMERA UNIDAD
ESTIMACIONES Y PRUEBAS DE HIPÓTESIS
Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones
respecto a una población, de los datos obtenidos realmente de una muestra.
La inferencia estadística comprende dos tipos principales de técnicas: Estimación de
parámetros y contrastación de hipótesis. Independientemente de la técnica que se utilice,
la finalidad general es utilizar datos de una muestra para extraer conclusiones respecto a
una población.
1. ESTIMACIÓN DE PARÁMETROS
Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa
respecto al valor de una característica de la población y desea conocer cuál podría ser tal
valor.
La estimación puede asumir 2 formas:
- Estimación puntual
- Estimación por intervalos
1.1. ESTIMACIÓN PUNTUAL.
Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar
el parámetro desconocido de la población.
Una desventaja de esta forma de estimación es que no aporta la precisión de la
estimación del parámetro.
Las estimaciones puntuales más usuales son:
COMPETENCIAS:
1. Estima parámetros mediante la estimación puntual e interválica. 2. Determina el tamaño adecuado de una muestra aleatoria 3. Contrasta hipótesis pramétricas para la media, varianza, proporción en una y dos
poblaciones
Métodos Estadísticos para la investigación
5
1.1.1. Estimación Puntual para la media poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
f
fx = x =
n
x = x =
i
iii
ˆˆ
1.1.2. Estimación Puntual para la varianza poblacional.
Se halla mediante las siguientes fórmulas.
- Para datos simples - Para datos agrupados
2 2 i2
2 2 i2
i
i
= s = ( x - x )
n - 1 = s =
( x - x ) f
f - 1
1.1.3. Estimación de parámetros de dos poblaciones
Sea X una variable aleatoria que se distribuye como una distribución normal con media x
y varianza ²x e Y otra variable aleatoria que se distribuye como una distribución normal
con media y y varianza ²y.
La estimación de parámetros de dos poblaciones se pueden realizar mediante:
a) La comparación de sus medias, luego:
212121ˆˆ x -x = - = -
b) La comparación de sus varianzas, luego:
s
s = =
2x
2x
x
x
x
2
x
2
1
2
1
2
2
1
2
ˆ
ˆˆ
Métodos Estadísticos para la investigación
6
1.1.4. Estimación puntual de una población de variable cualitativa
Sea X una variable cualitativa con:
P - 1 = Qy
AX si 0,
AX si 1,
N
M
N
XPcon
X
i
Luego:
p - 1 = qy
A xsi 0,
A xsi 1,
n
m
N
xpcon
x
i
Entonces: P p
1.1.5. Estimación puntual de dos poblaciones de variables cualitativas.
Sea X la variables aleatoria de una población cualitativa con Px proporción de aciertos en
X y sea Y la variables aleatoria de otra población cualitativa con Py proporción de aciertos
en Y, luego:
p - p = P - P = P - P xxxxxx 212121 ˆˆ
1.2. ESTIMACIÓN INTERVÁLICA
La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el
parámetro tiene la probabilidad especificada de estar. Los estimados por intervalos se
conoce como intervalos de confianza y los límites inferior y superior como los límites de
confianza.
En general el intervalo de confianza para el parámetro se expresa:
- 1 = )k + k - P( ˆˆˆˆ
Los intervalos confidenciales más usuales son:
1.2.1. Intervalo confidencial para la media poblacional
Para determinar el intervalo confidencial para la media poblacional se debe tomar en
cuenta lo siguiente:
Métodos Estadísticos para la investigación
7
- Cuando se conoce la varianza de la población (n 30)
- 1 = )n
Z + x n
Z - xP(22
)1()1(
- Cuando no se conoce la varianza de la población (n 30)
P( x - ts
n x + t
s
n) = 1 - ( n (
2,n-1)1
21 1 , )
1.2.2. Intervalo confidencial para la diferencia de medias poblacionales
Cuando n1 + n2 - 2 30 se usa el valor de la abscisa de la distribución normal
estándar Z(1-α/2)
Si, n1 + n2 - 2 < 30 se usa el valor de la abscisa de la distribución t student ( t(n-1, 1-α/2)
Se presentan los siguientes casos:
- Si ²1 y ²2 son conocidos
- 1 =] n
+n
Z + )x-x( - n
+n
Z - )x-xP[(22
22
2
2
1
2
1)
21(2121
2
2
1
1)1(21
- Si ²1 y ²2 no son conocidos
se presentan dos casos:
a. Si ²1 es aproximadamente igual a ²2 entonces; ²1 ²2 ²
2 - n + n
1)s - n( + 1)s - n( = s :donde
-1=])n
1+
n
1(st+)x-x(-)
n
1+
n
1(st-)x-xP[(
2
2)-nn(
2)-nn(
21
2
222
11
21
2,2
12121
21
2,2
1212121
Cuando ²1 es diferente a ²2
-1=]n
s+
n
st + )x-x(_ - _
n
s +
n
st - )x-xP[(
22
)-nn
22
)-nn(
2
2
1
12,
21(2121
2
2
1
12,
2121
2121
Métodos Estadísticos para la investigación
8
1.2.3. Intervalo confidencial para la proporción poblacional
Se presentan los siguientes casos:
- Cuando se conoce la proporción poblacional o n 30
- 1 =n
pqZ + p P
n
pqZ - P(p
22))1()1(
- Cuando no se conoce la proporción poblacional o n30
P(p - tpq
n P p + t
pq
n) = 1 - (
2,n-1) (
2,n-1)1 1
1.2.4. Intervalo confidencial para la diferencia de proporciones
poblacionales
Se pueden presentan los siguientes casos:
- Si P1 y P2 son proporciones poblacionales conocidas o n1 y n2 son muestras grandes
(n30)
-1=]n
qp+
n
qpZ+)p-p( p-P
n
qp+
n
qpZ-)p-pP[(
222
22
1
11)1(2121
2
22
1
11)1(21
- Si P1 y P2 son proporciones poblacionales desconocidas o n1 y n2 son muestras
pequeñas (n<30)
-1=]n
qp+
n
qpt+)p-p(P-P
n
qp+
n
qpt-)p-pP[( )-nn()-nn(
2
22
1
112,
212121
2
22
1
112,
21(21 2121
Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80 , n2 = 20 se
recomienda emplear:
n + n
pn + pn = p :donde
)n
1 +
n
1)(p - (1p = s
2
21
2211
21
Esta proporción denota la proporción conjunta de las dos muestras.
Métodos Estadísticos para la investigación
9
EJEMPLOS
1. Se ensaya un test para determinar el coeficiente de inteligencia a 8 alumnos; los
resultados fueron:
98, 108, 92, 111, 102, 95, 89, 115.
Determine la estimación puntual e interválica (use el 90% de confianza) para el promedio
verdadero del cociente de inteligencia.
Solución
n = 8, x = 101.25, s = 9.377 -1 = 0.90 Luego 2
1 = 0.95
como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895
a) Estimación puntual: 25.101
x
b) Estimación intervalica:
Por formula
- 1 = )n
st + x
n
st - xP( )(( 95.0,7)95.0,7
Reemplazando
- 1 = ) - P(8
377.9895.125.101
8
377.9895.125.101
Se obtiene
%9053.10797.94 =] P[
2. Un biólogo desea hacer una estimación, con un intervalo de confianza del 95%, de
la cantidad promedio de agua que consume diariamente cierta especie animal en
condiciones experimentales. El investigador supone que la población de valores de
consumo diario de agua está normalmente distribuido y, con base en experiencias
pasadas, que la varianza de la población es de 4 gramos cuadrados. Una muestra
aleatoria de 25 animales arroja una media de 16,5 gramos.
Métodos Estadísticos para la investigación
10
De acuerdo con los datos suministrados, el biólogo puede construir un intervalo de
confianza del 95%.
Solución
n = 25, x = 16.5, s = 2 -1 = 0.95 Luego 2
1 = 0.975
como n 30, entonces t(n – 1, 1 - /2) = t(24,0.975) = 2.064
Estimación intervalica:
Por formula
- 1 = )n
st + x
n
st - xP( )(( 95.07)95.07
Reemplazando
%9524
2064.25.16
24
2064.25.16 = ) - P(
Se obtiene
%9034.1766.15 =] P[
3. Como parte de un experimento, una gran empresa manufacturera encontró que el
tiempo promedio requerido para que 16 empleados escogidos al azar completaran una
tarea determinada era de 26 minutos. La desviación estándar era de 5 minutos. Construir
el intervalo de confianza del 95% para la media poblacional.
Solución
n = 16 x = 26 s = 5 1- = 0.95 entonces 2
1 = 0.975
como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131
Por formula
- 1 = )n
st + x
n
st - xP( )(( 975.0,15)975.0,15
Métodos Estadísticos para la investigación
11
Reemplazando
%95)16
5131.226
16
5131.226 = + - P(
Se obtiene
%9566.2834.23 =] P[
4. Se ha hecho un estudio de las diferencias entre estudiantes universitarios del
primer año que estuvieron en academias y estudiantes que no estuvieron. Para ello se
tomó una muestra aleatoria de 50 estudiantes universitarios que habían asistido a
academias y una muestra aleatoria simple independiente de 60 estudiantes que no lo
habían hecho. Al final del primer semestre se administró a los estudiantes una prueba de
rendimiento en matemática. Los que habían asistido a academias, obtuvieron un puntaje
promedio de 14,5, con una varianza de 4,8; y el puntaje promedio para el grupo que no
había asistido a la academia, fue de 13,75 con una varianza de 6,4. Construya un
intervalo de confianza para la diferencia entre las dos medias poblacionales (use 99% de
confianza).
Solución
ASISTIERON
ACADEMIA
NO ASISTIERON
ACADEMIA
nx1= 50
1x =14.5
s2x1 = 4.8
nx2 = 60
2x =13.75
s2x2 = 6.4
1 - = 0.99 luego 1- 2
= 0.995
Como nx1 + nx2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Por formula
-1=]n
s+
n
sz + )x-x(_ - _
n
s +
n
sz - )x-xP[(
22
)(
22
)(
2
2
1
1
212121
2
2
1
1
2121
Métodos Estadísticos para la investigación
12
Reemplazando
%9960
4.6
50
8.458.275.135.14
60
4.6
50
8.458.275.135.14
21=]+ + )-( - + - )-P[(
Se obtiene
%9991.141.021
=] - P[
5. Los estudiantes que se matricularon en un curso de Métodos Estadísticos fueron
distribuidas al azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades
para enriquecer el curso. El grupo B estudió mediante el método tradicional de
conferencias. Los puntajes obtenidos en una prueba de rendimiento, hecha al terminar el
curso dieron los siguientes resultados:
Grupo n x s
A 10 80 8
B 12 72 10
Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios
poblacionales.
Solución
La confianza, 1 - = 0.90 luego 1 - 2
= 0.95
Como nA + nB –2 < 30 entonces t (nA + nB –2,1– /2) = t(20, 0.95) = 1.725
Por formula
-1=]n
s+
n
st+)x-x( -
n
s+
n
st-)x-xP[(
B
2B
A
2A
n(nBABA
B
2B
A
2A
n(nBA BABA )2/1,2)2/1,2
Reemplazando
%9012
100
10
64725.17280
12
100
10
64725.17280 =]++)-( - +-)-P[(
BA
Se obtiene
%9062.1438.1 =] - P[BA
Métodos Estadísticos para la investigación
13
6. Una encuesta para verificar las actitudes de los trabajadores ante el boletín
mensual, se les pidió a 500 trabajadores de una gran empresa que indicaran con que
frecuencia leían el boletín de noticias. De los 500, 375 informaron que leían todas las
ediciones. Construir el intervalo de confianza del 95% para la proporción real de los que
opinan afirmativamente.
Solución
n = 500 p = 500
375= 0.75 q =0.25 1- = 0.95 luego
2
1 = 0.975
Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96
Por formula
- 1 =] n
pqZ + p P
n
pqZ - P[p )2/1()2/1(
Reemplazando
%95500
)25.0(75.096.175.0
500
)25.0(75.096.175.0 =] + P - P[
Se obtiene:
%9579.071.0 =] P P[
7. En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto
programa de televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado.
Determinar los límites de confianza del 99% para la diferencia de proporciones de todos
los adultos y jóvenes que vieron con agrado el programa.
Solución
ADULTOS JÓVENES
nA= 400
aA = 100
pA
=0,25
qA= 0,75
nJ = 600
aJ = 300
pJ=0,50
qJ
= 0,50
Métodos Estadísticos para la investigación
14
1 - = 0.99 luego 1- 2
= 0.995
Como nA+ nJ - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58
Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza
mancomunada así:
n + n
pn + pn = p
JA
JAJA
Reemplazando
4.01000
400
600400
50,0*60025,0*400
+
+ = p
)n
1 +
n
1)(p - (1p = s
JA
)1
+ 1
)(( = s 032.0600400
6.04.0
Por formula
-1=])n
1 +
n
1)(p - (1pZ+)p-p(P-P)
n
1 +
n
1)(p - (1pZ-)p-pP[(
JA
JAJA
JA
JA 2//1(2//1(
Reemplazando
%99)032.0(58.25.025.0)032.0(58.25.025.0 =]+)(P-P-)P[( JA
Se obtiene
%9917.033.0 =] P-P P[ JA
Métodos Estadísticos para la investigación
15
2. SELECCIÓN DEL TAMAÑO DE MUESTRA EN M.A.S
El procedimiento de muestreo, o diseño experimental, como se le llama comúnmente,
influye en la cantidad de información por observación o medición. Este diseño, junto con
el tamaño muestral n, determina la cantidad total de información relevante en la muestra.
Salvo en contadas ocasiones, trataremos la situación de muestreo más sencilla, un
muestreo de una población relativamente grande, y se enfocará la atención del tamaño
de muestra n.
Para ver cómo el tamaño muestral afecta al ancho de un intervalo de confianza,
considérese la desviación estándar de la distribución para cualquier estimador puntual.
Por ejemplo, la desviación estándar de la media muestral x , es:
nx
Nota: si se desea que el ancho de un intervalo de confianza sea pequeño, debe
aumentarse el tamaño de muestra.
Procedimiento para seleccionar el tamaño muestra
Sea el parámetro que se quiere estimar, y sea la desviación estándar del estimador
puntual. Entonces se procede según los pasos siguientes.
Elegir d, la cota para el error de estimación, y un coeficiente de confianza (1 - ),
Resolver la siguiente ecuación para el tamaño de muestra n:
dZ
)2/1(
Nota: Para la mayoría de los estimadores
es una función del tamaño de muestra n.
Propósito: Estimar la media poblacional
Como se recordardará la media muestral x se distribuye normalmente con media y
varianza 2/n, entonces dado un valor z(1-/2), enla distribución normal entre - z(1-/2) y
z(1-/2), se encuentra 1- de los posibles valores de x .
Métodos Estadísticos para la investigación
16
1-
/2 /2
-Z1- /2 Z1- /2
Entonces para tener una “confiabilidad” de 1- debe usarse el coeficiente de
“confiabilidad” de Z1- /2 (que llamaremos sólo z) obtenido en la tabla de distribución
normal estándar o en la función de estadísticas de Excel.
De otro lado si establecemos que el nivel de precisión de nuestra estimación de la media
es d unidades, estaríamos estableciendo el margen de error admisible para la media
muestral respecto a la media poblacional , entonces:
P( x - d) = 1 -
Implica que se tiene una confiabilidad de 1- de que el nivel de precisión se cumpla en la
estimación de la media poblacional a través de la media muestral x .
nzd
2
Entonces,
El tamaño de muestra para poblaciones infinitas es:
2
22
d
zn
Si de otro lado, el muestreo es sobre una población finita, entonces
1
N
nN
n
zd
Entonces, El tamaño de muestra para poblaciones finitas es:
222
22
)1(
zNd
zNn
Ajuste de tamaño de muestra:
Métodos Estadísticos para la investigación
17
Si 10.0N
n entonces n0 =
N
n
n
1
Ejemplo 1.
De una población de 4000 individuos se desea estudiar la media de la presión arterial
sistólica, la cual se distribuye normalmente con = 10, para ello se ha fijado un nivel de
confiabilidad de 95% y el nivel de precisión en 2. ¿Cuál será el tamaño de muestra
adecuado?
Solución:
Como datos del problema tenemos:
Z1- /2= Z0.975 = 1.96
d = 2
= 10
Entonces:
9410)96.1()14000(2
10)96.1(4000
)1( 222
22
222
22
zNd
zNn
Como 10.0N
n, entonces no es necesario usar la corrección n0.
El tamaño de 94 individuos es suficiente.
Ejemplo 2.
Resuelva el mismo problema pero considerando una precisión de d=0.8
Solución:
Tenemos ahora,
52310)96.1()14000(8,0
10)96.1(4000
)1( 222
22
222
22
zNd
zNn
Métodos Estadísticos para la investigación
18
Como 10.0N
n, entonces el tamaño de muestra será:
463
4000
5231
523
10
N
n
nn
Deberá tomarse entonces una muestra de 463 individuos.
Propósito: Estimar la proporción poblacional
El procedimiento es análogo al propósito anterior, debiendo emplearse ahora:
Para poblaciones infinitas
2
2
d
pqzn
Para poblaciones finitas
pqzNd
pqzNn
22
2
)1(
Y si 10.0N
n entonces completar el cálculo con:
N
n
nn
10
Ejemplo:
Se desea estudiar una población de 2000 alumnos referente a la prevalencia de
desnutrición. Se estima p estaría muy cercano a 0,25 y para ello se ha establecido como
nivel de confiabilidad el 95% y el nivel de precisión 0,05 ¡Cuál es el tamaño de muestra
necesario?
Solución:
N = 2000
Z1 - /2 = Z0,975 = 1.96
p = 0,25
Métodos Estadísticos para la investigación
19
q = 1 – p = 1 – 0,25 = 0,75
d = 0,05
Entonces,
252)75,0)(25,0()96,1()12000()05,0(
)75,0)(25,0()96,1(2000
)1( 22
2
22
2
pqzNd
pqzNn
Como 10.0N
n, entonces el tamaño de muestra será:
224
2000
2521
252
10
N
n
nn
El tamaño de muestra necesario es de 253 alumnos.
Métodos Estadísticos para la investigación
20
3. PRUEBAS DE HIPÓTESIS
A continuación definiremos algunos conceptos básicos para la prueba de hipótesis.
Hipótesis
Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede
hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los
alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para
realizar una investigación. Por esta razón se le denomina hipótesis de investigación.
Generalmente hay que volver a plantear las hipótesis de investigación convenientemente
de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas
las hipótesis reciben el nombre de hipótesis estadística.
Hipótesis nula (Ho)
Son aquellas que están referidas a algún parámetro de la población o de las poblaciones
de estudio. Estas son llamadas hipótesis científicas.
Hipótesis alternativa (Ha)
Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la
que sirve para contrastarla.
Errores de prueba y nivel de significación
Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad
no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal
caso estaremos cometiendo el denominado ERROR DE TIPO I.
De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la
decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE
TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos,
estaremos decidiendo bien.
Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha
probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos
corresponde al NIVEL DE SIGNIFICACIÓN.
P(ERROR TIPO I) =
Métodos Estadísticos para la investigación
21
Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o
falsa.
DECISIÓN NATURALEZA DE Ho SOBRE Ho Cierta Falsa
No rechazar Decisión Error tipo II
correcta (probabilidad ) Rechazar Error tipo I Decisión
(Probabilidad ) correcta
Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es
posible minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas
de tal modo que al disminuir una de ellas la otra aumenta. Así si queremos minimizar
inmediatamente aumenta la probabilidad de y viceversa. Generalmente el investigador
fija apriori el error que está dispuesto a tolerar, es decir la probabilidad máxima de
cometer el error de tipo I.
La decisión de una prueba estadística está asociada al nivel de significación:
a) Si P < 0.05 ( = 0.05)
se dice que existe significación en la prueba
b) Si P < 0.01 ( = 0.01)
se dice que existe alta significación en la prueba
Pruebas bilaterales y unilaterales
Cuando tenemos hipótesis alternativa de la forma:
Ho : = o Ho : P = Po
Ha : o Ha : P Po
Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser
mayor, significativamente o acaso menor, significativamente. En tales casos el nivel de
significación queda partido en /2 en cada lado de la distribución del estadístico o
función de prueba.
Métodos Estadísticos para la investigación
22
Tendremos entonces una prueba bilateral. (dos puntos críticos)
1 -
/2 /2 De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales. (un punto crítico)
Ho : = o
Ha : > o
1 -
Ho : = o
Ha : < o
1 -
A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama
REGIÓN DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN.
Una prueba de contrastación de hipótesis estadística se conduce básicamente según el
siguiente procedimiento.
1. Seleccionar el parámetro de interés 2. Plantear las hipótesis
- Hipótesis nula (Ho) - Hipótesis alternativa (Ha)
3. Establecer el nivel de significación de prueba () 4. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha
función de prueba. 5. Efectuar el reemplazo numérico en la función de prueba con la información
muestral. 6. Determinar las regiones de aceptación o rechazo en la distribución de la función
de prueba, según se trate de pruebas bilaterales o unilaterales. 7. Tomar una decisión sobre Ho, según la siguiente regla:
a.- Rechazar Ho si el valor de la función de prueba cae en la región de rechazo. En tal caso se concluirá que Ho se rechaza en favor de Ha con una
Métodos Estadísticos para la investigación
23
significación estadística. b.- No rechazar Ho si el valor de la función de prueba cae en la región de
aceptación. En tal caso se concluirá de que la información muestral no brinda suficientes evidencias como para sospechar de que Ho no sea cierta.
8. Establecer la conclusión.
Antes de poder estimar parámetros o realizar la prueba de hipótesis para hacer
conclusiones sobre los parámetros de la población es necesario que la variable en
estudio se ajuste a una distribución normal para que los resultados de la investigación
sean confiables. Por lo tanto la primera prueba de hipótesis a estudiar corresponde a la
PRUEBA DE NORMALIDAD DE DATOS, que nos permite determinar si la variables en
estudio se distribuye normalmente o no.
3.1. PRUEBA DE NORMALIDAD DE DATOS
1. Reconocimiento de una ley de probabilidad con información real.
a. Reconocimiento teórico (distribución de probabilidad)
b. Ajuste empírico de una población real a una teórica.
c. Pruebas de bondad de ajuste
- Prueba Ji-cuadrada
- Prueba de Kolmogorov-Smirnov
d. Construcción de muestras aleatorias
e. Construcción de muestras artificiales con una ley de probabilidad arbitraria. (método
de Monte Carlo).
f. Prueba de aleatoriedad.
2. Transformaciones de variables aleatorias no normales a normales.
Transformación raíz cuadrada:
Se usa cuando se tiene una variable (X) que se aproxima a una
distribución de Poisson, así:
20Xdecir es , X de pequeños valores para 1 + X = Z
X de grandes valores para X = Z
ii
ii
Métodos Estadísticos para la investigación
24
Transformación angular:
Se usa cuando se tiene una variable (X) que se aproxima a una
distribución Binomial, así:
X de pequeños valores para 1 + X arcsen = Z
X de grandes valores para X arcsen = Z
ii
ii
Transformación logarítmica:
Se usa cuando se tiene una variable (X) tiende a crecer
20Xdecir es , X de pequeños valores para 1 + X = Z
X de grandes valores para X = Z
ii
ii
Transformación de Fisher:
Se usa cuando se tiene una variable (X) que se aproxima a una distribución Ji-cuadrada
con n grados de libertad.
i i2Z = 2 X - 2n - 1 para cualesquier valor de X
3. PRUEBA DE BONDAD DE AJUSTE A LA DISTRIBUCIÓN NORMAL
Procedimiento
(1) Formular la hipótesis:
Ho: La información dada se ajusta a una ley de distribución normal
Ha: La información dada no se ajusta a una ley de distribución normal
(2) Fijar el nivel de significancia ()
las más usadas son; = 0,05; 0,01; 0,10
1 - = 0,90; 0,99; 0,90 grados de confianza
(3) Elegir la función pivotal
) (prueba e
)e - f( = U
22
1)-(r
i
2
iio
Métodos Estadísticos para la investigación
25
donde: r = m - k,
m = Nº de clases en la inf. real
n = Nº de parámetros de la ley de prob.
fi = frecuencia absoluta simple observada
ei = frecuencia absoluta simple esperada
ei = n pi ; ei 5
Uo = máx Sn(x) - P(x) (Prueba de Kolmogorov) donde: Sn(x) = Hi frec. rel. acum. observada
P(x) = Fi = P(Xx) frec. acum. Esperada
Tabla de la prueba de Kolmogoroy Smirnov ***
Tamaño de la
Muestra (n)
Nivel de significación correspondiente a D = el valor
máximo de Fo (X) = SN (X)
0.20 0.15 0.10 0.05 0.01
1 2 3 4 5
6 7 8 9
10
11 12 13 14 15
16 17 18 19 20
25 30 35
más de 35
0.900 0.684 0.565 0.494 0.446 0.410 0.381 0.358 0.339 0.322 0.307 0.295 0.284 0.274 0.266 0.258 0.250 0.244 0.237 0.231 0.21 0.19 0.18
n
07.1
0.925 0.726 0.597 0.525 0.474 0.436 0.405 0.381 0.360 0.342 0.326 0.313 0.302 0.292 0.283 0.274 0.266 0.259 0.262 0.246 0.22 0.20 0.19
n
14.1
0.950 0.776 0.642 0.564 0.510 0.470 0.438 0.411 0.388 0.368 0.352 0.338 0.325 0.314 0.304 0.295 0.286 0.278 0.272 0.264 0.24 0.22 0.21
n
22.1
0.975 0.842 0.708 0.624 0.565 0.521 0.486 0.457 0.432 0.410 0.391 0.375 0.361 0.349 0.338 0.328 0.318 0.309 0.301 0.294 0.27 0.24 0.23
n
36.1
0.995 0.929 0.828 0.733 0.669 0.618 0.577 0.543 0.514 0.490 0.468 0.450 0.433 0.418 0.404 0.392 0.381 0.371 0.363 0.358 0.32 0.29 0.27
n
63.1
De S. Siegel, Nonparametric Statistica, McGraw-Hill Book Company, Nueva York, 1958. Se ha adaptado de F. J. Massey, Jr., “the Kolmogorov-Smirnov Test for Goodness of Fit”, J. Amer. Statist. Ass., vol. 46, pág. 70, 1951, con la amable autorización del autor y el editor.
Métodos Estadísticos para la investigación
26
Ej. n = 10. = 0.05 P(U c) = 0.95 c = 0.410 (4) Determinar la región de rechazo y la región de aceptación.
(5) Tomar la decisión.
Si Uo RA entonces aceptamos Ho es decir la información se ajusta a una distribución
normal, si Uo RR entonces rechazamos Ho es decir la información no se ajusta a una
distribución normal.
Antes de realizar cualquier análisis estadístico se deben tener presentes las condiciones
de aplicación del mismo. En casi todos los análisis estadísticos, la asunción de
normalidad es un común denominador. De ahí que comencemos este apartado con la
prueba estadística de Normalidad. Ésta se denomina prueba de Kolmogorov - Smirnov y
se halla en el SPSS en el menú de Análisis, dentro de la opción de Pruebas no
paramétricas y finalmente bajo el nombre abreviado de K-S de una muestra... . El cuadro
de diálogo nos permite seleccionar la variable a analizar y la ley de probabilidad que se
propone como de la población de la que ha sido extraída la muestra.
Es importante notar que a veces las asunciones se refieren a la Normalidad de las
poblaciones que se comparan, por lo que esta prueba de K-S debe repetirse para cada
una de las muestras a comparar.
RA
1 –
RA
f(u)
U U0
Métodos Estadísticos para la investigación
27
Ejemplo:
La tabla siguiente presenta la información de notas de 162 estudiantes en el curso de
estadística durante un año dado. Probar que la siguiente muestra fue extraía de una
población de notas distribuidas en forma normal con = 0,01.
Notas
30-40
40-50
50-60
60-70
70-80
80-90
90-100
N de est.
5
10
28
52
31
26
10
Solución
Ho: Las notas se ajustan a una ley de distribución normal
Ha: Las notas no se ajustan a una ley de distribución normal
= 0.01
Notas x
Estandarizando z
Nº Estudiantes
f
Probabilidad P
Valores Esperados
ei = npi
Ji- Cuadrada (fi-ei)2/ei
30 – 40 -2.70 – -1.99 5 0.0198 3.20
40 – 50 -1.99 – -1.28 10 0.0767 12.42 0.02
50 – 60 -1.28 – -0.57 28 0.1833 29.69 0.10 60 – 70 -0.57 – 0.14 52 0.2706 43.84 1.52 70 – 80 0.14 – 0.84 31 0.2468 39.99 2.02
80 – 90 0.84 – 1.55 26 0.1391 22.53 0.53
90 – 100 1.55 – 2.26 10 0.0484 7.84 0.60
TOTAL 162 U0 = 4.79
Notas x
Estandarizando Z
Nº Estudiante
f
FrecuenciaRelativas
h
Probabilidad p
Frecuencias Relativas
Acumulada Sn(x)= Hi
Probabilidad
Acumulada P(x)
Kolmogorov
MaxH-P
30 – 40 -2.70 – -1.99 5 0.0309 0.0198 0.0309 0.0198 0.0111 40 – 50 -1.99 – -1.28 10 0.0617 0.0767 0.0926 0.0964 0.0038 50 – 60 -1.28 – -0.57 28 0.1728 0.1833 0.2654 0.2797 0.0143
60 – 70 -0.57 – 0.14 52 0.3210 0.2706 0.5864 0.5504 0.0360
70 – 80 0.14 – 0.84 31 0.1914 0.2468 0.7778 0.7972 0.0194 80 – 90 0.84 – 1.55 26 0.1605 0.1391 0.9383 0.9363 0.0020
90 – 100 1.55 – 2.26 10 0.0617 0.0484 1.0000 0.9847 0.0153
TOTAL 162 1 U0 = 0.0360
x = 68.09 s = 14.11
70.211.14
09.68301
Z
0198.00035.00233.070.299.199.170.21 ] ZP[] ZP[=] Z[p
15 15.68
Métodos Estadísticos para la investigación
28
Prueba X²:
345.112
) 0.99 , 3 ( =
e
)e - f( = U
2
1)-(r
i
2
iio
Como r = m – k = 6 – 2 = 4
Donde:
m: Nº de filas ajustadas
k: Nº parámetros de la distribución normal
Uo = 4.490 Ut = 11.345
Decisión:
Como Uo RA aceptamos Ho la información se ajusta a la distribución normal.
Prueba de Kolmogorov
Uo = máx Sn(x) - P(x) = 0.0342
= 0.01
n = 162
U = 0,0342
Ut = 128.0162
63.163.1
n, obtenido de la tabla de Kolmogorov
RA
1 – = 4,490
= 0,01
f(u)
U Ut = 11,345
RR
U0 = 4,490
RA
1 – = 0,99
= 0,01
f(u)
U Ut = 0,128
RR
U0 = 0,0342
Métodos Estadísticos para la investigación
29
Decisión:
Como Uo RA aceptamos Ho
Conclusión:
Se concluye que la información se ajusta a la distribución normal con el 1% de
significación de prueba.
3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL
Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las
características de una población normal.
Las hipótesis referentes a este parámetro pueden ser:
Ho: = o
Ha: o Prueba bilateral
Ho: = o
Ha: > o Prueba unilateral
Ho: = o
Ha: < o Prueba unilateral
Dicha prueba se efectúa mediante la siguiente función de prueba:
a) Si la desviación estándar poblacional no es conocida o n<30
)1,1(
n
oo t
ns/
- x = t
b) Si la desviación estándar poblacional es conocida o n30
n n/
- x = z (0,1)
oo
Métodos Estadísticos para la investigación
30
Ejemplo 1:
El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida
le permite a su compañía vender más pólizas que las compañías "promedio". El promedio
mensual de ventas de todos los agentes de la compañía es de $300. A una muestra de
agentes que han recibido el programa de entrenamiento se le encuentra las siguientes
ventas en dólares: 300, 270, 360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el
supervisor de estos agentes, adoptaría para los restantes el programa de entrenamiento
propuesto por el señor Martínez. Emplee 5% de nivel de significación.
Solución
= 300, n = 10, x = 351.9, s = 48.64 -1 = 0.95
como n 30, entonces t(n – 1, 1-) = t(9,0.95) = 1.895
Ho: 300
Ha: 300
= 0.05
f.p. 37.3
10
64.48
3009.3510
0
n
s
xt
Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis
nula a favor de la hipótesis alternativa
Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su
compañía vender más pólizas de seguro que la compañía promedio, por lo cual se
adoptará para el resto de los agentes el programa propuesto por el señor Martinez.
Ejemplo 2:
Los sistemas de escape de emergencia para tripulantes de aeronaves son impulsados
por un combustible sólido. Una de las características importantes de este producto es la
RA
1 - = 0,95
RR
= 0,05
tt = 1,812
t0 = 3,37
Métodos Estadísticos para la investigación
31
rapidez de combustión. Las especificaciones requieren que la rapidez promedio de
combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidéz es 2 cm/s.
El experimentador decide especificar una probabilidad para el error tipo I del 5%. Se
selecciona una muestra aleatoria de 25 y obtiene una rapidez promedio muestral de
combustión de 51,3 cm/s. ¿A qué conclusión debe llegar?
Solución:
= 50, n = 25, x = 51.3, =2 = 0.05
como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96
Ho: = 50
Ha: 50
= 0.05
f.p. 25.3
25
2
503.51
n
- x = Z
oo
96.1)975,0( Z= Z t
Decisión: Como Z o RR Rechazamos la Ho , a favor de Ha
Conclusión: Por lo tanto no se cumple con las especificaciones la rapidez promedio de
combustión difiere de 50 cm/s. Usando 5% de significación de prueba.
RR
2 = 0,025
Zt = -1,96
RA
1 - = 0,95
RR
2 = 0,025
Zt =1,96
Z0 =3.25
Métodos Estadísticos para la investigación
32
3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una
población.
Procedimiento:
Supóngase que se desea probar la hipótesis de que la varianza de una población normal
2 es igual a un valor específico, por ejemplo, 2
o. Sea X1, X2, ..., Xn una muestra aleatoria
de n observaciones tomadas de esta población.
Las hipótesis referentes a este parámetro pueden ser:
Ho: 2 = 2
o
Ha: 2 2
o Prueba bilateral
Ho: 2 = 2
o
Ha: 2 > 2
o Prueba unilateral
Ho: 2 = 2
o
Ha: 2 < 2
o Prueba unilateral
Se utiliza el estadístico de prueba
2
22 )1(
o
o
SnX
donde S2 es la varianza muestral. Ahora si Ho: 2 = 2
o es verdadera, entonces el
estadístico de prueba X2o sigue una distribución ji-cuadrada con n-1 grados de libertad.
Por consiguiente, se calcula el valor de la estadística de prueba X2o, y la hipótesis Ho:
2
= 2º , debe rechazarse si:
2
2/1,1
2
2
2/,1
2
no
no
sio
Métodos Estadísticos para la investigación
33
donde X2n-1,/2 y X2
n-1,1-/2 son los puntos que corresponden a los porcentajes 100/2
inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad,
respectivamente.
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis
unilateral: Ho: 2 = 2
o
Ha: 2 > 2
o
Se rechaza si: X2o > X2
(n-1,1-)
Para la otra hipótesis unilateral: Ho: 2 = 2
o
Ha: 2 < 2
o
Se rechaza si: X2o < X2
n-1,
RA
1 –
2
)2/,1( nX
RR
/2 RR
/2
2
)2/1,1( nX
RA
1 – RR
2
)1,1( nX
RA
1 –
RR
2
),1( nX
Métodos Estadísticos para la investigación
34
PROCEDIMIENTO PARA MUESTAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se
modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30 se
utiliza la distribución normal.
El estadístico de prueba es:
n
sZ
o
oo
2
El gráfico utilizado sería acampanado.
Ejemplo:
Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20
botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas
de fluido)2. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2,
entonces existe una proporción inaceptable de botellas que serán llenadas con una
cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el
fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de
prueba.
Solución:
2 = 0.01, n = 20, s2 = 0.0153 = 0.05
como n < 30, entonces 2
)1,1( nX = 1.302
)95.0,19( X
Ho: 2 = 0.01
Ha: 2 > 0.01
= 0.05
Métodos Estadísticos para la investigación
35
f.p. 07.2901.0
)0153.0)(19()1(2
22
o
o
SnX
1.302
)95.0,19( X
Decisión: Como 07.292 oX RA aceptamos Ho
Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza
es igual a 0.01.
3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN
POBLACIONAL
La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una
determinada característica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: P = Po
Ha: P Po Prueba bilateral
Ho: P = Po
Ha: P > Po Prueba unilateral
Ho: P = Po
Ha: P < Po Prueba unilateral
La función de prueba para valores de n 30 es:
n )/np-(1p
p - P = z (0,1)
oo
oo
RA
1 – = 0.95 RR
= 0.05
1.302 tX
07.292 oX
Métodos Estadísticos para la investigación
36
La función de prueba para valores de n < 30 es:
t )/np-(1p
p - P = t 1)-(n
oo
oo
Ejemplo 1:
El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio
adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos,
75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como
para apoyar la opinión del alcalde?
Solución
P = 0.60, n = 120, m = 75, 625.0120
75 p , = 0.05
como n > 30, entonces 645.1)95,0()1( Z Z= Z t
Ho: 60.0 P
Ha: 60.0 P
= 0.05
f.p. 56.0
120
)4.0(6.0
6.0625.00
)/np-(1p
p - P = Z
oo
o
Decisión: Como Z o RA aceptamos Ho
Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión
del alcalde. Usando un 5% de significación de prueba.
RA
1 - = 0,95
RR
= 0,05
Zt = 1,645
Z0 = 0,56
645.1)95,0( Z= Z t
Métodos Estadísticos para la investigación
37
Ejemplo 2:
Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilísticos. El cliente requiere que la fracción de
controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que
0,05, y que el fabricante demuestre esta característica del proceso de fabricación con
este nivel de calidad, utilizando = 0,05. El fabricante de semiconductores toma una
muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El
fabricante puede demostrar al cliente la calidad del proceso?
Solución
P = 0.05, n = 200, m = 4, 02.0200
4 p , = 0.05
como n > 30, entonces 645.1)95,0()1( Z Z= Z t
Ho: 05.0 P
Ha: 05.0 P
= 0.05
f.p. 94.1
200
)95.0(05.0
05.002.00
)/nP-(1P
P - p = Z
oo
o
Decisión: Como Z o RR rechazamos Ho , a favor de la Ha
Conclusión: El fabricante puede demostrar al cliente la calidad del proceso. Usando un
5% de significación de prueba.
RA
1 - = 0,95
RR
= 0,05
Zt = -1,645
Z0 = 3.03
645.1)95,0( Z= Z t
Métodos Estadísticos para la investigación
38
3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS
POBLACIONALES
La prueba de comparación de muestras, requiere que las variancias de las dos
poblaciones muestreadas sean iguales. En esta sección describiremos una prueba para
la hipótesis nula 21 = 2
2 , que se aplica a muestras aleatorias independientes obtenidas
de dos poblaciones normales; debe utilizarse con mucho cuidado por ser muy sensible a
las desviaciones de tal suposición
Las hipótesis referentes a este parámetro pueden ser:
Ho: 2
1 = 22
Ha: 2
1 22 Prueba bilateral
Ho: 2
1 = 22
Ha: 2
1 > 22 Prueba unilateral
Ho: 2
1 = 22
Ha: 2
1 < 22 Prueba unilateral
.Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones
normales que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza
el siguiente estadístico.
2
2
2
1
s
sF
que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1
grados de libertad.
Obs. F1 - (v1,v2) =),(F
1
12 vv
Regiones críticas para probar 2
2
2
1
Métodos Estadísticos para la investigación
39
Hipótesis alterna Estadístico de prueba Rechaza la hipótesis nula si:
21 < 2
2 2
2
2
1
s
sF
F < F(n1 – 1, n2 – 1)
21 > 2
2 2
2
2
1
s
sF
F > F1-(n1 – 1, n2 – 1)
21 2
2 2
2
m
M
s
sF
F < F/2(nM – 1, nm – 1) ó
F > F1-/2(nM – 1, nm – 1)
Donde: s2M : la mayor de las dos variancias muestrales,
s2m : la más pequeña de las variancias.
Para hipótesis unilateral: Ho: 2
2
2
1
Ha: 2
2
2
1
El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis
unilateral:
Ho: 2
2
2
1
Ha: 2
2
2
1
Para la otra hipótesis unilateral:
Ho: 2
2
2
1
Ha: 2
2
2
1
RA
1 –
)1,1(2/ mnMnF
RR
/2 RR
/2
)1,1(2/1 mnMnF
RA
1 – RR
)12,11(1 nnF
Métodos Estadísticos para la investigación
40
PROCEDIMIENTO PARA MUESTAS GRANDES
Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se
modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30, se
utiliza la distribución normal.
El estadístico de prueba es:
21
21
2
1
2
1
nns
ssZ
p
o
2
)1()1(
:
21
2
22
2
112
nn
snsns
donde
p
Ejemplo 1:
Se requiere determinar si existe menos variabilidad en el plateado realizado por la
compañía 1 que el efectuado por la compañía 2. Si las muestras aleatorias
independientes de tamaño 12 del trabajo desempeñado por las compañías producen
s1=0,035 mil y s2=0,062 mil, pruébese la hipótesis nula de que 21 = 2
2 contra la hipótesis
alterna de que 21 < 2
2 con un nivel de significancia de 0,05.
Solución:
n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05
como n1 + n2 < 30, entonces 355.0)11,11()1,1( 05,021 FnnF = F t
RA
1 –
RR
)12,11(1 nnF
Métodos Estadísticos para la investigación
41
Ho: 2
2
2
1
Ha: 2
2
2
1
= 0.05
f.p. 319.0)062.0(
)035.0(2
2
2
2
2
1 s
sF
Decisión: Como 0F RA se acepta Ho
Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía
2. Usando 5% de significación de prueba.
Ejemplo 2:
Las siguientes muestras aleatorias son mediciones de la capacidad de producción de
calor (en millones de calorías por tonelada (de especímenes de carbón de dos minas:
Mina 1: 8,260, 8,130, 8,350, 8,070, 8,340
Mina 2: 7,950, 7,890, 7,900, 8,140, 7,920, 7,840,
Utilícese un nivel de significancia de 0,02 para probar si es razonable suponer que las
variancias de las poblaciones muestreadas son iguales.
Solución:
n1 = 5, n2 = 6, s1 = 0.1275, s2 = 0.1045, = 0.02
como n1 + n2 < 30, entonces 39.11)5,4(06.0)5,4()1,1( 99.001.021 FFnnF = F t
RA
1 – = 0.95
RR
= 0.05
355.0tF
319.00 F
Métodos Estadísticos para la investigación
42
Ho: 2
2
2
1
Ha: 2
2
2
1
= 0.05
f.p. 49.1)1045.0(
)1275.0(2
2
2
2
2
1 s
sF
49.1oF
Decisión: Como 0F RA se acepta Ho
Conclusión: La variabilidad de ambas poblaciones es igual. Usando 2% de significación
de prueba.
3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES
Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis
natural es que ambas tienen igual promedio, o en otras palabras que la diferencia de
ambos promedios es nula o difieren en alguna cantidad específica.
Las hipótesis referentes a este parámetro pueden ser:
Ho: 1 = 2
Ha: 1 2 Prueba bilateral
Ho: 1 = 2
Ha: 1 > 2 Prueba unilateral
Ho: 1 = 2
Ha: 1 < 3 Prueba unilateral
RA
1 –
06.02/ F
RR
/2 RR
/2
39.112/1 F
Métodos Estadísticos para la investigación
43
Pueden presentarse varias situaciones dependiendo de como son sus varianzas:
Con varianzas conocidas:
La función de prueba es:
n
n +
n
) - ( - )x - x( = z (0,1)
22o
2
2
1
1
2121
Con varianzas desconocidas y diferentes:
La función de prueba es:
t
n
s +
n
s
) - ( - )x - x( = t 2) - n + n(
22o 21
2
2
1
1
2121
como n1 + n2 - 2 30 entonces esta función de prueba sigue una distribución normal
estándar.
Con varianzas desconocidas y aproximadamente iguales, la función de prueba es:
2 - n + n
s1) - (n + s1) - (n = s
a.mancomunad varianza la es s aquÍ
t
)n
1 +
n
1(s
) - ( - )x - x( = t
222
2
2) - n + n(
2
o
21
21
21
2121
21
Al igual que en el caso anterior, si n1 + n2 - 2 30 entonces la función de prueba sigue
una distribución normal estándar.
Ejemplo
Una compañía desea comparar las expectativas salariales anuales de su personal de
ventas femenino y masculino, según un nuevo plan de compensaciones venta-más-
comisión. Se pidió a n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar,
Métodos Estadísticos para la investigación
44
predijeron sus ingresos anuales bajo el nuevo plan. Las medias y desviaciones
muestrales eran:
1x = $ 31 083 2x = $ 29 745
s1 = $ 2 312 s2 = $ 2 569
¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del
ingreso anual esperado tanto entre los vendedores como las vendedoras? Haga la
prueba con =0,10.
Solución:
Ho: 21 5.59725522 - n + n
s1) - (n + s1) - (n = s
yx
2y
2x2
Ha: 21
= 0.10
f.p. 45.2
40
1
40
15.597255252
02974531083
11
21
2
+
n +
ns
) - ( - )y - x( = Z
xx
yx
o
645.1)95,0( Z= Z t
Decisión: Como Z o RR no existe suficiente evidencia como para aceptar la
hipótesis nula, por consiguiente aceptamos la Ha.
Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia
en el promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de
significación de prueba.
RR
2 = 0,05
Zt = -1,645
RA
1 - = 0,90 RR
2 = 0,05
Zt =1,645
Z0 = 2,46
Métodos Estadísticos para la investigación
45
3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES
POBLACIONALES
Cuando se desea comparar dos poblaciones cualitativas
Las hipótesis referentes a este parámetro pueden ser:
Ho: P1 = P2
Ha: P1 P2 Prueba bilateral
Ho: P1 = P2
Ha: P1 > P2 Prueba unilateral
Ho: P1 = P2
Ha: P1 < P3 Prueba unilateral
La función de prueba es:
n + n
pn + pn = p
:amancomunad proporción la es p AquÍ
n
)n
1 +
n
1)(p - (1p
)P - (P - )p - (p =z (0,1)
21
2211
21
2121
Ejemplo 1:
Un sociólogo cree que la proporción de hombres que pertenecen a un grupo
socioeconómico determinado (grupo A) y que ven regularmente lucha en TV. supera
mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras
aleatorias simples de los dos grupos arrojaron los siguientes resultados.
Tamaño de Número de hombres que ven Grupo la muestra regularmente lucha en TV A nA = 150 98
B nB = 200 80
¿proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo?
use = 0,05
Métodos Estadísticos para la investigación
46
Solución:
51.0350
8098
p
Ho: BA P P
Ha: BA P P
= 0.05
f.p. 63.4
200
1
150
1)49.0(51.0
0)4.065.0(0
+
= Z
645.1)95.0( Z= Z t
Decisión: Como Z o RR rechazamos Ho en favor Ha
Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del
sociólogo con un 5% de significación de prueba.
RA
1 - = 0,95 RR
2 = 0,05
Zt =1,645
Z0 = 4,63
Métodos Estadísticos para la investigación
47
REFERENCIAS
1. Downie, N, Heath, R. 1986. Métodos Estadísticos Aplicados. Quinta edición.
México: Editorial Harla.
2. Ferran, M. 2001. SPSS Análisis Estadístico. España: Editorial Mc Graw–Hill /
Interamericana.
3. Hernandez R, Fernandez C. Y Baptista P. 1996. Metodología de la Investigación.
Colombia: Editorial Mc Graw-Hill.
4. Martinez, Ciro. 1995. Estadística. Santa Fe de Bogotá: Editorial Presencia.
5. Mendenhall W, Sincich T. 1997. Probabilidad y estadística para ingeniería y
ciencias. Cuarta edición. México: Editorial Prentice-Hall hispanoamericana, S.A.
6. Meza de Castillo E. 1994. Probabilidad. Lima: CONCYTEC.
7. Miller F, Johnson. 1992. Probabilidad y Estadística para Ingenieros. Cuarta
edición. México: Editorial Prince Hall.
8. Mitacc Meza M. 1994. Tópicos de Estadística y Probabilidad. Lima: Editorial San
Marcos.
9. Montgomery D, Runger G. 1996. Probabilidad y Estadística aplicadas a la
Ingeniería. México: Mc Graw-Hill.
10. Montgomery D. 2004. Diseño y Análisis de Experimentos. Segunda edición.
México: Editorial Limusa S.A.
11. Morris H. 1988. Probabilidad y Estadística. Estados Unidos: Editorial ADDISON-
WESLEY Iberoamericana.
12. Moya R, Saravia A. 1998. Probabilidad e Inferencia Estadística. Segunda edición.
Lima: Editorial San Marcos.
13. Sierra Bravo R. 1994. Análisis Estadístico Multivariado, teoría y ejercicios.
España: Editorial Paraninfo, S.A.
14. Wonnacott y Wonnacott. 1991. Estadística Básica Practica. México: Editorial
Limusa