Upload
lourdesqg
View
213
Download
0
Embed Size (px)
Citation preview
TEMA 0. CONTRASTES DE HIPOTESIS ESTADISTICAS
Planteamiento general del problema
Sea X = (X1, . . . , Xn) una muestra aleatoria simple de tamano n procedente deuna poblacion, con distribucion perteneciente a una familia de distribuciones F
F = {F : }, = (1, . . . , k), Rk
Hipotesis estadstica: afirmacion sobre el valor del parametro
Formulacion de un contraste de hipotesis:
H0 : 0 Hipotesis nulaH1 : 1 Hipotesis alternativa
donde = 0 1 y 0 1 =
Objetivo: Analizar los datos observados para decidir si estos proporcionan o noevidencia suficiente para descartar la hipotesis propuesta
Test de hipotesis
Test de hipotesis. Un test de hipotesis es un procedimiento que nos permiteaceptar o rechazar la hipotesis nula basandose en los valores muestrales observa-dos
Basandose en una funcion de las observaciones T (X1, . . . , Xn) (estadstico decontraste), un test de hipotesis determina una region de rechazo R
Regla de decision. Observada la variable se tendra un valor concreto del es-tadstico de contraste, T (x1, . . . , xn)
Se aceptara la hipotesis nulaH0 si T (x1, . . . , xn) / R, los datos no presentanevidencia en contra de la hipotesis nula
Se rechazara la hipotesis nula H0 si T (x1, . . . , xn) R, los datos apoyan lahipotesis alternativa H1
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 1
Tipos de errores
Cuando se toma la decision de aceptar o rechazar la hipotesis nula se puedencometer dos tipos de error:
Error tipo I: Se rechaza H0 cuando esta es cierta
Error tipo II: Se acepta H0 cuando esta es falsa
H0 cierta H0 falsa
Rechazar H0 Error de tipo I Decision correcta
Aceptar H0 Decision correcta Error de tipo II
Conceptos fundamentales
Un test tiene nivel de significacion , 0 1, siP[ Rechazar H0] = P[T (X1, . . . , Xn) R] , 0
Un test tiene tamano , 0 1, si = sup
0P[ Rechazar H0] = sup
0P[T (X1, . . . , Xn) R]
Se define la funcion potencia como la funcion
: [0, 1]donde
() = P[ Rechazar H0] = P[T (X1, . . . , Xn) R]
Dados y , tests con nivel de significacion para contrastar H0 : 0frente a H1 : 1, es uniformemente mas potente que si secumple
() (), 1
Se dice que el test es uniformemente mas potente (UMP) a nivelde significacion si tiene nivel de significacion y para cualquier otrotest con nivel de significacion , es uniformemente mas potente que, es decir,
() (), 1
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 2
Procedimiento a seguir para realizar un contraste de hipotesis
Formulacion de las hipotesis H0 y H1{H0 : 0H1 : 1
Se fija una cota para la probabilidad de cometer un error de tipo I,
Se considera el estadstico de contraste T (X1, . . . , Xn), basadogeneralmente en un estimador del parametro
Se obtiene la distribucion muestral de dicho estadstico bajo la hipotesis deque H0 es cierta
Se determina la region de rechazo R imponiendo que el test tenga tamano, i.e.,
= sup0
P[ Rechazar H0] = sup0
P[T (X1, . . . , Xn) R]
Para los valores muestrales observados (x1, . . . , xn), se calcula el valor delestadstico de contraste, T (x1, . . . , xn)
Si T (x1, . . . , xn) / R, se acepta la hipotesis nula H0 Si T (x1, . . . , xn) R, se rechaza la hipotesis nula H0
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 3
Ejemplo. La longitud media de los tornillos fabricados por una empresa debeser de 30mm. Periodicamente se seleccionan al azar 36 tornillos y se mide sulongitud. Se considera que el proceso esta fuera de control cuando la longitudmedia muestral x < 29.8 o bien x >30.2mm. Se supone que la longitud de lostornillos se comporta como una distribucion normal con desviacion tpica 0.6mm.
1. Enunciar las hipotesis nula y alternativa propias de esta situacion.
2. Obtener la probabilidad de cometer un error de tipo I.
3. Calcular la funcion potencia para los valores de las longitudes medias 29.6,29.8, 30, 30.2 y 30.4.
4. Como una prueba alternativa, se considera que el proceso esta fuera decontrol cuando x < 29.75 o bien x >30.25mm. Si el tamano maximo acep-tado para un error de tipo I es 0.05. Cual de las dos pruebas es la mejorsuponiendo que en la hipotesis alternativa la longitud media es 30.5mm?
Solucion
1. Contraste de hipotesis:
{H0 : = 30
H1 : 6= 30Region de rechazo: x > 30.2 o x 30.2]
= P
[Z
30.2 300.1
]= P [Z < 2] + P [Z > 2] = 2 0.02275 = 0.0455
Cuando la hipotesis nula es cierta, se obtiene que X N (30, 0.1)3. Calculo de la funcion potencia:
(29.6) = P=29.6[Rechazar H0] = P=29.6[X < 29.8 o X > 30.2]
= P
[Z
30.2 29.60.1
]= P [Z < 2] + P [Z > 6] = 0.97725 + 0 = 0.97725
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 4
(29.8) = P=29.8[Rechazar H0] = P=29.8[X < 29.8 o X > 30.2]
= P
[Z
30.2 29.80.1
]= P [Z < 0] + P [Z > 4] w 0.5
(30.0) = 0.0455
(30.2) = (29.8) = 0.5
(30.4) = (29.6) = 0.97725
(30.5) = P=30.5[Rechazar H0] = P=30.5[X < 29.8 o X > 30.2]
= P
[Z
30.2 30.50.1
]= P [Z < 7] + P [Z > 3] = P [Z < 3] = 0.9987
4. Region de rechazo de la prueba alternativa: x > 30.25 o x 30.25]
= P
[Z
30.25 300.1
]= P [Z < 2.5] + P [Z > 2.5] = 2 0.0062 = 0.0124 < 0.05
(30.5) = P=30.5[Rechazar H0] = P=30.5[X < 29.75 o X > 30.25]
= P
[Z
30.25 300.1
]= P [Z < 7.5] + P [Z > 2.5] = P [Z < 2.5] = 0.9938
Al nivel de significacion de 0.05, el primer test es mas potente que este
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 5
Test de la razon de verosimilitudes
Formulacion del test de la razon de verosimilitudes
Se denomina razon de verosimilitudes para contrastar
H0 : 0H1 : 1
al cociente
(x) =
sup0
f(x)
sup
f(x)
Un test de razon de verosimilitudes para contrastar dichas hipotesis es aquelque rechaza H0 si (x) < c, donde c es una constante
La constante c (0, 1) se determina imponiendo la condicion de que el test tengatamano , es decir,
sup0
P[ Rechazar H0] = sup0
P[(x) < c] =
Comportamiento asintotico del test de la razon de verosimilitudes
Bajo ciertas condiciones de regularidad sobre f(x), Rk, abierto de Rk,la variable aleatoria
2 log (X)se distribuye asintoticamente bajo la hipotesis nula como una variable aleatoria2 con k r grados de libertad, donde k = dim() y r = dim(0)
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 6
Ejemplo Dos personas A y B juegan al siguiente juego: se lanza al aire unamoneda ganando A si sale cara y B si sale cruz. El jugador A proporcionauna moneda y despues de 200 lanzamientos, A ha ganado 130 veces. Tras esteresultado, B afirma que la moneda esta trucada y la probabilidad de obtenercara no es 0.5. A mantiene que la moneda es correcta. Ante esta situacion, seplantea la cuestion de decidir quien tiene razon
Sea p la probabilidad de obtener cara al lanzar una moneda y sea la v.a.
X =
{0 si sale cruz
1 si sale cara
X B(1, p), p (0, 1)Problema de contraste:
H0 : p = p0, p0 = 0.5
H1 : p 6= p0Aplicando el test de la razon de verosimilitudes
(x) =
supp=p0
fp(x)
supp(0,1)
fp(x)=
pnx0 (1 p0)nnxsupp(0,1)
pnx(1 p)nnx
=pnx0 (1 p0)nnxxnx(1 x)nnx =
(p0x
)nx(1 p01 x
)nnxSe rechaza H0, al nivel de significacion , si (x) < c, donde c se calculaimponiendo la condicion
= Pp=p0[(X) < c]
Puesto que el tamano muestral es grande, la distribucion de 2 log (x), si lahipotesis nula es cierta, se puede aproximar por la distribucion de una 21, entonces
= Pp=p0[(X) < c] = Pp=p0[2 log (X) > c] P [21 > c] = c = 21,1donde 21,1 es el cuantil de orden 1 de una 21
Para =0.05: 21,0.95=3.842 y C = {2 log (X) > 3.842 }Para p0=0.5, n = 200, x=0.65 = 2 log (x)=18.280 y se rechaza H0
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 7
Contrastes sobre los parametros de una poblacion normal
(X1, . . . , Xn) m.a.s. de N (, 2)Contrastes sobre la media
Region de rechazo Region de rechazo(2 conocida) (2 desconocida)
H0 : = 0H1 : 6= 0
|x 0|/n
> z1/2|x 0|s/n
> tn1,1/2
H0 : 0H1 : < 0
x 0/n< z
x 0s/n< tn1,
H0 : 0H1 : > 0
x 0/n> z1
x 0s/n> tn1,1
Contrastes sobre la varianza
Region de rechazo Region de rechazo( conocida) ( desconocida)
H0 : 2 = 20
H1 : 2 6= 20
ni=1
(xi )220
< 2n,/2
oni=1
(xi )220
> 2n,1/2
(n 1)s220
< 2n1,/2o
(n 1)s220
> 2n1,1/2
H0 : 2 20
H1 : 2 < 20
ni=1
(xi )220
< 2n,(n 1)s2
20< 2n1,
H0 : 2 20
H1 : 2 > 20
ni=1
(xi )220
> 2n,1(n 1)s2
20> 2n1,1
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 8
Contrastes sobre la diferencia de medias de dos poblacionesnormales no necesariamente independientes
((X1, Y1), . . . , (Xn, Yn)), m.a.s. de una distribucion normal bidimen-sional (X, Y )
(D1, . . . , Dn), donde Di = XiYi, i = 1, . . . , n, m.a.s. de N (D, 2D)
D = 1 2
2D = 21 +
22 212, generalmente desconocida
Region de rechazo
H0 : D = 0H1 : D 6= 0
|d 0|sD/
n> tn1,1/2
H0 : D 0H1 : D < 0
d 0sD/
n< tn1,
H0 : D 0H1 : D > 0
d 0sD/
n> tn1,1
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 9
Ejemplo. Se pueden utilizar dos pruebas analticas diferentes para determinarel nivel de impureza en aleacciones de acero. Se prueban ocho especmenes conambos procedimientos; los resultados aparecen en la tabla adjunta. Admitiendola hipotesis de normalidad para las variables en estudio, existen diferencias signi-ficativas entre los promedios de los niveles de impureza determinados por ambaspruebas, utilizando =0.01?
Especimen Prueba 1 Prueba 21 1.2 1.42 1.3 1.73 1.5 1.54 1.4 1.35 1.7 2.06 1.8 2.17 1.4 1.78 1.3 1.6
Solucion. El parametro de interes es la diferencia entre los promedios de losniveles de impureza determinados por ambas pruebas, D = 12. Planteamosel contraste de hipotesis:
H0 : D = 0H1 : D 6= 0
Para los datos muestrales calculamos el estadstico de contraste:
texp =d 0sD/
n=
0.21250.17268/
8= 3.48
Region crtica al nivel de significacion = 0.01:{|texp| > tn1,1/2} = {|texp| > t7,0.995} = {|texp| > 3.5}Como |texp| = 3.48 < 3.5, no se puede rechazar H0 al nivel de significacion = 0.01; las dos pruebas no proporcionan diferentes promedios de niveles deimpurezaSi calculamos el p-valor del test
p valor = 2P [tn1 > |texp|] = 2P [t7 > | 3.48|]= 2P [t7 > 3.48] = 2 0.00513 = 0.01026
se obtiene un valor pequeno, lo que nos indicara que a otro nivel de significacion,p.e., = 0.05 se rechazara H0
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 10
Contrastes sobre los parametros de dos poblacionesnormales independientes
(X1, . . . , Xn1) m.a.s. de N (1, 21), (Y1, . . . , Yn2) m.a.s de N (2, 22)X e Y independientes
Contrastes sobre la diferencia de medias
Region de rechazo Region de rechazo(21,
22 conocidas) (
21,
22 desconocidas,
21 =
22)
H0 : 1 2 = 0H1 : 1 2 6= 0
|x y 0|21n1
+22n2
> z1/2|x y 0|sp
1
n1+
1
n2
> tn1+n22,1/2
H0 : 1 2 0H1 : 1 2 < 0
x y 021n1
+22n2
< zx y 0sp
1
n1+
1
n2
< tn1+n22,
H0 : 1 2 0H1 : 1 2 > 0
x y 021n1
+22n2
> z1x y 0sp
1
n1+
1
n2
> tn1+n22,1
Se denota Sp =(n1 1)S21 + (n2 1)S22
n1 + n2 2Si 21 y
22 desconocidas y no pueden suponerse iguales (problema de Behrens-
Fisher), como estadstico de contraste se utiliza
X Y 0S21n1
+S22n2
cuya distribucion aproximada, bajo la hipotesis 1 2 = 0, es una t[f ], donde[f ] es la parte entera de
f =(s21/n1 + s
22/n2)
2
(s21/n1)2/(n1 + 1) + (s22/n2)
2/(n2 + 1) 2
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 11
Contrastes sobre el cociente de varianzas
Region de rechazo Region de rechazo(1 y 2 conocidas) (1 y 2 desconocidas)
H0 : 21 =
22
H1 : 21 6= 22
n1i=1
(xi 1)2/n1n2i=1
(yi 2)2/n2< Fn1,n2,/2
on1i=1
(xi 1)2/n1n2i=1
(yi 2)2/n2> Fn1,n2,1/2
s21s22
< Fn11,n21,/2
os21s22
> Fn11,n21,1/2
H0 : 21 22
H1 : 21 <
22
n1i=1
(xi 1)2/n1n2i=1
(yi 2)2/n2< Fn1,n2,
s21s22
< Fn11,n21,
H0 : 21 22
H1 : 21 >
22
n1i=1
(xi 1)2/n1n2i=1
(yi 2)2/n2> Fn1,n2,1
s21s22
> Fn11,n21,1
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 12
Contrastes sobre la media de una poblacion cualquiera,para n suficientemente grande (n 30)
Region de rechazo Region de rechazo(2 conocida) (2 desconocida)
H0 : = 0H1 : 6= 0
|x 0|/n
> z1/2|x 0|s/n
> z1/2
H0 : 0H1 : < 0
x 0/n< z
x 0s/n< z
H0 : 0H1 : > 0
x 0/n> z1
x 0s/n> z1
Contrastes sobre la diferencia de medias de dos poblacionesindependientes, para n1 y n2 suficientemente grandes (n1, n2 30)
Region de rechazo Region de rechazo(21,
22 conocidas) (
21,
22 desconocidas)
H0 : 1 2 = 0H1 : 1 2 6= 0
|x y 0|21n1
+22n2
> z1/2|x y 0|
s21n1
+s22n2
> z1/2
H0 : 1 2 0H1 : 1 2 < 0
x y 021n1
+22n2
< zx y 0s21n1
+s22n2
< z
H0 : 1 2 0H1 : 1 2 > 0
x y 021n1
+22n2
> z1x y 0s21n1
+s22n2
> z1
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 13
Contrastes sobre una proporcion,para n suficientemente grande (n 30)
Region de rechazo
H0 : p = p0H1 : p 6= p0
|p p0|p0(1 p0)/n
> z1/2
H0 : p p0H1 : p < p0
p p0p0(1 p0)/n
< z
H0 : p p0H1 : p > p0
p p0p0(1 p0)/n
> z1
Contrastes sobre la diferencia de proporciones p1 p2,para n1 y n2 suficientemente grandes (n1, n2 30)
Region de rechazo
H0 : p1 p2 = 0H1 : p1 p2 6= 0
|p1 p2 0|p1(1 p1)/n1 + p2(1 p2)/n2
> z1/2
H0 : p1 p2 0H1 : p1 p2 < 0
p1 p2 0p1(1 p1)/n1 + p2(1 p2)/n2
< z
H0 : p1 p2 0H1 : p1 p2 > 0
p1 p2 0p1(1 p1)/n1 + p2(1 p2)/n2
> z1
Para 0 = 0 se utiliza como estadstico de contraste
P1 P2P (1 P )(1/n1 + 1/n2)
donde P =n1P1 + n2P2n1 + n2
.
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 14
Ejemplo. Un fabricante de semiconductores produce controladores que se em-plean en aplicaciones de motores automovilsticos. El cliente requiere que la frac-cion de controladores defectuosos en uno de los pasos de manufactura crticos nosea mayor que 0.05 y que el fabricante demuestre esta caracterstica del procesode fabricacion con este nivel de calidad. El fabricante de semiconductores tomauna muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos sondefectuosos. El fabricante puede demostrar al cliente la calidad del proceso?
Solucion.
Sea p la fraccion de controladores defectuosos
Planteamos el contraste de hipotesis:
H0 : p 0.05H1 : p < 0.05
Para realizar este contraste se utiliza una aproximacion de la distribucion binomiala la distribucion normal, valida cuando el tamano muestral es grande y p esproximo a cero o a uno
Calculamos el estadstico de contraste:
zexp =p p0
p0(1 p0)/n=
4/200 0.050.05(1 0.05)/200 = 1.95
Region crtica al nivel de significacion :
{zexp < z}
Calculo del p-valor:
p valor = P [Z < zexp] = P [Z < 1.95] = 0.0256
Interpretacion del p-valor:
Para > 0.0256 se rechaza H0, p.e., =0.05
Para < 0.0256 no se puede rechazar H0, p.e., =0.01
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 15
Calculo del p-valor para contrastes planteados sobre la media de unadistribucion normal con conocida
Contraste:
{H0 : = 1200H1 : 6= 1200
Estadstico de contraste: zexp =x/n= 2.32
p-valor=2 P [Z > |zexp|] = 2 P [Z > |2.32|] = 2 P [Z > 2.32] ' 0.02Interpretacion: Se rechaza H0 con un 98% de confianza.
Contraste:
{H0 : = 20H1 : 6= 20
Estadstico de contraste: zexp =x/n= 1.88
p-valor=2 P [Z > |zexp|] = 2 P [Z > | 1.88|] = 2 P [Z > 1.88] ' 0.06Interpretacion: Se rechaza H0 con un 94% de confianza.
Contraste:
{H0 : = 4.25H1 : > 4.25
Estadstico de contraste: zexp =x/n= 1.48
p-valor=P [Z > zexp] = P [Z > 1.48] ' 0.07Interpretacion: Se rechaza H0 con un 93% de confianza.
Contraste:
{H0 : = 10H1 : > 10
Estadstico de contraste: zexp =x/n= 1.59
p-valor=P [Z > zexp] = P [Z > 1.59] ' 0.06Interpretacion: Se rechaza H0 con un 94% de confianza.
Contraste:
{H0 : = 10H1 : < 10
Estadstico de contraste: zexp =x/n= 0.23
p-valor=P [Z < zexp] = P [Z < 0.23|] ' 0.40Interpretacion: No podemos rechazar H0 con suficiente confianza.
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 16
ANEXO: DISTRIBUCIONES MUESTRALES
Distribuciones asociadas a la distribucion normal
Distribucion 2 de Pearson. Sean Z1, Z2, ..., Zn vv.aa. independientes eidenticamente distribuidas, con distribucion N (0, 1) y consideremos la v.a.definida como
X =ni=1
Z2i
La v.a. X tiene una distribucion denominada distribucion 2 de Pearson conn grados de libertad y se denota por
ni=1
Z2i 2n
Distribucion t de Student. Sean Y y Z vv.aa. independientes tales queY 2n y Z N (0, 1) y consideremos la v.a.
T =ZY/n
La v.a. T tiene una distribucion denominada t de Student con n grados delibertad y se denota por
T tnDistribucion F de Snedecor. Sean X e Y vv.aa. independientes tales queX 2m e Y 2n y consideremos la v.a.
F =X/m
Y/m
La v.a. F tiene una distribucion denominada distribucion F de Snedecor conm y n grados de libertad y se denota por
F Fm,nSi F Fm,n, entonces
1
F Fn,m
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 17
Estadsticos muestrales mas usuales
Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X, se define la media muestral X,la varianza muestral 2 y la cuasivarianza muestral S2 como
X =1
n
ni=1
Xi 2 =
1
n
ni=1
(Xi X)2 S2 = 1n 1
ni=1
(Xi X)2
Distribuciones muestrales
Distribuciones muestrales asociadas a una poblacion normal
Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X N (, 2), entoncesX /n N (0, 1) (n 1)S
2
2 2n1
X S/n tn1
Distribuciones muestrales asociadas a dos poblaciones normales in-dependientes
Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X N (1, 21)Sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y N (2, 22)X e Y vv. aa. independientes
X y S21 : media y cuasivarianza muestral para X, respectivamente
Y y S22 : media y cuasivarianza muestral para Y , respectivamente.
Si 21 y 22 conocidas, entonces
(X Y ) (1 2)21n1
+22n2
N (0, 1) S21/
21
S22/22 Fn11,n21
Si 21 y 22 desconocidas, pero iguales, entonces
(X Y ) (1 2)Sp
1
n1+
1
n2
tn1+n22 S2p =(n1 1)S21 + (n2 1)S22
n1 + n2 2
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 18
Si 21 y 22 desconocidas y distintas, entonces
(X Y ) (1 2)S21n1
+S22n2
t[f ] (distribucion aproximada)
donde [f ] es la parte entera de
f =(s21/n1 + s
22/n2)
2
(s21/n1)2/(n1 + 1) + (s22/n2)
2/(n2 + 1) 2
Tambien podemos utilizar la aproximacion a una distribucion t de Studentcon k grados de libertad, donde k = inf n1 1, n2 1
Distribuciones muestrales aproximadas asociadas a una poblacioncon media y varianza finitas para muestras de tamano suficiente-mente grande (n > 30)
Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X con media y varianza 2
finitas, entonces
X /n N (0, 1) X
S/n N (0, 1)
Caso particular: Sea X1, X2, . . . , Xn (n > 30) una m.a.s. de una v.a. Xcon distribucion de Bernoulli B(p), entonces
P pp(1 p)/n N (0, 1)
donde P =1
n
ni=1
Xi es el estadstico proporcion muestral.
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 19
Distribuciones muestrales aproximadas asociadas a dos poblacionesindependientes con medias y varianzas finitas para muestras detamano suficientemente grande (n1 > 30 y n2 > 30)
Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X con media 1 y varianza 21
finitas
Sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y con media 2 y varianza 22
finitas
X e Y vv. aa. independientes
X y S21 : media y cuasivarianza muestral de X
Y y S22 : media y cuasivarianza muestral de Y , respectivamente
Si 21 y 22 conocidas, entonces
(X Y ) (1 2)21n1
+22n2
N (0, 1)
Si 21 y 22 desconocidas, entonces
(X Y ) (1 2)S21n1
+S22n2
N (0, 1)
Caso particular: Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X condistribucion de Bernoulli B(p1) y sea Y1, Y2, . . . , Yn2 una m.a.s. de unav.a. Y con distribucion de Bernoulli B(p2)(n1, n2 > 30). X e Y vv. aa.
independientes. Sean P1 =1
n1
n1i=1
Xi y P2 =1
n2
n2i=1
Yi, entonces
(P1 P2) (p1 p2)p1(1 p1)/n1 + p2(1 p2)/n2
N (0, 1)
Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 20