20
 TEMA 0. CONTRASTES DE HIPOTESIS ESTADISTICAS Planteamiento general del problema Sea  X = (X 1 ,...,X  n )  una muestra aleatoria simple de tama˜no  n  procedente de una poblaci´ on, con distribuci´ on perteneciente a una familia de distribuciones F F  = {F θ  :  θ  ∈ Θ},  θ  = (θ 1 ,..., θ k ),  θ ∈ Θ ⊆ R k Hip´ ote si s estad´ ı stica:  armaci´ on sobre el valor del par´ ametro  θ Formulaci´ on de un contraste de hip´otesis: H 0  :  θ  ∈ Θ 0  Hip´ otesis nula H 1  :  θ  ∈ Θ 1  Hip´ otesis alterna tiva donde  Θ = Θ 0 Θ 1  y  Θ 0 Θ 1  = Objetivo:  Analizar los datos observados para decidir si ´estos proporcionan o no evidencia suciente para descartar la hip´ otesis propuesta Test de hip´ otesis Test de hip´ otesis.  Un  test de hip´ otesis  es un procedimiento que nos permite aceptar o rechazar la hip´ otesis nula bas´ andose en los valores muestr ales observa- dos Bas´ andose en una funci´ on de las observaciones  T (X 1 ,...,X  n )  (es tad ´ ı s tico de contraste), un test de hip´ otesis determina una regi´ on de rechazo  R Regla de decisi´ on.  Observad a la vari able se tendr´ a un valor concre to del es- tad ´ ı st ico de contra ste ,  T (x 1 ,...,x n ) Se aceptar´ a la hip´otesis nula H 0  si T (x 1 ,...,x n )  /  R, los datos no presentan evidencia en contra de la hip´otesis nula Se rec haz ar´ a la hip´otesis nula  H 0  si  T (x 1 ,...,x n )  R, los datos apoyan la hip´ otesis alternativa  H 1 Ampliaci´ on de Estad´ ıstica. Ingen ier ´ ıa Indust rial. Curso Ac ad´ emico 2007-0 8.  1

T0_CONTRASTES

Embed Size (px)

Citation preview

  • TEMA 0. CONTRASTES DE HIPOTESIS ESTADISTICAS

    Planteamiento general del problema

    Sea X = (X1, . . . , Xn) una muestra aleatoria simple de tamano n procedente deuna poblacion, con distribucion perteneciente a una familia de distribuciones F

    F = {F : }, = (1, . . . , k), Rk

    Hipotesis estadstica: afirmacion sobre el valor del parametro

    Formulacion de un contraste de hipotesis:

    H0 : 0 Hipotesis nulaH1 : 1 Hipotesis alternativa

    donde = 0 1 y 0 1 =

    Objetivo: Analizar los datos observados para decidir si estos proporcionan o noevidencia suficiente para descartar la hipotesis propuesta

    Test de hipotesis

    Test de hipotesis. Un test de hipotesis es un procedimiento que nos permiteaceptar o rechazar la hipotesis nula basandose en los valores muestrales observa-dos

    Basandose en una funcion de las observaciones T (X1, . . . , Xn) (estadstico decontraste), un test de hipotesis determina una region de rechazo R

    Regla de decision. Observada la variable se tendra un valor concreto del es-tadstico de contraste, T (x1, . . . , xn)

    Se aceptara la hipotesis nulaH0 si T (x1, . . . , xn) / R, los datos no presentanevidencia en contra de la hipotesis nula

    Se rechazara la hipotesis nula H0 si T (x1, . . . , xn) R, los datos apoyan lahipotesis alternativa H1

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 1

  • Tipos de errores

    Cuando se toma la decision de aceptar o rechazar la hipotesis nula se puedencometer dos tipos de error:

    Error tipo I: Se rechaza H0 cuando esta es cierta

    Error tipo II: Se acepta H0 cuando esta es falsa

    H0 cierta H0 falsa

    Rechazar H0 Error de tipo I Decision correcta

    Aceptar H0 Decision correcta Error de tipo II

    Conceptos fundamentales

    Un test tiene nivel de significacion , 0 1, siP[ Rechazar H0] = P[T (X1, . . . , Xn) R] , 0

    Un test tiene tamano , 0 1, si = sup

    0P[ Rechazar H0] = sup

    0P[T (X1, . . . , Xn) R]

    Se define la funcion potencia como la funcion

    : [0, 1]donde

    () = P[ Rechazar H0] = P[T (X1, . . . , Xn) R]

    Dados y , tests con nivel de significacion para contrastar H0 : 0frente a H1 : 1, es uniformemente mas potente que si secumple

    () (), 1

    Se dice que el test es uniformemente mas potente (UMP) a nivelde significacion si tiene nivel de significacion y para cualquier otrotest con nivel de significacion , es uniformemente mas potente que, es decir,

    () (), 1

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 2

  • Procedimiento a seguir para realizar un contraste de hipotesis

    Formulacion de las hipotesis H0 y H1{H0 : 0H1 : 1

    Se fija una cota para la probabilidad de cometer un error de tipo I,

    Se considera el estadstico de contraste T (X1, . . . , Xn), basadogeneralmente en un estimador del parametro

    Se obtiene la distribucion muestral de dicho estadstico bajo la hipotesis deque H0 es cierta

    Se determina la region de rechazo R imponiendo que el test tenga tamano, i.e.,

    = sup0

    P[ Rechazar H0] = sup0

    P[T (X1, . . . , Xn) R]

    Para los valores muestrales observados (x1, . . . , xn), se calcula el valor delestadstico de contraste, T (x1, . . . , xn)

    Si T (x1, . . . , xn) / R, se acepta la hipotesis nula H0 Si T (x1, . . . , xn) R, se rechaza la hipotesis nula H0

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 3

  • Ejemplo. La longitud media de los tornillos fabricados por una empresa debeser de 30mm. Periodicamente se seleccionan al azar 36 tornillos y se mide sulongitud. Se considera que el proceso esta fuera de control cuando la longitudmedia muestral x < 29.8 o bien x >30.2mm. Se supone que la longitud de lostornillos se comporta como una distribucion normal con desviacion tpica 0.6mm.

    1. Enunciar las hipotesis nula y alternativa propias de esta situacion.

    2. Obtener la probabilidad de cometer un error de tipo I.

    3. Calcular la funcion potencia para los valores de las longitudes medias 29.6,29.8, 30, 30.2 y 30.4.

    4. Como una prueba alternativa, se considera que el proceso esta fuera decontrol cuando x < 29.75 o bien x >30.25mm. Si el tamano maximo acep-tado para un error de tipo I es 0.05. Cual de las dos pruebas es la mejorsuponiendo que en la hipotesis alternativa la longitud media es 30.5mm?

    Solucion

    1. Contraste de hipotesis:

    {H0 : = 30

    H1 : 6= 30Region de rechazo: x > 30.2 o x 30.2]

    = P

    [Z

    30.2 300.1

    ]= P [Z < 2] + P [Z > 2] = 2 0.02275 = 0.0455

    Cuando la hipotesis nula es cierta, se obtiene que X N (30, 0.1)3. Calculo de la funcion potencia:

    (29.6) = P=29.6[Rechazar H0] = P=29.6[X < 29.8 o X > 30.2]

    = P

    [Z

    30.2 29.60.1

    ]= P [Z < 2] + P [Z > 6] = 0.97725 + 0 = 0.97725

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 4

  • (29.8) = P=29.8[Rechazar H0] = P=29.8[X < 29.8 o X > 30.2]

    = P

    [Z

    30.2 29.80.1

    ]= P [Z < 0] + P [Z > 4] w 0.5

    (30.0) = 0.0455

    (30.2) = (29.8) = 0.5

    (30.4) = (29.6) = 0.97725

    (30.5) = P=30.5[Rechazar H0] = P=30.5[X < 29.8 o X > 30.2]

    = P

    [Z

    30.2 30.50.1

    ]= P [Z < 7] + P [Z > 3] = P [Z < 3] = 0.9987

    4. Region de rechazo de la prueba alternativa: x > 30.25 o x 30.25]

    = P

    [Z

    30.25 300.1

    ]= P [Z < 2.5] + P [Z > 2.5] = 2 0.0062 = 0.0124 < 0.05

    (30.5) = P=30.5[Rechazar H0] = P=30.5[X < 29.75 o X > 30.25]

    = P

    [Z

    30.25 300.1

    ]= P [Z < 7.5] + P [Z > 2.5] = P [Z < 2.5] = 0.9938

    Al nivel de significacion de 0.05, el primer test es mas potente que este

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 5

  • Test de la razon de verosimilitudes

    Formulacion del test de la razon de verosimilitudes

    Se denomina razon de verosimilitudes para contrastar

    H0 : 0H1 : 1

    al cociente

    (x) =

    sup0

    f(x)

    sup

    f(x)

    Un test de razon de verosimilitudes para contrastar dichas hipotesis es aquelque rechaza H0 si (x) < c, donde c es una constante

    La constante c (0, 1) se determina imponiendo la condicion de que el test tengatamano , es decir,

    sup0

    P[ Rechazar H0] = sup0

    P[(x) < c] =

    Comportamiento asintotico del test de la razon de verosimilitudes

    Bajo ciertas condiciones de regularidad sobre f(x), Rk, abierto de Rk,la variable aleatoria

    2 log (X)se distribuye asintoticamente bajo la hipotesis nula como una variable aleatoria2 con k r grados de libertad, donde k = dim() y r = dim(0)

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 6

  • Ejemplo Dos personas A y B juegan al siguiente juego: se lanza al aire unamoneda ganando A si sale cara y B si sale cruz. El jugador A proporcionauna moneda y despues de 200 lanzamientos, A ha ganado 130 veces. Tras esteresultado, B afirma que la moneda esta trucada y la probabilidad de obtenercara no es 0.5. A mantiene que la moneda es correcta. Ante esta situacion, seplantea la cuestion de decidir quien tiene razon

    Sea p la probabilidad de obtener cara al lanzar una moneda y sea la v.a.

    X =

    {0 si sale cruz

    1 si sale cara

    X B(1, p), p (0, 1)Problema de contraste:

    H0 : p = p0, p0 = 0.5

    H1 : p 6= p0Aplicando el test de la razon de verosimilitudes

    (x) =

    supp=p0

    fp(x)

    supp(0,1)

    fp(x)=

    pnx0 (1 p0)nnxsupp(0,1)

    pnx(1 p)nnx

    =pnx0 (1 p0)nnxxnx(1 x)nnx =

    (p0x

    )nx(1 p01 x

    )nnxSe rechaza H0, al nivel de significacion , si (x) < c, donde c se calculaimponiendo la condicion

    = Pp=p0[(X) < c]

    Puesto que el tamano muestral es grande, la distribucion de 2 log (x), si lahipotesis nula es cierta, se puede aproximar por la distribucion de una 21, entonces

    = Pp=p0[(X) < c] = Pp=p0[2 log (X) > c] P [21 > c] = c = 21,1donde 21,1 es el cuantil de orden 1 de una 21

    Para =0.05: 21,0.95=3.842 y C = {2 log (X) > 3.842 }Para p0=0.5, n = 200, x=0.65 = 2 log (x)=18.280 y se rechaza H0

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 7

  • Contrastes sobre los parametros de una poblacion normal

    (X1, . . . , Xn) m.a.s. de N (, 2)Contrastes sobre la media

    Region de rechazo Region de rechazo(2 conocida) (2 desconocida)

    H0 : = 0H1 : 6= 0

    |x 0|/n

    > z1/2|x 0|s/n

    > tn1,1/2

    H0 : 0H1 : < 0

    x 0/n< z

    x 0s/n< tn1,

    H0 : 0H1 : > 0

    x 0/n> z1

    x 0s/n> tn1,1

    Contrastes sobre la varianza

    Region de rechazo Region de rechazo( conocida) ( desconocida)

    H0 : 2 = 20

    H1 : 2 6= 20

    ni=1

    (xi )220

    < 2n,/2

    oni=1

    (xi )220

    > 2n,1/2

    (n 1)s220

    < 2n1,/2o

    (n 1)s220

    > 2n1,1/2

    H0 : 2 20

    H1 : 2 < 20

    ni=1

    (xi )220

    < 2n,(n 1)s2

    20< 2n1,

    H0 : 2 20

    H1 : 2 > 20

    ni=1

    (xi )220

    > 2n,1(n 1)s2

    20> 2n1,1

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 8

  • Contrastes sobre la diferencia de medias de dos poblacionesnormales no necesariamente independientes

    ((X1, Y1), . . . , (Xn, Yn)), m.a.s. de una distribucion normal bidimen-sional (X, Y )

    (D1, . . . , Dn), donde Di = XiYi, i = 1, . . . , n, m.a.s. de N (D, 2D)

    D = 1 2

    2D = 21 +

    22 212, generalmente desconocida

    Region de rechazo

    H0 : D = 0H1 : D 6= 0

    |d 0|sD/

    n> tn1,1/2

    H0 : D 0H1 : D < 0

    d 0sD/

    n< tn1,

    H0 : D 0H1 : D > 0

    d 0sD/

    n> tn1,1

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 9

  • Ejemplo. Se pueden utilizar dos pruebas analticas diferentes para determinarel nivel de impureza en aleacciones de acero. Se prueban ocho especmenes conambos procedimientos; los resultados aparecen en la tabla adjunta. Admitiendola hipotesis de normalidad para las variables en estudio, existen diferencias signi-ficativas entre los promedios de los niveles de impureza determinados por ambaspruebas, utilizando =0.01?

    Especimen Prueba 1 Prueba 21 1.2 1.42 1.3 1.73 1.5 1.54 1.4 1.35 1.7 2.06 1.8 2.17 1.4 1.78 1.3 1.6

    Solucion. El parametro de interes es la diferencia entre los promedios de losniveles de impureza determinados por ambas pruebas, D = 12. Planteamosel contraste de hipotesis:

    H0 : D = 0H1 : D 6= 0

    Para los datos muestrales calculamos el estadstico de contraste:

    texp =d 0sD/

    n=

    0.21250.17268/

    8= 3.48

    Region crtica al nivel de significacion = 0.01:{|texp| > tn1,1/2} = {|texp| > t7,0.995} = {|texp| > 3.5}Como |texp| = 3.48 < 3.5, no se puede rechazar H0 al nivel de significacion = 0.01; las dos pruebas no proporcionan diferentes promedios de niveles deimpurezaSi calculamos el p-valor del test

    p valor = 2P [tn1 > |texp|] = 2P [t7 > | 3.48|]= 2P [t7 > 3.48] = 2 0.00513 = 0.01026

    se obtiene un valor pequeno, lo que nos indicara que a otro nivel de significacion,p.e., = 0.05 se rechazara H0

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 10

  • Contrastes sobre los parametros de dos poblacionesnormales independientes

    (X1, . . . , Xn1) m.a.s. de N (1, 21), (Y1, . . . , Yn2) m.a.s de N (2, 22)X e Y independientes

    Contrastes sobre la diferencia de medias

    Region de rechazo Region de rechazo(21,

    22 conocidas) (

    21,

    22 desconocidas,

    21 =

    22)

    H0 : 1 2 = 0H1 : 1 2 6= 0

    |x y 0|21n1

    +22n2

    > z1/2|x y 0|sp

    1

    n1+

    1

    n2

    > tn1+n22,1/2

    H0 : 1 2 0H1 : 1 2 < 0

    x y 021n1

    +22n2

    < zx y 0sp

    1

    n1+

    1

    n2

    < tn1+n22,

    H0 : 1 2 0H1 : 1 2 > 0

    x y 021n1

    +22n2

    > z1x y 0sp

    1

    n1+

    1

    n2

    > tn1+n22,1

    Se denota Sp =(n1 1)S21 + (n2 1)S22

    n1 + n2 2Si 21 y

    22 desconocidas y no pueden suponerse iguales (problema de Behrens-

    Fisher), como estadstico de contraste se utiliza

    X Y 0S21n1

    +S22n2

    cuya distribucion aproximada, bajo la hipotesis 1 2 = 0, es una t[f ], donde[f ] es la parte entera de

    f =(s21/n1 + s

    22/n2)

    2

    (s21/n1)2/(n1 + 1) + (s22/n2)

    2/(n2 + 1) 2

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 11

  • Contrastes sobre el cociente de varianzas

    Region de rechazo Region de rechazo(1 y 2 conocidas) (1 y 2 desconocidas)

    H0 : 21 =

    22

    H1 : 21 6= 22

    n1i=1

    (xi 1)2/n1n2i=1

    (yi 2)2/n2< Fn1,n2,/2

    on1i=1

    (xi 1)2/n1n2i=1

    (yi 2)2/n2> Fn1,n2,1/2

    s21s22

    < Fn11,n21,/2

    os21s22

    > Fn11,n21,1/2

    H0 : 21 22

    H1 : 21 <

    22

    n1i=1

    (xi 1)2/n1n2i=1

    (yi 2)2/n2< Fn1,n2,

    s21s22

    < Fn11,n21,

    H0 : 21 22

    H1 : 21 >

    22

    n1i=1

    (xi 1)2/n1n2i=1

    (yi 2)2/n2> Fn1,n2,1

    s21s22

    > Fn11,n21,1

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 12

  • Contrastes sobre la media de una poblacion cualquiera,para n suficientemente grande (n 30)

    Region de rechazo Region de rechazo(2 conocida) (2 desconocida)

    H0 : = 0H1 : 6= 0

    |x 0|/n

    > z1/2|x 0|s/n

    > z1/2

    H0 : 0H1 : < 0

    x 0/n< z

    x 0s/n< z

    H0 : 0H1 : > 0

    x 0/n> z1

    x 0s/n> z1

    Contrastes sobre la diferencia de medias de dos poblacionesindependientes, para n1 y n2 suficientemente grandes (n1, n2 30)

    Region de rechazo Region de rechazo(21,

    22 conocidas) (

    21,

    22 desconocidas)

    H0 : 1 2 = 0H1 : 1 2 6= 0

    |x y 0|21n1

    +22n2

    > z1/2|x y 0|

    s21n1

    +s22n2

    > z1/2

    H0 : 1 2 0H1 : 1 2 < 0

    x y 021n1

    +22n2

    < zx y 0s21n1

    +s22n2

    < z

    H0 : 1 2 0H1 : 1 2 > 0

    x y 021n1

    +22n2

    > z1x y 0s21n1

    +s22n2

    > z1

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 13

  • Contrastes sobre una proporcion,para n suficientemente grande (n 30)

    Region de rechazo

    H0 : p = p0H1 : p 6= p0

    |p p0|p0(1 p0)/n

    > z1/2

    H0 : p p0H1 : p < p0

    p p0p0(1 p0)/n

    < z

    H0 : p p0H1 : p > p0

    p p0p0(1 p0)/n

    > z1

    Contrastes sobre la diferencia de proporciones p1 p2,para n1 y n2 suficientemente grandes (n1, n2 30)

    Region de rechazo

    H0 : p1 p2 = 0H1 : p1 p2 6= 0

    |p1 p2 0|p1(1 p1)/n1 + p2(1 p2)/n2

    > z1/2

    H0 : p1 p2 0H1 : p1 p2 < 0

    p1 p2 0p1(1 p1)/n1 + p2(1 p2)/n2

    < z

    H0 : p1 p2 0H1 : p1 p2 > 0

    p1 p2 0p1(1 p1)/n1 + p2(1 p2)/n2

    > z1

    Para 0 = 0 se utiliza como estadstico de contraste

    P1 P2P (1 P )(1/n1 + 1/n2)

    donde P =n1P1 + n2P2n1 + n2

    .

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 14

  • Ejemplo. Un fabricante de semiconductores produce controladores que se em-plean en aplicaciones de motores automovilsticos. El cliente requiere que la frac-cion de controladores defectuosos en uno de los pasos de manufactura crticos nosea mayor que 0.05 y que el fabricante demuestre esta caracterstica del procesode fabricacion con este nivel de calidad. El fabricante de semiconductores tomauna muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos sondefectuosos. El fabricante puede demostrar al cliente la calidad del proceso?

    Solucion.

    Sea p la fraccion de controladores defectuosos

    Planteamos el contraste de hipotesis:

    H0 : p 0.05H1 : p < 0.05

    Para realizar este contraste se utiliza una aproximacion de la distribucion binomiala la distribucion normal, valida cuando el tamano muestral es grande y p esproximo a cero o a uno

    Calculamos el estadstico de contraste:

    zexp =p p0

    p0(1 p0)/n=

    4/200 0.050.05(1 0.05)/200 = 1.95

    Region crtica al nivel de significacion :

    {zexp < z}

    Calculo del p-valor:

    p valor = P [Z < zexp] = P [Z < 1.95] = 0.0256

    Interpretacion del p-valor:

    Para > 0.0256 se rechaza H0, p.e., =0.05

    Para < 0.0256 no se puede rechazar H0, p.e., =0.01

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 15

  • Calculo del p-valor para contrastes planteados sobre la media de unadistribucion normal con conocida

    Contraste:

    {H0 : = 1200H1 : 6= 1200

    Estadstico de contraste: zexp =x/n= 2.32

    p-valor=2 P [Z > |zexp|] = 2 P [Z > |2.32|] = 2 P [Z > 2.32] ' 0.02Interpretacion: Se rechaza H0 con un 98% de confianza.

    Contraste:

    {H0 : = 20H1 : 6= 20

    Estadstico de contraste: zexp =x/n= 1.88

    p-valor=2 P [Z > |zexp|] = 2 P [Z > | 1.88|] = 2 P [Z > 1.88] ' 0.06Interpretacion: Se rechaza H0 con un 94% de confianza.

    Contraste:

    {H0 : = 4.25H1 : > 4.25

    Estadstico de contraste: zexp =x/n= 1.48

    p-valor=P [Z > zexp] = P [Z > 1.48] ' 0.07Interpretacion: Se rechaza H0 con un 93% de confianza.

    Contraste:

    {H0 : = 10H1 : > 10

    Estadstico de contraste: zexp =x/n= 1.59

    p-valor=P [Z > zexp] = P [Z > 1.59] ' 0.06Interpretacion: Se rechaza H0 con un 94% de confianza.

    Contraste:

    {H0 : = 10H1 : < 10

    Estadstico de contraste: zexp =x/n= 0.23

    p-valor=P [Z < zexp] = P [Z < 0.23|] ' 0.40Interpretacion: No podemos rechazar H0 con suficiente confianza.

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 16

  • ANEXO: DISTRIBUCIONES MUESTRALES

    Distribuciones asociadas a la distribucion normal

    Distribucion 2 de Pearson. Sean Z1, Z2, ..., Zn vv.aa. independientes eidenticamente distribuidas, con distribucion N (0, 1) y consideremos la v.a.definida como

    X =ni=1

    Z2i

    La v.a. X tiene una distribucion denominada distribucion 2 de Pearson conn grados de libertad y se denota por

    ni=1

    Z2i 2n

    Distribucion t de Student. Sean Y y Z vv.aa. independientes tales queY 2n y Z N (0, 1) y consideremos la v.a.

    T =ZY/n

    La v.a. T tiene una distribucion denominada t de Student con n grados delibertad y se denota por

    T tnDistribucion F de Snedecor. Sean X e Y vv.aa. independientes tales queX 2m e Y 2n y consideremos la v.a.

    F =X/m

    Y/m

    La v.a. F tiene una distribucion denominada distribucion F de Snedecor conm y n grados de libertad y se denota por

    F Fm,nSi F Fm,n, entonces

    1

    F Fn,m

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 17

  • Estadsticos muestrales mas usuales

    Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X, se define la media muestral X,la varianza muestral 2 y la cuasivarianza muestral S2 como

    X =1

    n

    ni=1

    Xi 2 =

    1

    n

    ni=1

    (Xi X)2 S2 = 1n 1

    ni=1

    (Xi X)2

    Distribuciones muestrales

    Distribuciones muestrales asociadas a una poblacion normal

    Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X N (, 2), entoncesX /n N (0, 1) (n 1)S

    2

    2 2n1

    X S/n tn1

    Distribuciones muestrales asociadas a dos poblaciones normales in-dependientes

    Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X N (1, 21)Sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y N (2, 22)X e Y vv. aa. independientes

    X y S21 : media y cuasivarianza muestral para X, respectivamente

    Y y S22 : media y cuasivarianza muestral para Y , respectivamente.

    Si 21 y 22 conocidas, entonces

    (X Y ) (1 2)21n1

    +22n2

    N (0, 1) S21/

    21

    S22/22 Fn11,n21

    Si 21 y 22 desconocidas, pero iguales, entonces

    (X Y ) (1 2)Sp

    1

    n1+

    1

    n2

    tn1+n22 S2p =(n1 1)S21 + (n2 1)S22

    n1 + n2 2

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 18

  • Si 21 y 22 desconocidas y distintas, entonces

    (X Y ) (1 2)S21n1

    +S22n2

    t[f ] (distribucion aproximada)

    donde [f ] es la parte entera de

    f =(s21/n1 + s

    22/n2)

    2

    (s21/n1)2/(n1 + 1) + (s22/n2)

    2/(n2 + 1) 2

    Tambien podemos utilizar la aproximacion a una distribucion t de Studentcon k grados de libertad, donde k = inf n1 1, n2 1

    Distribuciones muestrales aproximadas asociadas a una poblacioncon media y varianza finitas para muestras de tamano suficiente-mente grande (n > 30)

    Sea X1, X2, . . . , Xn una m.a.s. de una v.a. X con media y varianza 2

    finitas, entonces

    X /n N (0, 1) X

    S/n N (0, 1)

    Caso particular: Sea X1, X2, . . . , Xn (n > 30) una m.a.s. de una v.a. Xcon distribucion de Bernoulli B(p), entonces

    P pp(1 p)/n N (0, 1)

    donde P =1

    n

    ni=1

    Xi es el estadstico proporcion muestral.

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 19

  • Distribuciones muestrales aproximadas asociadas a dos poblacionesindependientes con medias y varianzas finitas para muestras detamano suficientemente grande (n1 > 30 y n2 > 30)

    Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X con media 1 y varianza 21

    finitas

    Sea Y1, Y2, . . . , Yn2 una m.a.s. de una v.a. Y con media 2 y varianza 22

    finitas

    X e Y vv. aa. independientes

    X y S21 : media y cuasivarianza muestral de X

    Y y S22 : media y cuasivarianza muestral de Y , respectivamente

    Si 21 y 22 conocidas, entonces

    (X Y ) (1 2)21n1

    +22n2

    N (0, 1)

    Si 21 y 22 desconocidas, entonces

    (X Y ) (1 2)S21n1

    +S22n2

    N (0, 1)

    Caso particular: Sea X1, X2, . . . , Xn1 una m.a.s. de una v.a. X condistribucion de Bernoulli B(p1) y sea Y1, Y2, . . . , Yn2 una m.a.s. de unav.a. Y con distribucion de Bernoulli B(p2)(n1, n2 > 30). X e Y vv. aa.

    independientes. Sean P1 =1

    n1

    n1i=1

    Xi y P2 =1

    n2

    n2i=1

    Yi, entonces

    (P1 P2) (p1 p2)p1(1 p1)/n1 + p2(1 p2)/n2

    N (0, 1)

    Ampliacion de Estadstica. Ingeniera Industrial. Curso Academico 2007-08. 20