Clase 11 Prueba o Contraste de Hipótesis

Embed Size (px)

Citation preview

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    1/11

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    2/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 2

    especificacin de la compaa se conoce como la hiptesis nula.Por lo general se la identifica con elsmbolo H0. En nuestro ejemplo se puede establecer como:

    368:0 H

    Obsrvese que la hiptesis nula se escribe en trminos del parmetro de la poblacin. Esto es as debidoa que el gerente est interesado en el proceso de empaque completo, es decir, la poblacin de todas las

    cajas de cereal que se estn llenando. Las estadsticas muestrales se utilizarn para hacer inferenciasacerca de la condicin del proceso completo de llenado. La base terica de la prueba de hiptesisrequiere que la hiptesis nula sea considerada verdadera hasta que las evidencias, que son los resultadosde la muestra, indiquen que sta es falsa. Si la hiptesis nula se considera falsa, alguna otra debe serverdadera.Siempre que especifiquemos una hiptesis nula, tambin debemos especificar una hiptesis alternativa,H1, que indique lo opuesto a la hiptesis nula. Para el ejemplo, la hiptesis alternativa se puedeestablecer como:

    368:1 H La hiptesis alternativa representa la conclusin a la que se llegara si hubiera suficiente evidencia de lainformacin de la muestra para decidir que es improbable que la hiptesis nula sea verdadera y, por

    tanto, rechazarla. En el ejemplo, si los pesos de las cajas muestreadas estuvieran lo suficientementealejados de 368 gramos especificados por la compaa, el gerente de produccin rechazara la hiptesisnula en favor de la hiptesis alternativa; por consiguiente, detendra la produccin y llevara a efectocualquier accin necesaria para corregir el problema.

    Valor crtico de la estadstica de prueba

    La decisin de rechazar o no la hiptesis nula, en base a la evidencia emprica, se basa en la creencia deque los elementos de la muestra aleatoria representan fielmente las caractersticas de los elementos de lapoblacin de donde ha sido tomada. El hecho de no rechazar la hiptesis nula no es una prueba de questa sea verdadera, lo nico que podemos decir es que la evidencia fue insuficiente para garantizar su

    rechazo. Para tomar cualquier decisin, se requiere usar la distribucin muestral de la estadstica deinters (en nuestro ejemplo, de la media muestral) y luego calcular el valorde la estadstica de pruebaparticular, basndonos en el resultado de la muestra. Como la distribucin muestral de la estadsti ca deprueba, a menudo, sigue una distribucin normal o t , podemos utilizar estas distribuciones paradeterminar la probabilidad de que una hiptesis nula sea verdadera (la estadstica de prueba es la funcinpivote ya conocida). El valor de la estadstica de prueba se llama valor crtico.

    Regiones de rechazo y de no rechazo

    La distribucin muestral de la estadstica de prueba se divide en dos regiones, una regin de rechazo(conocida tambin como regin crtica) y una regin de no rechazo.Si el valor de la estadstica de

    prueba cae en la regin de rechazo, se rechaza la hiptesis nula (porque el valor sera improbable si H0fuese verdadera). En el ejemplo, el gerente de produccin llegara a la conclusin de que la media de lapoblacin no es 368.Si el valor de la estadstica de prueba cae dentro de la regin de no rechazo, no sepuede rechazar la hiptesis nula. En nuestro ejemplo, el gerente de produccin llegara a la conclusinde que la cantidad promedio de contenido no ha cambiado.Con el fin de tomar una decisin respecto de H0, primero debemos determinar el valor crtico de laestadstica de prueba, el cual separa las regiones de no rechazo y de rechazo.

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    3/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 3

    Riesgos en la toma de decisiones al utilizar la metodologa de la prueba de hiptesis

    Cuando se usa una estadstica muestral para tomar decisiones acerca de un parmetro poblacional, existeel riesgo de llegar a una conclusin incorrecta. Dos tipos diferentes de error se pueden presentar cuandose aplica la metodologa de prueba de hiptesis:

    Un error de tipo Ise presenta si la hiptesis nula, H0, es rechazada cuando, de hecho, es verdaderay deba ser aceptada.Un error de tipo II se presenta si la hiptesis nula, H0, es aceptada cuando, de hecho, es falsa ydeba ser rechazada.

    Nivel de significacin: es la probabilidad de cometer un error del tipo I. Se especifica antes de quese lleve a cabo la prueba de hiptesis. Se le denota como y una vez que se ha especificado su valorse conoce el tamao de la regin crtica y se puede determinar el valor crtico. Su complemento,

    1 , es el coeficiente de confianzay representa la probabilidad de que la hiptesis nula, H0, no searechazada cuando de hecho es verdadera.

    Ahora, a manera de resumen, presentaremos los conceptos necesarios de una prueba de hiptesis.

    REVISIN DE CONCEPTOS PARA LA METODOLOGA DE LA PRUEBA DE HIPTESIS

    Hiptesis estadstica: Supuesto o conjetura acerca de un parmetro poblacional o acerca de ladistribucin de probabilidad de una variable aleatoria.

    Contraste de Hiptesis: Una prueba de una hiptesis estadstica es una regla de decisin que permiterechazar o no la hiptesis nula planteada, en base a la informacin proporcionada por la muestraaleatoria.

    Hiptesis nula y alternativa: La hiptesis nula es la que establece que el parmetro estudiado tiene unvalor especfico.La hiptesis alternativa, sobre la cual se enfoca la atencin, generalmente representa la suposicin que elinvestigador quiere probar. Se establece como lo opuesto a la hiptesis nula y representa la conclusin ala que se llegara si la hiptesis nula fuera rechazada.El rechazo de la hiptesis nula implicar la aceptacin de la hiptesis alternativa.Para formular las hiptesis podemos seguir los pasos siguientes:

    Formular las hiptesis, estableciendo como alternativa aquella que se desea probar.1. En la hiptesis nula se plantea que el parmetro es igual a un valor especfico.2. Considerar el nivel de significacin como medida de la confiabilidad de la decisin de

    rechazar la hiptesis nula. Este valor de debe ser pequeo.3.

    Si no existe suficiente informacin en la muestra como para rechazar la hiptesis nula, espreferible indicar que la hiptesis nula no puede ser rechazada en lugar de aceptarla.

    Error tipo I y Error tipo II: La decisin de rechazar o no la hiptesis nula, en base a la informacincontenida en una muestra, est sujeta a dos tipos de errores; estos errores se deben a fluctuacionesaleatorias en el muestreo. Se comete un error tipo I cuando se rechaza una hiptesis nula verdadera. Se

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    4/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 4

    comete un error de tipo II cuando se decide a favor de una hiptesis nula que en realidad es falsa. Paracontrolar estos errores se le asigna una probabilidad pequea.

    ESTADO REALDECISI N H0es verdadera H0es falsaRechazar H0 Error tipo I

    Aceptar H0 Error tipo II

    Nivel de Significacin: Es la probabilidad de cometer el error tipo I. Se le denota como .= P[Rechazar H0/ H0es verdadera]

    La probabilidad de equivocarse al rechazar la hiptesis nula, siendo sta verdadera, es a lo ms .

    Estadstica de prueba: Variable aleatoria utilizada para tomar la decisin no se rechaza Ho serechaza Ho.Generalmente, la estadstica de prueba es la funcin pivote que se usa en la estimacin por intervalos.

    Regin crtica: Conjunto de valores de la estadstica de prueba que causan el rechazo de la hiptesisnula.

    Punto crtico: Primer valor (o valor frontera) en la regin crtica.

    Regla de decisin: Si el valor calculado de la estadstica de prueba queda localizado dentro de la regincrtica, se rechaza Ho; caso contrario no se podr rechazar Ho.

    Regla para la conclusin: Si la decisin es rechazar Ho, entonces la conclusin ser existeevidencia suficiente al nivel de significacin para indicar que ... (el significado de la hiptesisalternativa). Si la decisin es no se rechaza Ho, entonces la conclusin debe ser no existe suficiente

    evidencia al nivel de significacin que indique que ... (el significado de la hiptesis alternativa).Notar que: (1) la decisinse refiere a Ho, y (2) la conclusines una aseveracin que sostiene o no loafirmado en H1.

    PROCEDIMIENTO PARA REALIZAR UNA PRUEBA O CONTRASTE DE HIPTESIS

    Dado el nivel de significacin , para hallar la regin de rechazo RR, que proporcione una regla dedecisin para aceptar o no la hiptesis nula 00: H frente a una hiptesis alternativa, se procede del

    modo siguiente:

    1. Formular las hiptesis H0y H1.2.

    Fijar el nivel de significacin y usar este valor para determinar la regin crtica.3. Elegir la estadstica de prueba adecuada, dependiendo del parmetro que interese probar, y

    calcular su valor en base a la informacin proporcionada por la muestra.4. Tomar la decisin: se rechaza H0 o no se rechaza H0.5. Conclusin: interpretacin de la decisin.

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    5/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 5

    A continuacin, haremos las pruebas de hiptesis para los parmetros y 2 de una poblacin normal,y para el parmetro p de una poblacin de Bernoulli.

    PRUEBAS DE HIPOTESIS USUALES

    PRUEBA DE HIPTESIS PARA LA MEDIA CUANDO SE MUESTREA UNA POBLACINNORMAL

    SeanX1,X2, ...,Xnuna muestra aleatoria de una distribucin normal con media desconocida. Interesaprobar unode los siguientes conjuntos de hiptesis con respecto a .

    A) H0 : = 0 B) H0 : = 0 C) H0 : = 0H1: < 0 H1: > 0 H1: 0

    CASO 1.- Supongamos que la varianza poblacional 2 es conocida. En este caso, la estadstica deprueba es

    Z=X

    n

    0

    la cual tiene distribucin normal estndar.La regin crtica de tamao correspondiente a cada conjunto de hiptesis es:

    A) RR = { Z: Z -Z} C) RR = { Z: Z -Z/2 } { Z: Z Z/2 }B) RR = { Z: Z Z}

    Ejemplo:Ante un reclamo de la gerencia, sobre el tiempo de realizacin de una tarea, los empleados de unacompaa sostienen que ellos completan la tarea en a lo ms 13 minutos. Qu conclusin obtiene lagerencia si para una muestra de 400 tareas se obtiene un promedio de tiempo de terminacin de 14minutos? Se sabe por informacin de trabajos similares, que los tiempos de ejecucin de la tarea tieneuna distribucin normal con desviacin estndar de 10 minutos. Usar el nivel de significacin 005. Solucin:El problema se plantea de la siguiente manera:

    H0: = 13 versus H1: >13con un nivel de significacin 005. .En este caso la hiptesis alternativa se toma mayor que 13 pues el gerente justificara el reclamo de lacompaa si la media poblacional es superior a 13 minutos.

    El valor de la estadstica de prueba esZ=X

    n

    0 =14 13

    10 4002

    /

    La regin de rechazo correspondiente al nivel de significacin 005. est dada por 1645. , .

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    6/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 6

    Como el valor de la estadstica de prueba cae en la regin de rechazo, el gerente puede rechazar lahiptesis nula H0. El riesgo de que el gerente se equivoque al rechazar la hiptesis nula, sobre la basedel resultado encontrado en la muestra, es menor o igual que 0.05.

    CASO 2.- Supongamos que la varianza poblacional 2 es desconocida. En este caso se utiliza comoestadstica de prueba

    T=X

    s n

    0

    la cual tiene distribucin t de Student con n-1grados de libertad.La regin crtica de tamao correspondiente a cada conjunto de hiptesis es:

    A) RR = { t: t -t} B) RR = { t: t t}C) RR = { t: t-t/2 t: tt/2 }

    Ejemplo: En 10 mediciones sobre la resistencia de un alambre, se obtuvieron los siguientes resultados:X = 10.48 y S= 1.36.Suponiendo que la variable aleatoria X que representa a las mediciones sigue una distribucin normalcon media y varianza 2 desconocida, probar la hiptesis nula H0: =10 versus H1: > 10, al nivelde significacin = 0.01Solucin:Siendo la varianza poblacional desconocida y la muestra pequea, la estadstica de prueba es T =

    X

    s n

    0 la cual tiene distribucion t con 9 g.l.

    El valor calculado de esta estadstica de prueba es 1.1160.

    La regin crtica al nivel de significacin = 0.01 es [ ),83.1 .Como el valor de la estadstica de prueba no cae en la regin crtica, no se rechaza H 0.La muestra aleatoria no es significativa.

    PRUEBA DE HIPTESIS CON RESPECTO A LA VARIANZA CUANDO SE MUESTREA UNAPOBLACIN NORMAL

    Sean X1, X2, ..., Xn una muestra aleatoria de una distribucin normal con media desconocida yvarianza 2desconocida. Sea la hiptesis nula

    H0 : 2

    = 02

    frente a una de las siguientes alternativas:

    H1: 2< 0

    2 H1:

    2> 02

    H1: 20

    2

    La estadstica de prueba es:

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    7/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 7

    22

    0

    2

    1

    ( )n S

    la cual tiene distribucin Ji cuadrado con n1 grados de libertad.Se rechazar H0 si el valor de la estadstica de prueba se encuentra dentro de la regin de rechazo detamao , correspondiente a cada hiptesis:

    RR = { 22} RR = { 22} RR = {

    22/2 22/2 }

    Ejemplo:Un fabricante de mquinas de llenado de leche en bolsas asegura que cada una de estas mquinas llenabolsas con un contenido promedio de un litro y una varianza igual a 0.01. La varianza de una muestra de10 bolsas fue S2 = 0.02.Suponiendo que la cantidad vertida tiene distribucin normal probar la hiptesis H0:

    2 =0.01 frente aH1:

    2 >0.01, al nivel de significacin 005.

    Solucin:El valor de la estadstica de prueba es

    22

    0

    2

    1

    ( )n S=

    9 002

    0 0118

    x .

    .

    Para 005. el valor crtico de la distribucin chi cuadrado con 9 g.l. es 16.92 demodo que la regin crtica para esta prueba es 1692. , .Como el valor calculado de la estadstica de prueba cae en la regin crtica, se rechaza H 0.Las mquinas del fabricante no son muy precisas.

    PRUEBA DE HIPTESIS PARA LA PROPORCINDE UNA POBLACIN DE BERNOULLI.

    Sea X1, X2, ..., Xnuna muestra aleatoria de una poblacin de Bernoulli con media (la proporcinpoblacional de elementos que poseen cierta caracterstica de inters) y con varianza )1( . Se sabeque, cuando la muestra es grande, la proporcin muestral p de elementos que poseen la caracterstica de

    inters, tiene distribucin normal, aproximadamente, con media y varianza )1( /n. Esto es, p

    ~

    nN

    )1(,

    o lo que es lo mismo,

    Z =

    n

    p)1(

    ~N(0,1).

    Supngase que se desea probar la hiptesis nulaH0: = 0

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    8/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 8

    contra una de las siguientes alternativas:

    H1: < 0 H1: > 0 H1: 0

    En este caso, la estadstica de prueba es:

    Z =

    n

    p

    )01(0

    0

    la cual tiene distribucin normal estndar.La regin crtica de tamao , correspondiente a cada una de las hiptesis es:

    RR = { z -z} RR = { z z} RR = { z -z/2 z z/2 }

    Ejemplo:Un ministro de trabajo afirma que en su pas existe el 40% de desocupados. Con el fin de evaluar estaafirmacin se tom una muestra aleatoria de 500 personas resultando que 300 eran desocupadas. En basea la informacin obtenida Qu se puede decir acerca de la afirmacin del ministro?.Solucin:Considerando que la v.a. X definida en la poblacin y descrita por

    X = 1, si individuo es desocupado= 0, si no es desocupado

    sigue una distribuci de Bernoulli con parmetro , se trata de probarHo: =0.40 frente a H1: >0.40, con 005. .En la muestra de tamao 500, la proporcin de desocupados es p = 300/500 = 0.6

    El valor de la estadstica de prueba, si H0es verdadera, es

    Z =

    n

    p

    )01(0

    0

    = 28.9500/)6.0(4.0

    4.06.0

    Este valor es mayor que el cuantil 645.195.0 z y por tanto podemos afirmar, con un riesgo de 5%, que

    los resultados muestrales son significativos y el porcentaje de desocupados es mayor que 40%.

    PRUEBAS DE HIPTESIS PARA DOS POBLACIONES NORMALES

    PRUEBA DE H IPTESIS REFERENTE A LA I GUALDAD DE MEDI AS

    En muchas investigaciones es necesario comparar dos procedimientos diferentes; as, se comparan dosprocedimientos para fabricar componentes electrnicos, se comparan dos mtodos de enseanza, etc.Usualmente el problema se traduce en comparar las medias de dos variables aleatorias.

    La metodologa se presenta a continuacin.

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    9/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 9

    Sean X1, X2, ..., Xn1 y Y1, Y2, ..., Yn2muestras aleatorias provenientes de dos distribuciones normalesindependientes con medias 1 y 2 y varianzas 1

    2 y 22 , respectivamente. Supngase que se quiera

    probar la hiptesis nula

    H0 : 12= 0

    contra una de las siguientes alternativas:

    H1 : 12< 0 H1 : 12> 0 H1 : 120

    CASO 1.- Las varianzas poblacionales 12 y 2

    2 son conocidas.

    En este caso, la estadstica de prueba es:

    Z =

    2

    2

    2

    1

    2

    1

    2121 )()(

    nn

    XX

    la cual tiene distribucin normal estndar.La regin crtica de tamao correspondiente a cada una de las hiptesis es:

    RR = { Z: Z -z} RR = { Z: Z z} RR = { Z: Z -z/2 } { Z: Z z/2 }

    CASO 2.- Las varianzas poblacionales son desconocidas pero son iguales.

    En este caso, la estadstica de prueba es:

    T =

    )11

    (

    )()(

    21

    2

    2121

    nnS

    XX

    c

    la cual tiene distribucin t de Student con n1+ n22 grados de libertad, y donde Sc2 es el estimador

    combinado de la varianza 2.Las regiones crticas correspondientes a las hiptesis mencionadas son:

    RR = { T: T

    -t} RR = { T: T

    t} RR = {T: T

    -t/2 }

    {T: T

    t/2 }

    CASO 3.- Las varianzas poblacionales no se conocen y son diferentes.

    La estadstica de prueba que se utiliza en este caso es:

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    10/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 10

    T =

    2

    2

    2

    1

    2

    1

    2121 )()(

    n

    S

    n

    S

    XX

    cuya distribucin es t de Student conggrados de libertad, dondeges el mnimo entre (n11) y (n22).

    PRUEBAS DE HIPTESIS REFERENTES A LA IGUALDAD DE LAS VARIANZAS DE DOSPOBLACIONES NORMALES INDEPENDIENTES

    Sean X1, X2, ..., Xn1 y Y1, Y2, ..., Yn2muestras aleatorias provenientes de dos distribuciones normalesindependientes con medias desconocidas 1 y 2y varianzas desconocidas1

    2 y22 , respectivamente. Se

    desea probar la hiptesis nula

    H0 : 12

    = 22

    frente a una de las siguientes alternativas:

    H1: 12 < 2

    2 H1: 1

    2 > 22

    H1: 12 2

    2

    La estadstica de prueba que se utiliza es:

    F=S

    S

    1

    2

    2

    2

    2

    2

    1

    2

    la cual tiene distribucinFcon n11 y n21 grados de libertad.Pero, bajo la hiptesis nula, 1

    2 = 22 , entonces la estadstica se reduce a:

    F=S

    S

    1

    2

    2

    2

    La regin crtica asociada a cada una de las hiptesis alternativas es:

    RR = {f 1/f1-, n 2 -1, n 1 -1 } RR = {f f1-, n 1 -1, n 2 -1}

    RR = {f 11

    21 12 1

    fn n

    , .

    f fn n1

    21 12 2

    , .

    }

    PRUEBA DE HIPTESIS REFERENTE A LA IGUALDAD DE PROPORCIONES DE DOSPOBLACIONES INDEPENDIENTES DE BERNOULLI

  • 8/10/2019 Clase 11 Prueba o Contraste de Hiptesis

    11/11

    UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

    LIC. JUSTA CARIDAD HUAROTO SUMARI Pgina 11

    Sean X1, X2, ..., Xn1 y Y1, Y2, ..., Yn2 muestras aleatorias de sendas poblaciones de Bernoulliindependientes, con mediasp1 yp2 y varianzasp1(1p1) y p2(1p2), respectivamente. En las muestrasde tamao n1y n2sean X e Y el nmero observado de elementos que poseen la caracterstica de inters.

    Luego, las proporciones muestrales1

    1n

    Xp y

    2

    2n

    Yp tienen distribuciones muestrales que se

    comportan aproximadamente como una distribucin normal, cuando n1y n2 son grandes.Entonces, la estadstica 21 pp tiene distribucin normal con media p p1 2 y con varianza

    p p n1 1 11 + p p n2 2 21 , de modo que la variable aleatoria

    2

    22

    1

    11

    2121

    11

    n

    pp

    n

    pp

    ppppZ

    ~ N(0,1)

    Usaremos esta distribucin muestral para hacer inferencias con respecto a

    p1p2.Si se desea probar la hiptesis nula

    H0:p1p2= 0

    frente a una de las siguientes alternativas:

    H1:p1p2< 0 H1:p1p2> 0 H1:p1p20

    seguiremos el procedimiento ya conocido. Dado que bajo H0 se supone que las dos proporciones soniguales, seap =p1=p2 la proporcin comn.

    Si H0 es verdadera, la estadstica 21

    pp tiene distribucin normal con media 0 y varianza p p n1 1 11 + p p n2 2 21 = p p

    n n( )( ).1

    1 1

    1 2

    Como no se conoce el valor de p, se combina la informacin de las dos muestras para obtener elestimador combinado

    21

    2211*

    nn

    pnpnp

    .

    As, )1

    n

    1)p-(1pN(0,~

    21

    **

    21

    npp . En este caso, usaremos como estadstica de prueba

    )/1/1)(1(

    21

    **

    21

    nnppppZ

    la cual tiene distribucin normal estndar, para valores grandes de n 1 y n2.Las regiones de rechazo para cada uno de los conjuntos de hiptesis son, respectivamente,

    RR = { Z: Z -z} RR = { Z: Z z} RR = {Z: Z -z/2 Z z/2 }.