29
UNIVERSIDAD DE SAN CARLOS FACULTAD DE INGENIERÍA DEPARTAMENTO DE ESTADÍSTICA ESTADÍSTICA 2 ING. VINICIO MONZÓN AUX. SARINA ESTIMACIÓN Y PRUEBA DE HIPÓTESIS “INTRODUCCION”

Estimacion y Prueba de Hipotesis

Embed Size (px)

DESCRIPTION

Prueba de hipótesis y estimación

Citation preview

  • UNIVERSIDAD DE SAN CARLOS FACULTAD DE INGENIERA DEPARTAMENTO DE ESTADSTICA ESTADSTICA 2 ING. VINICIO MONZN AUX. SARINA

    ESTIMACIN Y PRUEBA DE HIPTESIS

    INTRODUCCION

  • La Estadstica es una disciplina prctica que evoluciona con las necesidades de acuerdo a los cambios de cada sociedad. El propsito de este trabajo es presentar el campo de la estadstica y las aplicaciones vistas en clase. Las aplicaciones del anlisis de datos y la metodologa estadstica son parte integral de la organizacin y presentacin del trabajo. Presenta la explicacin y desarrollo de cada tema (Teorema de limite central, proporciones, Estimacin, hipotes) en un entorno de aplicaciones en el que los resultados estadsticos proporcionan bases para decisiones y soluciones de los problemas. La caracterstica del trabajo es agregar gran variedad de ejemplos que se basan en datos reales al usar muchas fuentes de informacin, ya que creemos que con el uso de ejemplos reales que pueden ser aplicados en el campo de negocios, economa, ingeniera; ayudara a estimular mas el inters del alumno en el material y as todos podamos aprender la metodologa y la aplicacin de la estadstica.

    TEOREMA DEL LMITE CENTRAL Considere una poblacin normal con 100 y 100 , si aleatoriamente se

    elige una muestra de tamao 16 Cul es la probabilidad de que el valor de la

    media de la muestra este entre 90 y 110? Es decir Cul es la (90 110)P x ?

    SOLUCION Debido que la poblacin esta distribuida normalmente, la distribucin maestral de las X esta tambin distribuida de manera normal. Para encontrar probabilidades asociadas a una distribucin normal, es necesario convertir la

  • proposicin (90 110)P x en una proposicin de probabilidad que implique a

    Z para usar la tabla de la distribucin normal estndar. La distribucin maestral

    se observa en la figura siguiente, en donde (90 110)P x esta representada por

    el rea sombreada.

    90 110

    La formula para encontrar la Z correspondiente de un valor conocido de X es: La media y el error estndar de la

    media son x

    y x

    n

    . As la formula vuelve a escribirse en trminos de

    , y n :

    xx

    z

    n

    Volviendo ala ilustracin y aplicando la formula

    el puntaje z para 90 :x 90 100 10

    2.0020 5

    16

    xx

    z

    n

    el puntaje z para 100 :x 110 100 10

    2.0020 5

    16

    xx

    z

    n

    En consecuencia:

    (90 110) ( 2.00 2.00) 2(0.4772) 0.9544P x P z

    INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA CONOCIDA

    El dixido de azufre y el dixido de nitrgeno son productos secundarios del consumo de combustible fsiles. Se trata de sustancias que pueden viajar largas distancias y convertirse en cidos antes de depositarse en la forma de lluvia acidas. Los datos siguientes se obtuvieron respecto a la concentracin de dixido de azufre (microorganismos por metro cbico) en un bosque bvaro supuestamente daado por la lluvia acida a un 95%

    x

    x

    xz

  • 52.7 43.9 41.7 71.5 47.6 55.1 62.2 56.5 33.4 61.8 54.3 50.0 45.3 63.4 53.9 65.5 66.6 70.0 52.4 38.6 46.2 44.4 60.7 56.4

    52.8 SOLUCION: Una calculadora estadstica proporciona los valores siguientes:

    53.9166x 10.0737s 2 101.4797s

    -2.069 2.069

    La participacin de la curva es necesaria para encontrar un intervalo de confianza de 95% de la media de concentracin de dixido de azufre en ese bosque. Los lmites de confianza del intervalo son:

    2

    / 53.92 2.069(10.07) / 24x t s n

    En otras palabras, se tiene confianza de 95% de que la concentracin media de dixido de azufre en el bosque referido se ubica en el intervalo (49.67, 58.17). la concentracin promedio de esta compuesto en reas no daadas del pas es de 20g/m3. Puesto que se trata de un valor no incluido en el intervalo, existen altos de dixido de azufre en el bosque daado.

    INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZA IGUALES PERO DESCONOCIDAS

    Vamos a demostrar el procedimiento de estimacin para un estudio de muestras que realizo el banco prosperidad. Unas muestras aleatorias independientes de saldos de cuenta de cheques para clientes de dos de sus sucursales dieron los siguientes resultados

  • Sucursal Cantidad de cuentas de

    cheques

    Media de la muestra de

    saldos

    Desviacin estndar de la

    muestra

    Norte 12 X1 = $1000 S1 = $ 150

    Sur 10 X2 = $ 920 S2 = $ 120

    Con estos datos determinaremos un intervalo de confianza del 90% para la diferencia entre las medias de los saldos de las dos sucursales. Suponemos que estos saldos se distribuyeron normalmente en ambas sucursales, y que las varianzas de los mismos son iguales en ambas sucursales. Al aplicar la ecuacin vemos que el estimado combinado de la varianza poblacional es:

    2 22 1 1 2 2

    1 2

    ( 1) ( 2)

    2

    n s n ss

    n n

    2 2(11)(150) + (9)(120)

    12 10 2

    18,855

    -1.725 1.725

    El estimado correspondiente de la desviacin estndar de 1 2x x

    es

    1 2

    2

    1 2

    1 1x x

    s sn n

    1 118,855

    12 10

    58.79

    La distribucin t para el procedimiento de estimacin de intervalo tiene

    1 2n n 2 12 10 2 20 grados de libertad. Con .052

    0.10, 1.725.t t As, al

    aplicar la ecuacin:

  • 1 21 2

    .05 x xx x t s

    Vemos que el estimado del intervalo es

    1000 920 (1.725)(58.79)

    80 101.41

    Con 90% de nivel de confianza, el estimado del intervalo de la diferencia entre las medias de los saldos en las dos sucursales es de -$21.41 a $181.41 dlares. El hecho de que en este intervalo haya un margen negativo de valores indica

    que la diferencia real 1 2 entre las dos medias puede ser negativa. As, 2

    puede ser, en realidad, mayor que 1 lo que indica que la media de la poblacin

    de saldos puede ser mayor en la sucursal sur, aun cuando los datos de las muestras indican una media mayor para la sucursal norte. El hecho de que el intervalo de confianza contenga al valor 0 se puede interpretar como una indicacin de que no tenemos la evidencia suficiente para afirmar que la media de las poblaciones de los saldos es diferente para las dos sucursales.

    LIMITE DE TOLERANCIA

    Como parte de un proyecto ms grande para estudiar el comportamiento de paneles como recubrimiento esforzado, un componente estructural que se utiliza de manera extensa en Norteamrica en el articulo time-Dependent Bending Properties of Lumber (J. of Testing and Eval; 1996: 187-193) aparecen varias propiedades mecnicas de especmenes de madera de pino escocs. Considere las observaciones siguientes acerca del modulo de elasticidad (MPa) obtenido un minuto despus de cargar en cierta configuracin:

  • 10490 16620 17300 15480 12970 17620 13400 13900 13630 13260 14370 11700 15470 17840 14070 14760

    Donde 16n , 14532.5x , 2055.67s , para un nivel de confianza de 95%, in intervalo de tolerancia bilateral en e que se capta por lo menos 95% de los valores del modulo de elasticidad para especimenes de madera en la poblacin muestreada utiliza el valor critico de tolerancia de 2.903. El intervalo resultante es:

    (x Valor critico de tolerancia) s

    14532.5 (2.903)(2055.67)

    14532.5 5967.6 (8564.9,20500.1)

    Se puede estar altamente confiado de que por al menos 95% de los especmenes de madera tienen valore de modulo de elasticidad entre 8564.9 y

    20500.1.

    -2.903 2.903

    INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZA NO IGUALES Y DESCONOCIDA

    Acme Ltd. Vende dos tipos de amortiguadores de caucho para coches de bebes. Las pruebas de desgaste para medir la durabilidad revelaron que 13 amortiguadores del tipo 1 duraron un promedio de 11.3 semanas con una desviacin estndar de 3.5 semanas; mientras que 10 del tipo 2 duran un promedio de 7.5 semanas , con una desviacin estndar de 2.7 semanas. El tipo 1 es el mas costoso para fabricar y el CEO (Director Ejecutivo) de Acme no desea utilizarlo a menos que tenga un promedio de duracin de por lo menos

  • ocho semanas mas que el del tipo 2.El CEO tolerara una probabilidad de error de solo el 2 % .No existe evidencia que sugiera que las varianzas de la duracin de los dos productos sean iguales.

    1 11.3x 2 7.5x

    1 13n 2 10n

    1 3.5s 2 2.7s

    2 2

    1 1 2 2

    2 2 2 2

    1 1 1 2 2 2

    ( / / ). .

    ( / ) /( 1) ( / ) /( 1)

    s n s ng l

    s n n s n n

    22 2

    2 22 2

    (3.5) /13 (2.7) /10

    (3.5) /13) (2.7) /10)

    12 9

    20.99 20

    Un intervalo de confianza del 98% ( 0.02) con 20 . .g l requiere un valor t de

    2.528 .

    -2.528 2.528

    I.C. para 2 2

    1 2

    (3.5) (2.7)(11.3 7.5) 2.528

    13 10

    3.8 3.3

    1 20.5 7.1 Semanas

    Interpretacin Acme puede estar 98% seguro de que el tipo uno dura entre 0.5 y 7.1 semanas mas que el tipo 2. Debido a que la diferencia requerida de ocho semanas no esta en el intervalo, el CO puede estar 98% seguro de que no desea utilizar el tipo 1.

    INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL Las empresas de bsqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y asegurar talento para la alta gerencia. Tales firmas denominadas cazadoras de cabeza son responsables de la ubicacin de muchos de los mejores directores ejecutivos de la nacin. Business Week reporto recientemente que uno de cuatro directores ejecutivos es una persona de fuera un ejecutivo con menos de 5 aos en la compaa que maneja-. Si en una muestra de 350 compaas de los Estados Unidos, 77 tienen directores ejecutivos de fuera, un intervalo del 99% de confianza apoyara la afirmacin?

  • SOLUCION:

    -2.58 2.58

    770.22

    350p

    (0.22)(0.78)0.022

    350ps

    Entonces el intervalo de confianza esta dado por:

    0.22 (2.58)(0.022)

    pp Zs

    Por lo tanto:

    0.163 0.277 Interpretacin: se confa en que al nivel del 99% entre el 16.3% y el 27.7% de las empresas de Estados Unidos tienen directores ejecutivos de fuera. La afirmacin esta apoyada por tales descubrimientos, ya que el 25% esta contenido dentro del intervalo.

    INTERVALO DE CONFIANZA PARA MEDIA CON VARIANZA Los datos siguientes de la tensin disruptiva de circuitos forzados elctricamente se leyeron de una grafica de probabilidad normal que apareci en el articulo Damage of Flexible Printed Boards Associated with lightning-Induced Voltaje Sugers(IEEE Transaction on Components Gybrids, and manuf. Tech, 1985:214-220). La linealidad de la grafica respaldo la su pocin de que la tensin disruptiva tiene una distribucin aproximadamente normal.

    1470 1510 1690 1740 1900 2000 2030 2100 2190

  • 2200 2290 2380 2390 2480 2500 2580 2700

    Sea 2 la varianza de la distribucin de la tensin disruptiva. El valor calculado

    de la varianza maestral es de 2s = 137324.3, la estimacin puntual de 2 . Con n-

    1 =16, 95% grados de libertad, un IC de 95% requiere 20.975,16 6.908x y

    2

    0.025,16 28.845x .

    El intervalo es

    16(137324.3) 16(137324.3), (79172.3,318064.4)

    28.845 6.908

    Al sacar la raz cuadrada de cada punto extremo se obtiene (276.0, 5640.0) como el IC de 95 % para . Estos intervalos son bastantes amplios, lo que refleja variabilidad sustancial en la tensin disruptiva en combinacin con unja tamao de muestrea pequeo.

    DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES: MUESTRAS

    APAREADAS Una empresa manufacturera tiene dos mtodos con lo que sus obreros pueden realizar una tarea de produccin. Para maximizar la produccin, la empresa desea identificar el mtodo con la menor media del tiempo de terminacin por

    unidad. Sea 1 la media del tiempo de terminaci0on del mtodo 1 y 2 la

    correspondiente para el mtodo 2. Sin haber indicacin preliminar del mtodo preferido, comenzaremos, tentativamente, suponiendo que los dos mtodos de produccin tienen la misma media de tiempo de terminacin. As, la hiptesis

  • nula H0: 1 2 0 , si se rechaza esta, podemos concluir que las medias de los

    dos tiempos de terminacin son distintas. En este caso se recomendara el mtodo que tenga la menor media de tiempo de terminacin. La hiptesis nula y alternativa se escribira as:

    H0: 1 2 0

    Ha: 1 2 0

    Para elegir el procedimiento de muestreo que se usara para recopilar los tiempos de produccin y probar las hiptesis tenemos dos opciones de diseos alternativos. Uno se basa en muestras independientes y el otro en muestras apareadas.

    1. diseo con muestras independientes: se selecciona una muestra aleatoria simple y cada uno de ellos usa el mtodo 1. se selecciona una segunda muestra independiente de obreros y cada una de ellas usa el mtodo dos.

    2. diseo con m muestras apareadas: se selecciona una muestra aleatoria simple de obreros. Cada uno de ellos usa primero un mtodo y despus el otro. El orden de los mtodos se asigna al azar a los obreros. Algunos de ellos siguen el primer mtodo y otros el mtodo dos. Cada obrero produce un par de valores, uno para el mtodo uno y el otro para el mtodo dos.

    En el diseo con muestras apareadas se prueban los dos mtodos de produccin bajo condiciones similares (es decir , con los mismos obreros); por consiguiente, este diseo conduce, con frecuencia, a un error muestral que el diseo con muestra independiente. El motivo principal es que un diseo con muestras apareadas se elimina la variacin entre obreros como fuente del error muestral. La clave para analizar el diseo con muestras apareadas es tener en cuenta que solo se considera la columna de las diferencias. En consecuencia, tenemos seis datos (.6, .5, -.2, .5, .3, 0, .6) que usaremos para analizar la diferencia entre las medias de los dos mtodos de produccin.

    Sea d la media de las diferencias para la poblacin de los obreros. Con

    esta notacin, las hiptesis nula y alternativa se expresan como sigue:

    H0: 0d

    Ha: 0d

    Si se rechaza H0, se llega ala conclusin de que las medias de los tiempos de terminacin son distintas. La notacin d es para recordar que la muestra apareada produce datos de

    diferencia. La media y la desviacin estndar de la muestra de los seis valores son los siguientes:

    1.8.30

    6

    idd

    n

    2( ) .56.335

    1 5

    i

    d

    d ds

    n

  • La poblacin tiene una distribucin normal, y se puede aplicar la distribucin

    t con 1n grados de libertad para probar la hiptesis nula acerca d un

    promedio poblacional. Con datos de diferencia, el estadstico de pruebas es:

    d

    d

    dt

    s

    n

    Con .05 y 1 5n grados de libertad .025( 2.571)t , la regla de rechazo

    para la prueba bilateral es

    Rechazar Ho si 2.571t o si 2.571t

    Como .30d , .335ds y 6n , el valor de estadstico de prueba para la

    hiptesis nula H0: 0d es

    .30 02.19

    .3356

    d

    d

    dt

    s

    n

    En vista que 2.19t no esta en la regin de rechazo, los datos de las

    muestras no proporcionan pruebas suficientes para rechazar la hiptesis nula. Con los resultados de la muestras podemos definir un estimado de intervalo de la diferencia entre las medidas de poblacin, con la metodologa para poblacin nica. Los clculos son:

    2

    dsd tn

    .3350.3 2.571

    6

    0.3 .35 En consecuencia, el intervalo de confianza de 95% de la diferencia entre las medias de los dos mtodos de produccin es de -0.05 minutos asta 0.654 minutos, observe que como el intervalo de confianza abarca el valor de cero, los datos de la muestra no aportan pruebas suficientes para rechazar la Ho

    INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS PROPORCIONES

    Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno del da es diferente al de los trabajadores del turno de la noche. Se realiza una comparacin de 150 trabajadores de cada turno. Los resultados muestran que 37 trabajadores diurnos han estado ausentes por lo menos 5 veces durante el ao anterior, mientras que 52 trabajadores nocturnos han faltado por lo menos 5 veces Qu relevantes que revelan estos datos sobre la tendencia al ausentismo entre los trabajadores? Calcule un intervalo de

  • confianza al 90% para la diferencia entra las proporciones de trabajadores de los dos turnos que faltaron 5 veces o mas.

    1

    2

    370.25

    150

    520.35

    150

    p

    p

    1 2

    (0.25)(0.75) (0.35)(0.65)0.0526

    150 150p ps

    Entonces nuestro intervalo de confianza para dos proporciones esta dado por:

    1 21 2 1 2 p p

    p p Zs

    Donde:

    1 2

    1 2

    (0.25 0.35) (1.65)(0.0526)

    0.10 0.087

    Por tanto 18.7% 1.3%

    Debido a que lo proporcin de los trabajadores nocturnos que se ausentaron cinco veces o mas (p2 ) se resto de la proporcin de trabajadores diurnos que se ausentaron, la empresa puede puede estar 90 % segura

    INTERVALO DE CONFIANZA PARA MEDIA CON MUESTRAS GRANDES La tensin disruptiva de corriente alterna (CA) de un liquido aislante indica su resistencia dielctrica .en el articulo Testing practice for the AC Breakdown Voltaje TESTING OF Insulation liquis(IEEE Electrical insulation magazine, 1995;21-26) se dan las siguientes observaciones mustrales acerca de la tensin disruptiva (kn) de un circuito particular en ciertas condiciones.

    62 50 53 57 41 53 55 61 59 64 50 53 64 62 50 68 54 55 57 50 55 50 56 55 46 55 53 54 52 47 47 55 57 48 63 57 57 55 53 59 53 52 50 55 60 50 56 58

  • Un diagrama de caja de los datos muestra una concentracin alta en la mitad media de los datos (extensin del cuadro estrecho) .Hay un solo valor atpico en el extremo superior ,pero en realidad este valor esta un poco mas cerca de la media (55) de lo que esta observacin muestra mas pequea.

    Las cantidades del resumen con n= 48 2626xi

    y 2 144950xi , de

    las cuales 54.7x y 5.23s . Entonces el intervalo de confianza de 95 % es

    5.23

    54.7 1.96 54.7 1.5 5.23,56.248

    Es decir, 53.2 56.2

    Con un nivel de confianza de aprox. 95%.El intervalo es razonablemente estrecho lo cual indica que se estimo con precisin el valor de .

    Infortunadamente, la eleccin del tamao de la muestra para producido una extensin de intervalo deseado no es tan directa aqu como lo fue para el caso

    de conocida. Esto porque la extensin de (7.8) es 2

    2 .z s n Puesto que el

    valor no de s no esta disponible antes de reunir los datos, la extensin del intervalo no se puede determinar solo mediante la eleccin de n .la nica opcin para un investigador que desee especificar una extensin deseada es hacer una su pocin con base en la experiencia en cuanto a cual podra ser el valor de s. Si se es conservador y se supone un valor mas grande de s, se elegir una n mas grande de lo necesarios posible que el investigador pueda especificar un valor razonablemente preciso del intervalo poblacional (la diferencia entre valores mximos y mnimos).Entonces, si la distribucin de la poblacin no esta demasiado sesgada, al dividir el intervalo entra 4 se obtiene un valor aproximado de cual podra ser s.

    -1.96 1.96

    INTERVALO DE CONFIANZA PARA MEDIA CON MUESTRAS PEQUEAS. Como parte de un proyecto mas grande para estudiar el comportamiento de paneles con recubrimiento esforzado, un componente estructural que se utiliza de manera extensa en Norteamrica, en el articulo Times-Dependent Bending propertiel of lumber (J. of Testing and Eval., 1996:187-193) aparecen varias propiedades mecnicas de especmenes de madera de pino escocs. Considere las observaciones siguientes acerca del modulo de elasticidad (MPa) obtenido un minuto despus de cargar en cierta configuracin:

    10490 16620 17300 15480 12970 17620 13400 13900

  • 13630 13260 14370 11700 15470 17840 14070 14760 El calculo a mano de la media muestral u la desviacin estndar se simplifico al

    restar 10000 de cada observacin: 10000.i iy x Se comprueba con facilidad

    que 72520yi y 2 392083800,yi de donde 4532.5y y 2055.67ys . Por

    consiguiente, 14532.5x y 2055.67xs (sumar o restar la misma constante de

    cada observacin no afecta la variabilidad). El tamao de la muestra es 16, as que un intervalo de confianza para la media poblacional de l modulo de elasticidad se basa en 15 gl. Un intervalo de confianza de 95% para un intervalo bilateral requiere el valor crtico t de 2.131. El intervalo resultante es

    0.025,15

    2055.6714532.5 (2.131)

    16

    sx t

    n

    14532.5 1095.2 (13437.3,15627.7)

    Este intervalo es bastante amplio por el tamao de la muestra pequea y por la gran cantidad de variabilidad en la muestra. Un lmite de confianza inferior de 95 % se obtiene al usar 1.753y en lugar de 2.131y , respectivamente.

    -2.131 2.131

    PRUEBA DE HIPTESIS PRUEBA DE HIPTESIS CON VARIANZA CONOCIDA Un fabricante de sistemas rociadores utilizados para proteccin contra incendios en edificios de oficinas afirma que la temperatura promedio real de activacin del sistema es 130 C,. Una muestra de n = 9 sistemas, cuando se prueban ,

    produce una temperatura promedio muestral de activacin de 131.08 F. si la distribucin de los tiempos de activacin es normal con desviacin estndar de 1.5 F. los datos contradicen del fabricante al nivel de significancia de

    =0.01 ?

  • Solucin: 1) Parmetro de inters: temperatura de activacin

    2) Hiptesis nula: Ho: 130 ( valor nulo = 0 130)

    3) Hiptesis alterna Ha: 130 ( una desviacin con respecto al valor afirmado en cualquier direccin de inters)

    -2.58 2.58

    4) valor del estadstico de prueba:

    0 130z=1.5

    x x

    n n

    5) Regin de rechazo: la forma de Ha implica el uso de una prueba de dos extremos con regin de rechazo ya sea Z Z0.005 o bien Z -Z0.005. De la tabla da que Z0.005 = 2.58, as que se rechaza Ho si Z 2.58 o Z -2.58

    6) sustituyendo 9n y 131.08x

    131.08 130 1.08z= 2.16

    1.5 0.59

    7) El valor calculado 2.16z no cae en la regin de rechazo

    ( -2.58

  • Ha: 16 Si se rechaza Ho, el gerente de produccin pedir detener el proceso de produccin, y ajustar el mecanismo de control de los pesos de llenando para asegurar que el peso promedio sea de 16 onzas. Si la muestra produce valores de 16.02, 16.22, 15.82, 15.92, 16.22, 16.32, 16.12, 15.92 onzas, y el nivel de significancia es de 0.05. Qu accin se debe emprender? Suponga que la poblacin de los pesos de llenado se distribuye normalmente

    128.5616.07

    8

    ixx

    n

    onzas

    Y

    2( ) 0.220.18

    1 7

    ix xs

    n

    onzas

    Se procede a calcular la media y desviacin estndar de la muestra

    16.07x onzas , 0.18s onzas

    -2.365 2.365 A un nivel de significancia de 0.05 , los estadsticos t0.025 y t0.025 determinan la regin de rechazo de la prueba. Consultando la tabla de distribuciones t y vemos que con n-1 = 7 grados de libertad. t0.025 = -2.365 y t0.025 = 2.365. As , la regla de rechazo que resulta es :

    RECHAZAR Ho si t < -2.365 o si t > 2.365

    Usando 16.07x onzas , 0.18s onzas tenemos que

    16.07 16.001.10

    0.188

    oxts

    n

  • Como t = 1.10 no esta en la regin de rechazo, no se puede rechazar la hiptesis nula. No existen las pruebas suficientes para detener el proceso de produccin. PRUEBA DE HIPOTEIS CON VARIANZAS IGUALES Y CONOCIDAS El anlisis de una muestra aleatoria que consiste en m=20 especmenes de acero roldado e frio para determinar las resistencias de cadencia, produjeron

    una resistencia promedio muestral de 29.8x Klb/pulg. Una segunda muestra aleatoria de n=25 especmenes promedio de acero galvanizado bilaterales

    proporciono una resistencia promedio muestral de 34.7y Klb/pulg. Suponiendo

    que las dos distribuciones de resistencia a la cadencia promedio reales

    correspondientes 1 y 2

  • Son diferentes? Se lleva a cabo una prueba al nivel de significacin de 1%.

    1. el parmetro de inters es 1 2 , la diferencia entre las resistencias

    promedio reales para los dos tipos de acero.

    2. la hiptesis nula es H0: 1 2 =0.

    3. la hiptesis alternativa es Ha: 1 2 0; si Ha es verdadera, entonces

    1 y 2 son diferentes.

    -2.58 2.58

    4. el valor estadstico de prueba es:

    2 2

    1 2

    x yz

    m n

    5. la desigualdad en Ha implica que la prueba es de dos extremos. Para un

    nivel de significancia del 1%, 2 0.005

    y 0.0052

    2.58.z z Ho se rechazara

    si 2.58z o si 2.58z .

    6. la sustitucin de m=20, X=29.8

    29.5 34.7 4.903.66

    1.3416.0 25.0

    20 25

    z

    7. Puesto que 3.66 2.58 z cae en el extremo inferior de la regin

    de rechazo. Por lo tanto se rechaza la hiptesis nula al nivel de

    0.01 a favor de la conclusin de que 1 2 . Los datos muestrales

    sugieren fuertemente que la resistencia a la cadencia promedio real para el acero roldado en frio difiere de la del acero galvanizado. El valor de P para esta prueba P dice que se debe rechazar la hiptesis nula a cualquier nivel de significancia razonable.

  • PRUEBA DE HIPOTESIS ACERCA DE LA VARIANZA Una variable aleatoria estudiada durante el diseo de la media-flecha de traccin delantera de un nuevo modelo de automvil es el desplazamiento en milmetros de las juntas de velocidad constante. Con el Angulo de las juntas fijo en 12, se realizan 20 simulaciones y se obtienen los datos siguientes: 6.2 1.9 4.4 4.9 3.5 4.6 4.2 1.1 1.3 4.8 4.1 3.7 2.5 3.7 4.2 1.4 2.6 1.5 3.9 3.2

    En relacin con estos datos, 3.39x y 1.41s . los ingenieros de diseo de la media-flecha afirman que la desviacin estndar en el desplazamiento de las flechas de velocidad constante es menor de 1.5mm. la desviacin estndar

  • estimada con base a las 20 observaciones es de 1.41mm. acaso los datos sustenta la afirmacin de los ingenieros? A fin de responder la pregunta, se supone a prueba:

    : 1.5

    : 1.5

    Ho

    Ha

    Lo anterior es equivalente a: 2 2

    2 2

    : (1.5)

    : (1.5)

    Ho

    Ha

    El valor observado de la estimaron de la estadstica de prueba es:

    2 2

    22

    0

    1 19(1.41)16.79

    1.5

    n s

    Puesto que se trata de una prueba de cola izquierda, se rechaza la hiptesis nula si el valor es demasiado bajo para haber ocurrido al azar cuando la hiptesis nula es verdadera. Con base a la tabla de ji cuadrada, pueden verse que:

    2

    19 14.6 0.25P X y 2

    19 18.3 0.50P X

    El valor observado de la estadstica de prueba, 16.79, se ubica entre 14.6 y 18.3, por lo que el valor de P de la prueba se sita entre 0.25 y 0.5. este ultimo es mas bien alto, por lo que resulta imposible rechazar la hiptesis nula. Los datos son insuficientes para afirmar que 1.5 mm.

    PRUEBA DE HIPTESIS SOBRE UNA PROPORCIN. La mayor parte de las fallas en las lneas de transmisin resulta de factores externos y suelen ser transitoria. Se piensa que mas de 70 % de esas fallas de debe a relmpagos. A de obtener datos que sustenten esa afirmacin, se ponen a prueba:

    0.7

    0.7

    Ho p

    Hi p

    Los datos recopilados durante un ao muestran que 151 de 200 fallas observadas derivan de relmpagos .El valor observado de la estadstica de prueba es:

  • 00 1/ / (151/ 200 0.7) / 0.7(0.3) /(200) 1.697o pp p p n

    1.69

    Se trata de una prueba d cola derecha, de modo que se rechaza si ese valor es inusualmente grandes fin de decidir si 1.697 es un valor positivo grande, se

    calcula el valor P . En la tabla 1.69 0.0455p Z Y 1.70 0.0446P Z normal estndar, se observa que P.

    El valor observado 1.697 se ubica entre 1.69 y 1.70, de modo que el valor P esta entre 0.0446 y 0.4455. Son dos las explicaciones de este valor P pequeo. La hiptesis nula es verdadera y se acaba de observar un evento infrecuente, que ocurre apenas unas cuatro veces por cada 100, o la hiptesis nula no es verdadera y el porcentaje verdadero de gallas que causan los relmpagos es mayor de 70 % .La ultima explicacin parece mas factible, de modo que se rechaza HO y se llega ala conclusin de que p >0.7. Este mtodo de prueba de una hiptesis de p supone que el tamao de la

    muestra es grande , y los interpretamos como n y p0 son tales que 0.5OP y

    0 5np o n 0 0.5p y 01 5p

    Estos criterios se satisfacen por 00 0.7 0.5 1

    200(0.3) 60 5yn p

    p

    PRUEBA DE HIPTESIS PARA LA COMPARACIN DE DOS PROPORCIONES.

    Una compaa tiene dos fundidoras de tamaos similar y dedicadas a las mismas operaciones de produccin. Se implanta un programa experimental de seguridad experimental en una de ellas. Antes de ampliar el programa al otra, los administradores desean comparar la proporcin de trabajadores lesionados durante el periodo de prueba en el sitio experimental contra el de la otra planta. Se piensa que el programa es rentable si las proporciones difieren en ms de 0.05, lo que se pone a prueba es:

    0 1 2 0.05H P P

  • 1 1 2 0.05H P P

    Donde 1P Y 1P denotamos las proporciones de trabajadores lesionados en

    las plantas de control y experimental, respectivamente, cometer un error tipo 1 seria costoso, por lo que se preestablece en 0.01.

    2.33

    El punto critico de esta prueba de cola derecha es de 0.01Z = 2.33. Al

    trmino del periodo de prueba se, han lesionad 24 de 263 trabajadores en la planta de control, y apenas cinco de los 250 de la planta experimental, Con base en esos datos:

    1

    2

    24/ 263 0.91

    5/ 250 0.020

    P

    P

    1 2 0.071P P

    es esta diferencia suficientemente grande pata llegar a la conclusin de que la diferencia verdadera entre las proporciones excede de 0.05? A efecto de decidir , se evala la estadstica de prueba:

    1 2 1 2

    1 1 1 2 2 21 / 1 /

    p p P P

    p p n p p n

    =

    0.071 0.051.059

    0.091 0.909 / 263 0.2 0.98 / 250

    Este valor no excede el punto critico 2.33, por lo que se imposible rechazar la hiptesis nula con el valor =0.01 .Se carece de la evidencia que se considera necesaria para justificar la ampliacin del programa de seguridad.

    PRUEBA DE HIPTESIS CON VARIANZAS NO IGUALES, CONOCIDAS El deterioro d muchas redes de tubera municipales en todo el pais es una preocupacin creciente. Una tecnologa, propuesta para la rehabilitacin de tuberas, utiliza un revestimiento flexibles insertado en la tubera existente. En el articulo Effect of Welding on a High-Density Poltethylene Liner se proporciona los siguientes datos acerca de la resistencia a la tensin ( lb/pulg2 ) de especimenes de revestimiento cuando se utilizo cierto tipo de fusin y cuando no se uso este proceso: Sin fusin 2748 2700 2655 2822 2511

  • 3149 3257 3213 2220 2753 N1 = 10 X1 = 2902.8 S1 = 277.3 Fundido 3027 3356 3359 3297 3125 2910 2889 2902 N2 = 8 X2 = 3108.1 S2 = 205.9

    1) 1) sea 1 la resistencia promedio real a la tensin de especimenes cuando se emplea tratamiento sin fusin y 2 la resistencia promedio real a la tensin cuando se utiliza el tratamiento de fusin

    2) Ho: 1 - 2 0

    Ha: 1 - 2 < 0

    3) el valor nulo do = 0 por lo tanto el estadstico de prueba es

    2 2

    1 2

    x yz

    S S

    m n

    -1.7459

    4) ahora se calcula tanto el estadstico de prueba como los gl para la

    pruebas

    2 2

    2902.8 3108.1 205.31.8

    113.97(277.3) (205.9)

    10 08

    t

    Usando 1 / 7689.529S m y 2 / 5299.351S n 2

    2 2

    (7689.529 5299.351) 168711003.715.94

    (7689.529) / 9 (5299.351) / 7 10581747.35

    De modo que la prueba se basara en 15 grados de libertad

    5) en la tabla se muestra que el rea bajo la curva t con 15gl y = 0.05, el valor es 2.1315

  • 6) No se rechaza la hiptesis nula y se rechaza la hiptesis alterna, lo que confirma la conclusin expresada en el artculo a un nivel significancia del 0.05

    CONCLUSIONES

    De acuerdo con lo anterior realizado podemos concluir que: La Estadstica es mas que las matemticas presentes en las formulas y los datos. Incluye los procesos de resolucin de

  • problemas, pensamiento estadstico, recoleccin de datos, obtencin de resultados numricos y grficos y las conclusiones de tales

    resultados. Existen muchas pruebas de hiptesis que tienen como objetivo la toma de decisiones. Y por eso la conclusin de rechazar Ho proporciona el apoyo estadstico para llegar a la conclusin de que Ha es verdadera y que es adecuado realizar la accin que proceda. La afirmacin de no rechazar Ho aunque no es concluyente, con frecuencia hace que los datos se comporten como si Ho fuera verdadera. El valor de p que es el nivel de significancia, es una medida de la posibilidad de obtener los resultados de la muestra cuando se supone que la hiptesis nula es verdadera. Cuando el valor de p es menor es menos probable que los resultados de la muestra provengan de un caso en que la hiptesis nula es verdadera. Y as los estudiantes sacamos la conclusin sin consultar las tablas estadsticas. La estadstica aplica tcnicas matemticas para cuantificar las ideas que se estn investigando y para reducir la informacin a un formato numrico, el que este se pueda tratarse la grafica o algebraicamente

    GLOSARIO

    Estimado del intervalo Un estimado de un parmetro de poblacin que define un intervalo dentro del que se cree esta contenido el valor parmetro Nivel de confianza

  • Es la confianza asociada con un estimado de intervalo Margen de error El valor sumado a y restado de un punto estimado a fin de determinar un intervalo de confianza. Distribucin t Una familia de distribuciones de probabilidades que se puede usar para determinar estimados de intervalo de una media de poblacin cuando se desconozca la desviacin estndar de la poblacin, y que este tenga una distribucin normal o casi normal de probabilidades. Grados de Libertad Un parmetro de la distribucin t. cuando se usa la distribucin t para determinar un estimado de intervalo de una media poblacional, n-1 grados de libertad, siendo n el tamao de la muestra aleatoria simple. Hiptesis Nula La hiptesis que se supone, tentativamente, es verdadera en el procedimiento de prueba de hiptesis. Hiptesis Alternativa La hiptesis que se concluye como verdadera cuando se rechaza la hiptesis nula. Error Tipo I El error de rechazar Ho siendo esta verdadera. Error Tipo II El error de aceptar Ho siendo esta falsa. Valor Crtico Un valor que se compara con el estadstico de prueba para determinar si se debe rechazar o no Ho. Valor p La probabilidad de que cuando sea verdadera la hiptesis nula se obtenga un resultado de una muestra que sea al menos tan

  • improbable como el que se observa. Con frecuencia se le conoce como nivel de significancia

    BIBLIOGRAFIA

  • Arnold, Jesse C. Milton, J. Susan Probabilidad y Estadstica con aplicaciones para ingeniera y ciencias computacionales. Cuarta edicin, Editorial Mc Graw Hill, Mxico, paginas 225-244, 312-325, 336-349. Johnson Robert, Kuby Patricia, Estadstica Elemental lo esencial. 2da edicin, Editorial Thomson, Mxico, paginas 263-270, 270-277, 284, 288, 299, 307, 321. Williams Anderson Sweeney Estadstica para Administracin y Economa. 7ma. Edicin, volumen II, Editorial Thomson, Mxico, paginas 1-37, 37-93, 94-135, 135-158.