30
 Parte 2 Intervalos de confianza Prof. María B. Pintarelli 153 9- Intervalos de confianza 9.1 – Introducción Se ha visto como construir a partir de una muestra aleatoria un estimador puntual de un parámetro desconocido. En esos casos necesitábamos dar algunas características del estimador, como por ejemplo si era insesgado o su varianza. A veces resulta más conveniente dar un intervalo de valores posibles del parámetro desconocido, de manera tal que dicho intervalo contenga al verdadero parámetro con determinada probabilidad. Específicamente, a partir de una muestra aleatoria se construye un intervalo 2 1 ˆ , ˆ Θ Θ  donde los extremos 1 ˆ Θ  y 2 ˆ Θ  son dos estadísticos, tal que ( ) ( )  α θ  = Θ Θ 1 ˆ , ˆ 2 1  P  donde θ  es el parámetro desconocido a estimar y α  es un valor real entre cero y uno dado de antemano. Por ejemplo si 05 . 0 = α , se quiere construir un intervalo ( ) 2 1 ˆ , ˆ Θ Θ  tal que ( ) ( ) 95 . 0 ˆ , ˆ 2 1  = Θ Θ θ  P , o escrito de otra forma ( ) 95 . 0 ˆ ˆ 2 1  = Θ Θ  θ  P  Esta probabilidad tiene el siguiente significado: como 1 ˆ Θ  y 2 ˆ Θ  son estadísticos, los valores que ellos toman varían con los valores de la muestra, es decir si n  x  x  x ,..., , 2 1  son los valores medidos de la muestra entonces el estadístico 1 ˆ Θ  tomará el valor 1 θ  y el estadístico 2 ˆ Θ  tomará el valor 2 θ . Si medimos nuevamente la muestra obtendremos ahora valores , , 2 ´, 1 ,..., , n  x  x  x  y por lo tanto 1 ˆ Θ  toma- rá el valor , 1 θ  y el estadístico 2 ˆ Θ  tomará el valor , 2 θ , diferentes en general de los anteriores. Esto significa que si medimos la muestra 100 veces obtendremos 100 valores diferentes para 1 ˆ Θ  y 2 ˆ Θ  y por lo tanto obtendremos 100 intervalos distintos, de los cuales aproximadamente 5 de ellos no contendrán al verdadero parámetro. Al valor α 1  se lo llama nivel de confianza del intervalo. También se suele definir como nivel de confianza al ( ) % 100 1  α  La construcción repetida de un intervalo de confianza para µ  se ilustra en la siguiente figura µ  

Important Ees Tad

Embed Size (px)

DESCRIPTION

estadistica

Citation preview

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    153

    9- Intervalos de confianza

    9.1 Introduccin

    Se ha visto como construir a partir de una muestra aleatoria un estimador puntual de un parmetro

    desconocido. En esos casos necesitbamos dar algunas caractersticas del estimador, como por

    ejemplo si era insesgado o su varianza.

    A veces resulta ms conveniente dar un intervalo de valores posibles del parmetro desconocido,

    de manera tal que dicho intervalo contenga al verdadero parmetro con determinada probabilidad.

    Especficamente, a partir de una muestra aleatoria se construye un intervalo ( )21 , donde los extremos 1 y 2 son dos estadsticos, tal que ( )( ) = 1, 21P donde es el parmetro desconocido a estimar y es un valor real entre cero y uno dado de antemano. Por ejemplo si

    05.0= , se quiere construir un intervalo ( )21 , tal que ( )( ) 95.0, 21 =P , o escrito de otra forma ( ) 95.0 21 = P Esta probabilidad tiene el siguiente significado: como 1 y 2 son estadsticos, los valores que

    ellos toman varan con los valores de la muestra, es decir si nxxx ,...,, 21 son los valores medidos de

    la muestra entonces el estadstico 1 tomar el valor 1 y el estadstico 2 tomar el valor 2 . Si

    medimos nuevamente la muestra obtendremos ahora valores ,,

    2

    ,

    1 ,...,, nxxx y por lo tanto 1 toma-

    r el valor ,

    1 y el estadstico 2 tomar el valor ,

    2 , diferentes en general de los anteriores. Esto

    significa que si medimos la muestra 100 veces obtendremos 100 valores diferentes para 1 y 2 y por lo tanto obtendremos 100 intervalos distintos, de los cuales aproximadamente 5 de ellos no

    contendrn al verdadero parmetro.

    Al valor 1 se lo llama nivel de confianza del intervalo. Tambin se suele definir como nivel de confianza al ( ) %1001 La construccin repetida de un intervalo de confianza para se ilustra en la siguiente figura

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    154

    9.2 Intervalo de confianza para la media de una distribucin normal, varianza conocida.

    El mtodo general para construir intervalos de confianza es el siguiente llamado mtodo del pivo-

    te:

    Supongamos el siguiente caso particular, sea ( )nXXX ,...,, 21 una muestra aleatoria de tamao n de una v.a. X donde ),(~ 2NX , 2 conocido, se quiere construir un intervalo de confianza para de nivel 1 . Supongamos 05.0= .

    1- tomamos un estimador puntual de , sabemos que X= es un estimador con buenas propie-dades.

    2- a partir de X= construimos el estadstico

    n

    XZ

    = . Notar que Z (pivote) contiene al ver-

    dadero parmetro y que bajo las condiciones dadas )1,0(~ NZ 3- como conocemos la distribucin de Z, podemos plantear: hallar un nmero z tal que

    ( ) 95.0= zZzP Por la simetra de la distribucin normal estndar podemos escribir

    ( ) ( ) ( ) ( ) 95.012 === zzzzZzP ( ) 975.0= z 96.1=z

    Por lo tanto ( ) 95.096.196.196.196.1 =

    =

    n

    XPZP

    Despejamos :

    95.096.196.196.196.1

    96.196.196.196.1

    =

    +=

    =

    =

    =

    nX

    nXPX

    nX

    nP

    nX

    nP

    n

    XP

    Entonces

    95.096.1;96.196.196.1 =

    +=

    +

    nX

    nXP

    nX

    nXP

    Es decir el intervalo de confianza para es

    +

    nX

    nX

    96.1;96.1 y tiene nivel de confian-

    za 0.95 o 95%.

    Aqu n

    X

    96.1 1 = y n

    X

    96.1 2 +=

    Repetimos el procedimiento anterior y construimos un intervalo de confianza para con nivel de confianza 1

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    155

    1-Partimos de la esperanza muestral =

    =n

    iXn

    X11

    1 para una muestra aleatoria ( )nX,...,X,X 21 de

    tamao n. Sabemos que es un estimador insesgado y consistente de .

    2-Construimos el estadstico

    N~n/

    XZ

    = (0,1)

    La variable aleatoria Z cumple las condiciones necesarias de un pivote

    Para construir un intervalo de confianza al nivel de confianza 1- partiendo del pivote Z, comen-

    zamos por plantear la ecuacin

    ( ) = zZzP 1- ,

    donde la incgnita es el nmero real z.

    Si reemplazamos la v.a. Z por su expresin tenemos:

    =

    +=

    =

    n

    zX

    n

    zXP

    n

    zX

    n

    zPz

    n/

    XzP 1-

    Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)

    llegamos a:

    =

    +

    n

    zX

    n

    zXP 1-

    Evidentemente, si definimos

    +=

    =

    nzX

    nzX

    2

    1

    , hemos construido dos estadsticos 1 y 2 tales que ( )= 21 P 1- ,

    es decir hemos construido el intervalo de confianza bilateral deseado [ ]21 , . Todos los elemen-tos que forman los estadsticos 1 y 2 son conocidos ya que el nmero z verifica la ecuacin anterior, es decir (ver figura):

    z

    2

    z 2

    z

    2

    2

    2

    zz =

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    156

    ( ) ( ) ( )zzzZzP = =1- donde ( )z es la Fda para la v.a. N~Z (0,1)

    Recordando que ( ) ( )zz = 1 , esta ecuacin queda: ( ) ( )zz = ( ) 12 z =1- , o bien (ver figura anterior),

    ( )2

    1

    z = o de otra forma 2

    )(

    => zZP .

    Al valor de z que verifica esta ecuacin se lo suele indicar 2

    z . En consecuencia, el intervalo de

    confianza bilateral al nivel de significacin 1- queda:

    [ ]

    +=

    nzX

    nzX

    22

    21 ,,

    En consecuencia:

    Ejemplo:

    Un ingeniero civil analiza la resistencia a la compresin del concreto. La resistencia est distribui-

    da aproximadamente de manera normal, con varianza 1000 (psi)2. Al tomar una muestra aleatoria

    de 12 especmenes, se tiene que 3250=x psi. a) Construya un intervalo de confianza del 95% para la resistencia a la compresin promedio.

    b) Construya un intervalo de confianza del 99% para la resistencia a la compresin promedio.

    Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a).

    Solucin:

    La v. a. de inters es Xi: resistencia a la compresin del concreto en un espcimen i

    Tenemos una muestra de 12=n especmenes. Asumimos que ),(~ 2NX i para 12,...,3,2,1=i con 1000

    2 = a) Queremos un intervalo de confianza para de nivel 95%. Por lo tanto 05.0=

    El intervalo a utilizar es

    +

    nzX

    nzX

    22

    , .

    Buscamos en la tabla de la normal estndar el valor de 96.1025.02

    == zz

    Reemplazando:

    =

    + 89227.3267,10773.3232

    12

    100096.13250,

    12

    100096.13250

    b) repetimos lo anterior pero ahora 01.0=

    Si ( )nXXX ,...,, 21 una muestra aleatoria de tamao n de una v.a. X donde ),(~ 2NX , 2 conocido, un intervalo de confianza para de nivel 1 es

    +

    nzX

    nzX

    22

    , (8.1)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    157

    El intervalo a utilizar es

    +

    nzX

    nzX

    22

    , .

    Buscamos en la tabla de la normal estndar el valor de 58.2005.02

    == zz

    Reemplazando:

    =

    + 55207.3273,44793.3226

    12

    100058.23250,

    12

    100058.23250

    La longitud del intervalo encontrado en a) es: 35.78454

    La longitud del intervalo encontrado en b) es: 47.10414

    Notar que la seguridad de que el verdadero parmetro se encuentre en el intervalo hallado es ma-

    yor en el intervalo b) que en el a), pero la longitud del intervalo b) es mayor que la del intervalo a).

    Al aumentar el nivel de confianza se perdi precisin en la estimacin, ya que a menor longitud

    hay mayor precisin en la estimacin.

    En general la longitud del intervalo es n

    zL

    2

    2=

    Notar que:

    a) si n y estn fijos, a medida que disminuye tenemos que 2

    z aumenta, por lo tanto L

    aumenta.

    b) si y estn fijos, entonces a medida que n aumenta tenemos que L disminuye.

    Podemos plantearnos la siguiente pregunta relacionada con el ejemplo anterior: qu tamao n de

    muestra se necesita para que el intervalo tenga nivel de confianza 95% y longitud la mitad de la

    longitud del intervalo hallado en a)?

    Solucin: el intervalo hallado en a) tiene longitud 35.78454, y queremos que el nuevo intervalo

    tenga longitud 17.89227 aproximadamente. Planteamos:

    89227.171000

    96.1289227.172 2/ =nn

    zL

    Despejando n :

    4889227.17

    100096.12

    2

    nn

    O sea, hay que tomar por lo menos 84 especmenes para que el intervalo tenga la longitud pedida.

    En general, si queremos hallar n tal que ln

    zL =

    2

    2 , donde l es un valor dado, entonces

    despejando n

    2

    2

    2

    l

    z

    n

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    158

    Si estimamos puntualmente al parmetro con X estamos cometiendo un error en la estimacin

    menor o igual a n

    zL

    2

    2= , que se conoce como precisin del estimador

    Ejemplo: Se estima que el tiempo de reaccin a un estmulo de cierto dispositivo electrnico est

    distribuido normalmente con desviacin estndar de 0.05 segundos. Cul es el nmero de medi-

    ciones temporales que deber hacerse para que la confianza de que el error de la estimacin de la

    esperanza no exceda de 0.01 sea del 95%?

    Nos piden calcular n tal que 01.02

    2

    =n (muestra grande) por lo tanto el intervalo buscado es

    +

    nzX

    nzX

    22

    ,

    Puesto que 1-=0.95 025.02

    05.095.01 ===

    De la tabla de la normal estandarizada obtenemos 025,0z =1.96. Entonces reemplazando:

    +

    100

    496.1,

    100

    496.1 XX

    Para el valor particular x =501.2 tenemos el intervalo

    Para muestras tomadas de una poblacin normal, o para muestras de tamao 30n , de una poblacin cualquiera, el intervalo de confianza dado anteriormente en (8.1), proporciona buenos

    resultados.

    En el caso de que la poblacin de la que se extrae la muestra no sea normal pero 30n , el ni-vel de confianza del intervalo (8.1) es aproximadamente 1 . Pero para muestras pequeas tomadas de poblaciones que no son normales no se puede garanti-

    zar que el nivel de confianza sea 1 si se utiliza (8.1).

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    159

    =

    +=

    + 0.502,4.500

    10

    496.12.501,

    10

    496.12.501

    496.1,

    100

    496.1

    nxx .

    Al establecer que

    05024500 .,. es un intervalo al 95% de confianza de estamos diciendo que

    la probabilidad de que el intervalo

    05024500 .,. contenga a es 0.95. O, en otras palabras, la

    probabilidad de que la muestra aleatoria ( )nX,...,X,X 21 tome valores tales que el intervalo aleato-

    rio

    +

    100

    496.1,

    100

    496.1 XX defina un intervalo numrico que contenga al parmetro fijo

    desconocido es 0.95.

    9.3 - Intervalo de confianza para la media de una distribucin normal, varianza desconocida

    Nuevamente como se trata de encontrar un intervalo de confianza para nos basamos en la espe-

    ranza muestral =

    =n

    iXn

    X11

    1 que sabemos es un buen estimador de . Pero ahora no podemos

    usar como pivote a

    n/

    XZ

    =

    porque desconocemos y una condicin para ser pivote es que, excepto por el parmetro a esti-

    mar ( en este caso ), todos los parmetros que aparecen en l deben ser conocidos. Entonces pro-

    ponemos como pivote una variable aleatoria definida en forma parecida a Z pero reemplazando

    por un estimador adecuado.

    Ya vimos que la varianza muestral definida

    ( )2

    11

    2

    1

    1=

    =n

    i XXn

    S ,

    donde X es la esperanza muestral, es un estimador insesgado de la varianza poblacional ( )XV , es decir, ( ) ( ) 22 XVSE == n . Entonces estimamos con S y proponemos como pivote a la va-riable aleatoria

    n/S

    XT

    = .

    Pero para poder usar a T como pivote debemos conocer su distribucin.

    Se puede probar que la distribucin de T es una distribucin llamada Student con parmetro n-1.

    Nota: Una v.a. continua tiene distribucin Student con k grados de libertad, si su f.d.p. es de la

    forma

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    160

    ( )

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    161

    =

    +

    n

    StX

    n

    StXP 1-

    Evidentemente, si definimos

    +=

    =

    n

    StX

    n

    StX

    2

    1

    , hemos construido dos estadsticos 1 y 2 tales que ( )= 21 P 1- ,

    veamos quien es el nmero t que verifica la ecuacin, es decir (ver figura):

    ( ) ( ) ( )tFtFtTtP = =1- donde ( )tF es la Fda para la v.a. T 1nt .

    Por la simetra de la distribucin t de Student se deduce fcilmente de la figura anterior que

    ( ) ( )tFtF = 1 , entonces:

    ( ) ( )tFtF = ( ) 12 tF =1- , o bien (ver figura anterior),

    ( )2

    1

    tF = .

    Al valor de t que verifica esta ecuacin se lo suele indicar 1,

    2n

    t . En consecuencia, el intervalo de

    confianza bilateral al nivel de significacin 1- queda:

    +

    n

    StX

    n

    StX

    nn 1,2

    1,2

    , con 2

    11,

    2

    =

    n

    tF .

    En consecuencia:

    Si ( )nXXX ,...,, 21 una muestra aleatoria de tamao n de una v.a. X donde ),(~ 2NX , 2 desconocido, un intervalo de confianza para de nivel 1 es

    +

    n

    StX

    n

    StX

    22

    , (8.2)

    2

    t 2

    t

    libertad de grados 4=k

    2

    2

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    162

    Ejemplo:

    Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre que dieron valores

    1021 x,...,x,x tales que =

    ==10

    1

    481010

    1

    i

    i .xx ohms y ( )=

    =10

    2

    9

    1

    !i

    i xxS = 1.36 ohms. Supngase

    que X~N(,2). Se desea obtener un intervalo de confianza para la esperanza poblacional al 90 %.

    Tenemos que = 9001 . = 10. 05.02/ = De la Tabla de la t de Student tenemos que 8331.19,05.0 =t . Entonces el intervalo de confianza

    buscado es:

    +=

    +

    10

    36.18331.148.10,

    10

    36.18331.148.10,

    1,2

    1,2 n

    StX

    n

    StX

    nn

    Esto es: [ ]27.11 ,69.9 .

    9.4 Intervalo de confianza para la diferencia de dos medias, varianzas conocidas

    Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:

    ( )( )

    2

    222

    2

    111

    ,N~X

    ,N~X y suponemos que las varianzas 21 y

    2

    2 son conocidas.

    Sean adems

    ( )111211 n

    X,...,X,X una muestra aleatoria de tamao 1n de 1X

    ( )222221 n

    X,...,X,X una muestra aleatoria de tamao 2n de 2X .

    Deseamos construir un intervalo al nivel de confianza 1 para la diferencia de esperanzas

    21 . Ya sabemos cul es la distribucin del promedio de variables aleatorias normales independientes:

    Si la muestra aleatoria se toma de una distribucin normal, 2 es desconocido y el tamao de la

    muestra grande, entonces se puede probar que al reemplazar por S, el estadstico

    ( )10,Nn/S

    XZ

    = aproximadamente

    y puedo construir el intervalo para como antes:

    +

    n

    SzX

    n

    SzX

    22

    , , pero su nivel es aproximadamente 1

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    163

    =

    =

    =

    =

    2

    1

    1 2

    2

    222

    2

    2

    1 1

    2

    111

    1

    1

    1

    1

    n

    i

    i

    n

    i

    i

    n

    ,N~X

    nX

    n

    ,N~X

    nX

    Consideremos ahora la diferencia 21 XXY = . Si 1X y 2X tienen distribucin normal y son in-dependientes, su diferencia tambin es normal, con esperanza igual a la diferencia de las esperan-

    zas y la varianza es la suma de las varianzas:

    +

    2

    2

    2

    1

    2

    12121 ,N~

    nnXX

    .

    Por lo tanto

    ( ) ( )1,0N~

    2

    2

    2

    1

    2

    1

    2121

    nn

    XXZ

    +

    = , es decir, tiene distribucin normal estandarizada.

    La v.a. Z cumple con toda las condiciones para servir de pivote y construiremos nuestro intervalo

    en forma anloga a cmo hicimos en los casos anteriores:

    Comenzamos por plantear la ecuacin

    ( ) = zZzP 1- , donde la incgnita es el nmero real z.

    Reemplazamos la v.a. Z por su expresin y tenemos sucesivamente (multiplicando por n/ y

    restando X ):

    ( ) ( )

    ( ) ( ) ( )

    =

    +++=

    =

    ++=

    +

    12

    2

    2

    1

    2

    12121

    2

    2

    2

    1

    2

    121

    2

    2

    2

    1

    2

    12121

    2

    2

    2

    1

    2

    1

    2

    2

    2

    1

    2

    1

    2121

    nnzXX

    nnzXXP

    nnzXX

    nnzPz

    nn

    XXzP

    Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)

    llegamos a:

    ( ) =

    +++ 1

    2

    2

    2

    1

    2

    12121

    2

    2

    2

    1

    2

    121

    nnzXX

    nnzXXP

    Evidentemente, si definimos

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    164

    +=

    +=

    ,

    2

    2

    2

    1

    2

    1212

    2

    2

    2

    1

    2

    1211

    nnzXX

    nnzXX

    habremos construido dos estadsticos 1 y 2 tales que ( )( )= 2211 P 1- , es decir habremos construido el intervalo de confianza bilateral deseado [ ]21 A,A . Todos los elementos que forman los estadsticos 1 y 2 son conocidos ya que el nmero z verifica la ecuacin anterior, es decir:

    ( ) ( ) ( )zzzZzP = =1- donde ( )z es la Fda para la v.a. N~Z (0,1)

    o bien, segn vimos:

    ( )2

    1

    z = que anotamos 2

    z

    En consecuencia, el intervalo de confianza bilateral al nivel de significacin 1- queda:

    +++

    2

    2

    2

    1

    2

    1

    2

    21

    2

    2

    2

    1

    2

    1

    2

    21 ,nn

    zXXnn

    zXX

    Por lo tanto

    Ejemplo:

    Se utilizan dos mquinas para llenar botellas de plstico con detergente para mquinas lavaplatos.

    Se sabe que las desviaciones estndar de volumen de llenado son 10.01 = onzas de lquido y 15.02 = onzas de lquido para las dos mquinas respectivamente. Se toman dos muestras aleato-

    rias, 121 =n botellas de la mquina 1 y 102 =n botellas de la mquina 2. Los volmenes prome-dio de llenado son 87.301 =x onzas de lquido y 68.302 =x onzas de lquido. Asumiendo que ambas muestras provienen de distribuciones normales

    Construya un intervalo de confianza de nivel 90% para la diferencia entre las medias del volumen

    de llenado.

    Solucin:

    Como 90.01 = entonces 10.0=

    Si 1X y 2X son dos variables aleatorias independientes normalmente distribuidas:

    ( )2111 ,N~ X , ( )2222 ,N~ X y suponemos que las varianzas 21 y 22 son conocidas. Un intervalo de confianza para la diferencia 21 de nivel 1 es

    +++

    2

    2

    2

    1

    2

    1

    2

    21

    2

    2

    2

    1

    2

    1

    2

    21 ,nn

    zXXnn

    zXX

    r

    (8.3)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    165

    Por lo tanto 65.105.02

    == zz

    El intervalo ser ( ) ( )

    +++

    10

    15.0

    12

    10.065.168.3087.30;

    10

    15.0

    12

    10.065.168.3087.30

    2222

    O sea

    281620.0;09837.0

    Si se conocen las desviaciones estndar y los tamaos de las muestras son iguales (es decir

    nnn == 21 ), entonces puede determinarse el tamao requerido de la muestra de manera tal que la longitud del intervalo sea menor que l

    ( )22

    2

    1

    2

    2

    2

    2

    2

    1

    2

    2

    2

    +

    +=l

    z

    nlnn

    zL

    Ejemplo:

    De una muestra de 150 lmparas del fabricante A se obtuvo una vida media de 1400 hs y una des-

    viacin tpica de 120 hs. Mientras que de una muestra de 100 lmparas del fabricante B se obtuvo

    una vida media de 1200 hs. y una desviacin tpica de 80 hs.

    Halla los lmites de confianza del 95% para la diferencia las vidas medias de las poblaciones A y

    B.

    Para muestras tomadas de dos poblaciones normales, o para muestras de tamao 301 n y 302 n , de dos poblaciones cualesquiera, el intervalo de confianza dado anteriormente en

    (8.3), proporciona buenos resultados.

    En el caso de que la poblacin de la que se extrae la muestra no sea normal pero 301 n y 302 n , el nivel de confianza del intervalo (8.3) es aproximadamente 1 .

    Si las muestras aleatorias se toma de una distribucin normal, donde 1 y 2 son desconocidos, 301 n y 302 n , entonces se puede probar que al reemplazar 1 por S1 y 2 por S2, el esta-

    dstico

    )1,0()(

    1

    2

    1

    1

    2

    1

    2121 N

    n

    S

    n

    S

    XX

    +

    . aproximadamente

    y puedo construir el intervalo para 21 como antes:

    +++

    1

    2

    1

    1

    2

    1

    2

    21

    1

    2

    1

    1

    2

    1

    2

    21 ,n

    S

    n

    SzXX

    n

    S

    n

    SzXX , (8.4)

    pero su nivel es aproximadamente 1

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    166

    Solucin:

    Sean las variables aleatorias:

    :1X duracin en horas de una lmpara del fabricante A

    :2X duracin en horas de una lmpara del fabricante B

    No se dice cul es la distribucin de estas variables, pero como 1501 =n y 1002 =n podemos usar el intervalo dado en (8.4)

    Tenemos que 14001 =x , 12002 =x , 1201 =s y 802 =s . Adems 95.01 = 1.96z z 0.025

    2

    ==

    Entonces el intervalo es

    =

    ++ 7922.224;2077.175100

    80

    150

    12096.112001400;

    100

    80

    150

    12096.112001400

    2222

    Observacin: como este intervalo no contiene al cero, podemos inferir que hay diferencia entre las

    medias con probabilidad 0.95, es ms, podemos inferir que la media del tiempo de duracin de las

    lmparas del fabricante A es mayor que la media del tiempo de duracin de las lmparas del fabri-

    cante B con probabilidad 0.95 .

    9.5 Intervalo de confianza para la diferencia de dos medias, varianzas desconocidas

    Nuevamente supongamos que tenemos dos variables aleatorias independientes normalmente dis-

    tribuidas:

    ( )( )

    2

    222

    2

    111

    ,N~X

    ,N~X y suponemos que las varianzas 21 y

    2

    2 son desconocidas .

    Sean adems

    ( )111211 n

    X,...,X,X una muestra aleatoria de tamao 1n de 1X

    ( )222221 n

    X,...,X,X una muestra aleatoria de tamao 2n de 2X .

    Pero ahora 1n o 2n no son mayores que 30

    Supongamos que es razonable suponer que las varianzas desconocidas son iguales, es decir

    == 21 Deseamos construir un intervalo al nivel de confianza 1 para la diferencia de esperanzas

    21

    Sean 1X y 2X las medias muestrales y 2

    1S y 2

    2S las varianzas muestrales. Como 2

    1S y 2

    2S son

    los estimadores de la varianza comn 2 , entonces construimos un estimador combinado de 2 . Este estimador es

    ( ) ( )

    2

    11

    21

    2

    22

    2

    112

    +

    +=

    nn

    SnSnS p

    Se puede comprobar que es un estimador insesgado de 2 . Se puede probar que el estadstico

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    167

    ( )

    21

    2121

    11

    nnS

    XXT

    p +

    =

    r

    tiene distribucin Student con 221 + nn grados de libertad

    Por lo tanto se plantea la ecuacin

    =

    ++1

    2,2

    2,2

    2121 nnnntTtP

    o

    ( )

    =

    +

    ++1

    11 2,2

    21

    2121

    2,2

    2121 nn

    p

    nnt

    nnS

    XXtP

    r

    Despejamos 21 y queda la expresin

    =

    ++

    ++1

    1111

    212,

    2

    21

    212,

    2

    212121 nn

    Stnn

    StXXP pnn

    pnn

    Entonces

    Ejemplo:

    Se piensa que la concentracin del ingrediente activo de un detergente lquido para ropa, es afecta-

    da por el tipo de catalizador utilizado en el proceso de fabricacin. Se sabe que la desviacin es-

    tndar de la concentracin activa es de 3 g/l, sin importar el tipo de catalizador utilizado. Se reali-

    zan 10 observaciones con cada catalizador, y se obtienen los datos siguientes:

    Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0

    Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8

    a) Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concen-

    traciones activas para los dos catalizadores. Asumir que ambas muestras fueron extradas de po-

    blaciones normales con varianzas iguales.

    b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del cata-

    lizador utilizado?

    Si 1X y 2X son dos variables aleatorias independientes normalmente distribuidas:

    ( )2111 ,N~ X , ( )2222 ,N~ X y suponemos que las varianzas 21 y 22 son desconocidas e iguales, es decir == 21 Un intervalo de confianza para la diferencia 21 de nivel 1 es

    nnSt nnXX

    nnSt nnXX pp

    21

    2,2/21

    21

    2,2/21

    11;

    112121

    +++ ++

    (8.5)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    168

    Solucin:

    Sean las variables aleatorias

    :1X concentracin del ingrediente activo con catalizador 1

    :2X concentracin del ingrediente activo con catalizador 2

    Asumimos que ambas variables tienen distribucin normal con varianzas iguales

    Estamos e3n las condiciones para usar (8.5)

    Tenemos que 22.651 =x , 42.682 =x , 444.31 =s , 224.22 =s , 1021 == nn

    Calculamos ( ) ( )

    4036.821010

    224.29444.39

    2

    11 22

    21

    2

    22

    2

    112 =++

    =+

    +=

    nn

    SnSnS p

    Por lo tanto 89890.24036.8 ==pS

    Buscamos en la tabla de la Student 060.218,025.02,

    221

    ==+

    ttnn

    Entonces el intervalo es

    [ ]52935.0;8706.510

    1

    10

    189890.2060.242.6822.65;

    10

    1

    10

    189890.2060.242.6822.65

    =

    =

    ++

    b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del cata-

    lizador utilizado, pues el 0 no pertenece al intervalo.

    En muchas ocasiones no es razonable suponer que las varianzas son iguales. Si no podemos ga-

    rantizar que las varianzas son iguales, para construir un intervalo de confianza de nivel 1 para

    21 utilizamos es estadstico

    1

    2

    1

    1

    2

    1

    2121* )(

    n

    S

    n

    S

    XXT

    +

    =

    Se puede probar que *T tiene aproximadamente una distribucin Student con grados de liber-tad donde

    ( )

    ( ) ( )11 2

    2

    2

    2

    2

    1

    2

    1

    1

    1

    2

    2

    2

    21

    2

    1

    +

    +=

    n

    nS

    n

    nS

    nSnS si no es entero, se toma el entero ms prximo a

    Por lo tanto planteamos la ecuacin

    =

    1

    ,2

    *

    ,2

    tTtP

    Y despejando 21 el intervalo es

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    169

    +++

    2

    2

    2

    1

    2

    1

    ,2

    21

    2

    2

    2

    1

    2

    1

    ,2

    21 ,n

    S

    n

    StXX

    n

    S

    n

    StXX

    Entonces

    Ejemplo:

    Una muestra de 6 soldaduras de un tipo tena promedio de prueba final de resistencia de 83.2 ksi y

    desviacin estndar de 5.2. Y una muestra de 10 soldaduras de otro tipo tena resistencia promedio

    de 71.3 ksi y desviacin estndar de 3.1. supongamos que ambos conjuntos de soldaduras son

    muestras aleatorias de poblaciones normales. Se desea encontrar un intervalo de confianza de 95%

    para la diferencia entre las medias de las resistencias de los dos tipos de soldaduras.

    Solucin:

    Ambos tamaos muestrales son pequeos y las muestras provienen de poblaciones normales. No

    podemos asumir igualdad de varianzas. Entonces aplicamos (8.6)

    Tenemos que 2.831 =x , 3.712 =x , 2.51 =s , 1.32 =s , 10;6 21 == nn

    Como 95.01 = entonces 025.02=

    Adems ( )

    ( ) ( ) ( ) ( )718.7

    9

    101.3

    5

    62.5

    10

    1.3

    6

    2.5

    11

    22

    222

    2

    2

    2

    2

    2

    1

    2

    1

    1

    1

    2

    2

    2

    21

    2

    1 =

    +

    +

    =

    +

    +=

    n

    nS

    n

    nS

    nSnS

    Entonces buscamos en la tabla de la Student 365.27,025.0 =t

    Por lo tanto el intervalo es

    =

    +++=

    =

    +++

    43.17,37.610

    1.3

    6

    2.5365.23.712.83;

    10

    1.3

    6

    2.5365.23.712.83

    ,

    2222

    2

    2

    2

    1

    2

    1

    ,2

    21

    2

    2

    2

    1

    2

    1

    ,2

    21n

    S

    n

    StXX

    n

    S

    n

    StXX

    Si 1X y 2X son dos variables aleatorias independientes normalmente distribuidas:

    ( )2111 ,N~ X , ( )2222 ,N~ X y suponemos que las varianzas 21 y 22 son desconocidas y distintas

    Un intervalo de confianza para la diferencia 21 de nivel aproximadamente 1 es

    +++

    2

    2

    2

    1

    2

    1

    ,2

    21

    2

    2

    2

    1

    2

    1

    ,2

    21 ,n

    S

    n

    StXX

    n

    S

    n

    StXX

    (8.6)

    Donde

    ( )

    ( ) ( )11 2

    2

    2

    2

    2

    1

    2

    1

    1

    1

    2

    2

    2

    21

    2

    1

    +

    +=

    n

    nS

    n

    nS

    nSnS

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    170

    9.6 Intervalo de confianza para 21 para datos pareados

    Hasta ahora se obtuvieron intervalos de confianza para la diferencia de medias donde se tomaban

    dos muestras aleatorias independientes de dos poblaciones de inters. En ese caso se tomaban 1n

    observaciones de una poblacin y 2n observaciones de la otra poblacin.

    En muchas situaciones experimentales, existen solo n unidades experimentales diferentes y los

    datos estn recopilados por pares, esto es cada unidad experimental est formada por dos observa-

    ciones.

    Por ejemplo, supongamos que se mide el tiempo en segundos que un individuo tarda en hacer una

    maniobra de estacionamiento con dos automviles diferentes en cuanto al tamao de la llanta y la

    relacin de vueltas del volante. Notar que cada individuo es la unidad experimental y de esa unidad

    experimental se toman dos observaciones que no sern independientes. Se desea obtener un inter-

    valo de confianza para la diferencia entre el tiempo medio para estacionar los dos automviles.

    En general, supongamos que tenemos los siguientes datos ( ) ( ) ( )nn XXXXXX 2122122111 ,;...;,;, 1 . Las variables aleatorias 1X y 2X tienen medias 1 y 2 respectivamente. Sea jjj XXD 21 = con nj ,...,2,1= .

    Entonces

    ( ) ( ) ( ) ( ) 212121 === jjjjj XEXEXXEDE y

    ( ) ( ) ( ) ( ) ( ) ( )212221212121 ,2,2 XXCovXXCovXVXVXXVDV jjjjjjj +=+==

    Estimamos ( ) 21 =jDE con ( ) 211

    21

    1

    11XXXX

    nD

    nD

    n

    j

    jj

    n

    j

    j === ==

    En lugar de tratar de estimar la covarianza, estimamos la ( )jDV con ( )=

    =n

    j

    jD DDn

    S1

    2

    1

    1

    Anotamos 21 =D y ( )jD DV=2

    Asumimos que ( )2,N~ DDjD con nj ,...,2,1=

    Las variables aleatorias en pares diferentes son independientes, no lo son dentro de un mismo par.

    Para construir el intervalo de confianza notar que

    1/

    = nD

    D tnS

    DT

    entonces al plantear la ecuacin ( ) = tTtP 1- , deducimos que 1,

    2

    =n

    tt

    Por lo tanto el intervalo de confianza para 21 =D de nivel 1 se obtendr al sustituir T en la ecuacin anterior y despejar 21 =D El intervalo resultante es

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    171

    +

    n

    StD

    n

    StD D

    n

    D

    n 1,2

    1,2

    ;

    Entonces

    Ejemplo:

    Consideramos el ejemplo planteado al comienzo. Deseamos un intervalo de nivel 0.90

    Sean las variables aleatorias

    jX 1 : tiempo en segundos que tarda el individuo j en estacionar automvil 1 con nj ,...,2,1=

    jX 2 : tiempo en segundos que tarda el individuo j en estacionar automvil 2 con nj ,...,2,1=

    Medimos estas variables de manera que tenemos las siguientes observaciones

    Automvil 1 Automvil 2 diferencia

    sujeto (observacin jx1 ) (observacin jx2 ) jD

    1 37.0 17.8 19.2

    2 25.8 20.2 5.6

    3 16.2 16.8 -0.6

    4 24.2 41.4 -17.2

    5 22.0 21.4 0.6

    6 33.4 38.4 -5.0

    7 23.8 16.8 7.0

    8 58.2 32.2 26.0

    9 33.6 27.8 5.8

    10 24.4 23.2 1.2

    11 23.4 29.6 -6.2

    12 21.2 20.6 0.6

    13 36.2 32.2 4.0

    14 29.8 53.8 -24.0

    A partir de la columna de diferencias observadas se calcula 21.1=D y 68.12=DS

    Adems 771.113,05.01,

    2

    ==

    ttn

    , entonces el intervalo para la diferencia 21 =D de nivel 0.90

    es

    =

    + 21.7;79.4

    14

    68.12771.121.1;

    14

    68.12771.121.1

    Cuando las observaciones se dan de a pares ( ) ( ) ( )nn XXXXXX 2122122111 ,;...;,;, 1 , y las diferen-cias

    jjj XXD 21 = son tales que ( )2,N~ DDjD para nj ,...,2,1= , un intervalo de confianza de nivel 1 para 21 =D es

    +

    n

    StD

    n

    StD D

    n

    D

    n 1,2

    1,2

    ; (8.7)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    172

    9.7 Intervalo de confianza para la varianza de una distribucin normal

    Supongamos que se quiere hallar un intervalo de confianza para la varianza 2 de una distribu-cin normal.

    Sea ( )nX,...,X,X 21 una muestra aleatoria de una v.a. X, donde ),(~ 2NX .

    Tomamos como estimador puntual de 2 a ( )2

    11

    2

    1

    1=

    =n

    i XXn

    S

    Luego a partir de este estimador puntual construimos el estadstico ( )

    2

    21

    Sn

    X

    =

    Este estadstico contiene al parmetro desconocido a estimar 2 y tiene una distribucin conocida, se puede probar que X tiene una distribucin llamada ji-cuadrado con n-1 grados de libertad

    Observacin: Si X es una v.a. continua se dice que tiene distribucin ji-cuadrado con k grados de

    libertad si su f.d.p. es

    ( )

    0

    22

    1)( 2

    12

    2

    >

    =

    xex

    kxf

    xk

    k

    Notacin: X~2

    k La distribucin ji-cuadrdo es asimtrica. En la figura siguiente se grafica la densidad para diferen-

    tes valores de k

    10 20 30 40 50 60

    0.02

    0.04

    0.06

    0.08

    0.1

    0.12

    Anotaremos k,2 al cuantil de la ji-cuadrado con k grados de libertad que deja bajo la fdp a dere-

    cha un rea de , y a su izquierda un rea de 1 . Propiedades:

    1- Se puede probar que si nXXX ,...,, 21 son variables aleatorias independientes con distribucin

    )1,0(N entonces 22

    2

    2

    1 ... nXXXZ +++= tiene distribucin ji-cuadrado con n grados de libertad.

    30

    15

    2

    =

    =

    =

    k

    k

    k

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    173

    2- Si nXXX ,...,, 21 son variables aleatorias independientes tal que iX tiene distribucin ji-

    cuadrado con ik grados de libertad, entonces nXXXZ +++= ...21 tiene distribucin ji-cuadrado

    con k grados de libertad donde nkkkk +++= ...21

    3- Si 2~ kX entonces para k grande

    1,12~2 kNX aproximadamente.

    Para desarrollar el intervalo de confianza planteamos hallar dos nmeros a y b tales que

    ( ) = 1bXaP es decir ( )

    =

    1

    12

    2

    bSn

    aP

    Se puede probar que la mejor eleccin de a y b es: 21,

    21

    =n

    a y 2

    1,2

    =

    nb

    Por lo tanto

    ( )

    =

    1

    1 21,

    2

    2

    22

    1,2

    1 nn

    SnP

    y despejando 2 se llega a

    ( ) ( )

    =

    111

    2

    1,2

    1

    22

    2

    1,2

    2

    nn

    SnSnP

    Entonces

    2

    1

    2

    1,2

    1 n

    2

    1,2

    n

    2

    5=k

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    174

    Observacin: un intervalo de confianza para de nivel 1 , es ( ) ( )

    2

    1,2

    1

    2

    2

    1,2

    2 1 ;

    1

    nn

    SnSn

    Ejemplo:

    Un fabricante de detergente lquido est interesado en la uniformidad de la mquina utilizada para

    llenar las botellas. De manera especfica, es deseable que la desviacin estndar del proceso de llenado sea menor que 0.15 onzas de lquido; de otro modo, existe un porcentaje mayor del desea-

    ble de botellas con un contenido menor de detergente. Supongamos que la distribucin del volu-

    men de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se ob-

    tiene una varianza muestral 0153.02 =S . Hallar un intervalo de confianza de nivel 0.95 para la verdadera varianza del volumen de llenado.

    Solucin:

    La v.a. de inters es X: volumen de llenado de una botella

    Se asume que ),(~ 2NX con desconocido. Estamos en las condiciones para aplicar (8.8)

    Tenemos que 95.01 = 05.0 = 91.82 19,975.02

    1,2

    1==

    n y 85.322 19,025.0

    2

    1,2

    ==

    n

    Adems 0153.02 =S

    Por lo tanto el intervalo es

    ( ) ( ) ( ) ( ) ( ).03260 ;00884.0

    91.8

    0153.0120 ;

    85.32

    0153.01201 ;

    12

    1,2

    1

    2

    2

    1,2

    2

    =

    =

    nn

    SnSn

    Y un intervalo para es ( ) ( )1805.0 ;09.00326.0 ;00884.0 =

    Por lo tanto con un nivel de 0.95 los datos no apoyan la afirmacin que 15.0

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    175

    Supongamos que se tienen dos poblaciones normales e independientes con varianzas desconocidas 2

    1 y 2

    2 respectivamente. Se desea encontrar un intervalo de nivel 1 para el cociente de las

    dos varianzas 2

    2

    2

    1

    .

    Se toma una muestra aleatoria de tamao 1n de una de las poblaciones y una muestra de tamao

    2n de la otra poblacin. Sean 2

    1S y 2

    2S las dos varianzas muestrales.

    Consideramos el estadstico

    21

    21

    22

    22

    S

    S

    F =

    Notar que F contiene al parmetro de inters 2

    2

    2

    1

    , pues 22

    21

    21

    22

    =

    S

    SF

    Se puede probar que F tiene una distribucin llamada Fisher con 12 n y 11 n grados de libertad.

    Observacin:

    Sea X una variable aleatoria continua, se dice que tiene distribucin Fisher con u grados de libertad

    en el numerador y v grados de libertad en el denominador si su fdp es de la forma

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    176

    Existe la siguiente relacin entre los cuantiles de una vuF , y de una uvF ,

    uv

    vuf

    f,,

    ,,1

    1

    =

    Planteamos la siguiente ecuacin ( ) = 1bFaP y se pede probar que la mejor eleccin de a y b es :

    1,1,2

    1 12 =

    nnfa y

    1,1,2

    12 =

    nnfb

    Entonces

    =

    1

    1,1,2

    2

    1

    2

    1

    2

    2

    2

    2

    1,1,2

    1 1212 nnnnf

    S

    SfP

    Despejando el cociente 2

    2

    2

    1

    queda :

    =

    1

    1,1,2

    2

    2

    2

    1

    2

    2

    2

    1

    1,1,2

    12

    2

    2

    1

    1212 nnnnf

    S

    Sf

    S

    SP

    Por lo tanto

    20 ;15 == vu

    2

    2

    1,1,2

    1 12 nnf

    1,1, 12 nnf

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    177

    Ejemplo:

    Una compaa fabrica propulsores para uso en motores de turbina. Una de las operaciones consiste

    en esmerilar el terminado de una superficie particular con una aleacin de titanio. Pueden emplear-

    se dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rugosidad

    superficial promedio. Interesara seleccionar el proceso que tenga la menor variabilidad en la rugo-

    sidad de la superficie. Para esto se toma una muestra de 12 partes del primer proceso, la cual tiene

    una desviacin estndar muestral 1.51 =S micropulgadas, y una muestra aleatoria de 15 partes del segundo proceso, la cual tiene una desviacin estndar muestral 7.42 =S micropulgadas. Se desea encontrar un intervalo de confianza de nivel 90% para el cociente de las dos varianzas.

    Suponer que los dos procesos son independientes y que la rugosidad de la superficie est distribui-

    da de manera normal.

    Solucin:

    Estamos en las condiciones para aplicar (8.9)

    Buscamos en la tabla de la Fisher 39.058.2

    11

    14,11,05.0

    11,14,95.01,1,

    21 12

    ==== f

    ffnn

    y 74.211,14,05.01,1,

    212

    ==

    ffnn

    Entonces el intervalo es

    [ ]23.3 ;46.0 2.747.4

    1.5 ;39.0

    7.4

    1.52

    2

    2

    2

    =

    Como este intervalo incluye al 1, no podemos afirmar que las desviaciones estndar de los dos

    procesos sean diferentes con una confianza de 90%.

    9.9 Intervalo de confianza para una proporcin

    Sea una poblacin de tamao N (eventualmente puede ser infinito) de cuyos individuos nos inter-

    esa cierta propiedad A. Supongamos que la probabilidad de que un individuo de la poblacin veri-

    fique A es ( )APp = .El significado del parmetro p es, en consecuencia, el de proporcin de indi-viduos de la poblacin que verifican la propiedad A. Podemos definir una variable

    aleatoria iX que mide a los individuos de la poblacin la ocurrencia o no de la propiedad A .

    La variable aleatoria tendr la distribucin:

    Si se tienen dos poblaciones normales e independientes con varianzas desconocidas 21 y 2

    2 respectivamente, entonces un intervalo de nivel 1 para el cociente de las dos varianzas

    2

    2

    2

    1

    es

    1,1,

    2

    2

    2

    2

    1

    1,1,2

    12

    2

    2

    1

    1212

    ;nnnn

    fS

    Sf

    S

    S (8.9)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    178

    ( )( ) ( )

    ( ) ( )

    ===

    ====

    ,100

    11

    pXPp

    pXPp

    xp

    i

    i

    es decir, Xi es una v.a. que toma slo dos valores: 1 (si el individuo verifica A) con probabilidad p

    y 0 (cuando no verifica A) con probabilidad 1-p. Esto es equivalente a decir que Xi tiene una distri-

    bucin binomial con parmetros 1 y p: Xi ~ B(1,p).

    Supongamos que consideramos una muestra aleatoria ( )nXXX ...,, 21 de tamao n . Si formamos el estadstico =X nXXX +++ ...21 , es evidente que esta v.a. mide el nmero de individuos de la muestra de tamao n que verifican la propiedad A. Por lo tanto por su significado X es una v.a.

    cuya distribucin es binomial con parmetros n y p: X~B(n,p). De acuerdo con esto, la variable

    aleatoria P definida: n

    XP = representa la proporcin de individuos de la muestra que verifican la

    propiedad A.

    Observemos que siendo Xi ~ B(1,p) es ( ) pXE i = . Y, dado que X~B(n,p), tambin es

    ( ) ( ) pnpn

    XEnn

    XEPE ===

    =11

    , es decir P es un estimador insesgado de p . Esto es de espe-

    rar pues =

    ==n

    i

    iXnn

    XP

    1

    1 .

    Pero adems, es fcil ver que P es estimador consistente de p . En efecto, tenemos que ( ) pPE = , pero tambin es

    ( ) ( ) ( )n

    pppnp

    nn

    XVPV

    ==

    =1

    112

    .

    Deseamos construir un intervalo de confianza de p. Es razonable basarnos en el estimador insega-

    do P . Consideramos como pivote a la variable aleatoria

    ( )n

    pp

    pPZ

    =

    1 cuya distribucin es, para n suficientemente grande, aproximadamente N(0,1). En

    efecto:

    Siendo n

    X

    n

    X

    n

    XP n+++= ... 21 , es ( )

    =

    =

    =

    n

    i

    i pn

    XEPE

    1

    y ( ) ( )=

    =

    =

    n

    i

    i

    n

    pp

    n

    XVPV

    1

    1

    Por lo tanto:

    ( )( )1,0~

    1

    N

    n

    pp

    pPZ

    granden

    = ,

    El pivote puede ponerse en una forma ms conveniente si tenemos en cuenta que, segn vimos

    recin, P es estimador consistente de p y en consecuencia, en el denominador reemplazamos el

    parmetro desconocido p por su estimador P , y se puede probar que :

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    179

    ( )

    =

    n

    PP

    pPZ

    1

    N(0,1). aproximadamente si n es grande

    Partiendo de este pivote podemos seguir los mismos pasos de los casos anteriores para llegar al

    siguiente intervalo de confianza al nivel 1 de p:

    ( ) ( )

    +

    n

    PPzP

    n

    PPzP

    1,1

    22

    con 2

    12

    =

    z .

    Entonces

    Observaciones:

    1- Este procedimiento depende de la aproximacin normal a la distribucin binomial. Por lo tanto

    el intervalo (8.10) se puede utilizar si 10 >Pn y 10)1( > Pn , es decir, la muestra debe contener un mnimo de diez xitos y diez fracasos.

    2- La longitud del intervalo es ( )

    n

    PPzL

    12

    2

    = , pero esta expresin est en funcin de P

    Si nos interesa hallar un valor de n de manera tal que la longitud L sea menor que un valor deter-

    minado, podemos hacer dos cosas:

    a) tomar una muestra preliminar, con ella estimar p con P y de la expresin anterior despejar n, lo

    que lleva a

    ( ) ( )PP

    l

    z

    nln

    PPzL 1

    2

    1

    2

    2

    2

    2

    =

    b) si no tomamos una muestra preliminar, entonces acotamos ( ) ( )5.015.01 PP , entonces

    ( ) ( )

    2

    2

    22

    5.015.0

    21

    2

    =

    l

    z

    nln

    zn

    PPzL

    Ejemplo:

    Si P es la proporcin de observaciones de una muestra aleatoria de tamao n que verifican una

    propiedad de inters, entonces un intervalo de confianza para la proporcin p de la poblacin

    que cumple dicha propiedad de nivel aproximadamente 1 es

    ( ) ( )

    +

    n

    PPzP

    n

    PPzP

    1 ,1

    22

    (8.10)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    180

    Un fabricante de componentes compra un lote de dispositivos de segunda mano y desea saber la

    proporcin de la poblacin que estn fallados. Con ese fin experimenta con 140 dispositivos elegi-

    dos al azar y encuentra que 35 de ellos estn fallados.

    a) Calcular un intervalo de confianza del 99% para la proporcin poblacional p.

    b) De qu tamao deber extraerse la muestra a fin de que la proporcin muestral no difiera de la

    proporcin poblacional en ms de 0.03 con un 95% de confianza?

    Solucin:

    a) El tamao de la muestra es 140=n (muestra grande)

    La proporcin muestral es 25.0140

    35 ==P

    El nivel de confianza es 9901 . = 010. = 00502

    .= .

    De la tabla de la normal estandarizada vemos que 58.2005.0 =z . Entonces el intervalo buscado es:

    ( ) ( ) [ ]34441.0 ,15558.0140

    25.0125.058.225.0 ,

    140

    25.0125.058.225.0 =

    +

    b) Buscamos el tamao n de la muestra tal que con un 95% de confianza la proporcin muestral P

    est a una distancia 0.03 de la proporcin poblacional p, es decir buscamos n tal que

    03.02

    L , por lo tanto como 05.0= 025.0

    2=

    si tomamos la muestra anterior como pre-

    liminar :

    ( ) ( ) 3333.80025.0125.003.02

    96.121

    22

    2

    2 =

    =

    PP

    l

    z

    n

    Por lo tanto hay que tomar una muestra de tamao por lo menos 801. como ya se tom una mues-

    tra de tamao 140, hay que tomar otra adicional de tamao 661140801 = Supongamos que no tomamos una muestra inicial, entonces directamente planteamos

    1111.106703.02

    96.12

    2

    2 =

    =

    l

    z

    n

    Entonces hay que tomar una muestra de tamao 1068 por lo menos.

    9.10 Intervalo de confianza para la diferencia entre dos proporciones

    Supongamos que existen dos proporciones de inters 1p y 2p y es necesario obtener un intervalo

    de confianza de nivel 1 para la diferencia 21 pp .

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    181

    Supongamos que se toman dos muestras independientes de tamaos 1n y 2n respectivamente de

    dos poblaciones.

    Sean las variables aleatorias

    :1X nmero de observaciones en la primera muestra que tienen la propiedad de inters

    :2X nmero de observaciones en la segunda muestra que tienen la propiedad de inters

    Entonces 1X y 2X son variables aleatorias independientes y X1~B(n1,p1) ; X2~B(n2,p2)

    Adems 1

    11

    n

    XP = y

    2

    22

    n

    XP = son estimadores puntuales de 1p y 2p respectivamente.

    Vemos que ( ) 2121 ppPPE = y ( ) ( ) ( )2

    22

    1

    1121

    11n

    pp

    n

    ppPPV

    +

    =

    Aplicando la aproximacin normal a la binomial podemos decir que

    ( )( ) ( )

    )1,0(11

    2

    22

    1

    11

    2121 N

    n

    pp

    n

    pp

    ppPPZ

    +

    = , y como en el caso de intervalo para una proporcin estima-

    mos ( ) ( )

    2

    22

    1

    11 11

    n

    pp

    n

    pp +

    con

    ( ) ( )2

    22

    1

    1111

    n

    PP

    n

    PP +

    y entonces

    ( )( ) ( )

    )1,0(11

    2

    22

    1

    11

    2121 N

    n

    PP

    n

    PP

    ppPPZ

    +

    = aproximadamente.

    Planteamos la ecuacin ( ) ( ) ( )zzzZzP = =1- , lo que lleva a

    2

    zz = , y con una deduccin anloga a las anteriores se llega al intervalo

    ( ) ( ) ( ) ( )

    +

    +

    +

    2

    22

    1

    11

    2

    21

    2

    22

    1

    11

    2

    21

    11 ;11

    n

    PP

    n

    PPzPP

    n

    PP

    n

    PPzPP

    Entonces

    Ejemplo:

    Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se

    administra la vacuna a una muestra aleatoria de 3000 sujetos, y de ese grupo 13 contraen gripe.

    Como grupo de control se seleccionan al azar 2500 sujetos, a los cuales no se les administra la va-

    cuna, y de ese grupo 170 contraen gripe. Construya un intervalo de confianza de nivel 0.95 para la

    diferencia entre las verdaderas proporciones de individuos que contraen gripe.

    Si 1P y 2P son las proporciones muestrales de una observacin de dos muestras aleatorias inde-

    pendientes de tamaos 1n y 2n respectivamente que verifican la propiedad de inters, entonces

    un intervalo de confianza de nivel 1 aproximadamente es

    ( ) ( ) ( ) ( )

    +

    +

    +

    2

    22

    1

    11

    2

    21

    2

    22

    1

    11

    2

    21

    11 ;11

    n

    PP

    n

    PPzPP

    n

    PP

    n

    PPzPP (8.11)

  • Parte 2 Intervalos de confianza Prof. Mara B. Pintarelli

    182

    Solucin:

    Sean las variables aleatorias

    :1X nmero de personas que contraen gripe del grupo que recibi la vacuna

    :2X nmero de personas que contraen gripe del grupo que no recibi la vacuna

    Entonces X1~B(n1,p1) ; X2~B(n2,p2) donde 30001 =n ; 25002 =n

    Adems 3000

    131 =P ;

    2500

    1702 =P

    Y 96.195.01 025.02

    === zz

    Entonces

    ( ) ( ) ( ) ( )

    =

    +

    +

    +

    =

    =

    +

    +

    +

    0535222.0;0738112.02500

    2500

    1701

    2500

    170

    3000

    3000

    131

    3000

    13

    96.12500

    170

    3000

    13

    ;2500

    2500

    1701

    2500

    170

    3000

    3000

    131

    3000

    13

    96.12500

    170

    3000

    13

    11 ;11

    2

    22

    1

    11

    2

    21

    2

    22

    1

    11

    2

    21n

    PP

    n

    PPzPP

    n

    PP

    n

    PPzPP