58
Capítulo I Aspectos generales de Probabilidades y Variables Aleatorias [15] Probabilidades En este capítulo se introduce el concepto de la probabilidad, tó- pico necesario para la compresión de temas a desarrollarse en los capítulos posteriores. Bernoulli fue el primero en estudiar la teoría de la probabili- dad en forma sistemática con un enfoque científico; observando los resultados del lanzamiento de una moneda un número gran- de de veces, notó que el número de caras y el número de sellos tendían a ser iguales. Es decir, que la frecuencia relativa de la obtención de caras se acercaba más a la frecuencia relativa de sellos, cuanto mayor era el número de lanzamientos. O bien, ambas frecuencias relativas se parecían cada vez más a 0.5. Otro tanto le ocurría en el lanzamiento de dados: la frecuencia relati- va de un 4 tendía a 1/6. Repitió una y otra vez este tipo de expe- rimentos con monedas, dados y cartas, y siempre llegaba a la misma conclusión. Imaginó haber encontrado un fenómeno más general y así dio comienzo a la teoría de probabilidades. Sus re- sultados teóricos se correspondían razonablemente con la reali- dad. Sin embargo, debe marcarse siempre una clara distinción entre los resultados empíricos y los teóricos. El uso de la teoría de la probabilidad se inició en los albores del siglo XVII, haciéndose popular entre los “geometras” de aquel entonces, hoy se emplea en el campo de los seguros, control de calidad, genética, mecáni- ca estadística y muchos más.

Capítulo I Aspectos generales de Probabilidades y Variables ......14 La teoría de la Probabilidad se constituye en el fundamento de la inferencia estadística, en este capítulo

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

  • 1 3

    Capítulo IAspectos generales de

    Probabilidades y Variables Aleatorias

    [15]

    Probabilidades

    En este capítulo se introduce el concepto de la probabilidad, tó-pico necesario para la compresión de temas a desarrollarse enlos capítulos posteriores.

    Bernoulli fue el primero en estudiar la teoría de la probabili-dad en forma sistemática con un enfoque científico; observandolos resultados del lanzamiento de una moneda un número gran-de de veces, notó que el número de caras y el número de sellostendían a ser iguales. Es decir, que la frecuencia relativa de laobtención de caras se acercaba más a la frecuencia relativa desellos, cuanto mayor era el número de lanzamientos. O bien,ambas frecuencias relativas se parecían cada vez más a 0.5. Otrotanto le ocurría en el lanzamiento de dados: la frecuencia relati-va de un 4 tendía a 1/6. Repitió una y otra vez este tipo de expe-rimentos con monedas, dados y cartas, y siempre llegaba a lamisma conclusión. Imaginó haber encontrado un fenómeno másgeneral y así dio comienzo a la teoría de probabilidades. Sus re-sultados teóricos se correspondían razonablemente con la reali-dad. Sin embargo, debe marcarse siempre una clara distinciónentre los resultados empíricos y los teóricos. El uso de la teoría dela probabilidad se inició en los albores del siglo XVII, haciéndosepopular entre los “geometras” de aquel entonces, hoy se empleaen el campo de los seguros, control de calidad, genética, mecáni-ca estadística y muchos más.

  • 1 4

    La teoría de la Probabilidad se constituye en el fundamentode la inferencia estadística, en este capítulo se estudiarán sólolos conceptos básicos, con el objetivo de brindar al lector los mé-todos fundamentales y necesarios para comprender la inferen-cia estadística.

    Puede señalarse que el concepto de probabilidad está implí-cito en distintas situaciones. Por ejemplo: en las encuestas de opi-nión donde se indican las posibilidades que tendría determinadocandidato de ganar las elecciones; en el campo de la educaciónprimaria se puede afirmar que la deserción escolar es de un 65%en zonas marginales; la posibilidad de que un alimento esté con-taminado es del 50%; la posibilidad de que una estudiante de se-cundaria quede embarazada es del 20%, etc.

    Los investigadores del área de educación y de ciencias so-ciales continuamente se preguntan si los resultados de sus inves-tigaciones se deben a la casualidad o son el producto de la in-fluencia de diversos factores. Por ejemplo, se emplean dos méto-dos de enseñanza, el método A y el método B con la finalidad decomparar el número de alumnos desaprobados; al término delcurso se conoce que el grupo que estudió con el método A, tres decada diez estudiantes desaprueban y el grupo que estudió con elmétodo B uno de cada diez estudiantes desaprueban. ¿Puede afir-marse que el método A es mejor que el método B?. Esta y otraspreguntas pueden responderse a través de la aplicación de losconceptos y leyes de la probabilidad.

    A continuación se definirán algunos términos importantes:

    • Experimento aleatorioEs todo proceso que se puede repetir indefinidamente obte-

    niéndose resultados no previsibles. Por ejemplo, el experimentode elegir un estudiante al azar y observar el grado de instruccióndel padre.

    • Espacio muestralEl espacio muestral asociado a un experimento aleatorio, es

    el conjunto de todos los posibles resultados de un experimento.

  • 1 5

    El espacio muestral lo denotaremos por Ω. Por ejemplo, en el casodel experimento de seleccionar un niño al azar y observar el gra-do de instrucción del padre los resultados posibles se pueden re-presentar en el conjunto:

    Ω={sin instrucción, primaria, secundaria,superior universitaria}

    • Evento o sucesoCada uno de los resultados de un experimento aleatorio, es

    denominado evento o suceso. Un evento E es un elemento o sub-conjunto de elementos del espacio muestral Ω. Por ejemplo, al se-leccionar un alumno y registrar el grado de instrucción del padreen este caso una de las posibilidades es que el padre tenga ins-trucción superior , en este caso se define el evento: E1={padre coninstrucción superior}.

    • Eventos mutuamente excluyentesDos o más eventos son mutuamente excluyentes, si la ocu-

    rrencia de un evento implica la no ocurrencia de cualquier otroevento. Por ejemplo, en el espacio muestral Ω, los eventosE1={padre con instrucción superior} y E2={padre con instrucciónprimaria}, son eventos mutuamente excluyentes.

    A continuación se presentará el concepto de probabilidaden tres perspectivas: probabilidad clásica, probabilidad como fre-cuencia relativa, probabilidad subjetiva .

    Probabilidad clásica

    La probabilidad clásica se remonta al siglo XVII en los trabajosde los matemáticos Pascal y Fermat, y se presenta a través de lasiguiente definición.

    Si un experimento aleatorio produce N resultados igualmen-te probables y mutuamente excluyentes, y si dentro de estos Nresultados el evento E ocurre m veces, la probabilidad de ocu-rrencia del evento E es igual a m/N.

  • 1 6

    Esta definición se expresa como

    ( )NmEP =

    Se lee: la probabilidad de que ocurra el evento E es igual a mentre N.

    Probabilidad según el concepto de frecuencia relativa

    El enfoque de frecuencia relativa de probabilidad está relaciona-do a un número grande de veces que se repite un experimentodigamos, n veces, y si algún evento E ocurre un número m deveces la frecuencia relativa de la ocurrencia del evento E

    nm ,

    estima la probabilidad de ocurrencia del evento E.

    La expresión es la siguiente: ( )nmEP =

    Esta interpretación de probabilidad como frecuencia relati-va depende de la idea de regularidad estadística, que estableceque las frecuencias relativas tienden a estabilizarse y a aproxi-marse a un valor fijo después de repetir el experimento un grannúmero de veces. Por ejemplo, en un Centro de Salud de Limanacieron 2,000 niños, intuitivamente puede decirse que la pro-babilidad de nacimiento de un niño es igual a la probabilidad denacimiento de una niña, es decir 0.50. El experimento consiste enobservar en forma secuencial los nacimientos. En base a esta in-formación se organiza la siguiente tabla, en la cual la segundacolumna contiene el número de niñas nacidas en cada 100 naci-mientos. Se define el evento E:{nacimiento de una niña}.

    Puede observarse que las frecuencias relativas tienden a "es-tabilizarse" y a aproximarse a 0,50 después de un gran númerode repeticiones de un experimento, aun cuando al inicio de lasecuencia se observa una considerable fluctuación. Este compor-tamiento de las frecuencias relativas se ha comprobado experi-mentalmente muchas veces.

  • 1 7

    Número de niñas observada en una secuencia de 2,000 nacimientos

    NÚMERO DE NÚMERO DE NÚMERONACIMIENTOS NIÑAS ACUMULADO ni/N

    X ni

    1-100 55 55 0,5500101-200 46 101 0,5050201-300 47 148 0,4933301-400 50 198 0,4950401-500 41 239 0,4780501-600 51 290 0,4833601-700 51 341 0,4871701-800 42 383 0,4788801-900 46 429 0,4767

    901-1000 55 484 0,48401001-1100 50 534 0,48551101-1200 56 590 0,49171201-1300 50 640 0,49231301-1400 48 688 0,49141401-1500 51 739 0,49271501-1600 52 791 0,49381601-1700 45 836 0,49181701-1800 56 892 0,49561801-1900 58 950 0,50001901-2000 40 990 0,4950

  • 1 8

    Probabilidad subjetiva

    Existen diversas situaciones en las cuales la probabilidad de ocu-rrencia de un evento no puede ser calculada de acuerdo a losmétodos anteriores. A través de estos métodos no es posible porejemplo calcular la probabilidad de que en los próximos 10 añosse reduzca la contaminación ambiental en la Tierra o que se eli-mine la hepatitis B en los escolares de la selva peruana. La mag-nitud de la probabilidad que una persona asigna subjetivamentea un evento está en relación al grado de seguridad que esa perso-na tiene en la ocurrencia del evento. La probabilidad subjetivano depende de la posibilidad de repetición de un experimento.

    Axiomas de probabilidad

    Los axiomas de probabilidad garantizan que las probabilidadesasignadas a los eventos puedan interpretarse como frecuenciasrelativas. Los axiomas no determinan las probabilidades, estasse asignan de acuerdo al conocimiento del sistema estudiado. Lossiguientes axiomas propuestos por Kolmogorov, facilitan el cál-culo de probabilidades de algunos eventos a partir del conoci-miento de las probabilidades de otros eventos.

    Si Ω es el espacio muestral asociado a un experimento y E escualquier evento del espacio muestral, se cumple:

    i) P(Ω)=1ii) 0≤P(E) ≤1iii) Para dos eventos E1 y E2 definidos en W, con E1 ∪ E2 =φ,

    se cumple que:

    P(E1 ∪ E2 ) = P(E1)+P(E2).

    Los axiomas de probabilidad y las propiedades derivadas deestos se limitan a la asignación de probabilidades de manera talque es concordante interpretar éstas como frecuencia relativa.Como consecuencia de los axiomas anteriores se presentan lassiguientes propiedades.

  • 1 9

    Propiedades

    1. P(f)=0, donde f es el conjunto vacío.2. Para cualquier evento E P(Ec)=1-P(E), donde Ec es el

    complemento del evento E.3. Si el evento E1 ⊂ E2 P(E1) £ P(E2).

    Ejemplo 1.1

    Un centro educativo convoca a concurso la plaza de director delcolegio y recibe 25 solicitudes para desempeñar este cargo. Quin-ce de los postulantes al cargo son hombres y diez son mujeres.Cinco de ellos tienen el grado de doctor y veinte el grado de ma-gister. Un postulante es elegido aleatoriamente entre los veinti-cinco. Los evaluadores se formulan las siguientes preguntas:

    a) ¿Cuál es la probabilidad de que el postulante seleccionadosea una mujer?

    b) ¿Cuál es la probabilidad de que el postulante seleccionadotenga el grado de doctor?

    c) ¿Cuál es la probabilidad de que postulante seleccionado ten-ga el grado de magister y sea hombre?

    Vamos a responder las preguntas planteadas.

    Solución

    La información relacionada al sexo y grado académico de lospostulantes es la siguiente:

    Distribución de los 25 postulantes al cargo de director por sexo y grado académico

    Grado académicoSexo Total

    Magister Doctor

    Femenino 8 2 10Masculino 12 3 15

    Total 20 5 25

  • 2 0

    a) El experimento consiste en seleccionar aleatoriamente a unpostulante y observar su sexo, los posibles resultados son hom-bre o mujer. Entonces Ω1 = { E1, E2 } donde:

    E1: Mujer y E2: Hombre.

    La probabilidad de que el postulante seleccionado sea mu-jer es,

    b) El experimento consiste en seleccionar aleatoriamente a unpostulante y observar su grado académico. Los posibles re-sultados son magister o doctor. Entonces Ω2 ={ F1, F2 } don-de: F1: Magister y F2: Doctor.La probabilidad de que el postulante seleccionado tenga el

    grado de doctor es,

    c) El experimento consiste en seleccionar aleatoriamente a unpostulante y observar sexo y grado académico simultánea-mente.

    E1 ∩ F1: Mujer con grado de magíster n(E1 ∩ F1)=8E1 ∩ F2: Mujer con grado de doctor n(E1 ∩ F2)=2E2 ∩ F1: Hombre con grado de magíster n(E2 ∩ F1)=12E2 ∩ F2: Hombre con grado de doctor n(E2 ∩ F2)= 3

    La probabilidad de que el postulante seleccionado sea hom-bre y tenga el grado de magister es,

    48.02512)()( 1212 ==

    ∩=∩n

    FEnFEP

    4.02510)()( 11 === n

    EnEP

    2.0255)()( 11 === n

    FnFP

  • 2 1

    Variables aleatorias

    Dado un experimento aleatorio al que se le asocia un espacio mues-tral Ω, una función X que asigna a cada elemento de ω en Ω uno ysólo un número real X(ω)=x es llamada variable aleatoria. Esa de-cir, el dominio de la función es el espacio muestral Ω y el rango esel conjunto de números reales.

    Las variables aleatorias pueden ser clasificadas como dis-cretas o continuas. Se dice que es discreta si tiene un rango finitoo infinito numerable y es continua si tiene un rango que contieneun intervalo de números reales. Este intervalo puede ser finito oinfinito

    Ejemplos de variables aleatorias discretas:

    X: Número de libros solicitados en una biblioteca.X: Número de cursos a implementarse en un semestre acadé-

    mico.X: Número de alumnos matriculados en el curso de Filosofía.X: Número de computadoras en red del laboratorio de infor-

    mática.

    Ejemplos de variables aleatorias continuas:

    X: Tiempo dedicado a la revisión bibliográfica.X: Diámetro de un disco compacto.X: Tiempo de espera en el banco para efectuar el pago de ma-

    trícula.

    Ejemplo 1.2

    Un alumno es seleccionado aleatoriamente y se observa si es-tá aprobado o desaprobado. El espacio muestral es Ω = {apro-

  • 2 2

    bado, desaprobado} = {A,D}. Consideremos X como una fun-ción definida sobre Ω tal que X(D) = 0 y X(A) = 1. Así, X esuna función real valorada que tiene como dominio al espaciomuestral Ω y como rango al conjunto de números reales {x:x=0,1}.

    Variable aleatoria discreta y su distribución de probabilidad

    La distribución de probabilidad de una variable aleatoria discre-

    ta, X , es el conjunto de pares ( ))(, xpx ; donde:x representa a un valor observado de la variable aleatoria y

    ( )xXPxp ==)( representa la correspondiente probabilidad yes la fracción de veces que puede esperarse que x ocurra y cum-ple con las siguientes propiedades:

    ∑ =≤≤

    1)( )

    1)(0 )

    xpii

    xpi

    Ejemplo 1.3

    Una biblioteca que cuenta con un total de 4270 libros, clasifica es-tos libros según el número de hojas deterioradas.

    En este caso la variable aleatoria en estudio es X: Número dehojas deterioradas encontradas en un libro. Esta es una variablealeatoria discreta y el rango de posibles valores de X puede ser

    { }12,....,2,1,0=xR si el número máximo de hojas deterioradas es12. Vamos a encontrar la distribución de probabilidad del núme-ro de hojas deterioradas.

    En la siguiente tabla se presenta las frecuencias encontradassegún el número de hojas deterioradas.

  • 2 3

    Por ejemplo, puede decirse que de un total de 4.270 libros sehan encontrado, 1.394 que no contienen ninguna hoja deteriora-da, 36 libros con 6 hojas deterioradas, etc.

    Solución

    Vamos a presentar la distribución de probabilidad de la variablealeatoria, número de hojas deterioradas.

    Las probabilidades ( )xXPxp ==)( , son calculadas divi-diendo sus respectivas frecuencias absolutas entre el total. Porejemplo,

    ( )

    ( )

    ( ) 0002,0270.4112)12(

    .

    .

    3206,0270.4369.11)1(

    3265,0270.4394.10)0(

    ====

    ====

    ====

    XPp

    XPp

    XPp

    Número de hojas Número dedeterioradas libros

    X if0 1.3941 1.3692 8033 3574 2015 716 367 188 99 5

    10 311 312 1

    TOTAL 4.270

  • 2 4

    Solución: Se observa la última tabla y la probabilidad es:( ) 0471,04 ==XP

    ii) ¿Cuál es la probabilidad de que un libro seleccionado alea-toriamente contenga exactamente 6 hojas deterioradas?.

    Solución: Se observa la última tabla y la probabilidad es:( ) 0084,06 ==XP

    Función de distribución

    La función de distribución está definida como la probabilidad deque la variable aleatoria X tome un valor inferior o igual a x , esdecir:

    ( )xXPxF ≤=)(

    Los resultados se presentan en la siguiente tabla

    En base al conocimiento de la distribución de probabilidad,pueden formularse algunas preguntas, las que respondemos di-rectamente.

    i) ¿Cuál es la probabilidad de que un libro seleccionado alea-toriamente contenga exactamente 4 hojas deterioradas?.

    Número de hojas )(P xX =deterioradas

    0 0,32651 0,32062 0,18813 0,08364 0,04715 0,01666 0,00847 0,00428 0,00219 0,001210 0,000711 0,000712 0,0002

    TOTAL 1,0000

  • 2 5

    A continuación se presenta la función de distribución y surespectiva representación gráfica para el Ejemplo 1.3.

    Fig. 2. Representación gráfica de la función de distribución

    Así,

    Número de hojas )()( xXPxF ≤=deterioradas

    0 0,32651 0,64712 0,83523 0,91884 0,96595 0,98256 0,99097 0,99518 0,99729 0,9984

    10 0,999111 0,999812 1,0000

    1)12()...1()0()12()12(...

    6471.0)1()0()1()1(3265.0)0()0(

    ==+=+==≤=

    ==+==≤==≤=

    XPXPXPXPF

    XPXPXPFXPF

    0 4 8 12nº libros

    Func

    ión

    de d

    istri

    buci

    ónF(

    x)

    1.0000

    0.8000

    0.6000

    0.4000

  • 2 6

    La función de distribución es expresada de la siguiente forma:

  • 2 7

    toriamente tenga entre 4 y 7 hojas deterioradas inclusive?

    Solución: Para obtener la probabilidad se calcula:

    ( ) ( ) ( )

    0763.0 9188.09951.0

    3774−=

    ≤−≤=≤≤ XPXPXP

    Media, varianza y desviación estándar

    La media de una variable aleatoria discreta X (media de la distri-bución) se define por:

    ∑== )()(ì xxpXE

    La varianza de una variable aleatoria discreta X (varianzade la distribución) se define por:

    ( )22 )( µσ −== XEXVar

    La desviación estándar es la raíz cuadrada de la varianza,

    ( )[ ]2ì)( −== XEXVarσEjemplo 1.5

    En relación al ejemplo 1.3 se obtendrá la media, la varianza y ladesviación estándar.

    Solución

    Media:

    3435.1)0002.0(12...)3206.0(1)3265.0(0)(ì12

    0=+++== ∑

    =xxxp

    y puede decirse que el número promedio es de 1 hoja dete-

  • 2 8

    riorada.Varianza: En la siguiente tabla se presentan los cálculos auxi-

    liares para encontrar el valor de la varianza118.2)3435.1(923.3 22 =−=σ y el valor de la desviación están-

    dar 455.1=σ .

    A continuación se presentan las distribuciones especiales:Bernoulli y Binomial.

    Distribución de Bernoulli

    La distribución de Bernoulli caracteriza a una variable aleatoriacon dos posibles resultados y con probabilidad de ocurrencia cons-

    tante. Típicamente cada uno de estos resultados, representan un«éxito» (x=1) o un «fracaso» (x=0).

    Definición. Una variable aleatoria X, tiene una distribución

    Número de hojas p(x) p(x)x p(x)x2deterioradas x

    0 0.3265 0.0000 0.00001 0.3206 0.3206 0.32062 0.1881 0.3762 0.75223 0.0836 0.2508 0.75254 0.0471 0.1884 0.75325 0.0166 0.0830 0.41576 0.0084 0.0504 0.30357 0.0042 0.0294 0.20668 0.0021 0.0168 0.13499 0.0012 0.0108 0.094810 0.0007 0.0070 0.070311 0.0007 0.0077 0.085012 0.0002 0.0024 0.0288

    TOTAL 1.0000 1.3435 3.9230

  • 2 9

    de Bernoulli si su distribución de probabilidad está dada por:

    ≤≤=−−==

    casootrocualquier;p,x;xp)(xpx)XP

    010 1011(

    donde p es la probabilidad de «éxito» y 1-p la probabilidadde «fracaso», es decir:

    pp)(p)XPpp)(p)XP

    −=−===−==

    110(11(

    010

    111

    Una variable aleatoria con distribución Bernoulli puede serutilizada para modelar situaciones como la siguiente:

    • Ante una promoción de becas de estudios de computaciónun individuo puede aceptar o no la promoción.

    • Un analista clínico evalúa a un paciente y podrá clasificarlocomo inmune o no a una determinada enfermedad.

    • Un artículo puede ser clasificado como defectuoso o nodefectuoso después de haber sido sometido a un control decalidad.

    Esperanza y varianza

    La media y varianza de una variable aleatoria con distribuciónde Bernoulli están definidas por:

    pqppXVarppXE

    =−=≤≤=

    )1()(10,)(

    Distribución binomial

    La distribución Binomial es de importancia porque sirve paramodelar muchas situaciones de la vida real. Se basa en n ensa-yos independientes de Bernoulli, cada ensayo con dos posiblesresultados y la probabilidad de éxito p permanece constante encada prueba o ensayo. La variable aleatoria estudiada es el nú-

  • 3 0

    mero de éxitos en n pruebas independientes.Formalizando, se dice que una variable aleatoria, tiene una

    distribución Binomial si su distribución de probabilidad está dadapor:

    =−

    ==

    ;c.c

    ,x;p)(pxn

    x)XPxnx

    0

    n,..,101(

    donde:

    X : representa el número total de «éxitos» en los n ensayos.

    La media y varianza de la variable aleatoria son:

    npqXVarnpXE=

    =)(

    )(

    Ejemplo 1.6

    Históricamente, la probabilidad de que un alumno de maestríaen educación desapruebe el curso de metodología de la investi-gación es .45.0=p Se obtiene una muestra aleatoria de 6 estu-diantes de maestría que llevan el curso de metodología de la in-vestigación y vamos a encontrar:

    a) El número esperado de alumnos que desaprueban el curso.b) La probabilidad de que exactamente tres alumnos desaprue-

    ben el curso.c) La probabilidad que a lo más dos alumnos desaprueben el

    curso.d) Por lo menos cinco alumnos desaprueben el curso

    Solución 6=n 45.0=p

    X : número de alumnos desaprobados{ }6,...,1,0 y la distribuciónde probabilidad de la variable es:

  • 3 1

    ( ) ( ) xxx

    xXP −

    == 655.045.06

    =x { }6,...,1,0 Así:

    ( ) ( )

    ( ) ( )

    ( ) ( )

    ( ) ( )

    ( ) ( )

    ( ) ( )

    ( ) ( ) 0083.055.045.066

    6

    0609.055.045.056

    5

    1861.055.045.046

    4

    3032.055.045.036

    3

    2780.055.045.026

    2

    1359.055.045.016

    1

    0277.055.045.006

    0

    666

    565

    464

    363

    262

    161

    060

    =

    ==

    =

    ==

    =

    ==

    =

    ==

    =

    ==

    =

    ==

    =

    ==

    XP

    XP

    XP

    XP

    XP

    XP

    XP

    a) El número esperado de alumnos desaprobados es:

    )6(6)5(5)4(4)3(3)2(2)1(1)0(0

    6

    0)()(

    pppppppx

    xXxPXE

    ++++++=

    ∑=

    ==

    = 0(0.0277) + 1(0.1359) + 2(0.2780) + 3(0.3032) + 4(0.1861)+ 5(0.0609) + 6(0.0083)= 0 + 0.1359 + 0.5560 + 0.9096 + 0.7444 + 0.3045 + 0.04898= 2.7002

    Se espera encontrar aproximadamente tres desaprobados.

    b) P(X=3) = 0.3032c) P(X≤2) = P(X=0)+P(X=1)+P(X=2)=0.0277+0.1359+0.2780 = 0.4416d) P(X≥5) = 1-P(X£4) =1-[ P(X=0)+P(X=1)+P(X=2)+P(X=3)+ P(X=4)]

    = 1 - [0.0277+0.1359+0.2780+0.3032+0.1861]= 1-0.9309

  • 3 2

    = 0.0691

    Distribución de probabilidad de una variable continua

    Una variable aleatoria continua es aquella que puede asumircualquier valor en un intervalo específico de valores. En conse-cuencia, entre dos valores cualesquiera asumidos por la variablealeatoria continua existe un número infinito de valores.

    Definición

    Una función no negativa ƒ(x) se llama función de densidad deprobabilidad de la variable aleatoria X, sí el área total delimita-da por su curva y el eje de las x, es igual a 1 y sí la subárea delimi-tada por la curva, el eje de las x, y por las líneas perpendiculareslevantadas sobre dos puntos cualesquiera a y b da la probabili-dad de que X esté entre los puntos a y b.

    Distribución normal

    Una de las distribuciones teóricas más estudiadas en los textosde estadística y más utilizada en la práctica es la distribuciónnormal, también llamada distribución gaussiana. Su impor-tancia se debe fundamentalmente a la frecuencia con la que dis-tintas variables asociadas a fenómenos naturales y cotidianossiguen, aproximadamente, esta distribución. Caracteres morfo-lógicos (como la talla o el peso), o psicológicos (como el cocienteintelectual) son ejemplos de variables de las que frecuentementese asume que siguen una distribución normal. El uso extendidode la distribución normal en las aplicaciones estadísticas puedeexplicarse, además, por otras razones. Muchos de los procedimien-tos estadísticos habitualmente utilizados suponen normalidad delos datos observados. La simple exploración visual de los datospuede sugerir la forma de su distribución. No obstante, existenotras medidas, gráficos de normalidad y contrastes de hipótesisque pueden ayudarnos a decidir, de un modo más riguroso, si la

  • 3 3

    muestra de la que se dispone procede o no de una distribuciónnormal. Cuando los datos no siguen una distribución normal, po-dremos o bien transformarlos o emplear métodos estadísticos noparamétricos.

    Definición

    Una variable aleatoria continua, tiene una distribución normalsi su función de densidad de probabilidad está dada por:

    0,óìx,exx

    >∞

  • 3 4

    Corresponde a una variable con distribución normal con media 0y varianza 1:

    2

    21

    ð21)( zezf −=

    y cuyas probabilidades P(Z ≤ z) están tabuladas en la deno-minada tabla normal.

    Estandarización de una variable con distribución normal

    Una variable aleatoria X con distribución normal con media µ yvarianza σ2 puede ser transformada en una variable normal es-tándar:

    • La distancia entre la recta x = µ y el punto de inflexión de lacurva es igual a σ.

    • La distribución normal constituye realmente una «familia»de distribuciones, puesto que para cada valor de µ y σ existeuna distribución diferente.

    • La curva de la distribución normal se extiende de -∞ hasta +∞.• Si levantamos perpendiculares entre:

    Si una variable aleatoria X tiene una distribución normal, pue-den calcularse las probabilidades de que X tome valores entre a yb, P(a ≤ X ≤ b). Puesto que X es una variable aleatoria continua P(a≤ X ≤ b) = P(a < X < b)

    Distribución normal estándar

    µ - σ y µ - σ corresponde aproximadamente al 68.3% del área total.

    µ - 2σ y µ - 2σ corresponde aproximadamente 95.4% del área total.

    µ - 3σ y µ - 3σ corresponde aproximadamente 99.7% del área total.

  • 3 5

    )1,0(~ì),ì(~ NXZNXσ

    σ −=⇒

    Las áreas de la distribución normal estándar correspondena probabilidades que se encuentran tabuladas. En la Tabla A delApéndice se presentan las áreas bajo la curva entre -∞ y z0, esdecir P(Z ≤ z0).

    Ejemplo 1.7

    Vamos a determinar las siguientes probabilidades:

    a) P(Z 1.75)

    d) ¿Cuál es el valor de z 0 si P( Z < z 0 ) = 0.9505

    Solución

    a) En la Tabla A se encuentra el área acumulada hasta 1.45,esta corresponde al valor de la siguiente probabilidadP(Z

  • 3 6

    • Se obtiene la probabilidad requerida.

    b) P(-1.2< Z < 2.1) = P(Z< 2.1) - P(Z

  • 3 7

    d) En la Tabla A, para obtener z0 donde P(Z< z0) =0.9265, se ubi-ca el valor de la probabilidad en este caso 0.9505 y el cuantilcorrespondiente es 1.65.

    Ejemplo 1.8

    Supongamos que se sabe que el peso de una población de alum-nos que practican natación sigue una distribución normal, conuna media de 63 Kg y una desviación estándar de 10 Kg. si seelige aleatoriamente un estudiante, vamos a responder las siguien-tes preguntas:

    a) ¿Cuál es la probabilidad que tenga más de 69 Kg de peso?.b) ¿Cuál es la probabilidad que tenga menos de 58 Kg de peso?.c) ¿Cuál es la probabilidad que un alumno elegido al azar, ten-

    ga entre 60 y 65 Kg?.

    Solución

    La variable aleatoria en estudio es X : Peso y X ~ N( 63, 102),donde µ = 63 σ2 = 100 σ = 10

    Estandarizando la variable aleatoria )1,0(~1063 NXZ −=

    a)

    ( ) ( )

    ( )

    2743.0 7257.01

    6.01 10

    636910

    631

    69169

    =−=

    ≤−=

    −≤−−=

    ≤−=>

    ZP

    XP

    XPXP

    b)

  • 3 8

    ( )

    ( )

    6915.0

    5.0 10

    635810

    6358

    =≤=

    −≤−=≤

    ZP

    XPXP

    c)

    ( )

    ( ) ( )( ) ( )

    0.1972 1-0.61790.5793

    1- 3.02.0 3.02.0

    2.010

    633.0

    106365

    1063

    1063606560

    =+=

  • 3 9

    do con grados n de libertad. La distribución ji cuadrado es unadistribución asimétrica y se denota como 2 )(~ nX χ

    Función de densidad de probabilidadde la distribución ji cuadrado

    Esperanza y varianza

    .2nVar(X)ynE(X) ==

    La distribución ji cuadrado y su relación con la distribución nor-mal

    Si ( )1

    2

    2

    −=

    ∑n

    XXS

    i

    Es la varianza de una muestra aleatoria nXXX ,...,, 21 de tama-ño n, seleccionada de una población distribuida normalmente conmedia µ y σ2, entonces:

    2

    2)1(σ

    Sn −

    Tiene distribución ji cuadrado con n - 1 grados de libertad.

  • 4 0

    El número de grados de libertad en toda operación estadísti-ca es igual al número de observaciones menos toda restricciónimpuesta a tales observaciones. Una restricción es cualquier va-lor que deba calcularse en base a dichas observaciones.

    La variable que sigue una distribución ji cuadrado se re-presenta por la letra griega 2χ y toma solamente valores nonegativos.

    En la tabla C del Apéndice se tienen tabuladas las probabili-dades para una variable aleatoria ji cuadrado para diferentesgrados de libertad.

    Ejemplo 1.9

    Un grupo de investigadores conoce que los coeficientes intelec-tuales de una población de niños, sigue una distribución normalcon varianza igual a 4. Seleccionan una muestra aleatoria de ta-maño 17 de esta población y desean conocer la probabilidad deque la varianza muestral sea a lo más 4.86.

    Solución

    En este caso: n =17, σ2 = 4 y )16(22

    ~)1( χσ

    Sn −

    ≤=

    ≤=

    −≤−=≤

    4.192 )16(÷

    85.44

    162)16(÷

    85.42)1(

    2

    2)1()85.42(

    P

    P

    nSnPSPσσ

    Se ingresa a la Tabla C con 16 grados de libertad y la abscisa19.4 encontrándose el valor de la probabilidad igual a 0.75, esdecir: 75.0)85.42( =≤SP

    Propiedades

  • 4 1

    Si elevamos al cuadrado una variable aleatoria con distribuciónN(0,1) se genera una variable ji cuadrado con un grado de liber-tad, es decir:

    2)1(÷~

    2)1,0(~ iZNiX

    iZ ⇒−

    µ

    Si se tiene n variables aleatorias independientes con distri-bución N(0,1), la suma de los cuadrados de dichas variables tie-ne distribución ji cuadrado con n grados de libertad.

    2)(÷~

    2

    11

    2n

    n

    iiXn

    iiZ ∑

    =

    −=∑

    = σµ

    Distribución t de Student

    Si la variable aleatoria X tiene función de densidad dada por:

    ( )∞

  • 4 2

    20

    −==

    nnVar(X)yE(X)

    En 1908, W.S. Goset, quien escribía bajo el seudónimo de Stu-dent, describió la distribución de la variable:

    nSXt µ−=

    Como una variable con distribución t con n-1 grados de li-bertad, cuando la muestra es seleccionada desde una poblaciónnormal con media µ y varianza σ2. Esta distribución permitirárealizar inferencias relacionadas a la medias poblacionales cuan-do la varianza es desconocida. Se debe notar que el denomina-dor de la variable t, contiene la desviación estándar muestral Sen lugar de σ.

    En la tabla B del anexo se tienen tabuladas las probabili-dades para una variable aleatoria t para diferentes grados delibertad.

    Ejemplo 1.10

    Si X es una variable aleatoria con distribución t con 10 grados delibertad se obtendrá las siguientes probabilidades:

    a) P(X(10) ≤ 2.228)b) P(X(10) ≥ 2.228)c) P(X(10) ≤ 2.228)

    Solución

    a) En la fila 10 de la Tabla B se encuentra que el valor de laprobabilidad es 0.975, es decir P(X ≤ 2.228) = 0.975.

    b) P(X ≥ 2.228) = 1- P(X ≤ 2.228) = 1- 0.975 = 0.025

    c) P(X≤ 2.228) = P(-2.228≤ X ≤ 2.228) = P(X ≤ 2.228) - P(X ≤ - 2.228)

  • 4 3

    = P(X ≤ 2.228) – [ 1 - P(X ≤ - 2.228) ]= 2 P(X ≤ 2.228) - 1= 2 (0.975) –1= 0.95

    Utilizando el SPSS, ejecutar los comandos Transform/Com-

    pute/escoger la función CDF.T(2.228,10)/OK.

    en el Editor del SPSS:

    Función de distribuciónCuantil: q = 2.228

    Grados de libertad

  • 4 4

    Distribución F de Snedecor

    Si la variable aleatoria X tiene función de densidad por

    0,

    122

    2)(2

    12

    2

    >

    +

    Γ

    Γ

    = +

    x

    xnm

    xnm

    nm

    nm

    xf nm

    mm

    Se dice que X tiene distribución F con m y n grados de libertad.

    Notación: X ~ F(m, n)

    Ejemplo 1.11

  • 4 5

    Se encontrarán algunas probabilidades para ilustrar el uso de laTabla D del anexo.

    a) Si X tiene una distribución F con m = 9 y n = 10 grados delibertad, encontraremosP(X ≤ 3.14).

    b) Si tiene una distribución F con m = 7 y n = 15 grados de liber-tad, encontraremosP(X ≥ 4.57).

    c) Si tiene una distribución F con m = 8 y n = 5 grados de liber-tad, encontraremosP(X ≤ 6.63).

    Solución

    a) En la Tabla D ubicamos la intersección de la fila correspon-diente a m = 10 y la columna correspondiente n = 9 y se en-cuentra el cuantil 3.14 al que le corresponde una probabili-dad de 0.95.

    Es decir, X ~ F(10, 9) P( £ 3.14) = 0.95.

    b) P(X ≥ 4.57) = 1- P(X < 4.57) = 1- 0.975 = 0.025

    Es decir, X ~ F(15, 7) P(X ≥ 4.57) = 0.025

    c) Si X ~ F(5, 8) P(X ≤ 6.63) = 0.99

    Utilizando el SPSS para resolver el item a) ejecutar los si-guientes comandos:

    Transform/Compute/escoger la función CDF.F(3.14,9,10)/

  • 4 6

    OK.

    Se obtiene la probabilidad deseada.

    Distribuciones muestrales

    Cuantil: 1 = 3.14 m = 9 n = 10

  • 4 7

    El estudio de determinadas características de una población se efec-túa a través de diversas muestras que pueden extraerse de ella ylas estadísticas obtenidas de las muestras permiten estimar losparámetros de la población. Por ello, en el proceso de hacer infe-rencias respecto a una población en estudio, basándonos en infor-mación muestral, es necesario conocer la relación que se estableceentre estadísticas y parámetros. Esta se realiza a través de la dis-tribución muestral de una estadística.

    Definición La distribución muestral de una estadística es la dis-tribución de todos los posibles valores que puede tomar la estadís-tica, calculada en base a muestras del mismo tamaño, selecciona-das aleatoriamente de una misma población.

    El conocimiento de las distribuciones muestrales permiteconocer mínimamente la media y la varianza de la estadística.

    En el caso de considerar poblaciones finitas y discretas, sepuede construir empíricamente una distribución de probabilidadde la siguiente manera:

    • Se seleccionan aleatoriamente todas las muestras posiblesde tamaño n de una población finita de tamaño N.

    • Se calcula la estadística de interés para cada una de lasmuestras.

    • Se organizan los valores observados de la estadística y seobtienen sus respectivas frecuencias.

    En aquellos casos en los cuales la población no es finita, seobtiene un gran número de muestras del mismo tamaño de estapoblación y así se obtiene una aproximación de la distribuciónmuestral.

    Algunas estadísticas de importancia son la media mues-

  • 4 8

    tral( X ), la varianza muestral( 2S ), la diferencia de medias mues-trales en el caso de dos muestras ( 21 XX − ), el cociente de varian-zas muestrales )( 2

    2

    21

    SS .

    Cabe establecer la diferencia entre la distribución poblacio-nal de la variable, la distribución muestral de la estadística y ladistribución de la muestra observada, para lo cual se toma el si-guiente ejemplo, que por razones estrictamente metodológicas,la población es de tamaño 5.

    Ejemplo 1.12

    En una población conformada por 5 docentes donde la variableen estudio es el número de años de experiencia docente ( X ).Encontraremos:

    a) la distribución poblacional de la variable.b) La distribución muestral de la estadística media muestral

    ( X ). c) La distribución de una de las muestras observadas.

    Solución

    a) La distribución de la variable aleatoria años de experienciadocente es la siguiente, donde se obtiene la media y la va-rianza poblacional:

    DOCENTE AÑOS DE EXPERIENCIADOCENTE (X)

    1 x1 = 22 x2 = 33 x3 = 44 x4 = 55 x5 = 6

  • 4 9

    ( ) ( )2

    ì

    5

    4

    45

    1

    2

    1

    2

    2

    5

    11

    =−

    =−

    =

    ===

    ∑∑

    ∑∑

    ==

    ==

    N

    ii

    N

    ii

    ii

    N

    ii

    XX

    XX

    N

    N

    σ

    µ

    b) Distribución muestral de la estadística: media muestral ( X ).

    A continuación se presenta todas las posibles muestras detamaño n=2 seleccionadas desde la población de tamaño N=5 ysus respectivas medias muestrales. Las muestras que aparecensombreadas indican que son muestras obtenidas en base a unmuestreo con reemplazamiento. Las restantes son resultado deun muestreo sin reemplazamiento

    Segunda selección

    Primera 2 3 4 5 6selección

    Muestra x Muestra x Muestra x Muestra x Muestra x2 (2,2) 2 (2,3) 2.5 (2,4) 3 (2,5) 3.5 (2,6) 4

    3 (3,2) 2.5 (3,3) 3 (3,4) 3.5 (3,5) 4 (3,6) 4.5

    4 (4,2) 3 (4,3) 3.5 (4,4) 4 (4,5) 4.5 (4,6) 5

    5 (5,2) 3.5 (5,3) 4 (5,4) 4.5 (5,5) 5 (5,6) 5.5

    6 (6,2) 4 (6,3) 4.5 (6,4) 5 (6,5) 5.5 (6,6) 6

    Se organizaran el conjunto de todos los posibles valores obteni-dos en base a las muestras de tamaño dos, considerando el mues-treo con reemplazamiento y el muestreo sin reemplazamiento.• Si el muestreo es con reemplazamiento el número total de

    posibles muestras es Nn, para este ejemplo N=5 y n=2 obte-niéndose 52 =25 muestras.

  • 5 0

    • Se obtiene el valor ( x ) de la media muestral ( x ) para cadauna de las muestras.

    • En una tabla se organizan los valores ( x ) obtenidos para lasmuestras de tamaño 2 y sus respectivas frecuencias.

    • En una tabla se organizan los valores x obtenidos para las25 muestras de tamaño 2 y sus respectivas frecuencias.

    xx Frecuencia Frecuencia

    absoluta Relativa

    if

    2.0 1 1/25

    2.5 2 2/25

    3.0 3 3/25

    3.5 4 4/25

    4.0 5 5/25

    4.5 4 4/25

    5.0 3 3/25

    5.5 2 2/25

    6.0 1 1/25

    Total 25 1.00

  • 5 1

    Para el muestreo con reemplazamiento:

    La media y la varianza de la media muestral x son:

    425

    10025

    6)5.5(2...)5.2(2225

    8

    1ì ==++++∑

    == =i

    ii fx

    X

    donde la media de la distribución muestral de x tiene el mis-mo valor que la media poblacional.

    12525

    254645.242

    25

    4 2228

    1

    2

    ...22 =

    −−−∑ −=

    ++

    +

    =

    = =iifix

    donde la varianza de la distribución muestral de x es iguala la varianza poblacional dividida entre el tamaño de la mues-tra, es decir

    122

    22 ===

    nX

    σ

    Los resultados obtenidos en este ejemplo conducen a señalarque cuando el muestreo se realiza con reemplazamiento desdeuna población finita:

    • La media de la estadística x es igual a la media de la po-blación.

    • La varianza de la estadística x es igual a la varianza de lapoblación dividida entre el tamaño de la muestra.

    x tiene media µ y varianza n

    2σ.

    c) Distribución de la muestraEsta distribución se refiere a la distribución de la variable Xen la muestra observada. Si la muestra observada es el par (5,2), entonces para el nú-

    mero de años en la docencia tenemos:

    su 5.3225 =+=x y su varianza:

    ( )n

    xxs i

    i∑=

    −=

    2

    1

    2

    2 = ( ) ( )2

    5.15.1 22 −+ =2.25,

    Valores con los que en la práctica estimamos la media po-blacional y la varianza poblacional de la variable.

  • 5 2

    Para el muestreo sin reemplazamiento

    El número total de posibles muestras es:

    )!(!!nNn

    NnN

    −=

    Y para este ejemplo N=5 y n=2 se obtienen ( ) 10)!25(!2 !525 =−= muestras.• Se obtiene el valor ( x ) de la media muestral para cada una

    de las muestras.• En una tabla se organizan los valores ( x ) obtenidos para las

    10 muestras de tamaño 2 y sus respectivas frecuencias.

    x Frecuencia FrecuenciaAbsoluta relativa

    if

    2.5 1 1/10

    3.0 1 1/10

    3.5 2 2/10

    4.0 2 2/10

    4.5 2 2/10

    5.0 1 1/10

    5.5 1 1/10

    Total 10 1.00

  • 5 3

    Se deja como ejercicio obtener la media y la varianza de lamedia muestra.

    Distribución de la media muestral

    Formalizando la presentación hecha previamente tenemos que:Si X es una variable aleatoria con distribución normal con

    media µ y varianza conocida σ 2 y desde dicha población se tomauna muestra aleatoria nXX ,...,1 de tamaño n; se prueba que lavariable estandarizada:

    n

    uXZ σ−= tiene distribución N(0,1) (1.1)

    donde es la media muestral.

    La expresión (1.1) será usada en el siguiente capítulo paraconstruir el intervalo de confianza y en el capítulo 4 para postu-lar hipótesis para la media poblacional. En el siguiente ejemplovamos a ilustrar otro uso de la distribución muestral de la mediamuestral.

    Ejemplo 1.13

    Se tiene conocimiento que el gasto semanal de los adolescentesque juegan en la internet sigue una distribución normal con me-

  • 5 4

    dia igual a S/. 18.00 y una desviación estándar igual a S/. 6.00.¿Cuál es la probabilidad de que una muestra aleatoria de 36 ado-lescentes tenga un gasto semanal promedio entre S/. 16.00 y S/.20.00?

    Solución

    X: gasto semanal de los adolescentes en la internet

    X : media muestral de los gastos semanales de los adolescentesen la internetµ = 18 σ = 6 σ 2 =36 µ 2/n = 36/36 = 1

    ( )2016

  • 5 5

    Distribución de la media muestral en poblaciones no normales(muestras grandes)

    En la práctica en diversas investigaciones nos enfrentamos aaquellos casos en los cuales la variable aleatoria en estudio nosigue una distribución normal. Puede visualizarse los datos ex-ploratoriamente y comprobar este hecho o aplicar una pruebaque nos permita decidir con una probabilidad de error si se pue-de afirmar que la variable sigue una distribución normal. En elcaso de que la variable aleatoria no tenga una distribución nor-mal, se plantea como solución: seleccionar una muestra de ta-maño grande desde la población en estudio y utilizar el teoremade límite central. Este teorema es uno de los más importantes dela estadística y cumple un rol fundamental en las aplicaciones.

    Teorema de Límite Central: Sin tener en cuenta la forma fun-cional de la población de donde se selecciona la muestra, la me-dia muestral calculada en base a una muestra extraída desde unapoblación con media µ y varianza finita σ2, sigue una distribuciónaproximadamente normal con media µ y varianza σ2/n, cuandoel tamaño de muestra es grande. Es decir, la media muestral X deuna muestra aleatoria procedente de cualquier distribución conmedia µ y varianza finita σ2, se distribuye aproximadamentecomo una variable normal con media µ y varianza σ2/n.

    Puede expresarse este resultado de la siguiente manera:

    ∞→⇒

    nN

    nXfX

    2

    2 óìóì ,),(~

    Así, cuando el tamaño de muestra que se toma es suficiente-mente grande (mayor que 30), aún cuando no se conozca la dis-tribución de la variable X, por el teorema del límite central, lasvariables:

    n

    XZ σ

    µ−=

    y n

    SX

    tµ−

    = (1.3)

  • 5 6

    Tienen distribución aproximadamente normal, donde es unamuestra aleatoria de tamaño n y X es la medial muestral.

    Cabe indicar que dichas estadísticas pueden usarse paraconstruir intervalos de confianza para la media poblacional orealizar pruebas de hipótesis para el mismo parámetro.

    Ejemplo 1.14

    En una población de jóvenes alcohólicos con edades entre 16 y 21años se conoce que el tiempo promedio de consumo de alcohol esde 4 años con una desviación estándar de 2 años. ¿Cuál es la pro-babilidad de que en una muestra aleatoria de 100 jóvenes alco-hólicos de esta población se obtenga un tiempo medio que fluc-túe entre 2 y 6 años?.

    Solución

    X: tiempo ( años) de consumo de alcohol

    σ = 4 σ2 = 4 σ = 2 σ2/n = 4/100 = 0.04

    1002

    4−=

    XZ =

    2.04−

    =X

    Z tiene distribución y podemos calcular la

    siguiente probabilidad:

    ( )

  • 5 7

    rística A (π)en una población. Por ejemplo, la proporción de estu-diantes que llegan temprano a la clase de estadística, la propor-ción de estudiantes provenientes de colegios privados que postu-laron al proceso de admisión 2004-I a la UNMSM, la proporciónde estudiantes motivados con la carrera profesional que han esco-gido, etc. Estas situaciones implican el uso de la distribución de laproporción muestral, P, a partir de la cual haremos inferencias.

    Si nXX ,....,1 es una muestra aleatoria de tamaño n desde unapoblación donde es la proporción de elementos con cierta carac-

    terística A (en la muestra aleatoria),entonces, en muestras gran-

    des tiene distribución aproximadamente N( n)1(, πππ − ), donde:

    ∑=

    =n

    iiXn

    P1

    1 ,

    =ticacaracterísla posee no elemento el si 0

    ticacaracterísla posee elemento el si 1iX . Luego, la estadística:

    nPZ

    )1( πππ

    −−= tiene distribución aproximadamente N(0,1) (1.4)

    y se usará para construir intervalos de confianza y postularhipótesis para el parámetro poblacional π.

    Ejemplo 1.15

    Se conoce que el 60% de los postulantes a la Universidad Nacio-nal Mayor de San Marcos, proceden de distintas provincia delpaís. Si se selecciona aleatoriamente una muestra de 150 alum-nos de esta población. ¿Cuál es la probabilidad de que la propor-ción muestral de estudiantes que proceden de provincias se en-cuentre entre 0.50 y 0.70

    Solución

    Debido a que se cuenta con una muestra de tamaño grande pue-de afirmarse que la distribución de P se aproxima a una distri-bución normal con media p=0.60 y desviación estándar:

    n/)1( ππ − .

  • 5 8

    La probabilidad de que la proporción muestral se encuentreentre 0.50 y 0.70, puede ser obtenida de la siguiente forma:

    ( )

    ( )( ) ( )( )

    98758.01)993790.0(215.22

    5.25.25.25.2

    04.010.0

    04.010.0

    0016.010.0

    0016.010.0

    150)60.01(60.060.070.0

    150)60.01(60.060.0

    150)60.01(60.060.050.070.050.0

    =−=−

  • 5 9

    Con los supuestos anteriores, la diferencia de medias mues-

    trales 21 XX − tiene distribución

    +−

    2

    22

    1

    21

    21 , nnN σσµµ y luego la

    variable aleatoria estandarizada,

    ( ) ( )

    2

    22

    1

    21

    2121

    nn

    XXZσσ

    µµ

    +

    −−−=, tiene distribución (1.5)

    que también se usará para obtener intervalos de confianza ypruebas de hipótesis para la diferencia de medias poblacionales:

    21 µµ − .

    Ejemplo 1.16

    Un psicólogo tiene conocimiento que los temas relacionados conla inteligencia emocional influyen en las expectativas profesio-nales de los jóvenes. Este profesional, recibe información que unapoblación de jóvenes capacitados sobre este tema obtuvieron unanota promedio de 16 y una varianza de 4, y que otra poblaciónde jóvenes que no recibieron capacitación relacionada a este tema,obtuvieron una nota promedio de 12 y una varianza de 3. Poste-riormente selecciona dos muestras: una muestra de tamaño 10de la población de jóvenes capacitados (muestra 1) y otra mues-tra de tamaño 12 de aquellos que no recibieron capacitación so-bre este tema (muestra 2) y se pregunta por la probabilidad quela diferencia entre la nota promedio de la muestra 1 con respectoa la de la muestra 2 sea más de 5 puntos.

    Solución

    301212401610

    2

    222

    2

    111

    ======

    óìóì

    ..

    nn

    ( ) ( )),(~ 10

    123

    104

    121621 NXXZ+

    −−−=

  • 6 0

    ( ) ( ) ( ) ( )

    10750892501

    2411650

    1123

    104

    12165

    123

    104

    121621521

    ..

    ).(.

    =−=

    =

    +

    −−>

    +

    −−−=>−

    ZP

    ZP

    XXPXXP

    La probabilidad que la diferencia entre las notas promediosde aquellos jóvenes que recibieron capacitación con respecto alos que no recibieron, supere los cinco puntos es de 0.1075.

    Distribución de la diferencia de medias muestrales cuando lasvarianzas poblacionales son desconocidas e iguales

    Si X e Y son variables aleatorias independientes con distribucio-nes ( )21,σµN y ( )22,σµN respectivamente; entonces, las mediasmuestrales 1X y 2X correspondientes a las muestras aleatoriasindependientes

    1,111,..., nXX y 2,221,..., nXX de tamaño n1 y n2 tienen

    distribuciones de tamaño n1 y n2, tienen las siguientes distribu-

    ciones

    1

    2

    1, nN

    σµ y

    2

    2

    2, nN

    σµ . Luego, la variable aleatoria 1X y 2X

    estandarizada ( ) ( )

    2

    2

    1

    22121

    nn

    XXZσσ

    µµ

    +

    −−−= , tiene distribución ( )1,0N .

    Como la varianza poblacional es desconocida, tiene que serestimada y en lugar de la variable estandarizada Z, se tiene lavariable aleatoria:

    ( ) 11

    )(

    21

    2

    2121

    +

    −−−=

    nnpS

    XXt µµ

    (1.6)

  • 6 1

    cuya distribución es t-student con ( )221 −+ nn y se denotacon t nn( )221 −+ , donde

    ( ) ( )2

    11

    21

    221

    2112

    −+−+−

    =nn

    nn SSSp es el estimador de la varianza pobla-

    cional σ2.

    Ejemplo 1.17

    Un psicólogo tiene conocimiento que los temas relacionados a lainteligencia emocional influyen en las expectativas profesiona-les de los jóvenes. Este profesional, recibe información que unapoblación de jóvenes capacitados sobre este tema obtuvieron unanota promedio de 18, y que otra población de jóvenes que no re-cibieron capacitación relacionada a este tema, obtuvieron unanota promedio de 11 y desconoce los valores de las varianzas,pero considera razonable suponer que son iguales. Seleccionamuestras de tamaño 14 de cada una de las poblaciones y en lasmuestras obtiene 928.121 =s 864.2

    22 =s . El psicólogo desea de-

    terminar la probabilidad que la diferencia entre las notas pro-medios sea menor que 6.

    Solución

    Se cuenta con la siguiente información:

    1421 == nn 928.121 =s 864.2

    22 =s 181 =µ 112 =µ

    22

    21 σσ =

    desconocidos

    y se obtiene: ( ) ( ) 5479126

    864213928113.

    ..=

    +=pS

    ( ) ( )

    −++

    −−−= 21414

    141

    14154791

    111821 tt XX ~).(

    ( )

    −−= 2658510

    721 tt XX ~.

  • 6 2

    ( )

    ( )

    ( )

    ( )

    .05.0 95.01

    )709.1(1 )709.1(

    5851.01

    141

    1415479.1

    76

    141

    1415479.1

    111821621

    26

    26

    26

    =−=

  • 6 3

    Si 30≥k , la estadística tiene distribución aproximadamentenormal. Si las muestras son suficientemente grande ( 301 ≥n y

    302 ≥n ) e independientes, la estadística ( )

    2

    22

    1

    21

    21

    nS

    nS

    XXZ+

    −= tiene dis-

    tribución aproximadamente normal estándar.

    Estos resultados se usarán posteriormente para abordar eltópico de pruebas de hipótesis.

    Distribución de la diferencia de dos proporciones muestrales

    En las poblaciones 1 y 2, con respectivas proporciones poblacio-nales 1π y 2π ( de estudiantes, profesores, etc.,para ser más gené-ricos, de «unidades»), con determinados atributos. Los paráme-tros que son las proporciones poblacionales tienen como esti-

    madores en cada una de las muestras: 1

    1 nAP = y

    12 n

    BP = , donde

    es el número de elementos con el atributo de interés en la prime-ra muestra y es el número de elementos con el mismo atributo enla segunda muestra. Cuando las muestras son suficientementegrandes, la estadística

    ( )

    ( )

    +−

    −−−

    21

    2121

    111

    )(

    nnPP

    PP ππ tiene distribución aproximadamente )1,0(N

    donde 21

    2211

    nnPnPnP

    ++= .

    Ejemplo 1.18

    Se conoce que el 50% de profesores de educación superior de laRegión Sur y el 33% de profesores de educación superior de laRegión Norte acreditan tener una maestría. De cada una de estas

  • 6 4

    poblaciones se seleccionan muestras de tamaño 100 (no necesaria-mente las muestras deben ser del mismo tamaño). ¿Cuál es la pro-babilidad que la diferencia entre las proporciones muestralessea inferior al 30%?.

    Solución

    • Población 1 profesores de la Región Sur mues-tra de tamaño 100

    • Población 2 profesores de la Región Norte mues-tra de tamaño 100

    • Característica de interés: estudios de maestría.• Proporción de profesores con estudios de maestría en la po-

    blación 1 0.50• Proporción de profesores con estudios de maestría en la po-

    blación 2 0.33

    Se supone que 21 PP − , sigue aproximadamente una distri-bución normal con media

    17.033.050.02121 =−=−=− ππµ pp

    y varianza

    ( ) ( ) 004711.0100

    33.0133.0100

    50.0150.0221

    =−+−=− ppσ

    y )1,0(004711.017.0)(

    10021001

    21 NPPZnn

    →−−==

    =

    La probabilidad buscada es:

    ( )

  • 6 5

    Distribución muestral del cociente de varianzas

    Si 1X e 2X son variables aleatorias independientes con distribu-ciones ( )211,σµN y ( )222 ,σµN respectivamente, la estadística F seconstruye en base al cociente entre dos estadísticas ji cuadrados.

    2

    )(

    2

    )(

    12

    2

    1

    11

    22

    221

    22

    221

    21

    211

    21

    211

    2

    2

    1

    1

    1

    1

    −=

    n

    n

    ÷

    n

    nF

    ÷

    Sn

    Sn

    Sn

    Sn

    ~)(

    )(

    )(

    ~)(

    ó

    ó

    ó

    ó

    ),(~ 1211 −− nnf

    1.8940

    ( )222 ,σµN La estadística 22

    21

    SSF = tienen distribución F-Sne-

    decor con ( )11 −n y ( )12 −n grados de libertad.

    Es decir, ),(~ 121122

    22

    21

    21 −−= nnf

    S

    SF

    ó

    ó(1.9)

  • 6 6

    Ejemplo 1.19

    Un asesor supone que la variabilidad en el número diario de ho-ras de estudio es la misma en alumnos del último año de la carre-ra profesional de lingüística y los alumnos del último de bibliote-cología. El asesor selecciona una muestra aleatoria de 16 estu-diantes del último año de lingüística independiente de una mues-tra de 21 estudiantes de bibliotecología y se quiere conocer laprobabilidad de que el cociente entre las varianzas muestralessea inferior a 1.84. Suponga varianzas poblacionales iguales.

    Solución

    2)1(21~2

    22)20(

    2

    22)12(

    2)1(16~2

    21)15(

    2

    21)11(

    −=−

    −=−

    ÷SSn

    ÷SSn

    σσ

    σσ

    Función de densidad de probabilidad F

    22

    21

    202

    22)20(

    152

    21)15(

    122

    22)12(

    112

    21)11(

    S

    S

    S

    S

    nSn

    nSn

    F ==

    −−

    −−

    =

    σ

    σ

    σ

    σ

  • 6 7

    Ejercicios

    1.1. Se conoce que 1000 estudiantes universitarios fueron clasi-ficados de acuerdo con los puntajes que obtuvieron en el exa-men de ingreso a la universidad y el colegio de procedencia.La información es la siguiente:

    En la tabla F_Snedecor con 15 y 20 grados de libertad para

    < 84.12

    2

    21

    SSP se encuentra el valor 0.90. Es decir:

    < 84.12

    2

    21

    SSP 90.0)84.1( )20,15( =

  • 6 8

    a) Calcular la probabilidad que un estudiante elegido al azarhaya obtenido un puntaje entre 151 y 190.

    b) Calcular la probabilidad que un estudiante elegido alazar haya obtenido un puntaje de 190 o menos.

    c) Calcular la probabilidad que un estudiante elegido alazar proceda de un colegio estatal.

    d) Calcular la probabilidad que un estudiante elegido alazar que haya obtenido un puntaje de 191 o más y pro-ceda de un colegio privado.

    e) Calcular la probabilidad que un estudiante elegido alazar que haya obtenido un puntaje de 150 o menos yproceda de un colegio estatal.

    1.2 Usted es un inspector de escuelas públicas y realiza un expe-rimento para investigar si la habilidad en lectura de estu-diantes de primer año de secundaria ha mejorado o no. Lasnotas nacionales sobre la habilidad en lectura, para los estu-diantes de primer año de secundaria muestran una distribu-ción normal con media de 80 palabras por minuto y una des-viación estándar igual a 12 palabras por minuto. En base auna muestra aletoria de 185 estudiantes de esta población:a) Determine la probabilidad de que la media muestral sea

    inferior a 82 palabras por minuto.b) Determine la probabilidad de que la varianza muestral

    sea superior a 100.

    1.3 Años de experiencia han demostrado que un examen de ad-misión a la Facultad de Educación de una Universidad, losestudiantes obtienen en media 140 puntos con una desvia-ción estándar de 10 puntos. En base a una muestra aleatoriade 25 postulantes a la Facultad de Educación se desea deter-minar las siguientes probabilidades:

    a) ( )145

  • 6 9

    1.4 Hace tres años el ministro de Educación afirmó que histórica-mente la proporción de alumnos que estudian en zonas rura-les y abandonan sus estudios al culminar el tercer año de pri-maria es de 0.30. En los últimos dos años el gobierno ha reali-zado inversiones en infraestructura y docencia en dichas zo-nas rurales con la esperanza de revertir el resultado plantea-do por el ministro. Con el fin de evaluar los cambios, despuésde dos años se tomo una muestra aleatoria de 500 estudian-tes. Determine la probabilidad que la proporción muestral dealumnos que estudian en zonas rurales abandonen sus estu-dios al culminar el tercer año de primaria sea inferior a 0.28.

    1.5 Un investigador en el campo educativo sostiene que el mó-dulo didáctico empelado en la enseñanza de las Matemáti-cas es uno de los factores que influyen y determina en el pro-ceso de enseñanza-aprendizaje y por lo tanto, el móduloadoptado incidirá en el rendimiento académico de los estu-diantes. Se decide realizar el siguiente experimento: Duran-te un semestre se llevó a cabo el trabajo lectivo en dos gru-pos independientes de estudiantes de la misma carrera en lamisma Universidad, empleando dos métodos (A y B) de ca-racterísticas bien diferenciadas. Al final del curso se aplicóel mismo examen a todos los estudiantes que obtuvieron lassiguientes notas.

    Suponiendo que las muestras provienen de poblaciones nor-

    Método A 15 16 15 13 13 16 16 14 17

    Método B 13 14 14 11 12 14 13

    males con media 151 =µ y varianza 421 =σ ; con media 131 =µ y

    varianza 422 =σ , respectivamente. Determine las siguientes pro-babilidades:

    a) ( )021 >− XXP

  • 7 0

    b) ( )221