Notas de Probabilidades

Embed Size (px)

Citation preview

Notas de Probabilidades y Estad sticaCap tulos 1 al 12

V ctor J. [email protected] Basadas en apuntes de clase tomados por Alberto Dboli, durante el a o 2003 e n Versin corregida durante 2004 y 2005, con la colaboracin de Mar Eugenia Szretter o o a 20 de Marzo de 2006

2

Indice general1. Espacios de Probabilidad. 1.1. Experimentos aleatorios. Algunas consideraciones heur sticas. 1.2. Axiomas de probabilidad. . . . . . . . . . . . . . . . . . . . . 1.2.1. Algebras. . . . . . . . . . . . . . . . . . . . . . . . 1.2.2. Espacios de Probabilidad. . . . . . . . . . . . . . . . . 1.3. Algebra generada por una familia de conjuntos. . . . . . . 1.4. Espacios de probabilidad nitos o numerables. . . . . . . . . . 1.5. Probabilidad condicional. . . . . . . . . . . . . . . . . . . . . 1.6. Independencia de eventos. . . . . . . . . . . . . . . . . . . . . 7 7 8 8 10 18 21 23 25

2. Variable Aleatoria. 31 2.1. Concepto de variable aleatoria. . . . . . . . . . . . . . . . . . 31 2.2. Espacio de probabilidad asociado a una variable aleatoria. . . 32 2.3. Funcin de distribucin de una variable aleatoria. . . . . . . . 35 o o 3. Variables aleatorias discretas y continuas. 41 3.1. Variables aleatorias discretas. . . . . . . . . . . . . . . . . . . 41 3.2. Ejemplos de distribuciones discretas. . . . . . . . . . . . . . . 43 3.2.1. Distribucin Binomial. . . . . . . . . . . . . . . . . . . 43 o 3.2.2. Distribucin Binomial Negativa (o Distribucin de Paso o cal). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2.3. Distribucin Geomtrica. . . . . . . . . . . . . . . . . 46 o e 3.2.4. Distribucin Hipergeomtrica. . . . . . . . . . . . . . . 47 o e 3.2.5. Distribucin de Poisson. . . . . . . . . . . . . . . . . . 48 o 3.2.6. Grco de la funcin de distribucin asociada a una a o o variable aleatoria discreta. . . . . . . . . . . . . . . . . 49 3.3. Variables aleatorias absolutamente continuas. . . . . . . . . . 49 3.4. Ejemplos de distribuciones continuas. . . . . . . . . . . . . . . 53 3.4.1. Distribucin uniforme en un intervalo. . . . . . . . . . 53 o 3.4.2. Generacin de distribuciones a partir de la distribuo cin uniforme en [0,1] . . . . . . . . . . . . . . . . . . 55 o 3.4.3. Distribucin Normal N , 2 . . . . . . . . . . . . . . 59 o 3.4.4. Distribucin Exponencial. . . . . . . . . . . . . . . . . 62 o 3

3.5. Variables aleatorias mixtas. . . . . . . . . . . . . . . . . . . . 4. Vectores aleatorios. 4.1. Denicin de vector aleatorio. . . . . . . . . . . . . . . . . . . o 4.2. Espacio de probabilidad inducido. . . . . . . . . . . . . . . . . 4.3. Funcin de distribucin conjunta de un vector aleatorio. . . . o o 4.4. Algunas propiedades de vectores aleatorios. . . . . . . . . . . 4.5. Independencia de variables aleatorias. . . . . . . . . . . . . . 4.5.1. Algunas consideraciones heur sticas. . . . . . . . . . . 4.5.2. Conservacin de la independencia por transformaciones. o 4.5.3. Independencia de vectores aleatorios. . . . . . . . . . .

65 69 69 70 71 78 80 80 86 86

5. Vectores aleatorios discretos y continuos. 89 5.1. Vectores aleatorios discretos. . . . . . . . . . . . . . . . . . . 89 5.1.1. Funcin de densidad de probabilidad conjunta. . . . . 91 o 5.1.2. Caracterizacin de la funcin de densidad marginal o o asociada a un subconjunto de variables. . . . . . . . . 92 5.2. Ejemplos de vectores aleatorios con distribucin discreta. . . 94 o 5.2.1. Distribucin Multinomial. . . . . . . . . . . . . . . . . 94 o 5.2.2. Distribucin Hipergeomtrica Multivariada. . . . . . . 96 o e 5.3. Vectores Aleatorios de tipo absolutamente continuo. . . . . . 98 6. Transformaciones de variables y vectores aleatorios. 6.1. Transformaciones montonas de variables aleatorias. . . . . o 6.1.1. Distribucin Normal . . . . . . . . . . . . . . . . . . o 6.2. Transformaciones inyectivas de vectores aleatorios. . . . . . 6.3. Algunas aplicaciones a la distribucin normal. . . . . . . . . o 6.4. Transformaciones no inyectivas . . . . . . . . . . . . . . . . 6.4.1. Distribucin Chi-cuadrado con un grado de libertad. o 6.5. Algunas distribuciones complementarias. . . . . . . . . . . . 6.5.1. Distribucin Gamma. . . . . . . . . . . . . . . . . . o 6.5.2. Distribucin beta. . . . . . . . . . . . . . . . . . . . o 6.5.3. Distribucin Chi-cuadrado. . . . . . . . . . . . . . . o 6.5.4. Distribucin t de Student . . . . . . . . . . . . . . . o 105 105 107 109 112 114 115 . 116 . 116 . 121 . 123 . 123 . . . . .

7. Esperanza Matemtica. a 125 7.1. Integral de Riemann-Stieltjes. . . . . . . . . . . . . . . . . . . 125 7.1.1. Denicin de la integral. . . . . . . . . . . . . . . . . . 125 o 7.2. Denicin de Esperanza Matemtica. . . . . . . . . . . . . . . 128 o a 7.2.1. Algunas consideraciones heur sticas. . . . . . . . . . . 128 7.2.2. Esperanza de una variable aleatoria discreta. . . . . . 129 7.2.3. Denicin general de esperanza matemtica. . . . . . 129 o a 7.2.4. Esperanza matemtica para una variable absolutamente a continua. . . . . . . . . . . . . . . . . . . . . . . . . . 133 4

7.2.5. Algunas propiedades de la esperanza matemtica . . . 134 a 7.3. Esperanza del producto de variables aleatorias independientes. 149 7.4. Una frmula general para la esperanza de una variable transo formada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 7.5. Esperanza de distribuciones simtricas . . . . . . . . . . . . . 154 e 7.6. Mediana de una variable aleatoria. . . . . . . . . . . . . . . . 158 7.7. Varianza de una variable aleatoria. . . . . . . . . . . . . . . . 161 7.7.1. Esperanzas y varianzas de distribuciones normales . . 163 7.8. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 7.9. Distribucin Normal Bivariada. . . . . . . . . . . . . . . . . . 167 o 8. Teor de la Prediccin. a o 173 8.1. Error cuadrtico medio y predictores ptimos. . . . . . . . . . 173 a o 8.2. Predictores constantes. . . . . . . . . . . . . . . . . . . . . . . 175 8.3. Predictores lineales. . . . . . . . . . . . . . . . . . . . . . . . 176 9. Esperanza y distribucin condicional. o 9.1. Caso discreto. . . . . . . . . . . . . . . 9.2. Caso general . . . . . . . . . . . . . . 9.3. Caso continuo . . . . . . . . . . . . . . 9.4. Varianza condicional . . . . . . . . . . 179 179 187 190 192 195 195 196 199 204 207 213

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

10.Convergencia de Variables Aleatorias. 10.1. Convergencia de funciones. . . . . . . . . . . . . . . . . 10.2. Convergencia casi segura y en probabilidad. . . . . . . . 10.3. Preservacin de la convergencia por funciones continuas. o 10.4. Ley dbil de los grandes nmeros. . . . . . . . . . . . . . e u 10.5. Ley fuerte de los grandes nmeros. . . . . . . . . . . . . u 10.6. Teorema de la Convergencia Dominada . . . . . . . . . .

. . . . . .

. . . . . .

. . . . . .

11.Convergencia en Distribucin. o 217 11.1. Denicin de convergencia en distribucin. . . . . . . . . . . . 217 o o 11.2. Funciones caracter sticas. . . . . . . . . . . . . . . . . . . . . 220 11.2.1. Variables aleatorias complejas. . . . . . . . . . . . . . 220 11.2.2. Denicin de funcin caracter o o stica y propiedades. . . 221 11.3. Momentos y funcin caracter o stica. . . . . . . . . . . . . . . . 226 11.3.1. Derivacin dentro del signo esperanza. . . . . . . . . . 226 o 11.3.2. Derivadas de la funcin caracter o stica y momentos. . . 227 11.4. Funcin caracter o stica de una distribucin normal. . . . . . . 229 o 11.5. Teorema Central del L mite. . . . . . . . . . . . . . . . . . . . 233 11.5.1. Caso de variables independientes idnticamente dise tribuidas . . . . . . . . . . . . . . . . . . . . . . . . . 233 11.5.2. Teorema Central del L mite para variables no idntie camente distribuidas. . . . . . . . . . . . . . . . . . . . 236 5

11.5.3. Una Aplicacin a la Binomial. . . . . . . . o 11.6. Teorema de Slutsky. . . . . . . . . . . . . . . . . 11.7. Aplicacin a intervalos de conanza. . . . . . . . o 11.8. Un teorema util de Convergencia en Distribucin o 12.Procesos de Poisson. 12.1. Procesos de punto. . . . . . . . . . . . 12.2. Axiomtica de los Procesos de Poisson a 12.3. Distribucin de un proceso de Poisson. o 12.4. Tiempos de espera . . . . . . . . . . . 12.5. Procesos de Poisson en el plano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

240 242 253 255 257 257 257 259 264 265

6

Cap tulo 1

Espacios de Probabilidad.1.1. Experimentos aleatorios. Algunas consideraciones heur sticas.

Se llamar experimento aleatorio a un experimento tal que (i) no se puede a preveer el resultado de un solo experimento, (ii) si se repite el experimento varias veces, la frecuencia con la cual el resultado est en un conjunto A a converge a un nmero. u

Ejemplo 1.1 El experimento consiste en arrojar una moneda. En este caso el conjunto de todos los posibles resultados ser a = {0, 1}, 0 corresponde a ceca y 1 a cara. Si se repite experimento muchas veces, la frecuencia con que sale por ejemplo cara, tiende a 0.5 Ejemplo 1.2 El experimento consiste en lanzar un dado. En este caso el conjunto de todos los posibles resultados ser a = {1, 2, 3, 4, 5, 6}. Si se tira el dado muchas veces, por ejemplo la fecuencia con que el resultado est en el conjunto A ser #A/6, donde #A representa el cardinal de a a A. Ejemplo 1.3 El experimento consiste en lanzar una jabalina y registrar la marca obtenida. En este caso el conjunto de todos los posibles resultados ser el conjunto de reales positivos y la frecuencia con que el resultado est, a e por ejemplo en un intervalo [a, b], depender del atleta. a 7

8

V ctor J. Yohai

Ejemplo 1.4 Se elige al azar un alumno de primer grado de un colegio y se anota su peso en kilos, x y la altura en metros y En este caso = {(x, y) R2 : x > 0, y > 0}. Como puede apreciarse los resultados pueden conformar un conjunto nito o innito de cualquier cardinalidad. Supongamos ahora que se hacen n repeticiones del experimento aleatorio. Si A , sea Cn (A) el nmero de veces que el resultado est en A, luego u a la frecuencia relativa del conjunto A se dene por fn (A) = Cn (A) . n

En el caso de un experimento aleatorio, cuando n crece, esta frecuencia se aproxima a un nmero que se llamar probabilidad de A y que denotaremos u a por P (A). Claramente 0 fn (A) 1, de manera que P (A) = l fn (A) , mn

y entonces 0 P (A) 1. Como veremos, en algunos casos, no se puede denir la probabilidad para todo subconjunto de resultados. Para precisar este concepto y estudiar sus propiedades formularemos la teor axiomtica de probabilidades. a a

1.2.

Axiomas de probabilidad.

En primer lugar deniremos algunas propiedades que tendr la familia a de todos los conjuntos para los cuales est denida su probabilidad. Esto a nos lleva al concepto de -lgebra. a

1.2.1.

Algebras.

Sea un conjunto. Deniremos el conjunto partes de , por P() = {A : A }. Dado un conjunto A, denotaremos por Ac el complemento de A. Denicin 1.1 Sea una familia A de subconjuntos de , es decir A o P().Se dice que A es una -lgebra sobre si satisface las siguientes a propiedades.

1.2. Axiomas de probabilidad.

9

A1. A. A2. Dado A A se tiene Ac A. A3. Sea A1 , . . . , An , . . . una sucesin de elementos de A. Entonces o

A=i=1

Ai A.

Propiedades de lgebras a Propiedad 1.1 A. Demostracin. Resulta de A1 y A2. 2 o Propiedad 1.2 Si A1 , ..., An son elementos de A entoncesn i=1

Ai A.

Demostracin. o Para ver esto supongamos que Ai A ; i = 1, 2, ..., n. Probaremos quen

A=i=1

Ai A.

Denamos una sucesin numerable (Bi )i1 agregando el conjunto de la o siguiente manera Bj = Aj , 1 j n, i=1

Bk = si k > n.

Entonces por ser A una -lgebra se tendr que a an

Bi A y por lo tanto

A=i=1

Ai =i=1

Bi A. 2

elementos de A entonces A =

Propiedad 1.3 Si A es una -lgebra, y A1 , ..., An , ... es una sucesin de a o i=1

Ai A.

Demostracin. Esto resulta de que A = ( oi=1

Ac )c . 2 i

10

V ctor J. Yohai

entonces A =

Propiedad 1.4 Si A es una -lgebra, y A1 , ..., An son elementos de A an i=1

Ai A.

Demostracin. Se demuestra igual que la Propiedad 1.2. 2 o Propiedad 1.5 Si A es una -lgebra, y A1 y A2 son elementos de A, a entonces A1 A2 A. Demostracin. En efecto A1 A2 = A1 Ac A. 2 o 2 Propiedad 1.6 La lgebra sobre ms chica posible es a a A0 = {, }, y la ms grande es a A1 = P () . Luego si A es una -lgebra sobre , se tendr a a A0 A A1 . 2

Observacin. En el contexto de la teor de la medida, un elemento de la o a lgebra A se llama un conjunto medible. a Como veremos en la prxima subseccin, la probabilidad estar denida o o a para los elementos de una lgebra. a

1.2.2.

Espacios de Probabilidad.

Denicin 1.2 Un espacio de probabilidad es una terna (, A, P ) donde o es un conjunto, A es una -lgebra sobre , y P : A [0; 1] es una a funcin que satisface: o 1. 2. P () = 1. ( -aditividad). Si (An )n1 es una sucesin de elementos de A disjuntos o dos a dos (Ai Aj = , si i = j), entonces

P(i=1

Ai ) =i=1

P (Ai ).

Observaciones.

1.2. Axiomas de probabilidad.

11

1. El conjunto se denomina espacio muestral y se interpreta como el conjunto de resultados posibles del experimento, los elementos de A se denominan eventos, y corresponden a los subconjuntos de para los cuales la probabilidad est denida. Finalmente P se denomina a funcin de probabilidad, y dado A A, P (A) se interpreta como la o probabilidad de que el resultado del experimento est en A. e 2. En el contexto de la teor de la medida, la terna (, A, P ) corresponde a a un espacio de medida donde la medida P asigna el valor uno al espacio total. 3. Si queremos formalizar la idea intuitiva de la probabilidad como l mite de la frecuencia relativa es importante observar que la frecuencia tiene la propiedad de -aditividad. En principio veamos que deber a ser aditiva Sean A1 , A2 , ..., Ak eventos disjuntos tomados de a dos, esto es, Ai Aj = si i = j entoncesk

fni=1

Ai

=

Cn

k i=1 Ai

n

=

k i=1 Cn (Ai )

k

n

=i=1

fn (Ai ) .

La -aditividad ahora se deduce pasando al l mite. Ejemplos de espacios de probabilidad. Ejemplo 1.5 Sea un conjunto, A = P(). Dado x0 , denimos: A 1 si x0 A P (A) = 0 si x0 A. /

a P se denota x0 y se dice que la probabilidad est concentrada en x0 o bien que el unico punto de probabilidad positiva es x0 . Ejemplo 1.6 Sea = {x1 , x2 , ..., xn , ...} cualquier conjunto numerable, A = P(X), y sea ai 0, i = 1, 2, ..., una sucesin tal que o

ai = 1.i=1

Denimos para todo A P (A) ={i: xi A}

ai

En este caso P dene una probabilidad y est completamente determinada a por las probabilidades ai asignadas a cada elemento xi .

12 Propiedades de la funcin de probabilidad. o Propiedad 1.7 P () = 0.

V ctor J. Yohai

Demostracin. Es inmediata, pues si tomamos Ai = , para todo i N o entonces por la -aditividad

0 P () = P

Aii=1

=i=1

P (Ai ) =i=1

P () 1,

y esto slo se cumple en el caso de que P () = 0. 2 on n i=1 P

Propiedad 1.8 Sean A1 , ...., An eventos disjuntos. Luego P (i=1

Ai ) =

(Ai ) .

Demostracin. Tomemos la sucesin Bj = Aj si j = 1, ..., n y Bj = si o o j > n. Aplicando la propiedad de aditividad se obtiene el resultado. 2 Propiedad 1.9 Si A A entonces P (Ac ) = 1 P (A) . Demostracin. Esto sale teniendo en cuenta que A y Ac son disjuntos y o 1 = P () = P (A Ac ) = P (A) + P (Ac ) . 2 Propiedad 1.10 Consideremos dos eventos A1 y A2 . Entonces P (A1 A2 ) = P (A1 ) P (A1 A2 ) . Demostracin. Como o A1 = (A1 A2 ) (A1 A2 ) se obtiene P (A1 ) = P (A1 A2 ) + P (A1 A2 ), y de ah sigue el resultado. 2 Proposicin 1.1 Si A1 , A2 son eventos y A2 A1 entonces o P (A1 A2 ) = P (A1 ) P (A2 ). y adems a

1.2. Axiomas de probabilidad.

13

P (A2 ) P (A1 ). Demostracin. Por la Propiedad 1.1 y el hecho de que A1 A2 = A2 tenemos o P (A1 A2 ) = P (A1 ) P (A1 A2 ) = P (A1 ) P (A2 ) Adems de aqu resulta a P (A1 ) = P (A2 ) + P (A1 A2 ) P (A2 ). 2

Propiedad 1.11 Si A1 , A2 son eventos entonces P (A1 A2 ) = P (A1 ) + P (A2 ) P (A1 A2 ) . Demostracin. Escribimos A1 A2 como la siguiente unin disjunta o o A1 A2 = (A1 A2 ) (A1 A2 ) (A2 A1 ) . Entonces usando la Propiedad 1.10 resulta P (A1 A2 ) = P (A1 A2 ) + P (A1 A2 ) + P (A2 A1 ) = + P (A2 ) P (A1 A2 ) = P (A1 ) P (A1 A2 ) + P (A1 A2 ) = P (A1 ) + P (A2 ) P (A1 A2 ) . 2

Propiedad 1.12 Sean Ai A, i = 1, 2, ..., k. Entoncesk k

Pi=1

Ai

P (Ai ) .i=1

Demostracin. De la Propiedad 1.11 se obtiene o P (A1 A2 ) = P (A1 ) + P (A2 ) P (A1 A2 ) , y el resultado vale para k = 2. El resto de la demostracin se hace por o induccin y se deja como ejercicio. o

14

V ctor J. Yohai n1 An .

Propiedad 1.13 (-subaditividad) Sea (An )n1 A y A =

Entonces

P (A) Demostracin. Denamos o B0 = , B1 = A1 ,

P (An ).n=1

B2 = A2 A1 ,

B3 = A3 (A1 A1 ), . . .n1

Bn = An

Ai .i=1

Luego es inmediato que los Bi son disjuntos dos a dos y

A=

Bn .n=1

Por la aditividad y el hecho de que Bn An , resulta P (Bn ) P (An ) y entonces

P (A) =n=1

P (Bn )

P (An ) . 2n=1

Propiedad 1.14 Sea (An )n1 una sucesin de eventos tales que An An+1 o para todo n y

A=i=1

Ai .

Luego P (A) = l m P (An ).n+

Demostracin. Como la sucesin es creciente entonces podemos transformar o o la unin en una unin disjunta deniendo: B0 = A0 = , B1 = A1 o o A0 , B2 = A2 A1 , ...., Bk = Ak Ak=1 , ... Luego

A=

Bk ,k=1

1.2. Axiomas de probabilidad.

15

y por lo tanto usando la aditividad y la Propiedad 1.1 se tiene n n

P (A) =k=1

P (Bk ) = l mn

n

P (Bk ) = l mk=1 n k=1

n

k=1

P (Ak Ak1 )

= l m

n

k=1

P (Ak )

P (Ak1 )

= l P (An ) . 2 mn

Propiedad 1.15 Sea (An )n1 una sucesin de eventos tal que An An+1 o para todo n y

A=i=1

Ai .

Entonces P (A) = l m P (An ).n+

Demostracin. Sea Bn = Ac . Luego (Bn )n1 es una sucesin creciente de o o n eventos y Ac =

Bi . Luego por la propiedad anterior tenemosi=1

1 P (A) = P (Ac )n+

= l m P (Bn )n+

= l m (1 P (An )) = 1 l m P (An ),n+

de donde se obtiene el resultado deseado. 2 Denicin 1.3 Se llama l o mite superior de una sucesin de conjuntos (An )n1 o al conjunto

A=k=1 n=k

An ,

y l mite inferior de la sucesin al conjunto o

A=k=1 n=k

An .

Adems ac

(A) = =

k1 n=k

Ac = Ac . n

An =

c

c

Ank1 n=k

=

k1 n=k

16

V ctor J. Yohai

Es decir el complemento del l mite inferior de la sucesin (An )n1 es el l o mite superior de la sucesin (Ac )n1 . o n Propiedad 1.16 (Caracterizacin de los l o mites superiores e inferiores) (i) Sea Luego A = A . (ii) Sea A = { : est en todos los An salvo en un nmero nito}. a u Luego A = A . (iii) A A Demostracin. o (i) Supongamos que A entonces para todo k N se tiene que n=k

A = { : est en innitos conjuntos An }. a

An de manera que A. Rec procamente si A entonces se /

encuentraen a lo sumo un nmero nito de conjuntos An . Supongamos u a / que An0 sea el ultimo en el que est, es decir si n > n0 entonces An para todo n > n0 de manera que

/ y entonces A. /

Ann=n0 +1

(ii) Consideremos la sucesin de los complementos, es decir (Ac )n1 . Por o n la observacin hecha anteriormente y el punto (i) se tiene que o A = (Ac )c = { : pertence a innitos Ac }c n = { : no pertenece a innitos Ac } n

= { : pertenece a lo sumo a un nmero nito de conjuntos Ac } u n = { : pertenece a todos a todos los An salvo un nmero nito} u = A .

(iii) Se obtiene del hecho de que claramente A A . 2

1.2. Axiomas de probabilidad.

17

En lo que sigue l n an y l n an denotarn respectivamente el m m a l mite superior e inferior de la sucesin an . o Propiedad 1.17 Dada una sucesin de eventos (An )n1 , se tiene o m (i) P A l n P (An ) . (ii) P (A) l n P (An ) . m (iii) Se dice que existe el lmite de la sucesin (An )n1 de conjuntos sii o A = A . En tal caso se tiene P A = P (A) = l P (An ) . mn

Demostracin. o (i) Como lo hicimos anteriormente consideremos

A=k=1 ik

Ai

y escribamos Bk =ik

Ai .

Entonces la sucesin (Bn )n1 es decreciente y o A=k1

Bk .

Luego, como para todo i k se tiene Ai Bk , podemos escribir P (Bk ) sup{P (Ai )}ik

y entoncesk1

inf {P (Bk )} inf sup{P (Ai )}k1 ik

Luego, como P (Bk ) es decreciente, se tiene P A = l P (Bk ) = inf {P (Bk )} mk k1

inf sup{P (Ai )} = l i P (Ai ) . mk1 ik

(ii) Se deja como ejercicio.

18 (iii) De (i) y (ii) tenemos que

V ctor J. Yohai

P (A) l n P (An ) l n P (An ) P A . m m Luego si A = A, resulta P (A) = P A y entonces P (A) = l n P (An ) = l n P (An ) = P A . m m Luego P (A) = P A = l n P (An ) . 2 m

1.3.

Algebra generada por una familia de conjuntos.

En general no se puede tomar como lgebra A a P() para denir el a espacio de probabilidad. Esto siempre es posible si es a lo sumo numerable. El siguiente teorema muestra que dada una familia de subconjuntos de , existe una menor lgebra que contiene a . a Teorema 1.1 Dado un conjunto y una familia de subconjuntos de , existe una lgebra A sobre tal que (i) a A y (ii) Si A es otra lgebra sobre tal que A, entonces A A. Se dice entonces que A a es la lgebra sobre generada por . a Demostracin. Denotaremos a la familia de todas las lgebras sobre que o a contienen a por R . Entonces R = {A : A es una lgebra sobre y A a }.

Claramente R es no vac ya que P() R. Denamos ahora a, A =AR

A.

Primero mostraremos que A es una lgebra sobre . a Veamos que A .En efecto, A, para toda A R, luego A . Sea ahora A A , mostraremos que Ac A . En efecto, como A A, para toda A R, se tiene Ac A, para toda A R. Luego Ac A . Sea una sucesin numerable de eventos A1 , A2 , ...., An , ... que estn en o a A . Mostraremos que Ai A . Dado A R, se tiene Ai A para todo i=1 e i, y luego Ai A tambin. Luego Ai A, para todo A R y i=1 i=1 entonces i=1

Ai

AR

A = A .

Esto prueba que es una -lgebra. Por otro lado si A es una lgebra a a y A , entonces A R, y esto implica que A A. 2

A

1.3. Algebra generada por una familia de conjuntos.

19

lgebra de Borel sobre los reales. Si tenemos un espacio de proa babilidad cuyo espacio muestral es el conjunto de nmeros reales R, parece u natural que la lgebra contenga los conjuntos de la forma (, x].Esto a permitir calcular la probabilidad de que el resultado del experimento aleatoa rio correspondiente sea menor o igual que x. Esto motiva la siguiente denicin. o Denicin 1.4 La lgebra de Borel sobre R, que denotaremos por B, es o a la lgebra sobre R generada por los conjuntos de la forma Ax = (, x], a para todo x R. Un conjunto B B se denomina boreliano. Propiedades de los borelianos. Propiedad 1.18 Todo intervalo (a, b] es un boreliano. Demostracin. Como o (a, b] = (, b] (, a], por la Propiedad 1.5 (a, b] es un boreliano 2 Propiedad 1.19 Dado x R, {x} B. Demostracin. Para esto se observa que para todo n N o In = (x Puesto que x resulta que {x} = 1 , x] B. n

1 x n In B,

n=1

y el resultado se obtiene por las propiedades 1.18 y 1.12. 2 De las propiedades 1.18 y 1.19, se deducen inmediatamente las propiedades 1.20-1.22 Propiedad 1.20 (a, b) = (a, b] {b} B.

20 Propiedad 1.21 [a, b] = {a} (a, b] B. Propiedad 1.22 [a, b) = {a} (a, b) B. Propiedad 1.23 Todo abierto es un boreliano

V ctor J. Yohai

Demostracin. Sea G R un abierto. Para todo x G existe un intervalo o (ax , bx ) tal que x (ax , bx ) G con ax y bx racionales. Por lo tanto G puede escribirse como la unin numerable de borelianos o G=xG

(ax , bx ),

y por lo tanto G B. 2 Propiedad 1.24 Todo cerrado es un boreliano Demostracin. Sea F un cerrado. Entonces F c = G es un abierto y por o Propiedad 1.23 se tiene que F c B. Ahora por ser lgebra se obtiene a que F = (F c )c B. 2 lgebra de Borel en Rn . a Denicin 1.5 La lgebra de Borel sobre Rn es la algebra sobre Rn o a generada por los conjuntos de la forma A(x1 ,x2 ,...,xn) = (, x1 ] (, x2 ] ... (, xn ], donde (x1 , ..., xn ) es una n-upla de nmeros reales. Ser denotada por B n . u a Observacin. De manera anloga al caso de la lgebra de Borel sobre R, o a a se pueden mostrar las propiedades 1.25-1.26 cuyas demostraciones se dejan como ejercicio. Propiedad 1.25 Cualquier rectngulo en Rn de la forma a (a1 , b1 ] (a2 , b2 ] (an , bn ] (a1 , b1 ) (a2 , b2 ) (an , bn ) [a1 , b1 ) [a2 , b2 ) [an , bn ) es un boreliano. Propiedad 1.26 Todo abierto y todo cerrado en Rn es un boreliano.

1.4. Espacios de probabilidad nitos o numerables.

21

1.4.

Espacios de probabilidad nitos o numerables.

Denicin 1.6 Sea (, A, P ) un espacio de probabilidad con a lo sumo o numerable. En este caso podemos tomar como A el conjunto de partes de (P()). Denimos la funcin de densidad p, asociada a la probabilidad P o por p : [0, 1] de la siguiente manera p () = P ({}) . Propiedades de la funcin de densidad o Propiedad 1.27 La funcin de densidad determina la funcin de probabio o lidad. Para todo A se tiene P (A) =wA

p () .

Demostracin. Si A entonces A se puede escribir como la siguiente unin o o disjunta A= {},A

donde cada conjunto {} A. Luego P (A) =A

P ({}) =A

p () . 2

Propiedad 1.28 Si es nito o numerable se cumple que p () = 1.

Demostracin. En efecto por la Propiedad 1.27 o 1 = P () =w

p () . 2

Denicin 1.7 Decimos que un espacio nito = {1 , .., n } es equiprobo able sii p (i ) = p (j ) , i, j.

22

V ctor J. Yohai

Observacin. Un espacio de probabilidad innito numerable no puede ser o equiprobable. En efecto, supongamos que = {1 , 2 , ..., n , ...}, y p() = c. Luego por la Propiedad 1.27 se tendr a

1=i=1

p(i ) =i=1 i=1 c

c,

lo que es un absurdo puesto que

= 0 segn c > 0 c = 0. o u o

Propiedad 1.29 Si es un espacio de probabilidad equiprobable entonces, la probabilidad de cualquier evento A se calcula por P (A) = donde #A denota el cardinal de A. Demostracin. Para ver esto supongamos que para todo se tenga o p () = c, entonces 1=

#A , #

p() =

c=c

1 = c #,

y luego, c= Adems a P (A) =wA

1 . # #A . #

p() =wA

c=cwA

1 = c (#A) =

Ejemplo 1.7 Hallar la probabilidad de que dado un conjunto de n personas, dos personas cumplan aos el mismo da. Se supondr que todos los aos n a n tienen 365 das y que las probabilidades de nacimiento en cualquier fecha son iguales. Supongamos que a cada persona se le asigna un nmero entre 1 y n y u sea xi el d del cumpleaos de la persona i. Luego 1 xi 365, y podemos a n considerar el siguiente espacio muestral = {(x1 , x2 , ..., xn ) : xi N : 1 xi 365} . donde N es el conjunto de nmeros naturales. u

1.5. Probabilidad condicional.

23

En vez de calcular la probabilidad de que dos personas cumplan el mismo d calculemos la del complemento, es decir la probabilidad de que todas a, cumplan aos en d distintos n as Ac = {(x1 , x2 , ..., xn ) : 1 xi 365, xi = xj i = j} . Se tiene # = 365n Adems a #Ac = 365 n!. n

La importancia de la combinatoria se ve en este punto; es necesario contar con principios de enumeracin. En este caso, primero seleccionamos o los n dias distintos entre los 365 d posibles y luego por cada muestra se as obtienen n! formas distintas de distribuirlos entre n personas. Las probabilidades que se obtienen usando est formula pueden cona tradecir la intuicin. Por ejemplo, si n = 20, P (A) 0,41, si n = 30, o P (A) 0,76 y si n = 40, P (A) 0,89.

1.5.

Probabilidad condicional.

Sea (, A, P ) un espacio de probabilidad, y consideremos dos eventos A, B A, y supongamos que P (B) = 0. Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce que otro evento B ha ocurrido. En este caso habr que rea denir el espacio muestral considerando solamente los elementos de B como posibles resultados. Por ejemplo, consideremos el experimento de tirar un dado y preguntmosnos acerca de la probabilidad de que salga un seis, sabiendo que e el dado escogido es un nmero par. En este caso la probabilidad no es 1/6, u puesto que tenemos la certeza de que el resultado est en el conjunto {2, 4, 6} a Como cada uno de estos tres resultados tienen idntica probabilidad, como e se ver, la probabilidad de obtener el 6 sabiendo que el resultado es par a ser 1/3. a Vamos a tratar de determinar cual debe ser la probabilidad de un evento A condicional a que se conoce que B ha ocurrido, utilizando interpretacin o heur stica de la probabilidad como limite de la frecuencia con la cual un evento ocurre. Para esto supongamos que se han hecho n repeticiones independientes del experimento y denotemos con nB : el nmero de veces en el que ocurre el resultado B, u nAB : el nmero de veces en el que ocurre el resultado A B. u

24

V ctor J. Yohai

Heur sticamente la probabilidad condicional de A dado B,ser el l a mite de la frecuencia con la cual A ocurre en los experimentos donde B ocurre, es decir el l mite de nAB . nB Luego, la probabilidad de que ocurra A condicional B ser a nAB = l m n nB n l mnAB n nB n

=

l n nAB m P (A B) n . nB = l n n m P (B)

Esto justica la siguiente denicin. o Denicin 1.8 Sea (, A, P ) un espacio de probabilidad A, B A tal que o P (B) > 0. Se dene la probabilidad condicional de A dado B por P (A|B) = P (A B) . P (B)

El siguiente teorema muestra que para cada B jo, P (.|B) es una funcin o de probabilidad. Teorema 1.2 Fijado el evento B , tal que P (B) > 0, denamos P : A [0, 1] por P (A) = P (A|B) para todo A A . Luego P es una probabilidad. Demostracin. o (i) P () = P (|B) = P (B) P ( B) = =1 P (B) P (B)

(ii) Sea (An )n1 , una sucesin de eventos disjuntos dos a dos, es decir si o i = j, entonces Ai Aj = . Luego

P An |B An B =

Ann=1

P

Ann=1

=P P =

B

n=1

P (B) n=1 P

=

n=1

P (B)

= n=1

(An B) = P (B)

=n=1

P (An B) = P (B)

P (An |B) =

P (An ) . 2n=1

1.6. Independencia de eventos.

25

1.6.

Independencia de eventos.

Denicin 1.9 Sea (, A, P ) un espacio de probabilidad y consideremos o A, B A. Se dice que A y B son independientes si P (A B) = P (A) P (B). Propiedad 1.30 (i) Si P (B) > 0, entonces A y B son independientes si y slo si P (A|B) = P (A). o (ii) Si P (B) = 0, dado cualquier A A se tiene que A y B son independientes. Demostracin. La demostracin es inmediata. 2 o o La propiedad de independencia se generaliza para un nmero nito de u eventos.

Denicin 1.10 Se dice que los eventos A1 , ..., Ak son independientes sii o para cualquier sucesin de subndices (i1 , ...ih ), h k, con ir = is si r = s o se tiene que h h

P

j=1

Aij =

P Aij .

j=1

Observaciones. 1. Para que tres eventos A1 , A2 y A3 sean independientes se deben cumplir las siguientes igualdades P (A1 A2 ) = P (A1 ) P (A2 )

P (A1 A3 ) = P (A1 ) P (A3 )

P (A1 A2 A3 ) = P (A1 ) P (A2 ) P (A3 ) . 2. No alcanza la independencia tomados de a dos. Como ejemplo tomemos = {1 , 2 , 3 , 4 } espacio de probabilidad equiprobable, es decir 1 P ({i }) = 4 . Entonces los conjuntos A1 = {1 , 2 } A2 = {1 , 3 }

P (A2 A3 ) = P (A2 ) P (A3 )

A3 = {2 , 3 }

26

V ctor J. Yohai

son independientes tomados de a dos pero no en forma conjunta. Ms a precisamente, se cumple que 1 2 Ai Aj = {k } para algn k u j : P (Aj ) = y luego P (Ai Aj ) = Pero A1 A2 A3 = , y por lo tanto 1 0 = P (A1 A2 A3 ) = P (A1 ) P (A2 ) P (A3 ) = . 8 1 1 1 = = P (Ai ) P (Aj ) . 4 2 2

Teorema 1.3 A1 , ..., Ak son eventos independientes si y slo si para cualquier o sucesin (i1 , ...ih ), h k, con ir = is si r = s y tal que o h

se tiene que

P

j=2

Aij > 0,

P Ai1

h j=2

Aij = P (Ai1 ) .

(1.1)

Demostracin. Supongamos primero que A1 , ..., Ak son independientes y demostraremos o que se cumple (1.1). Sean Ai1 , Ai2 , ..., Aih tales que ir = is si r = s y Ph j=2 Aij

> 0. Entoncesh j=2

P Ai1

Aij =

P P

h j=1 Aij h j=2 Aij

=

h j=1 P h j=2 P

Aij Aij

= P (Ai1 ) .

Supongamos ahora que A1 , ..., Ak son eventos que satisfacen la propiedad del enunciado. Queremos probar que entonces son independientes, es decir que h h

P

j=1

Aij =

P Aij .

(1.2)

j=1

1.6. Independencia de eventos.

27

Lo probaremos por induccin sobre h. Comenzaremos con h = 2. Dados Ai1 o y Ai2 con i1 = i2 , puede suceder que (a) P (Ai2 ) = 0 o que (b) P (Ai2 ) > 0. En el caso (a) se tiene que como Ai1 Ai2 Ai2 , resulta P (Ai1 Ai2 ) = 0 y luego P (Ai1 Ai2 ) = P (Ai1 )P (Ai2 ) (1.3) En el caso (b) como vale (1.1) se tiene P (Ai1 |Ai2 ) = y luego tambin vale e P (Ai1 Ai2 ) = 0 = P (Ai1 )P (Ai2 ). Esto muestra que (1.2) vale para h = 2. Supongamos ahora que (1.2) vale para h y probemos que tambin vale e para h+ 1. Elegimos Ai1 , Ai2 , ..., Aih , Aih+1 eventos. Consideramos dos casosh+1 o (a) Supongamos que P j=2 Aij = 0. En tal caso por la suposicin que (1.2) vale para h conjuntos se tiene que h+1 j=2 h+1 j=2

P (Ai1 Ai2 ) = P (Ai1 ) P (Ai2 )

Luego

0=P

Aij =

P Aij .

h+1

P Aij = 0,j=1

(1.4)

y como

h+1 j=1 Aij

h+1 j=2 Aij

De (1.4) y (1.5) obtenemos que h+1 j=1

P

se tendr que a h+1 j=1

Aij = 0.h+1

(1.5)

P

Aij =

P Aij .j=1

h+1 (b) Supongamos ahora que P > 0. Entonces como estamos j=2 Aij suponiendo que (1.1) vale se tiene h+1 j=2

P Ai1

Aij = P (Ai1 ) ,

28 y luego P P Equivalentemente P h+1 j=1 h+1 j=1 Aij h+1 j=2 Aij

V ctor J. Yohai

= P (Ai1 ) .

y como por la hipteisis inductiva (1.2) vale para h, se deduce o h+1 j=1 h+1 j=2 h+1 j=1

Aij = P (Ai1 ) P

h+1 j=2

Aij ,

P

Aij = P (Ai1 )

P Aij

=

P Aij . 2

Denicin 1.11 Sea I un conjunto nito o numerable, una sucesin {Ai }iI o o se dice una particin de sii o 1. Ai = iI

2.

Si i = j entonces Ai Aj =

Teorema 1.4 (Teorema de la Probabilidad Total) Sea (, A, P ) un espacio de probabilidad, {An }nI A una particin de con P (Ai ) > 0, para o todo i I y B A tal que P (B) > 0. Entonces P (B) =iI

P (Ai )P (B|Ai )

Demostracin. Como B se puede escribir como la siguiente unin disjunta o o B=iI

(B Ai ) ,

entonces como P (B|Ai ) = P (BAi )/P (Ai ), se tiene P (BAi ) = P (Ai )P (B|Ai ) y por lo tanto P (B) = P (Ai )P (B|Ai ) . 2iI

1.6. Independencia de eventos.

29

Teorema 1.5 (Bayes) Sea (, A, P ) un espacio de probabilidad y {Ai }1ik A una particin de con P (Ai ) > 0, 1 i k. Sea B A con P (B) > 0. o Supongamos conocidas a priori las probabilidades P (B|Ai ) y P (Ai ) para todo i. Entonces P (Ai |B) = P (Ai ) P (B|Ai )k j=1 P

(Aj ) P (B|Aj )

.

Demostracin. Usando el teorema de la probabilidad total teniendo en cuenta o que {Aj }1jk es una particin y aplicando la denicin de probabilidad o o condicional y el Teorema 1.4 se obtiene P (Ai |B) = = P (Ai B) P (B) P (Ai ) P (B|Ai )k j=1 P

(Aj ) P (B|Aj )

.2

Ejemplo de aplicacin del Teorema de Bayes. o Consideremos un test que detecta pacientes enfermos de un tipo espec co de enfermedad. La deteccin corresponde a que el test de positivo. El reo sultado de un test negativo se interpreta como no deteccin de enfermedad. o Sea A1 : el evento el paciente seleccionado no tiene la enferemedad A2 : el evento el paciente seleccionado tiene la enfermedad Entonces {A1 , A2 } constituye una particin del espacio de probabilidad o Consideremos adems a T+ : el evento el test da positivo T : el evento el test da negativo Supongamos conocidas las probabilidades de ser sano o enfermo antes de hacer el test (probabilidades apriori). P (A1 ) = 0,99; P (A2 ) = 0,01. Ademas supongamos que P (T+ |A1 ) = 0,01; P (T+ |A2 ) = 0,99. Observemos que para un test perfecto se pedir a P (T+ |A1 ) = 0; P (T+ |A2 ) = 1. Es decir, estamos suponiendo que el test no es perfecto. Calculemos la probabilidad de que dado que el test detecta enfermedad el paciente sea efectivamente enfermo (esta probabilidad se denomina probabilidad a posteriori). De acuerdo al Teorema de Bayes se tiene

30

V ctor J. Yohai

P (A2 |T+ ) = y

P (A2 ) P (T+ |A2 ) = 0,5. P (A1 ) P (T+ |A1 ) + P (A2 ) P (T+ |A2 )

P (A1 |T+ ) = 1 P (A2 |T+ ) = 0,5 La conclusin es que si el test da positivo, no hay una evidencia fuerte o de que el paciente est enfermo o sano ya que ambas probabilidades condie cionales son iguales a 0.50. Luego un test como el descripto no es util para detectar la enfermedad. Si logramos tener P (T+ |A1 ) = 0,001; P (T+ |A2 ) = 0,999 la situacin cambia; en tal caso resulta P (A2 |T+ ) = 0,91, que es ms acepto a able que la anterior.

Cap tulo 2

Variable Aleatoria.2.1. Concepto de variable aleatoria.

En muchos casos interesa conocer solamente alguna caracter stica numrie ca del resultado del experimento aleatorio. Demos dos ejemplos: 1. El experimento consiste en tirar dos dados y los posibles resultados son = { (x, y) : x I6 , y I6 } donde Ik = {1, 2, ..., k} y para cada resultado (x, y) interesa solo la suma de los dados x + y. 2. El experimento consiste en un tiro al blanco y el conjunto de los resultados es = { (x, y) : x R, y R}, x e y son la abcisa y ordenada del punto donde peg el tir tomando origen (0, 0) el punto o o correspondiente al blanco. En este ejemplo solo interesa la distancia al blanco, es decir (x2 + y 2 )1/2

Denicin 2.1 Sea (, A, P ) un espacio de probabilidad. Una variable aleatoo ria es una funcin X : R tal que para todo x R o X 1 ((, x]) A. Observaciones. 1. La condicion (2.1) permite calcular P ({ : X() x}) = P (X 1 ((, x])). 2. El concepto de variable aleatoria es esencialmente el mismo que el de funcin medible en teor de la medida. Si (, A, ) es un espacio o a de medida f : A R se dice medible sii para todo x vale que f 1 ((, x])) A. 31 (2.1)

32

V ctor J. Yohai

3. Si A es el conjunto de partes de , como es usual cuando es nito o numerable, la condicin (2.1) se cumple trivialmente. o Teorema 2.1 Sea X una variable aleatoria sobre un espacio de probabilidad (, A, P ). Entonces vale que X 1 (B) A para todo B B. (B es el conjunto de borelianos en R). Demostracin. Como por denicin X 1 ((, x]) A, basta con vericar o o que = {A R : X 1 (A) A} es una lgebra. Si esto es cierto se tendr que B , puesto que la a a lgebra de Borel es la ms chica que contiene a las semirectas. Veamos a a que esto es cierto. (a) R pues X 1 (R) = A.

(b) Si A , entonces Ac . Como X 1 (A) A, se tendr que a

(c) Sea {An }n . Luego X 1 (An ) A para todo n y como A es un lgebra se tendr que a a X 1 (An ) A.

Luego

(a), (b) y (c) prueban que es una -lgebra. 2 a

2.2.

Espacio de probabilidad asociado a una variable aleatoria.

Sea un espacio de probabilidad (, A, P ) y sea X : R una variable aleatoria. Asociada a esta variable podemos denir un nuevo espacio de probabilidad (R, B, P ) donde para todo B B se dene PX (B) = P X 1 (B) .

Obsrvese que P X 1 (B) est denido ya que X 1 (B) est en A. e a a Vamos a mostrar que PX es efectivamente una probabilidad. La funcin PX o se denomina probabilidad inducida por X o distribucin de X. o

X 1 (Ac ) = X 1 (A)c

A.

n

X 1

An

=

n

n

X 1 (An ) A.

2.2. Espacio de probabilidad asociado a una variable aleatoria.

33

Si a uno le interesa slo el resultado de la variable aleatoria, esto permite o trabajar en un espacio de probabilidad donde el espacio muestral es R y la lgebra es B, la lgebra de Borel. a a Teorema 2.2 PX es efectivamente una funcin de probabilidad. o Demostracin. o (a)

o (b) Si {Bi }i B es una sucesin disjunta dos a dos, entonces {X 1 (Bi )}i tambin lo es. Luego e PX Bi =P = X 1 Bi =P X 1 (Bi ) =

Deniremos el concepto de funcin medible o

Denicin 2.2 Una funcin g : R R, se dice medible Borel sii para todo o o xR g1 ((, x]) B. Observaciones.

1. Trabajaremos en este curso con funciones medibles Borel, de manera que a veces nos referiremos a ellas simplemente con el nombre de medibles. 2. Si B B resultar g1 (B) B. Este resultado se demuestra como el a anlogo para variables aleatorias. a 3. Considerando un espacio de probabilidad con = R y A = B es inmediato que g es medible Borel es equivalente a que g es una variable aleatoria. Ejercicio. Demostrar los siguientes resultados: Propiedad 2.1 Si g : R R es continua entonces g es medible.

PX (R) = P X 1 (R) = P () = 1.i i i

P X

1

(Bi ) =

PX ((Bi )) . 2

i

i

34

V ctor J. Yohai

Propiedad 2.2 Si g : R R es montona entonces g es medible. o Propiedad 2.3 Si B es boreliano, su funcin caracterstica IB es medible. o Propiedad 2.4 Sea {fn }n1 es una sucesin de funciones medibles. Eno tonces (i) Las siguientes funciones son mediblesn

f (x) = inf {fn (x)}, f (x) = sup{fn (x)}.n

1.

Tambin son medibles e

f (x) = l n fn (x) , m f (x) = l n fn (x) . m En particular si existe el lmite puntual n

f (x) = l fn (x) m es medible.

El siguiente teorema muestra que la composicin de una variable aleatoo ria con una funcin medible es una variable aleatoria. o Teorema 2.3 Si g : R R es medible y X : R es una variable aleatoria, entonces g (X) : R es tambin una variable aleatoria. e Demostracin. Basta con observar que dado B B o [g (X)]1 (B) = X 1 g1 (B) Como C = g1 (B) B, resulta que tambin X 1 g1 (B) B. 2 e Como consecuencia de este teorema si g es continua y X es una variable aleatoria resulta que g(X) tambien una variable aleatoria. Por ejemplo si X es una variable aleatoria, entonces seno(X) , coseno(X) , aX , con a constante son variables aleatorias. Teorema 2.4 Si X, Y son variables aleatorias entonces (i) X + Y , X Y son variables aleatorias. (ii) Si P (Y = 0) = 1 entonces X/Y es una variable aleatoria. Demostracin. Las demostraciones de (i) y (ii) se vern ms adelante. o a a

2.3. Funcin de distribucin de una variable aleatoria. o o

35

2.3.

Funcin de distribucin de una variable aleatoo o ria.

Denicin 2.3 Sea X una variable aleatoria. Se dene la funcin de diso o tribucin asociada a X como la funcin FX : R [0, 1] dada por o o FX (x) = PX ((, x]) = P X 1 ((, x]) . Observacin. Como veremos, la importancia de FX es que caracteriza la o distribucin de X. Es decir FX determina el valor de PX (B) para todo o BB Propiedades de la funcin de distribucin. o o Las cuatro propiedades que probaremos en el Teorema 2.5 van a caracterizar a las funciones de distribucin. o Teorema 2.5 Sea X una variable aleatoria sobre (, A, P ) y sea FX su funcin de distribucin. Entonces se tiene o o 1. 2. 3. 4. FX es montona no decreciente, es decir x1 < x2 implica FX (x1 ) o FX (x2 ) . l x FX (x) = 1. m l x FX (x) = 0. m FX es continua a derecha en todo punto de R.

Demostracin. o 1. Si x < x entonces (, x] (, x ], y por lo tanto FX (x) = P ((, x]) P (, x ] = FX x . 2. En primer lugar veamos quen

l FX (n) = 1. m

Consideremos la sucesin montona creciente de conjuntos o o

Entoncesn

An = R.

An = (, n], n N.

36

V ctor J. Yohai

Luego de acuerdo con la propiedad para sucesiones crecientes de eventos l FX (n) = l PX (An ) = PX m mn n

n

Ahora veamos que efectivamente l n FX (x) = 1, esto es para todo m > 0 existe x0 > 0 tal que si x > x0 entonces se cumple |FX (x) 1| < . O equivalentemente 1 < FX (x) < 1 + .

Por 0 FX (x) 1, se cumple que para cualquier > 0, FX (x) < + 1. Por lo tanto slo tenemos que mostrar que existe x0 > 0 tal que o si x > x0 entonces se cumple 1 < FX (x) . Sabemos que dado > 0 existe un n0 N tal que si n > n0 entonces 1 < FX (n) . Tomando x0 = n0 y teniendo en cuenta la monoton de FX , se a tendr que si x > x0 entonces a 1 < FX (n0 ) FX (x) . 3. Se demuestra de manera similar a (2). En primer lugar se prueba quen

l FX (n) = 0. m

Luego se considera la sucesin montona decreciente que converge a o o An = (, n], y se obtienen

l PX (An ) = 0. m

Luego se procede como en (2). 4. Queremos ver que FX es continua a derecha en cualquier punto x0 R. Es decir, dado > 0 existe > 0 tal que si 0 < x x0 < entonces FX (x0 ) FX (x) FX (x0 ) + .

An

= PX (R) = 1.

2.3. Funcin de distribucin de una variable aleatoria. o o

37

La primer inecuacin es vlida siempre ya que como x0 < x entonces o a FX (x0 ) FX (x0 ) FX (x). Basta entonces probar que FX (x) FX (x0 ) + . Consideremos la sucesin decreciente de conjuntos o An = que satisfacen

Entonces l FX m x0 + 1 n

n

Luego existe n0 N tal que si n > n0 entonces FX x0 + 1 n

Si tomamos < 1/n0 , entonces para todo x tal que 0 < x x0 < se tendr a FX (x) FX (x0 + ) FX x0 + 1 n0 FX (x0 ) + .2

Dada una funcin g : R R, denotemos por l xx0 g(x) el l o m mite de g(x) cuando x tiende a x0 por la izquierda. Entonces tenemos la siguiente propiedad de la funcin de distribucin. o o Propiedad 2.5 Para todo x0 R se tiene que l m FX (x) = FX (x0 ) PX ({x0 }) .

xx0

Demostracin. Sea a = FX (x0 ) PX ({x0 }) . Tenemos que mostrar que dado o > 0 existe > 0 tal que si x0 < x < x0 , entonces a FX (x) a + . Tenemos que a = PX ((, x0 ]) PX ({x0 }) = PX ((, x0 )). (2.2)

An = (, x0 ]. = l PX (An ) = PX mn

, x0 +

1 n

An

n

= PX ((, x0 ]) = FX (x0 )

FX (x0 ) +

38

V ctor J. Yohai

Como x0 < x < x0 implica que (, x] (, x0 ), se tendr que a FX (x) = PX ((, x]) PX ((, x0 )) = a. Luego, para probar (2.2) bastar probar que x0 < x < x0 implica a

Como la sucesin de intervalos An = (, x0 1/n] es creciente y o An = (, x0 ),n

se tendr an

l FX (x0 1/n) = l PX (An ) = PX ((, x0 )) m mn

Luego existe n0 tal que FX (x0 1/n0 ) a . Sea = 1/n0 y tomemos x0 < x < x0 . Por la monoton de FX se tendr a a a FX (x0 1/n0 ) = FX (x0 ) FX (x), y por lo tanto (2.3) se cumple. Esto prueba la Propiedad 2.5. 2 Propiedad 2.6 FX es continua a izquierda en x0 si y slo si PX ({x0 }) = 0. o Demostracin. El resultado es inmediato a partir de la Propiedad 2.5. 2 o Demostracin. o Teorema 2.6 Sea FX la funcin de distribucin de una v.a X. Entonces el o o conjunto de puntos de discontinuidad de FX es a lo sumo numerable. Demostracin. De acuerdo a la Propiedad 2.6, el conjunto de puntos de diso continuidad est dado por a A = {x : PX ({x}) > 0}. Para todo k N sea Ak = Entonces es fcil mostrar que a

= a. Ak = A.k=1

a FX (x).

(2.3)

x : PX ({x}) >

1 k

.

2.3. Funcin de distribucin de una variable aleatoria. o o

39

Luego para demostrar el teorema bastar probar que para k N se tiene a que #Ak < . En efecto, supongamos que para algn k0 existen innitos u puntos {xn }n1 tal que para todo n N se cumpla

Entonces si B=i

se tendr a PX (B) =

i=1

PX ({xi }) >

lo que es un absurdo. 2

Veremos ahora que toda funcin con las cuatro propiedades del Teorema o 2.5 es una funcin de distribucin para cierta variable aleatoria X (no unica). o o Para eso se requiere el siguiente teorema que daremos sin demostracin. o Teorema 2.7 (de Extensin) Sea F : R [0, 1] una funcin con las o o cuatro propiedades del Teorema 2.5 . Luego existe una unica probabilidad P sobre (R, B) tal que para todo x R se tiene P ((, x]) = F (x) . Este Teorema no se demostrar en este curso ya que requiere teor de a a la medida. La la probabilidad P se denomina extensin de la funcin F. o o Veremos ahora algunas consecuencias del Teorema de Extensin. o Corolario 2.1 Si X y X son variables aleatorias tales que FX = FX . Entonces para todo B B se tendr a PX (B) = PX (B) . Demostracin. Es consecuencia de la unicidad del teorema de extensin. 2 o o Corolario 2.2 Si F satisface las cuatro propiedades del Teorema 2.5 , entonces existe una variable aleatoria X (no necesariamente unica) tal que F = FX . Demostracin. De acuerdo al teorema de extensin se puede denir un espacio o o de probabilidad (R, B, P ) de forma tal que para todo x R F (x) = P ((, x]) . Ahora consideramos la funcin identidad X : R R denida como X (x) = o x para todo x R. Entonces se cumple que FX (x) = PX ((, x]) = P (X 1 ((, x])) = P ((, x]) = F (x) . 2

{xi } i=1

PX ({xn }) >

1 . k0

1 = , k0

40

V ctor J. Yohai

Cap tulo 3

Variables aleatorias discretas y continuas.Existen varios tipos de variables aleatorias. En este curso slo estudiareo mos con detalle las discretas y las (absolutamente) continuas.

3.1.

Variables aleatorias discretas.

Denicin 3.1 Se dice que una v.a. X es discreta sii existe A R nito o o numerable tal que PX (A) = 1. Observacin. Ese conjunto A no tiene porque ser unico. Si se le agrega o un conjunto nito o numerable de probabilidad cero, seguir teniendo esta a propiedad. A continuacin vamos a encontrar el conjunto ms chico que o a tiene esta propiedad. Denicin 3.2 Sea X una variable aleatoria discreta. Se dene el rango o de X como el conjunto de los puntos de discontinuidad de la funcin de o distribucin, es decir por o RX = {x R : PX ({x}) > 0}. Teorema 3.1 Sea X una variable aleatoria discreta. Luego (i) PX (RX ) = 1,(ii) Si PX (A) = 1, entonces RX A. Demostracin. o (i) Sea A un conjunto a lo sumo numerable tal que PX (A) = 1. Luego A se puede escribir como la siguiente unin disjunta o A = (A RX ) (A RX ) . 41

42 Entonces 1 = PX (A) = PX ((A RX ) (A RX )) Luego basta probar que PX (A RX ) = 0. = PX (A RX ) + PX (A RX ) .

V ctor J. Yohai

(3.1)

(3.2)

El conjunto A RX es nito o innito numerable. Adems para todo a x A RX se tiene que PX ({x}) = 0. Luego, como A RX = resulta que PX (A RX ) = PX ({x}) = 0.xPX (ARX ) xARX

{x},

Luego hemos demostrado (3.2). Luego por (3.1) se tiene PX (A RX ) = 1, y luego tambin P (RX ) = 1. e (ii) Sea un conjunto A numerable tal que PX (A) = 1. Supongamos que exista x0 RX tal que x0 A entonces consideramos A = A {x0 } y / se obtiene que PX (A) = PX (A) + PX ({x0 }) > PX (A) = 1, lo cual es un absurdo. 2 La importancia de RX reside en el hecho de que para calcular la probabilidad de un evento B solo interesan los puntos de B que estn en RX . En a este sentido se dice que la probabilidad se concentra en RX . Teorema 3.2 Para todo B B se tiene PX (B) = PX (RX B) . Demostracin. Podemos escribir a B como la siguiente unin disjunta o o B = (RX B) (B RX ) , y tomando probabilidad en ambos miembros se obtiene PX (B) = PX (RX B) + PX (B RX ) . (3.3)

3.2. Ejemplos de distribuciones discretas.

43

Pero de manera que

B RX (RX )c , PX (B RX ) PX ((RX )c ) = 0.

Luego PX (B RX ) = 0 y el teorema resulta de (3.3). 2 Denicin 3.3 Sea X una variable aleatoria discreta. Se dene la funcin o o de densidad de probabilidad asociada a la variable X como la funcin o pX : R [0, 1] tal que pX (x) = PX ({x}) . Tambin pX se suele llamar funcin de probabilidad puntual de X o funcin e o o de frecuencia de X. Observacin. La funcin de densidad satisface pX (x) > 0 sii x RX y o o determina totalmente la probabilidad PX . Para ver esto probaremos el siguiente teorema. Teorema 3.3 Si B B entonces PX (B) =xBRX

pX (x) .

Demostracin. B RX se puede escribir como la siguiente unin disjunta o o B RX =xBRX

{x}.

Como B RX es nito o numerable se tiene PX (B) = PX (RX B) = pX (x) 2.xBRX

3.2.3.2.1.

Ejemplos de distribuciones discretas.Distribucin Binomial. o

Supongamos que se repite n veces un experimento que puede dar lugar a dos resultados: xito o fracaso. Supongamos que todos los experimentos son e independientes y tienen la misma probabilidad de xito . Sea X la variable e aleatoria denida como el nmero total de xitos. La distribucin de esta u e o variable se denomina binomial con n repeticiones y probabilidad de xito . e La denotaremos con Bi (, n) .

44

V ctor J. Yohai

donde i = 1 indicar que el i-simo experimento result xito y i = 0 que a e oe fue fracaso. Como es nito podemos tomar como lgebra A el conjunto a de partes de . La variable X se puede denir porn

Para formalizar este experimento aleatorio tomaremos como espacio muestral = {(1 , 2 , ..., n ) : i {0, 1}} ,

X ((1 , 2 , ..., n )) =i=1

i .

El rango de esta variable es RX = {0, 1, ..., n}. Obtendremos seguidamente su funcin de densidad. Sea 0 x n, el evento {X = x} est dado o a porn

Ax = {(1 , 2 , ..., n ) :

i = x}.i=1

En primer lugar determinaremos la cantidad de elementos del conjunto Ax . Claramente un elemento de Ax queda determinado por los x lugares entre los n posibles donde aparecen los unos. De manera que # (Ax ) = n . x

Obsrvese que el espacio muestral no es equiprobable, por lo que la probae bilidad no se determina con el esquema casos favorables / casos igualmente posibles. Sea el resultado de un experimento cualquiera. Si = 0 entonces P () = 1 y si = 1 entonces P () = . Esto puede escribirse de manera ms compacta de la siguiente manera a P () = (1 )1 . En primer lugar calculemos la probabilidad de un elemento arbitrario del espacio muestral. Teniendo en cuenta la independencia de los resultados de los distintos experimentos y que la ocurrencia de (1 , 2 , ..., n ) involucra una interseccin de eventos se tiene que on

P ((1 , 2 , ..., n )) = Pn

i=1

{en el experimento i el resultado es i }

= =

i=1 n

i=1n

= i=1

P (i ) i (1 )1i =n

i

(1 )

n

i

i=1

.

3.2. Ejemplos de distribuciones discretas.

45

Ahora si = (1 , 2 , ..., n ) Ax entonces n i = x y queda que la i=1 probabilidad de ocurrencia de cualquier elemento de Ax es pX () = pX ((1 , 2 , ..., n )) = x (1 )nx En denitiva como Ax se puede escribir como la siguiente unin disjunta o Ax =Ax

{}

entonces pX () = P ({ : X() = x}) = P (A) =Ax

P ({}) =

= #(Ax ) x (1 )nx = n x (1 )nx . x

3.2.2.

Distribucin Binomial Negativa (o Distribucin de Paso o cal).

Consideremos, como en el caso de la distribucin binomial, un expero imento aleatorio cuyo resultado es xito con probabilidad y fracaso con e probabilidad 1. Supongamos que se hacen repeticiones independientes del experimento hasta que ocurran k xitos. Los parmetros de esta distribue a cin son : probabilidad de xito y k : el nmero de xitos buscado. o e u e Llamaremos X a la variable aleatoria denida como el nmero de experiu mentos que hay que realizar para obtener los k xitos. La distribucin de e o esta variable se denomina binomial negativa o de Pascal y se la denotar con a BN(, k). El rango de X es RX = {m N : m k} el cual es innito numerable. Consideremos la sucesin variables aleatorias independientes Zi , i N o denidas por Zi = 1 0 si el i-simo experimento es xito e e si el i-simo experimento es fracaso, ei

y denimos las variables Yi =j=1

Zj ,

46

V ctor J. Yohai

Claramente Yi cuenta la cantidad de xitos que se alcanzaron en los primeros e i experimentos. Luego su distribucin es Bi(, i). o El evento {X = x}, o sea el evento denido como la cantidad de experimentos necesarios para alcanzar k xitos es x, puede escribirse como una e interseccin de dos eventos o {X = x} = {Yx1 = k 1} {Zk = 1} . Los dos eventos del lado derecho de la ultima ecuacin son independien o tes. Luego, usando el hecho que Yx1 tiene distribucin Bi(, x 1) resulta o para x k. pX (x) = P (X = x) = P (Yx1 = k 1) P (Zk = 1) = = x 1 k1 (1 )xk k1 x1 k (1 )xk . k1

(3.4)

3.2.3.

Distribucin Geomtrica. o e

Se llama distribucin geomtica a la BN(, k), con k = 1. Luego es la o e distribucin de la variable aleatoria X denida como el nmero de expeo u rimentos necesarios para alcanzar el primer xito. A esta distribucin la e o denotarenos como G(). El rango de los valores posibles para la v.a. X es RX = {1, 2, ..., n, ...}. Reemplazando k = 1 en (3.4) se obtiene pX (x) = Podemos vericar que

x1 (1 )x1 = (1 )x1 . 0

pX (x) =x=1

x=1

(1 )x1 = (1 )j =

x=1

(1 )x1

=j=0

1 = 1. 1 (1 )

3.2. Ejemplos de distribuciones discretas.

47

3.2.4.

Distribucin Hipergeomtrica. o e

Consideremos una urna que contiene N bolillas de las cuales D son negras y N D blancas. Se extraen secuencialmente (una a una) n bolillas y se dene la variable X como el nmero total de bolilas negras extra u das. Si cada bolilla obtenida es repuesta en la urna antes de obtener la siguiente, el resultado de cada extraccin es independiente de las anteriores, ya que o esos resultados no modican la composicin de la urna. Luego en este caso o X tendr distribucin Bi(, n) con = D/N, ya que este nmero es la a o u probabilidad de sacar cada vez una bolilla negra. Si despus de cada extraccin la bolilla obtenida no se repone, no hay e o independencia en los resultados de las extracciones y la distribucin de X o se denomina hipergeomtrica. La denotaremos por H(N, D, n). e Estudiemos el rango de esta distribucin. Por un lado podemos obsero var que X no puede ser un nmero negativo, ni tampoco mayor que n, la u cantidad total de bolillas extraidas. Por lo tanto: 0 X n. (3.5)

Por otro lado, claramente a lo sumo se pueden extraer D negras, y luego X D. (3.6)

Adems el nmero de total de bolillas blancas extraidas debe ser menor a u que N D. Por lo tanto tambin tenemos e n X N D. En denitiva de (3.5), (3.6) y (3.7) obtenemos RX = {x N : mx (0, n N + D) x m (n, D)}. a n Podemos pensar que las D bolillas negras estn numeradas de 1 a D, y a las blancas de D + 1 a N. Luego si denotamos IN ={x N : 1 x N }, el resultado de extraer n bolillas ser un subconjunto de IN con cardinal n. a Luego, podemos tomar como espacio muestral = {A IN : #A = n}. Como todos estos subconjuntos tienen la misma probabilidad de ser extra dos, estaremos en un caso de resultados equiprobables. El cardinal de es N . n (3.7)

48

V ctor J. Yohai

El evento {X = x} corresponder a aquellos subconjuntos A que cona tienen x bolillas negras y n x blancas. Para obtener el cardinal de {X = x} procedamos de la siguiente manera. Primero consideremos el nmero de subu conjuntos de x bolas negras elegidas entre las D posibles. Este nmero es u D . x Para cada uno de estos subconjuntos de x bolas negras hay N D nx formas de elegir las restantes n x blancas. Luego #{X = x} = y por lo tanto #Ax = pX (x) = # D x N D , nxD x N D nx N n

.

Ejercicio. Sea n N jo y consideremos una sucesin de distribuciones hipergeo omtricas H (N, DN , n), N N tales que e DN = . N N l m Entonces si pH es la densidad de probabilidad de una distribucin H (N, DN , n) o N B la de una Bi(, n), se tiene ypN

l pH (x) = pB (x) . m N

Es decir para N sucientemente grande la distribucin H (N, DN , n) se o puede aproximar por la distribucin Bi(, n) . Heur o sticamente, este resultado puede interpretarse como que debido a que n es pequeo con respecto a n N, la reposicin o no de las bolillas extra o das no cambia substancialmente la composicin de la urna. o

3.2.5.

Distribucin de Poisson. o

La distribucin de Poisson se presenta cuando se considera el nmero o u de veces que ocuurre cierto evento en un intervalo determinado de tiempo. Por ejemplo (a) El nmero de clientes que entran en un determinado banco durante u un d a.

3.3. Variables aleatorias absolutamente continuas.

49

(b) El nmero de accidentes automovil u sticos que ocurren en la ciudad de Buenos Aires por mes. (c) El nmero total de llamadas telefnicas que llegan a una central tefnica u o o entre las 15 hs. y 16 hs. de los d hbiles. as a Para que las distribuciones de estas variables sean de Poisson, se requiere un conjunto de supuestos que trataremos con mayor detalle ms adelante a (ver el cap tulo 12). Por ahora slo indicamos su funcin de densidad. Para cada > 0, se o o dene la distribucin de Poisson con parmetro que simbolizaremos por o a P() por la siguiente densidad de probabilidad pX (x) = e x para x N0 , x!

donde N0 es el conjunto de enteros no negativos. Es claro que

pX (x) =x=0 x=0

e

x = e x!

x=0

x = e e = e0 = 1. x!

3.2.6.

Grco de la funcin de distribucin asociada a una a o o variable aleatoria discreta.

Supongamos que el rango de X sea nito RX = {x1 , ..., xn } y x1 < < xn . En tal caso la funcin de distribucin FX es una funcin no decreciente o o o escalonada, en los puntos de probabilidad positiva, xj , 0 j n. Seai

ci =j=1

pX (xj ) ; 1 i n.

Luego se tendr a 0 si x (, x1 ) FX (x) c si x [xi , xi+1 ), 1 i n 1 i 1 si x [xn , ).

Ejercicio. Gracar la FX para una Bi(1/4,10).

3.3.

Variables aleatorias absolutamente continuas.

Denicin 3.4 Se dice que una variable aleatoria X es continua sii FX es o continua para todo x R.

50

V ctor J. Yohai

Observacin. Esto es equivalente a pedir que la probabilidad en todo o punto es cero. Denicin 3.5 Se dice que FX es absolutamente continua sii existe una o funcin fX : R R0 tal que fX es integrable Riemann sobre R y para todo o x R se tiene x FX (x) = fX (t) dt.

La funcin fX se denomina funcin de densidad de la probabilidad asociada o o a X.

Propiedades de las Distribuciones Continuas. Propiedad 3.1 (a) Si fX es una funcin de densidad de probabilidad o para una variable aleatoria X entonces+

fX (t) dt = 1.

(b) Recprocamente si f 0 es integrable Riemann sobre R y cumple que +

f (t) dt = 1,

entonces deniendo F (x) =

x

f (t) dt.

se obtiene una funcin que resulta ser la funcin de distribucin de o o o alguna variable aleatoria X. Demostracin. o (a) Resulta de+ x

fX (t) dt = l m

x x

fX (t) dt

= l FX (x) = 1. m (b) Usando propiedades de las integrales de Riemann se puede mostrar que FX satisface las cuatro propiedades del Teorema 2.5 . Luego este resultado se obtiene del Corolario 2.2 del Teorema 2.7. 2

3.3. Variables aleatorias absolutamente continuas.

51

Propiedad 3.2 Supongamos que FX es absolutamente continua. Entoncesb

PX ((a, b]) =a

fX (t) dt.

Demostracin. o PX ((a, b]) = PX ((, b]) PX ((, a]) = FX (b) FX (a)b a

= b

fX (t) dt

fX (t) dt

=a

fX (t) dt. 2

Propiedad 3.3 Si FX es absolutamente continua entonces es continua. Demostracin. Primero supondremos que fX es acotada en un entorno del o punto x. Luego existe > 0 y M positivo tal que f (x) M para todo x [x , x] . Luego para todo tenemos PX ({x}) P ((x , x])x

=x

fX (t) dt

M. Como esto vale para todo , resulta PX ({x}) = 0. Luego FX es continua en x. Supongamos ahora que fX no es acotada en ningn entorno del punto u x. Luegox

FX (x) =

fX (t) dt

se dene porx y

fX (t) dt = l m yx yx

fX (t) dt

= l FX (y), m y luego FX es continua en x.2 El nombre densidad nos recuerda la cantidad de masa por unidad de longitud, rea o volumen segn el caso. En este caso se puede decir que a u fX (x) indica la probabilidad por unidad de longitud en las cercan del as punto x. Ms precisamente podemos enunciar el siguiente teorema. a

52

V ctor J. Yohai

Teorema 3.4 Sea fX una funcin de densidad continua en x0 , entonces o PX ([x0 h, x0 + h]) 1 = l m h0 h0 2h 2h l m Demostracin. Sea o Mh = mx{fX (x) : x [x0 h; x0 + h]} a y mh = m X (x) : x [x0 h; x0 + h]}. n{f Por continuidad fX (x0 ) = l Mh = l mh . m mh0 h0 x0 +h

fX (t) dt = fX (x0 ) .x0 h

(3.8)

Por otro lado valen las desigualdadesx0 +h

2hmh

x0 h

fX (t) dt 2hMh ,

y dividiendo por 2h en todos los miembros queda: mh 1 2hx0 +h x0 h

fX (t) dt Mh .

Luego, teniendo en cuenta (3.8) y pasando al l mite cuando h 0 se obtiene fX (x0 ) l m PX ([x0 h; x0 + h]) fX (x0 ) , h0 2h

de donde se deduce el Teorema. 2

Teorema 3.5 Sea fX una funcin de densidad continua en x0 y FX la o distribucin asociada. Entonces FX es derivable en x0 y o FX (x0 ) = fX (x0 ) . Demostracin. Se deduce de la anterior. 2 o Comentario vinculado a la teor de la medida. a En este prrafo el signo corresponde a la integral de Lebesgue. Ms a a generalmente se denen distribuciones absolutamente continuas utilizando funciones Borel medibles. Sea f : R R0 una funcin Borel medible tal o que

f (t) dt = 1.

(3.9)

3.4. Ejemplos de distribuciones continuas.

53

Entonces se puede denir una funcin de distribucin absolutamente cono o tinua porx

F (x) =

f (t) dt,

(3.10)

Se puede demostrar que la funcin F denida por (3.10) cumple las cuatro o propiedades del Teorema 2.5 y es continua y derivable en casi todo punto con derivada f (x). Adems si P es la correspondiente probabilidad sobre R a asociada a F y garantizada por el Teorema de Extensin, dado cualquier o boreliano B se tendr a

P (B) =B

f (t) dt =

IB (t)f (t) dt,

donde IB (t) es la funcin indicadora del conjunto B. o

3.4.3.4.1.

Ejemplos de distribuciones continuas.Distribucin uniforme en un intervalo. o

Consideremos dos nmeros reales a < b. Luego la distribucin uniforme, u o denotada por U(a, b), tiene como densidad fX (x) = con k = 1 > 0. Claramente ba b

k si x [a, b] 0 si x [a, b] . /

fX (x)dx = a

kdx =

k = 1. ba

Ejercicio. Mostrar que la funcin distribucin de U(a, b) es o o 0 xa FX (x) ba 1 si si x (, a) x [a; b)

si x (b, ).

Ejercicio. Mostrar que no existe ninguna distribucin uniforme sobre o toda la recta. En particular consideremos la distribucin uniforme U (0, 1) que tiene o como densidad 1 si x [a; b] fX (x) = 0 si x [a; b] . /

54 La funcin de distribucin es en este caso o o si x (, 0] 0 x si x (0, 1] FX (x) = 1 si x (1, ).

V ctor J. Yohai

(3.11)

Observaciones.

1. Es claro que (3.11) es cierta puesto que si x (0, 1)x

FX (x) = 0

fX (t) dtx

=

fX (t) dt +0 x

fX (t) dt

=0+0

1dt

= x. 2. Sea I = (c, d) (0, 1) Cul es la probabilidad de que X (c, d)? a PX ([c < X < d]) = FX (d) FX (c) = d c. Es decir, la probabilidad que esta distribucin asigna a cada intervalo o contenido en [0, 1] es su longitud. 3. Pueden generarse distribuciones uniformes de muchas maneras diferentes. Por ejemplo podemos elegir dos nmeros A1 , A2 de ocho d u gitos, y denir A3 por los ultimos ocho d gitos de A1 A2 . En general si ya hemos denido A1, A2 , ..., Ak como enteros de ocho d gitos, podemos denir recursimamente Ak+1 como los ultimos ocho d gitos de Ak1 Ak . Este proceso lo podemos continuar hasta obtener An para un n dado. Luego generamos n nmeros con distribucin U(0, 1) por u o Ui = Ai 108 , 1 i n. Estos nmeros no sern aleatorios. Sin embargo se comportarn como si u a a fuesen variables aleatorias independientes con ditribucin U(0, 1). En paro ticular, dados a y b tales que 0 < a < b < 1, se tendr que si n es grande a #{i : 1 i n, a < Ui < b} n ser aproximadamente ba. Es decir la frecuencia con la cual los Ui estn en a a un intervalo (a, b) es aproximadamente la probabilidad que la distribucin o U(0, 1) asigna a ese intervalo.

3.4. Ejemplos de distribuciones continuas.

55

3.4.2.

Generacin de distribuciones a partir de la distribuo cin uniforme en [0,1] o

Vamos a mostrar cmo a partir de una variable aleatoria con distribucin o o U (0, 1) se puede generar cualquier otra variable con cualquier funcin de o distribucin. o Para esto en primer lugar necesitamos algunas deniciones. Sabemos que una funcin de distribucin no tiene por qu ser continua y mucho menos o o e biyectiva, de manera que en general su inversa no existe. Pero podemos denir una funcin que tendr propiedades anlogas. o a a Sea F : R [0, 1] una funcin que cumple con las cuatro propiedades o del Teorema 2.5 que caracterizan una funcin de distribucin y consideremos o o y (0, 1) . Denimos Ay = {x R : F (x) y}. Observaciones. 1. Puede ocurrir que exista una preimagen v F del punto y : F 1 (y) = a . Si F es continua por Bolzano podemos asegurar que asume todos los valores intermedios entre el 0 y el 1 y en consecuencia en algn u punto x asumir el valor y. a 2. Puede ocurrir tambin que no exista la preimagen. Por ejemplo si F e no es continua para algunos valores de y ocurrir que F 1 (y) = . a 3. Puede ocurrir que existan innitas preimgenes. Basta con tomar una a funcin con las propiedades de funcin de distribucin que sea cono o o stante en un intervalo. Para y igual a ese valor hay innitas preimgenes. a

Ejercicio. Dar un ejemplo de cada una de las situaciones y dibujar el grco correspondiente. a

Teorema 3.6 Existe el nmo del conjunto Ay . Demostracin. Basta probar que Ay = y est acotado inferiormente. o a Comencemos probando que Ay = .Sabemos que F satisface la propiedad (2) del Teorema 2.5 y por lo tanton

l F (n) = 1. m

Como 0 < y < 1 existe n0 N tal que F (n0 ) y,

56

V ctor J. Yohai

de manera que n0 Ay . Ahora probaremos que Ay esta acotado inferiormente. Por la propiedad (3) del Teorema 2.5 se tiene que,n

l F (n) = 0. m

Como y > 0 entonces existe n0 N tal que F (n0 ) < y. (3.12) Ahora bien si x Ay no puede ser que n0 > x puesto que por monoton a (Propiedad (1) del Teorema 2.5) se cumplir a F (n0 ) F (x) y, en contradiccin con (3.12). En denitiva se tiene que si x Ay , entonces o n0 x, y por lo tanto Ay esta acotado inferiormente. 2 En virtud de la existencia y unicidad del nmo podemos denir la siguiente funcin o Denicin 3.6 Dada o F : R [0, 1] que satisface las propiedades de una funcin de distribucin (Propiedades o o (1)-(4) del Teorema 2.5) se dene F 1 : (0, 1) R por F 1 (y) = inf Ay . Propiedades de la funcin F1 . o Propiedad 3.4 (a) Dada una funcin de distribucin F, se tiene o o F F 1 (y) y. (b) El nmo del conjunto Ay resulta ser el mnimo de Ay , es decir F 1 (y) = m Ay . n

Demostracin. Bastar probar (a), ya que en ese caso F 1 (y) pertenece al o a conjunto Ay . Por denicin de o nmo existe una sucesin (xn )n Ay o 1 (y), es decir tal que decreciente que converge a Fn

l xn = F 1 (y) . m

Por la propiedad de continuidad a derecha de Fn

l F (xn ) = F F 1 (y) . m

(3.13)

3.4. Ejemplos de distribuciones continuas.

57

Ahora, como para todo n N se tiene que xn Ay sabemos que F (xn ) y, y luego por (3.13) resulta F F 1 (y) y, (3.14)

por lo tanto (a) queda demotrado. Esto implica F 1 (y) Ay . Luego hemos mostrado (a) y por lo tanto tambin hemos demostrado (b). 2 e Propiedad 3.5 Si F es continua entonces F F 1 (y) = y. Demostracin. Sabemos que F F 1 (y) y. Ahora supongamos que no se o cumple la igualdad, esto es que F F 1 (y) > y. Veremos que esto contradice el caracter de nmo del elemento F 1 (y) . 1 (y) e y que llamaremos y . Tomemos un punto intermedio entre F F Entonces y < y < F F 1 (y) . Por ser F continua, por el teorema de Bolzano se deduce que existe x (0, 1) tal que F (x ) = y . Luego reemplazando en la inecuacin anterior se obtiene la desigualdad o y < F (x ) < F F 1 (y) . Por un lado esto dice que x Ay y por otro teniendo en cuenta la monoton a de F resulta x < F 1 (y) . Esto contradice que F 1 (y) sea el m nimo, absurdo. 2 Propiedad 3.6 Dada una funcin de distribucin F, se cumple que o o F 1 (F (x)) x. Demostracin. Es claro que para todo x se tiene que x AF (x) puesto que o F (x) F (x) . Sabemos que F 1 (F (x)) es el m nimo de AF (x) y luego a AF (x) implica F 1 (F (x)) a. En particular si tomamos a = x AF (x) se obtiene el resultado buscado. 2

58

V ctor J. Yohai

Teorema 3.7 (Caracterizacin de Ay como semirecta) Sea F una funo cin de distribucin y tomemos y (0, 1) jo. Los conjuntos o o By = {x : x F 1 (y)} = [F 1 (y) , +) coinciden. Demostracin. Sabemos por la Propiedad 3.4 (b) que o F 1 (y) = m Ay . n Por otro lado es fcil ver que si x Ay y x > x, entonces tambin x Ay . a e Luego Ay = [F 1 (y), ). 2 Ejercicio. Probar que F 1 es montona no decreciente y por lo tanto o medible. Veremos ahora que dada cualquier funcin de distribucin F, a partir de o o cualquier variable aleatoria con distribucin U(0, 1), se puede generar otra o variable aleatoria con funcin de distribucin F. o o Teorema 3.8 Sea U una variable aleatoria con distribucin U(0, 1). Luego o si F es una funcin de distribucin (propiedades (1)-(4) del Teorema 2.5) o o se tiene que X = F 1 (U ) tiene funcin de distribucin F o o Demostracin. Usando el Teorema 3.7 y el hecho de que FU (u) = u, 0 u o 1, se tiene FX (x) = PX ((, x]) = P {F 1 (U ) x} = P ({U F (x)}) = FU (F (x)) = F (x) . 2 Ejercicio. Sea X una variable con rango RX = N0 (enteros no nega1 tivos) y sea pj = pX (j) , j N0 . Vericar que FX es de la forma1 FX (y) =

Ay = {x : F (x) y},

0 si 0 < y p0 i1 i si j=0 pj < y

i j=0 pj ,

i 1.

Comprobar que el resultado anterior vale en este caso. El siguiente teorema de demostracin inmediata es muy importante. o Teorema 3.9 Sean X y X dos variables aleatorias tales que FX = FX . Consideremos una funcin g medible y consideremos las variables aleatorias o obtenidas componiendo Z = g (X) ; Z = g (X ) . Entonces PZ = PZ .

3.4. Ejemplos de distribuciones continuas.

59

Demostracin. Sea B B y probemos que o PZ (B) = PZ (B) . Sabemos que PZ (B) = P Z 1 (B) = P X 1 g1 (B) = PX g1 (B) . Por el Corolario 2.1 del Teorema de Extensin se tiene que PX g1 (B) = o 1 (B) y luego PX g PZ (B) = PX g1 (B) = P X 1 g1 (B) = P Z 1 (B) = PZ (B) . 2 El siguiente resultado vale para funciones de distribucin continuas. o Teorema 3.10 Si X es una variable aleatoria con distribucin FX cono tinua y consideramos la variable aleatoria Y = FX (X) entonces Y tiene distribucin U(0, 1). o Demostracin. Consideremos una variable aleatoria U con distribucin U (0, 1) o o = F 1 (U ) . Sabemos que X tiene distribucin F . Luego por el o y sea X X X Teorema 3.9 las variables Y = FX (X) , Y = FX (X ) tienen la misma distribucin. Pero o1 Y = FX (X ) = FX FX (U ) , 1 y siendo FX continua por Propiedad 3.5 se tiene FX FX (U ) = U. Luego tiene distribucin U(0, 1) y por lo tanto, de acuerdo al Teorema 3.9 Y o tambin esa es la distribucin de Y. 2 e o

3.4.3.

Distribucin Normal N(, 2 ). o

La distribucin normal es tal vez la ms importante y sin lugar a dudas o a la que se usa con mayor frecuencia. A veces este uso se hace de manera inadecuada sin vericar los supuestos que la identican. Veremos ms adelante la a importancia de esta distribucin. Adelantamos sin embargo, informalmente o

60

que si {Yn }n es una sucesin de variables a independientes tales que ninguo na de ellas prevalezca sobre las otras, entonces la variable aleatorian

es aproximadamente normal para n sucientemente grande. Esta distribucin tiene mucha aplicacin en la teor de errores, donde se supone que o o a el error total de medicin es la suma de errores que obedecen a difereno tes causas. La distribucin normal depende de dos parmetros R y o a 2 R>0 . En este cap tulo solo veremos la distribucin normal correspondiente a o 2 = 1. En este caso la funcin de densidad es =0y o fX (x) = K exp x2 2 ,

donde K es una constante y exp(x) es la funcin exponencial ex . Calculareo mos la constante K de forma tal que+

y por lo tanto K= Sea I=

Para el clculo de esta integral podemos usar o bien residuos (teor a a de anlisis complejo) o bien calcular I 2 como integral doble a traves de un a cambio de variable a cordenadas polares. Optamos por la segunda forma I2 = = + + +

Ahora hacemos el cambio de variable x (, ) = x = cos () y (, ) = y = sin ()

1= exp + +

V ctor J. Yohai

Sn =j=1

Yj

K exp

x2 2

dx,

1+ exp + x2 2

. dx

exp

x2 2

dx.

x2 2 exp exp

+

dx

exp exp y 2 2

y 2 2

dy

x2 2

dxdy

=

x2 + y 2 2

dxdy.

3.4. Ejemplos de distribuciones continuas.

61

Claramente se tiene x2 + y 2 = 2 La transformacin del cambio de variable T (, ) = (x (, ) , y (, )) = o ( cos () , sin ()) 0, 0 < 2 tiene matriz diferencial DT (, ) = Entonces su jacobiano J (, ) = det (DT (, )) = det cos () sin () sin () cos () x x y y = cos () sin () sin () cos () .

= cos2 () + sin2 () = . En denitiva |J (, ) | = y aplicando la frmula de cambio de variables o en integrales mltiples resulta u I2 = =0 0 + + + +

exp 2

x2 + y 2 2

dxdy =

exp exp0

= 2

2 dd = 2 + 2 exp d = 2 2 0

2 2

d.

Haciendo el cambio de variable 2 , 2 du = d u= se obtiene I 2 = 20 +

exp (u) du

= 2, y por lo tanto

= 2 exp (u) |+ 0

I= Luego

2 x2 2

1 fX (x) = exp 2

.

62

V ctor J. Yohai

3.4.4.

Distribucin Exponencial. o

Esta distribucin depende de un parmetro que puede tomar cualquier o a valor real positivo. Su funcin de densidad es o f (x) = ex 0 si x 0 si x < 0.

Haciendo la transformacin y = x, dy = dx se obtiene o

f (x)dx =

ex dx =0

ey dy

= [e

0 y

]

| = 0

0 + 1 = 1.

Se deja como ejercicio vericar que la correspondiente funcin de distribucin o o es 1 ex si x 0 F (x) = (3.15) 0 si x < 0. La distribucin exponencial con parmetro ser denotada por E(). o a a Esta distribucin aparece generalmente cuando se trata de estudiar la o durabilidad de un mecanismo bajo el supuesto de que el sistema no se desgasta a lo largo del tiempo. Como ejemplo suele citarse a veces la duracin o de una lmpara elctrica. Sin embargo en este caso existe un cierto desgaste a e propio de la lmpara y su distribucin no es exactamente exponencial. Esta a o distribucin es ms adecuada para modelar la duracin de los mecanismos o a o electrnicos, ya que estos no tienen prcticamente desgaste. o a Para precisar el concepto de desgaste decimos que la distribucin de X o no tiene desgaste cuando dado a > 0 y b > 0 se tiene P (X a + b|X a) = P (X b) . Esto signica que la probabilidad de que llegue a durar hasta el tiempo a + b, dado que ha llegado hasta el tiempo a, es igual a la probabilidad de que haya durado hasta el tiempo b. Es decir el proceso no tiene memoria del tiempo que estuvo funcionando (no recuerda qu tan viejo es) y por e tanto, mientras funciona lo hace como si fuese nuevo. Decimos por el contrario que hay desgaste si P (X a + b|X a) es una funcin decreciente de a. o Vamos a mostrar que la propiedad de falta de desgaste caracteriza a la distribucin exponencial. Esto signica que las unicas distribuciones contio nuas y no negativas que tienen la propiedad de falta de desgaste son las exponenciales.

3.4. Ejemplos de distribuciones continuas.

63

Como {X a + b} {X a} = {X a + b} resulta que P (X a + b|X a) = P ({X a + b} {X a}) P ({X a + b}) = . P (X a) P (X a)

Por lo tanto la propiedad de falta de desgaste se puede escribir como P (X a + b) = P (X b) , P (X a) o equivalentemente P (X a + b) = P (X b) P (X a) . Si X tiene distribucin continua de P (X a) = FX (a) resulta o 1 FX (a) = P (X > a) = P (X a) . Entonces denimos GX (a) = 1 FX (a) , y como la propiededad de falta de memoria es equivalente (3.16), esta se puede escribir tambin como e GX (a + b) = GX (a) GX (b) (3.17) (3.16)

para todo a 0, b 0. En el caso en que X tiene distibucin exponencial por (3.15) se tiene o GX (x) = ex para todo x 0. El siguiente teorema muestra que la propiedad de falta de memoria caracteriza a las distribuiones exponenciales. Teorema 3.11 Sea X una variable aleatoria continua con valores no negativos. Luego la propiedad de falta de memoria dada por (3.17) se cumple si y slo si GX (x) = ex es decir si X tiene distribucin exponencial. o o Demostracin. Supongamos primero que GX (x) = ex . Probaremos que o (3.17) se cumple. En efecto GX (a + b) = e(a+b) = e(a)+(b) = ea eb = GX (a) GX (b) . Supongamos ahora que (3.17) se cumple. Probaremos que GX (x) = ex para algn > 0. En primer lugar veamos que para todo n, dados a1 u 0, ..., an 0 entoncesn n

GXi=1

ai

=i=1

GX (ai ) .

64

V ctor J. Yohai

Probaremos esta proposicin por induccin. Claramente vale para n = 2 por o o hiptesis. o Supongamos que vale para n y probemos que vale para n + 1.n+1 n

GXi=1

ai

= GXi=1 n

ai + an+1 aii=1

= GXn

Gx (an+1 )

=i=1 n+1

GX (ai ) GX (an+1 ) GX (ai ) .i=1

=

Ahora probaremos que para todo a 0 vale que GX (a) = [GX (1)]a . La estrategia es primero probarlo para cuando a es un entero no negativo, luego cuando es un racional no negativo y por ultimo cuando es un nmero u real no negativo. Sea n N entonces GX (n) = GX 1 + 1 + ... + 1n sumandos

= [GX (1)]n .

Ahora sea a =

m Q el conjunto de los nmeros racionales. Entonces u n m GX (m) = GX n n m n

m m = GX + ... + n n = GXn sumandos n

.

Entonces GX1 m = [GX (m)] n n 1 = [(GX (1))m ] n

= [GX (1)] n .

m

3.5. Variables aleatorias mixtas.

Por ultimo consideremos a R0 . Elijamos una sucesin (rn )n Q tal o que rn a. Siendo GX continua resulta GX (a) = l GX (rn ) mn

= l (GX (1))rn mn m = (GX (1))l n rn

= [GX (1)]a .

Veamos que 0 < GX (1) < 1. Supongamos que GX (1) = 0. Luego por (3.18) GX (a) = 0 para todo a 0. En particular GX (0) = 0 y luego FX (0) = 1. Esto implica que P (X = 0) = 1 y luego X es discreta. Supongamos ahora que GX (1) = 1. Luego por (3.18) tenemos que para todo a 0 se tiene GX (a) = 1. Luego para todo a 0 resulta FX (a) = 0 y entonces l x FX (x) = 0, lo cual es un absurdo, ya que este l m mite es 1. Luego podemos denir = log (GX (1)) , de manera que GX (1) = e Luego, usando (3.18), podemos escribir GX (a) = [GX (1)]a = ea , y el teorema queda probado. 2

3.5.

Variables aleatorias mixtas.

Adems de las variables discretas y absolutamente continuas existen a otros tipos de variables. Un estudio exhaustivo de los tipos de variables aleatorias requiere algunos conocimientos de la teor de la medida. Aqu ina troduciremos las variables mixtas cuya funcin distribucin es una combio o nacin convexa de funciones de una distribucin discreta y otra absolutao o mente continua. Denicin 3.7 Decimos que F es una funcin de distribucin mixta si o o o es una combinacin convexa de una distribucin absolutamente continua y o o otra discreta. Ms precisamente, si existen , 0 < < 1 , F1 funcin de a o distribucin absolutamente continua, F2 funcin de distribucin discreta tal o o o que F = (1 ) F1 + F2 . (3.19)

Teorema 3.12 Si F est dada por (3.19) se tiene que a

65 (3.18)

66 (a) F es una funcin de distribucin. o o

V ctor J. Yohai

(b) F no corresponde a la funcin de distribucin de una variable absoluo o tamente continua ni a una discreta. Demostracin. o (a) Por el Corolario 2.2 de la pgina 39 basta probar que F satisface a las Propiedades 1-4 del Teorema 2.5. Probemos primero que F es montona no decreciente. Sean x < x . Luego como F1 y F2 son o montonas no decrecientes se tendr F1 (x) F1 (x ) y como 1 o a > 0 resulta (1 )F1 (x) (1 ) F1 (x ). (3.20) Del mismo se tiene que F2 (x) F2 (x ). (3.21)

Sumando miembro a miembro (3.20) y (3.21) resulta qie F (x) F (x ).

Multiplicando por una constante se conserva la propiedad de que una funcin es continua a derecha y sumando funciones continuas a derecha o se obtiene otra funcin continua a derecha. Esto prueba que F es o continua a derecha. Por otro lado, tenemos quex+

l m F (x) = l m ((1 ) F1 + F2 ) (x)x+

= (1 ) l F1 (x) + l m m F2 (x)x+ x+

= (1 ) + = 1. Finalmente, tambin vale que: ex

l m F (x) = l m ((1 ) F1 + F2 ) (x)x

= (1 ) l F1 (x) + l m m F2 (x)x x+

= 0. Por lo tanto (a) queda probado. (b) Veamos ahora que F no corresponde a la funcin de de distribucin o o de una variable absolutamente continua o discreta. Sean Pi , las probabilidades inducidas por las distribuciones Fi , i = 1, 2 . Luego si P es la probabilidad asociada a F, usando el Teorema de Extensin de la o 39 se puede probar que P (B) = (1 )P1 (B) + P2 (B) B B1 .

3.5. Variables aleatorias mixtas.

67

Esta comprobacin se deja como ejercicio. Sea R2 el rango de una o variable con distribucin F2 . Por lo tanto R2 es numerable y P2 (R2 ) = o 1. Luego P (R2 ) = (1 ) P1 (R1 ) + P2 (R2 ) P2 (R2 ) = > 0 Por lo que se deduce que F no corresponde a una distribucin absoluo tamente continua, ya que stas asignan probabilidad 0 a todo conjunto e numerable. Para ver que no es discreta veamos que sobre un conjunto numerable arbitrario su probabilidad es menor que 1. Sea A un conjunto numerable, luego, teniendo en cuenta que F1 es absolutamente continua resulta que que P1 (A) = 0. Luego P (A) = (1 ) P1 (A) + P2 (A) = P (A2 ) < 1. Como esto ocurre para todo A arbitrario, F no puede ser discreta. 2

1 Ejemplo 3.1 Sea U U [0, 1] y consideremos V = m U, 2 . Entonces n

FV (u) =

u si u <

1 2 1 2

1 si u

Claramente P (V = 1/2) = P (1/2 U 1) = 1/2 de manera que V no es absolutamente continua. Tampoco es discreta. Es fcil ver que a 1 1 F = F1 + F2 2 2 donde F1 es la distribucin de una U[0, 1/2) y F2 la distribucin de una o o 1 variable discreta que asigna probabilidad 1 a x = 2 . Veremos cmo se puede generar una variable con la distribucin mixta o o (3.19). Teorema 3.13 Consideremos variables aleatorias independientes X1 con distribucin F1 , X2 con distribucin F2 y U que toma valores 0 y 1 con o o probabilidades 1 y respectivamente. Denimos la variable X= X1 si U = 0 X2 si U = 1

68

V ctor J. Yohai

Luego FX (1 )F1 + F2 . Demostracin. Teniendo en cuenta la independencia de las variables resulta o que FX (x) = PX ((, x]) = P ({X x}) = P ({X1 x} {U = 0}) ({X2 x} {U = 1}) = P ({X1 x} {U = 0}) + P ({X2 x} {U = 0})

= (1 )F1 (x) + F2 (x) . 2

= (1 )P (X1 x) + P (X2 x)

= P (X1 x)P (U = 0) + P (X2 x)P (U = 1)

Cap tulo 4

Vectores aleatorios.4.1. Denicin de vector aleatorio. o

En muchos casos interesa estudiar simultaneamente ms de una cara acter stica del resultado de un experimento aleatorio. Supongamos que el experimento consiste en elegir al azar alumnos de un determinado grado, y que estamos interesados en estudiar el perl biolgico de esos alumnos. o Podr amos considerar que el perl se compone de la talla, el peso, presin o sangu nea, frecuencia card aca y capacidad respiratoria. Por lo tanto interesar cinco variables aleatorias que deber estudiarse simultneamente. an an a Esto motiva la siguiente denicin de un vector aleatorio. o Denicin 4.1 Sea (, A, P ) un espacio de probabilidad. Se dice que o X = (X1 , X2 , . . . , Xk ) es un vector aleatorio de dimensin k si para cada o j = 1, 2, . . . , k se tiene que Xj : R es una variable aleatoria. Obsrvese que si X = (X1 , . . . , Xk ) es un vector aleatorio de dimene sin k, entonces tambin puede ser interpretado como una funcin X : o e o Rk . En efecto dado , el correspondiente valor de la funcin o k. es X() = (X1 (), . . . , Xk ()) R Teorema 4.1 Para todo x = (x1 , x2 , . . . , xk ) Rk se tendr a X1 ((, x1 ] (, x2 ] (, xk ]) A. X1 (B) = { : X () B}k

Demostracin. Sea B = (, x1 ] (, x2 ] (, xk ]. Entonces o

=

i=1 k

{ : Xi () (, xi ]} = Xi1 ((, xi ]) .

=i=1

69

70

V ctor J. Yohai

Luego como por denicin de variable aleatoria para todo i se tiene que Xi1 ((, xi ]) o A y A es una lgebra se concluye que X1 (B) A. 2 a Recordemos que B k denota la lgebra generada por los conjuntos de a k de la forma R Ax1 ,x2 ,...,xk = (, x1 ] (, x2 ] (, xk ] En R