19
Tema 3 Variables aleatorias discretas 3.1 De la medida en espacios de probabilidad En este cap´ ıtulo vamos a estudiar variables aleatorias. De nuevo, sabiendo que estamos ante alumnos de Inform´ atica, sentimos la necesidad de justificar para qu´ e y por qu´ e estudiamos tal concepto. Podemos justificar su estudio desde diversos ´angulos. Uno podr´ ıa ser el siempre imprescindible y convincente de las aplicaciones; ¿para qu´ e estudiar, si no, algo que no es relevante para la disciplina por la que uno siente pasi´ on? Otro ´ angulo igualmente importante pero menos evidente a primera vista es el conceptual; ¿para qu´ e estudiar algo que no tiene envergadura intelectual ni profundidad? ¡Abajo con lo irrelevante! Vamos a dar inmediatamente la definici´on de variable aleatoria y a partir de ella discutir estos dos ´ angulos. Hasta ahora nos hemos centrado en las probabilidades de sucesos (en especial, de sucesos finitos) y en general en c´ omo definir dichas probabilidades. En su momento, examinamos el comportamiento en media del algoritmo de ordenaci´ on quicksort, la paradoja de Monty Hall, la regla de Laplace, las probabilidades condicionadas, el teorema de Bayes, la aplicaci´on de este teorema al diagn´ ostico m´ edico, entre otros. El siguiente paso es medir sobre un espacio de probabilidad una cantidad de inter´ es. Dicha necesidad de medir estuvo motivada en su origen por las aplicaciones y la definici´ on de variable aleatoria no viene m´as que a formalizar dicha idea. He aqu´ ı su definici´ on formal; la figura 7.1 muestra una interpretaci´ on gr´afica de esa definici´ on (A es un suceso del espacio E en la figura). Definici´ on 3.1.1 Sea (E, ,P ) un espacio de probabilidad. Una variable aleatoria sobre un espacio de probabilidad es una funci´on definida sobre el espacio de resultados E. Es una definici´on sencilla, el lector no podr´ a sino coincidir con nosotros en esto, pero ¿por qu´ e es necesaria? Acudamos por un instante a la definici´ on de matem´aticas para explicar esa necesidad. Aunque no hay consenso definitivo sobre la definici´on de las matem´aticas —y probablemente nunca lo habr´a—, las definiciones modernas 1 se podr´ ıan sintetizar diciendo que las matem´ aticas son el estudio abstracto de la cantidad, la estructura, los patrones, el espacio y el cambio. Y es en el primer t´ ermino, la cantidad, y en el ´ ultimo, el cambio, que encontramos las razones de la importancia de las variables aleatorias. EnInform´atica necesitamos medir, y medir en presencia de la incertidumbre, porque los fen´ omenos son lo suficientemente complejos y porque la cantidad de datos es inmanejablemente grande. 1 Esta definici´ on est´ a tomada de la Wikipedia: https://en.wikipedia.org/wiki/Mathematics. 35

Variables aleatorias discretas - UPM...Ilustraremos con un ejemplo la definicion´ de variable aleatoria dada mas´ arriba. Se tiran dos dados no cargados y se observan los puntos

  • Upload
    others

  • View
    13

  • Download
    0

Embed Size (px)

Citation preview

Tema 3

Variables aleatorias discretas

3.1 De la medida en espacios de probabilidad

En este capıtulo vamos a estudiar variables aleatorias. De nuevo, sabiendo que estamos antealumnos de Informatica, sentimos la necesidad de justificar para que y por que estudiamos talconcepto. Podemos justificar su estudio desde diversos angulos. Uno podrıa ser el siempreimprescindible y convincente de las aplicaciones; ¿para que estudiar, si no, algo que no esrelevante para la disciplina por la que uno siente pasion? Otro angulo igualmente importantepero menos evidente a primera vista es el conceptual; ¿para que estudiar algo que no tieneenvergadura intelectual ni profundidad? ¡Abajo con lo irrelevante! Vamos a dar inmediatamentela definicion de variable aleatoria y a partir de ella discutir estos dos angulos.

Hasta ahora nos hemos centrado en las probabilidades de sucesos (en especial, de sucesosfinitos) y en general en como definir dichas probabilidades. En su momento, examinamos elcomportamiento en media del algoritmo de ordenacion quicksort, la paradoja de Monty Hall,la regla de Laplace, las probabilidades condicionadas, el teorema de Bayes, la aplicacion deeste teorema al diagnostico medico, entre otros. El siguiente paso es medir sobre un espaciode probabilidad una cantidad de interes. Dicha necesidad de medir estuvo motivada en suorigen por las aplicaciones y la definicion de variable aleatoria no viene mas que a formalizardicha idea. He aquı su definicion formal; la figura 7.1 muestra una interpretacion grafica de esadefinicion (A es un suceso del espacio E en la figura).

Definicion 3.1.1 Sea (E,⌦, P ) un espacio de probabilidad. Una variable aleatoria sobre unespacio de probabilidad es una funcion definida sobre el espacio de resultados E.

Es una definicion sencilla, el lector no podra sino coincidir con nosotros en esto, pero ¿porque es necesaria? Acudamos por un instante a la definicion de matematicas para explicaresa necesidad. Aunque no hay consenso definitivo sobre la definicion de las matematicas —yprobablemente nunca lo habra—, las definiciones modernas1 se podrıan sintetizar diciendo quelas matematicas son el estudio abstracto de la cantidad, la estructura, los patrones,

el espacio y el cambio. Y es en el primer termino, la cantidad, y en el ultimo, el cambio,que encontramos las razones de la importancia de las variables aleatorias. En Informaticanecesitamos medir, y medir en presencia de la incertidumbre, porque los fenomenosson lo suficientemente complejos y porque la cantidad de datos es inmanejablemente grande.

1Esta definicion esta tomada de la Wikipedia: https://en.wikipedia.org/wiki/Mathematics.

35

36 Variables aleatorias discretas

Figura 3.1: Esquema de la definicion de variable aleatoria

Ejemplos de medidas relevantes en informatica son el tiempo de ejecucion de algoritmos, loscodigos autocorrectores, los paquetes corruptos en redes, la sobrecarga de servidores web, losfallos en los discos duros, el reconocimiento optico de textos, la estimacion del error en laconversion analogica-digital, entre otros2. Esta lista deberıa ser suficiente en cuanto a lasaplicaciones, pero el lector puede investigar mas por su cuenta y convencerse rapidamente deque las variables aleatorias son ubicuas. Por otro lado, ese afan de medir esta incluido enel mencionado estudio de la cantidad y el cambio del que se hablaba en la definicion de lasmatematicas. Por tanto, las variables aleatorias surgen de la necesidad de medir sobre espaciosde probabilidad. Cuando se mide sobre conjuntos normales las medidas reciben el nombre defunciones. El hecho de que una variable aleatoria sea la generalizacion del concepto funcionya justifica su importancia teorica.

Volvamos a la definicion de variable aleatoria, que indudablemente merece mas analisispor nuestra parte. Esencialmente, es una funcion definida sobre un espacio de probabilidad.Recordamos que una funcion f : A �! B es una correspondencia tal que todo elemento a 2 Atiene una unica imagen f(a) 2 B, donde B es un conjunto de numeros. Vemos que la definicionde funcion requiere que la medida sea unica, que es algo logico e imprescindible.

3.2 Variables aleatorias

Ilustraremos con un ejemplo la definicion de variable aleatoria dada mas arriba. Se tiran dosdados no cargados y se observan los puntos que aparecen cara arriba (este ejemplo ya ha sidodesarrollado sin variables aleatorias en el ejemplo 2.4.15). Para este experimento, el espaciomuestral es E = A⇥A, donde A = {1, . . . , 6}. El espacio de probabilidad es la terna (E,⌦, P ),donde ⌦ = P(E) y la probabilidad de cualquier suceso elemental (a, b), con a, b 2 A, es 1/36.Definamos una variable aleatoria X sobre este espacio de probabilidad. Supongamos que nonos interesan los puntos que salen en los dados, sino su suma, que es una funcion sobre E.Ahora tenemos la variable aleatoria X : E �! N. Esta variable aleatoria produce un nuevo

espacio de probabilidad, que designaremos por (B,⌦B, PX), donde:

2Esta lista esta tomada del artıculo en que se describe el contenido del libro A course on probability theory

for computer scientists, de Mehran Sahami (Universidad de Stanford); vease http://dl.acm.org/citation.cfm?id=1953245. Solo se han tomado los ejemplos mas relevantes.

3.2. Variables aleatorias 37

• B es la imagen de E por X, esto es, X(E), que es el conjunto definido por B ={a 2 R | existe a 2 E con X(a) = e};

• ⌦B, un espacio de sucesos asociado a B;

• y finalmente la funcion de probabilidad se define por PX(b) = P ({e 2 E |X(e) = b}).

En nuestro caso concreto, del dado, la imagen de B o el conjunto de valores que toma X esel conjunto B = {2, 3, . . . , 12}, que son las posibles sumas de las caras del dado. Como conjuntode sucesos tomamos las partes de B, es decir, cualquier subconjunto de B es un suceso. Y, porultimo, las probabilidades de cada valor que toma X son las siguientes:

PX(2) =1

36PX(6) =

5

36PX(10) =

3

36

PX(3) =2

36PX(7) =

6

36PX(11) =

2

36

PX(4) =3

36PX(8) =

5

36PX(12) =

1

36

PX(5) =4

36PX(9) =

4

36

Nota 3.2.1 Formalmente, las probabilidades P y PX son dos funciones diferentes definidassobre dos espacios muestrales diferentes, E y X(E). No obstante, se suele indicar ambasprobabilidades simplemente con la letra P . No hay confusion posible con esta identificacion,pues los sucesos determinan a que probabilidad nos referimos. Nosotros seguiremos estaconvencion y usaremos P para ambas probabilidades.

Ejercicio 3.2.2 Justificad de donde salen las probabilidades anteriores.

Ejercicio 3.2.3 Se tiran tres monedas no cargadas. Se quiere estudiar la variable aleatorianumero de cruces en las tres tiradas. Identificad el espacio de probabilidad asociado a la variablealeatoria y calculad sus probabilidades.

Ejercicio 3.2.4 Un experimento consiste en tirar un dado no cargado repetidamente.Definimos la variable aleatoria numero de tiradas hasta que sale 5 (incluida esta ultima).Construid el espacio de probabilidad de esta variable aleatoria.

Las variables aleatorias se clasifican en dos grupos diferentes que determinan suscaracterısticas y calculo. Si una variable aleatoria toma valores en un conjunto finito o enuna sucesion infinita, entonces se dice que es una variable aleatoria discreta. Si tomavalores en todos los puntos de un intervalo, se dice que es una variable aleatoria continua.Esencialmente, los datos discretos se cuentan y los datos continuos se miden.

Ejercicio 3.2.5 Comprobad que las variables aleatorias de los tres ultimos ejemplos sondiscretas.

Ejercicio 3.2.6 Proporcionad un ejemplo de vuestra invencion de una variable aleatoriacontinua. Justificad que es ası.

La diferencia entre las variables discretas y las continuas es tan marcada que cada uno tieneun estudio por separado. Empezamos con las variables aleatorias discretas.

38 Variables aleatorias discretas

3.3 Variables aleatorias discretas

Consideremos un espacio de probabilidad (E,⌦, P ), donde el espacio muestral sea discreto.Estos espacios de probabilidad se caracterizan directamente por su funcion de masa, de laque damos su definicion formal a continuacion.

Definicion 3.3.1 Sea un espacio de probabilidad (E,⌦, P ), donde E es un conjunto discreto,pongamos E = {ei | i 2 I}, siendo I un subconjunto de N. Dada la variable aleatoria X, sufuncion de masa son las probabilidades pi = P (X(ei)), donde i 2 I.

A la pareja (ei, pi) se le suele llamar distribucion de probabilidad.

Ejercicio 3.3.2 ¿Podrıa explicar el lector por que en la definicion anterior aparece la expresion“siendo I un subconjunto de N”? ¿Esta seguro el lector de que comprende la definicion deconjunto discreto? Si no es ası, busquelo en internet.

Aplicando los axiomas de la probabilidad, los numeros pi, i 2 I cumplen dos propiedadesinmediatas, a saber: (1) pi � 0, para todo i 2 I; (2) la suma de todos los pi da 1. De hecho, elrecıproco es cierto y todo conjunto de numeros que cumplen (1) y (2) son funcion de masa dealguna variable aleatoria.

Ejercicio 3.3.3 Se tienen los siguientes conjuntos de numeros pi. Comprobad si son realmenteuna funcion de masa.

(a) pn =1

6

✓5

6

◆n

, donde n = 0, 1, 2, . . .;

(b) {pn} es el conjunto

⇢37

57,43

48,

5

130,31

111, 0, 0

�;

(c) pn =1

2

✓3

4

◆n

, donde n = 1, 2, 3, . . ..

Ejercicio 3.3.4 Un envıo de 8 ordenadores contienen 3 que son defectuosos. Una empresacompra 2 de estos 8 ordenadores. Hallad la funcion de masa para la variable aleatoria numerode ordenadores defectuosos en la compra.

Problema 3.3.5 Un jugador extrae dos bolas a la vez de una urna que contiene 3 blancas y 2verdes. El jugador pierde 3 e si saca las dos bolas blancas, gana 1 e si obtiene una bola blancay otra verde y queda en paz en otro caso. Se pide:

(a) Definir una variable aleatoria X que describa la ganancia del jugador. Hallar su funcionde masa y representarla.

(b) Hallar la distribucion de probabilidad de X.

(c) Calcular P (�3 X 0) y P (�4 < X < 0).

Problema 3.3.6 Sea pn, con n 2 N, una funcion de masa de una variable aleatoria. Probadque lımn!1 pn = 0.

3.4. Momentos de variables aleatorias 39

3.4 Momentos de variables aleatorias

Las variables aleatorias pueden presentar muchas formas, tanto en los valores que toman comoen su distribucion de probabilidades. Para caracterizarlas se suelen asociar unos numeros quenos indican el comportamiento de la variable aleatoria. Dichos numeros reciben el nombregeneral de momentos de la variable aleatoria. Esos numeros se dividen en tres grandescategorıas, las medidas de centralizacion, las medidas de dispersion y las medidas

de simetrıa. Las medidas de centralizacion pretenden averiguar si los valores de la variablealeatoria se concentran principalmente alrededor de un unico valor, llamado valor central;esto, desde luego, dependera de las probabilidades de la variable aleatoria. Las medidas dedispersion miden cuan lejos estan los valores de la variable aleatoria del valor central. Y porultimo, las medidas de simetrıa detectan si existe simetrıa en los valores de la variable aleatoriacon respecto al valor central.

3.4.1 Medidas de centralizacion y dispersion

Empezamos por plantear el problema de como elegir un valor central para un conjunto de ndatos. Primero, necesitamos algunas definiciones.

Supongamos que estamos en presencia de una variable aleatoria X, no importa si discretao continua. Observamos n valores de la variable y los anotamos, pongamos, por ejemplo, queestan en el conjunto M = {x1, x2, . . . , xn}. El conjunto de valores observados se llama muestra

y los numeros xi, i = 1 . . . , n, valores muestrales. El numero de observaciones n se llamatamano muestral. Por ejemplo, si la variable X consiste en los resultados de un dado yanotamos los resultados de 100 tiradas, entonces tendremos una muestra de tamano 100 dela variable X. La primera pregunta de envergadura conceptual esta contenida en el siguienteproblema.

Problema 3.4.1 La observacion de la variable X da lugar a una muestra M de tamano n.¿Que espacio de probabilidad hay asociado a dicha muestra? ¿Es diferente ese espacio del queesta asociado a la variable aleatoria X? Haced un esquema grafico que ilustre la situacion.

Problema 3.4.2 Consideremos un espacio de probabilidad y una variable aleatoria X sobredicho espacio. Observamos la variable n veces y sale el conjunto de valores numericos M ={x1, x2, . . . , xn}. ¿Como podrıamos asignar un valor z a ese conjunto de observaciones de modoque z resuma del mejor modo posible el conjunto M? Describid el criterio para decidir cuandola representacion del conjunto es buena. Poneos ejemplos sencillos antes de contestar a lapregunta en abstracto.

Problema 3.4.3 En vista del problema anterior y de los conceptos introducidos comoresultado de su discusion, generalizad a variables aleatorias discretas y continuas todos esosconceptos. Por lo menos deberıan definirse los conceptos de media

3, varianza y desviacion

tıpica. Recuerdo que esta prohibido consultar nada en internet y que todo lo que pongais aquıtiene que ser fruto de vuestro razonamiento y no de vuestra memoria.

Ejercicio 3.4.4 Se observa una variable y se obtiene la muestra M = {0, 4, 6, 10}. Hallad susmedidas de centralizacion y dispersion.

3Otros nombres para este concepto son esperanza matematica y promedio.

40 Variables aleatorias discretas

Problema 3.4.5 ¿Es cierto que la media es un valor que representa bien a una muestra? Dadun criterio para determinar cuando la media es representativa.

Ejercicio 3.4.6 Probad que la media x esta siempre comprendida entre el dato menor y eldato mayor de los valores muestrales.

Problema 3.4.7 Se miden las notas en un examen de una clase de 20 alumnos; las notas estandadas en una escala de 0 a 10. Al teclear las notas en el sistema informatico, el profesor seequivoca y en lugar de introducir la nota 9,5 pone 95. Describid como se comporta la media conel dato equivocado con respecto a la media si no se hubiese equivocado. ¿Que se puede concluircon respecto a la media como medida de representacion? ¿Que consecuencias conceptuales ypracticas se derivan de ello?

Problema 3.4.8 En vista del problema anterior, proponed nuevas medidas que solucionen losproblemas que hayais encontrado con la media.

Ejercicio 3.4.9 Volved al ejercicio 3.4.4 y calculad las nuevas medidas de centralizacion ydispersion que hayais definido en el problema anterior.

Definicion 3.4.10 Esperanza matematica de una variable aleatoria discreta. Tambiense llama media. Se designa por E(X) o por µ indistintamente. Si X es discreta con funcion demasa pi, i 2 N, entonces E(X) es

E(X) =1X

i=0

xi · pi

Definicion 3.4.11 Varianza de una variable aleatoria discreta. Se define la varianza �2

o V (X) de una variable aleatoria X como

�2 = E((X � µ)2)

Si X es discreta con funcion de masa pi, i 2 N, entonces esta expresion se transforma en

�2 =1X

i=0

(xi � µ)2 · pi

Problema 3.4.12 Probad las siguientes propiedades para una variable aleatoria discreta X(tambien son validas para variables continuas):

(a) Si a, b son dos numeros reales con a 6= 0, entonces E(aX + b) = aE(X) + b;

(b) V (X) = E(X2)� (E(X))2;

(c) Si a, b son dos numeros reales con a 6= 0, entonces V (aX + b) = a2V (X);

Definicion 3.4.13 Desviacion tıpica de una variable aleatoria. Se define la desviaciontıpica como la raız cuadrada positiva de la varianza.

Definicion 3.4.14 Coeficiente de variacion de una variable aleatoria. Se define elcoeficiente de variacion CV como el cociente �/µ.

3.4. Momentos de variables aleatorias 41

Para terminar el capıtulo de las medidas de dispersion vamos a dar otras medidas que sirvenpara completar el estudio de una variable aleatoria o de una muestra.

Definicion 3.4.15 El rango R, que se define como la diferencia entre el maximo y el mınimode los datos, o dicho mas formalmente, R = xmax � xmin, donde xmax = max{x1, x2, . . . , xn} yxmin = mın{x1, x2, . . . , xn}.

Definicion 3.4.16 El cuartil Q1 es el punto que, una vez ordenados los datos de menor amayor, deja el 25% a la izquierda y el 75% a la derecha. Q2 es la mediana. Q3 deja, en cambio,el 75% a la izquierda y el 25% a la izquierda.

Definicion 3.4.17 El rango intercuartılico se define como la diferencia RI = Q3 �Q1.

En el caso de una muestra, los valor anomalos se definen como aquellos que estan fueradel intervalo [Q1 � 1,5RI,Q3 + 1,5RI].

Problema 3.4.18 Volviendo a la variable aleatoria del problema 3.3.5, se pide:

(a) Obtener la media y la varianza de X.

(b) Decidir si el juego es equitativo y, en caso negativo, proponer un juego alternativo que sılo sea.

3.4.2 Falacias asociadas a la media

Puesto que la competencia transversal de esta asignatura es pensamiento crıtico, querrıamostratar algunas falacias asociadas a la media o esperanza matematica. Primero damos la siguientedefinicion de pensamiento crıtico4. Esta en ingles, pero se que todos vosotros dominais la lenguade Shakespeare.

Critical thinking is that mode of thinking —about any subject, content, orproblem— in which the thinker improves the quality of his or her thinking by skillfullyanalyzing, assessing, and reconstructing it. Critical thinking is self-directed, self-disciplined, self-monitored, and self-corrective thinking. It presupposes assent torigorous standards of excellence and mindful command of their use. It entailse↵ective communication and problem-solving abilities, as well as a commitment toovercome our native egocentrism and sociocentrism.

Problema 3.4.19 Analizad la definicion anterior y escribid un breve informe sobre ella. Estadpreparados para exponed vuestra definicion al resto de la clase.

Hay una falacia bastante comun asociada a la media y que da, lamentablemente, lugar apensamiento magico y, lo que es peor a pseudociencia. Supongamos que una variablealeatoria X toma ciertos valores con ciertas probabilidades. Dichos valores gravitan alrededorde la media, mas lejos o mas cerca segun sea su desviacion tıpica, como vimos mas arriba.Supongamos que observamos la variable y obtenemos un valor x1 bastante alejado de la media.A continuacion se obtiene un segundo valor muestral x2. Hay varias versiones de la falacia de

la regresion a la media. He aquı dos de ellas:

4Esta tomada de la The critical thinking community y se puede encontrar en http://www.criticalthinking.org/pages/our-concept-of-critical-thinking/411

42 Variables aleatorias discretas

(a) Falsas causas asignadas a fluctuaciones naturales. La logica erronea se encuentra enla asignacion de causas externas a la variacion entre x1 y x2. Lo normal es que si x1 es unvalor extremo, entonces el valor x2 se acerque a la media. No puede ser que observacionessucesivas de la variable den valores extremadamente lejos de la media, pues en ese casola media tomarıa otro valor. Un ejemplo tıpico de esta falacia aparece en medicina. Unpaciente tiene dolor de espalda y tras varios dıas de dolor, va a un homeopata (que no esun medico y en muchos casos farsantes). Este le “trata” y el dolor le baja. El pacienteconcluye que la medicina tradicional es ineficiente y que la homeopatıa es mejor. Lo queese paciente —carente de sentido crıtico— no se da cuenta es de que el dolor ha vueltoa su valor medio, que era bajo, y que esto ha coincidido con su visita al homeopata. Lagente tiende a tomar decisiones cuando la varianza esta en un pico. Tambien tiende aasignar causas enganosas a variaciones naturales de la variable. Esta falacia se consideraa veces un caso particular de la falacia post hoc, que consiste en asignar causas a hechosno relacionados solo porque coinciden en el tiempo.

(b) Valores extremos son constantes. Otra forma de falacia es la de suponer que losvalores que observamos, aunque sean extremos, representan a la media. En general, parasacar conclusiones hay que observar un buen numero de valores muestrales.

Para mas informacion sobre esta falacia, consultad la entrada de Wikipedia, Regressiontoward the mean (https://en.wikipedia.org/wiki/Regression toward the mean).

3.4.3 Medidas de asimetrıa

La simetrıa se suele medir con respecto a la media µ, aunque tambien se puede medir conrespecto a otras medidas de centralizacion tales como la mediana Me. La medida mas habitualpara medir la simetrıa respecto a la media es el coeficiente de asimetrıa de Fisher, el cualse define como sigue:

CAF =E((X � µ)3)

�3

Ejercicio 3.4.20 Volved al ejercicio 3.4.4 una vez, calculad el coeficiente de asimetrıa deFisher.

3.5 Funciones de distribucion de variables

aleatorias discretas

La funcion de distribucion es un concepto matematico que permite unificar el tratamiento devariables aleatorias discretas y continuas. Este concepto esta relacionado con la probabilidadacumulada hasta un punto. Su definicion formal es la siguiente:

Definicion 3.5.1 Funcion de distribucion. Sea X una variable aleatoria y x un numeroreal. La funcion de distribucion de X esta definida por

F (x) = P (X x)

3.6. Independencia de variables aleatorias 43

El suceso {X x} es equivalente a {X 2 (�1, x]}. Esta definicion es valida tambien paravariables aleatorias continuas.

Ejercicio 3.5.2 Describid con detalle la forma de la funcion de distribucion de X cuando estaes discreta.

Teorema 3.5.3 Propiedades de la funcion de distribucion. Sea X una variable aleatoriay F (x) su funcion de distribucion.

(a) F (�1) = 0 y F (+1) = 1;

(b) F es monotona no decreciente;

(c) F es continua por la derecha.

Ejercicio 3.5.4 Calcular en terminos de la funcion de distribucion, las siguientesprobabilidades: P (a < X b), P (a X b), P (a X < b), P (a < X < b), P (X = a).

Problema 3.5.5 Dada la funcion F adjunta, se pide:

F (x) =

8>>>><

>>>>:

0 si x < �6

002 si �6 x < �2

007 si �2 x < 2

1 si x � 2

(a) Representar F y verificar que es funcion de distribucion. Determinar si la variablealeatoria correspondiente, X, es discreta o continua.

(b) Obtener y representar la distribucion de probabilidad de X.

(c) Calcular P (X = 007), P (�6 X �2) y P (�3 < X < 2).

(d) Hallar la media y la varianza de X.

3.6 Independencia de variables aleatorias

La independencia, que hasta ahora solo habıamos definido para sucesos en el contexto deprobabilidad, puede definirse tambien para variables aleatorias. Esto no es de extranar, pues,como sabemos, una variable aleatoria genera un espacio de probabilidad y es garantıa deconsistencia que todos los conceptos asociados a un espacio de probabilidad se hereden enuna variable aleatoria. Antes de definir independencia de variables, veamos que es posibledefinir probabilidad condicionada en variables aleatorias.

Sean X, Y dos variables aleatorias. Si A y B son dos sucesos, entonces podemos escribir

P (X 2 A|Y 2 B) =P ({X 2 A} \ {Y 2 B})

P ({Y 2 B})y esta serıa la probabilidad condicionada para dos variables aleatorias.

44 Variables aleatorias discretas

La definicion de independencia de variables aleatorias seguirıa ası

P (X 2 A|Y 2 B) = P ({X 2 A})

y usando el teorema de caracterizacion de la independencia visto mas arriba, la formula anteriorse puede reescribir como

P ({X 2 A} \ {Y 2 B})) = P ({X 2 A}) · P ({Y 2 B})

Problema 3.6.1 Las distribuciones de X numero de bucles DO en un programa e Y numerode ejecuciones necesarias para depurar dicho programa son, respectivamente:

xi 0 1 2 3

pi 0’21 0’298 0’277 0’215

yi 1 2 3 4

qi 0’267 0’397 0’302 0’034

Calculad:

(a) La probabilidad de que un programa tomado al azar contenga como maximo un bucleDO.

(b) La probabilidad de que un programa tomado al azar requiera por lo menos dos ejecucionespara ser depurado.

(c) La probabilidad de {X � 2} condicionado a {Y = 1} sabiendo que la probabilidad de lainterseccion de ambos sucesos vale 00205. Determinar si X e Y son independientes.

(d) La media de Z = X � 2Y + 3.

3.7 Transformacion lineal de variables aleatorias

Con frecuencia, es necesario transformar las medidas que hace una variable aleatoria en otramedida distinta. Puede ser algo tan sencillo como un cambio de escala o que dos variablestengan algun tipo de relacion entre ellas reflejada por una formula matematica. En particularnos interesa la transformacion lineal, que tiene la forma general Y = aX + b, con a 6= 0.

Si X es discreta, tenemos que

PY (Y = yi) = PY (aX + b = yi) = PX

✓X =

yi � b

a

y tendrıamos las probabilidades de Y en funcion de las de X.

Problema 3.7.1 Construye el mapa conceptual del material cubierto hasta ahora.

3.8. Distribucion uniforme discreta 45

3.8 Distribucion uniforme discreta

Ejercicio 3.8.1 Consideremos el conjunto E = {1, 2, . . . , n}.

(a) Definid una variable discreta X que asigne a cada punto de E igual probabilidad.

(b) Hallad su funcion de masa y su funcion de distribucion.

(c) Hallad E(X), �2,CV y la mediana.

Problema 3.8.2 Supongamos ahora que E = {x1, x2, . . . , xn}, un conjunto arbitrario, dondexi 2 R. Generalizad los resultados del problema anterior.

3.9 Procesos de Bernouilli

Definicion 3.9.1 Procesos de Bernouilli Sea un experimento aleatorio que cumple lassiguientes propiedades:

(a) El experimento solo puede dar dos resultados posibles, que llamaremos A y B.

(b) La probabilidad p de obtener A no cambia con el tiempo.

Un proceso de Bernouilli es una variable aleatoria X definida sobre este experimento tal queX toma el valor 1 si sale A y 0 si sale B.

Si una variable aleatoria X modeliza un proceso de Bernouilli se escribe X B(1, p). Confrecuencia, los resultados del experimento se interpretan en un sentido muy general como exitoy fracaso. Por ejemplo, en el contexto de control de calidad, A es una pieza que pasa loscontroles y B es una pieza defectuosa.

Ejercicio 3.9.2 Sea X B(1, p).

(a) Hallad la funcion masa y la funcion de distribucion de X.

(b) Hallad E(X), �2 y CV .

Definicion 3.9.3 Distribucion binomial Consideremos un conjuntos de variables aleatoriasXi B(1, p), con i = 1, . . . , n. Si las variables Xi son independientes entre sı, la variableX = X1 + . . .+Xn se llama distribucion binomial y se escribe X B(n, p).

En general, si tenemos dos variables aleatorias X B(n1, p) e Y B(n2, p), la variableX + Y sigue una distribucion B(n1 + n2, p). El resultado es falso si la probabilidad p no escomun en ambas distribuciones binomiales.

Problema 3.9.4 Sea X B(n, p).

(a) Si interpretamos A como el suceso tener exito, ¿que mide la variable X?

46 Variables aleatorias discretas

(b) Hallad su funcion de masa y probad que suma 1.

(c) Hallad E(X), �2 y CV .

(d) Sabiendo que el coeficiente de asimetrıa de Fisher es

CAF =1� 2ppnp(1� p)

describid la asimetrıa de la distribucion binomial. Dibujad aproximadamente la funcionde masa en cada caso.

Las probabilidades de la binomial son tediosas de calcular a mano. En la practica secalculan por vıa del ordenador, con algun paquete estadıstico (Statgraphics, Matlab, SPSS),o bien mediante tablas. Las tablas se pueden encontrar en el Moodle (fichero Formularios ytablas). En la figura 3.2 se encuentra elementos de la tabla de la distribucion binomial. Porejemplo, si en una binomial X B(4, 0,15) queremos hallar la probabilidad de que X tome elvalor 2, consultando la tabla encontramos que tal valor es 0,988.

3.9. Procesos de Bernouilli 47

Figura 3.2: Tabla de la distribucion binomial

El lector se habra dado cuenta de que en la tabla solo aparece los valores de probabilidadpara distribuciones con 0 < p 0,5. ¿Que ocurre cuando p > 0,5? El siguiente problema dacuenta de esa cuestion.

Problema 3.9.5 Sea X B(n, p) e Y B(n, 1� p). Probad que

P (X = k) = P (Y = n� k)

Ejercicio 3.9.6 Un dado se tira 4 veces. ¿Cual es la probabilidad de sacar exactamente un 6?Resolved el problema usando una binomial.

Ejercicio 3.9.7 Como parte de un plan estrategico de negocio, el 20% de los nuevossuscriptores a un servicio de internet recibiran una promocion especial del proveedor del servicio.Un grupo de 10 vecinos se apuntan al servicio. ¿Cual es la probabilidad de que al menos 4reciben la promocion?

Problema 3.9.8 Un examen, que consta de 10 preguntas, se aprueba si se contestancorrectamente 6 o mas. Cada pregunta tiene 3 apartados y la respuesta se considera correcta sise contestan bien 2 o mas apartados. Sabiendo que la probabilidad de que un alumno estudiosoconteste bien cada apartado es 0,7, independientemente de lo que conteste en el resto de losapartados, calculad:

(a) La probabilidad de que dicho alumno apruebe el examen y la nota esperada.

(b) Sabiendo que este alumno ha aprobado el examen, calculad la probabilidad de que hayacontestado correctamente 7 preguntas.

Problema 3.9.9 En un huerto con 100 calabazas, la probabilidad de recolectar una sin pipases 0005.

(a) Calcular las probabilidades de los siguientes sucesos:

(i) Obtener mas de 6 calabazas con pipas al recolectar las 10 primeras.

(ii) Encontrar la primera calabaza sin pipas al recolectar la decima.

48 Variables aleatorias discretas

(iii) Recolectar en todo el huerto 10 calabazas sin pipas.

(iv) Recolectar en todo el huerto mas de 7 calabazas sin pipas.

(b) Hallar el numero esperado de calabazas sin pipas en el huerto.

Problema 3.9.10 Supongamos que 2000 puntos se seleccionan al azar e independientementedel cuadrado S = {(x, y)|0 x, y 1}. Sea X el numero de puntos que caen en el conjuntoA = {(x, y)|x2 + y2 < 1}. ¿Que distribucion tiene X? Halla su media, su desviacion tıpica ysu CV.

3.10 Distribucion geometrica

Consideremos de nuevo un proceso de Bernouilli que se repite de modo independiente.Queremos medir el numero de veces que hay que repetir el experimento antes de salir el primerexito o suceso A. La correspondiente variable aleatoria se llama geometrica y se escribeX G(p), donde p es la probabilidad de que salga A.

Problema 3.10.1 Sea X G(p).

(a) Hallad la funcion de masa de X y probad que suma 1.

(b) Hallad E(X).

(c) Sabiendo que el coeficiente de asimetrıa de Fisher es

CAF =2� pp1� p

describid la asimetrıa de la distribucion geometrica. Dibujad aproximadamente la funcionde masa.

La varianza y el coeficiente de variacion de de la distribucion geometrica son,respectivamente,

V (X) =1� p

p2, CV =

1p1� p

Otra variable asociada a los procesos de Bernouilli es el numero de veces que se repite elexperimento hasta que sale el primer exito. Esta variable es similar a la anterior y sus momentosse calculan de modo analogo.

Ejercicio 3.10.2 Un dado se tira hasta que aparece un 4. ¿Cual es la probabilidad de tirarel dado 10 veces antes de sacar 4? ¿Cual es la probabilidad de sacar 4 en la decima tirada?Resolved el problema usando una variable geometrica.

Teorema 3.10.3 Sea X una variable aleatoria G(p). La probabilidad de repetir el experimentok veces mas antes de sacar el primer exito no depende del numero previo de veces que hayamosrealizado el experimento.

3.11. Distribucion de Poisson 49

Problema 3.10.4 Supongamos que en un juego de azar (que no sea hacer un examen deestadıstica), la probabilidad de ganar es p, con 0 < p < 1. ¿Como se interpreta el teoremaanterior en el contexto de los juegos de azar?

Problema 3.10.5 En una red ATM los mensajes se envıan en rafagas de celdas de 53 octetos.Un mensaje tendra tantas celdas como quiera y sabremos que hemos llegado al final del mensajeporque en los bits de control de la ultima celda ası se indica. Se sabe que la variable aleatoriaX que cuenta el numero de celdas enviadas en la transmision de un mensaje antes de la celdaque marca el final del mensaje es geometrica de parametro p.

(a) Si sabemos que el numero medio de celdas por mensaje sin incluir la ultima celda es 7,calculad la probabilidad de que el numero de celdas enviadas en la transmision de unmensaje, excluyendo la ultima, sea menor que 3.

(b) Calculad la probabilidad de que el numero de celdas enviadas en la transmision de unmensaje, sin incluir la ultima celda, sea mayor que 7 si sabemos que es mayor que 4.

(c) Se transmiten 10 mensajes de forma independiente. Obtened la probabilidad de que en4 mensajes o mas el numero total de celdas enviadas por mensaje, sin incluir la ultimacelda, sea menor que 3.

3.11 Distribucion de Poisson

La distribucion se cuenta entre la mas importantes entre las discretas, principalmente por suubicuidad. Es capaz de modelizar eficazmente un gran abanico de situaciones muy disparesentre sı. Simeon Poisson (1781–1840) la introdujo por primera vez como parte de su teorıade la probabilidad en 1837. Aparecio en una obra suya en que investigaba la probabilidad deciertos hechos en juicios penales y civiles. Poisson se preguntaba sobre el numero de condenasinjustas en un paıs, variable que sigue ciertamente la distribucion que lleva su nombre.

¿Por que es tan ubicua la distribucion de Poisson? Definamos primero que es unexperimento de Poisson y ello nos hara entender el porque.

Definicion 3.11.1 Experimento de Poisson. Consideremos un experimento con lassiguientes propiedades:

(1) Los resultados del experimento se pueden clasificar en exito o fracaso, esto es, solo haydos resultados posibles.

(2) Se observa el numero de exitos por unidad de cierta magnitud (tiempo, longitud, area,volumen, etc.).

(3) El numero medio de exitos en una region dada es conocido; en otras palabras, se conocela media de exitos por unidad de magnitud. Ademas, este valor medio es constante en eltiempo.

(4) La probabilidad de exito es proporcional al tamano de la region (aquı region se refiere ala magnitud en cuestion).

50 Variables aleatorias discretas

(5) La probabilidad de exito en intervalos extremadamente pequenos es cero. Esto aseguraque la probabilidad de que dos sucesos ocurran a la vez es cero.

(6) Los sucesos ocurren de manera independiente.

Una objecion que se puede hacer a la definicion anterior es que, en la practica, esascondiciones son difıciles de comprobar exhaustivamente. Ello es cierto en muchas ocasiones. Delo que se trata entonces es de suponer que son razonablemente ciertas las hipotesis anterioresy ver como el modelo explica los resultados de ulteriores experimentos.

Para que el lector tome consciencia de la importancia de la distribucion de Poisson, he aquıuna lista de modo alguno exhaustiva de situaciones en que aparece esta distribucion:

(a) El numero de coces dadas por los caballos del ejercito prusiano. Esta fue la primeraaplicacion de la distribucion de Poisson de la que se tiene constancia historica.

(b) El numero de partıculas alfa emitidas por una sustancia radioactiva por unidad de tiempo.

(c) El numero de bombas lanzadas por bombarderos aereos en el sur de Londres durante laSegunda Guerra Mundial.

(d) El numero de accidentes en cierto punto de una carretera por dıa.

(e) El numero de erratas por pagina.

(f) El numero de pasas por centımetro cubico en un plumcake.

(g) El numero de cambios cromosomicos en una celula como consecuencia de la exposicion alos rayos X.

(h) El numero de alumnos con verdadera pasion por la informatica por grupo.

(i) El numero de pelos encontrados en las hamburguesas de McDonalds (o de cualquier otracadena de comida basura).

(j) El numero de fallos en una maquina por mes.

(k) El numero de llamadas a un servicio de atencion al cliente por hora.

Si solo queremos centrarnos en ejemplos con sabor netamente informatica, aquı va otra listasimilar, mas corta pero suficientemente representativa; el lector puede construir su propia lista:

(a) El numero de peticiones a un servidor por unidad de tiempo.

(b) El numero de errores de codificacion que comete un equipo de programadores por semana.

(c) El numero de fallos de un disco duro por mes.

(d) El numero de mensajes que llegan a la unidad de proceso de un ordenador por segundo.

(e) El numero de cuelgues de un sistema operativo por semana.

(f) El numero de mensajes de correo basura que llegan por semana.

3.11. Distribucion de Poisson 51

(g) El numero de programas compilados por un ordenador por dıa.

La variable de Poisson es numero de sucesos por unidad de magnitud y su funcion

de masa de la distribucion de Poisson esta dada por la expresion de mas abajo

P (X = k) = e���k

k!donde el rango de valores es k 2 N (el numero de sucesos por unidad de magnitud puede sercualquier numero natural). La figura 3.3 muestra la funcion de masa para distintos valores de�.

Figura 3.3: La funcion de masa de la distribucion de Poisson

Problema 3.11.2 Comprobad que la funcion de masa dada anteriormente lo es efectivamente.Usad la siguiente formula, consecuencia del desarrollo de Taylor (¡ah, que tiempo aquellos deAM!) y que es valida para todo x 2 R:

ex =1X

n=0

xn

n!

El calculo efectivo de una probabilidad en una distribucion de Poisson se hace tambien atraves de la consulta de tablas o del ordenador.

Suponemos que el lector estara un tanto desorientado ante esa funcion de masa. ¿De dondesale una expresion tan complicada? Obviamente, Poisson no se la invento de la nada ni tuvoun acceso de inspiracion y dijo “¡ah!, todos estos fenomenos siguen esta distribucion con estafuncion de masa tan intricada”. Poisson obtuvo esta distribucion a partir de la binomial B(n, p)imponiendo las condiciones de mas arriba en el experimento y haciendo tender n a infinito yp a cero con ciertas restricciones. El siguiente teorema que, excepcionalmente damos condemostracion, muestra el trabajo original de Poisson y da, ademas, una explicacion logica yorganica de donde sale la funcion de masa.

52 Variables aleatorias discretas

Teorema 3.11.3 Sean X B(n, p) una variable aleatoria binomial. Supongamos que se danlas siguientes condiciones:

(a) El parametro n tiende a infinito;

(b) np permanece constante e igual a �.

Entonces la funcion de masa de la binomial tiende a la de una Poisson.

Prueba: Teniendo en cuenta que en todo momento np = �, tenemos la siguiente demostracion(consultese las explicaciones de los pasos de los calculos mas abajo):

lımn!1

P (X = k) = lımn!1

✓n

k

◆· pk(1� p)n�k (1)

= lımn!1

n!

k!(n� k)!· pk(1� p)n�k

(2)= lım

n!1

n!

k!(n� k)!·✓�

n

◆k ✓1� �

n

◆n�k

(3)=�k

k!lımn!1

n · (n� 1) · . . . · (n� (k � 1))

nk·✓1� �

n

◆n�k

(4)=�k

k!

✓lımn!1

n · (n� 1) · . . . · (n� (k � 1))

nk

◆·

lımn!1

✓1� �

n

◆n�k!

(5)=�k

k!

✓lımn!1

n · (n� 1) · . . . · (n� (k � 1))

nk

◆·

lımn!1

✓1� �

n

◆n

·✓1� �

n

◆�k!

(6)=�k

k!· 1 · e�� · 1 =

�k

k!e��

donde: en (1) se ha aplicado la definicion de numero combinatorio; en (2) se ha sustituido p

por �/n; en (3) se ha sacado fuera del lımite el termino�k

k!y reordenado el resto de terminos;

en (4) se han separado en dos lımites el producto de (3); en (5) se ha separado el segundo lımiteen dos productos para facilitar su calculo; en (6) se han calculado los lımites entre parentesis.El primer lımite de (6) da 1 puesto que en el numerador y el denominador hay k factores en n.El siguiente lımite da e�� por la definicion de numero e y el ultimo lımite tiende claramente a1.

Problema 3.11.4 ¿Como se llega del teorema anterior a la definicion de experimento dePoisson? Dad una explicacion conceptual de esa relacion.

Problema 3.11.5 Si X P (�), calculad E(X), V (X) y el coeficiente de variacion.

Ejercicio 3.11.6 El coeficiente de asimetrıa de la variable Poisson es 1p�. Interpretad dicho

coeficiente.

Teorema 3.11.7 Sean X1 P (�1) y X2 P (�2) dos variables aleatorias independientescon distribucion de Poisson. Entonces la variable X = X1 + X2 sigue una distribucion X P (�1 + �2).

La propiedad que prueba este teorema se llama reproductividad.

3.11. Distribucion de Poisson 53

Ejercicio 3.11.8 El numero de peticiones que llegan a un servidor sigue una distribucion dePoisson. Si la media de ese numero es de 10 mensajes por segundo, ¿cual es la probabilidad deque no haya ninguna peticion en un segundo? ¿Y de que haya 15 o menos en un segundo?

Problema 3.11.9 Sabiendo que un ordenador compila, en promedio, 5 programas cada 10minutos, calculad la probabilidad de que compile:

(a) Mas de 2 programas y menos de 6 en 10 minutos.

(b) 25 programas en una hora.

Problema 3.11.10 Una fabrica suelta un vertido contaminante 2 veces al mes en promedio.La fabrica se revisa cuando hay mas de 8 vertidos contaminantes en un trimestre. La fabricase para si un trimestre hay mas de 1 mes con al menos 4 vertidos. Calculad:

(a) La probabilidad de que un trimestre haya que revisar la fabrica.

(b) El numero esperado de vertidos contaminantes en un trimestre.

(c) La probabilidad de que la fabrica funcione 5 trimestres antes de ser revisada.

(d) El numero medio de trimestres que tienen que transcurrir antes de que la fabrica tengaque ser revisada.

(e) La probabilidad de que un mes haya al menos 4 vertidos contaminantes.

(f) La probabilidad de que un trimestre haya que parar la fabrica.

Problema 3.11.11 Construye el mapa conceptual de este tema.