30
Eventos Dependientes La ocurrencia de un evento influye en la ocurrencia de otro evento. Si un proyecto se empieza tarde otro proyecto que dependa del mismo requerirá tiempo adicional. Si los eventos son dependientes, entonces, por definición, se debe considerar el primer evento al determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición que A ya haya ocurrido. Se necesita del principio de probabilidad condicional. La probabilidad de los eventos conjuntos A y B es: Aunque el uso de una tabla puede simplificar los cálculos de probabilidad, existen ejemplos en los cuales es muy diftcilla creación de una tabla, por tanto se requiere el uso de fórmulas. El siguiente ejemplo ilustra este caso. El gerente de créditos de Dollar- Wise Department Store recolecta datos.sobre 100 de sus clientes. De los 60 hombres, 40 tienen tarjetas de crédito (C ). De las 4(} mujeresr'Sfl tienen tarjeta de crédito (C). Diez de los 1 P (A n B) = P(A) X P(B lA)

Trabajo de Probabilidades

Embed Size (px)

Citation preview

Page 1: Trabajo de Probabilidades

Eventos Dependientes

La ocurrencia de un evento influye en la ocurrencia de otro evento. Si un proyecto se empieza

tarde otro proyecto que dependa del mismo requerirá tiempo adicional. Si los eventos son

dependientes, entonces, por definición, se debe considerar el primer evento al determinar la

probabilidad del segundo.

Es decir, la probabilidad del evento B depende de la condición que A ya haya ocurrido. Se

necesita del principio de probabilidad condicional. La probabilidad de los eventos conjuntos A y

B es:

Aunque el uso de una tabla puede simplificar los cálculos de probabilidad, existen ejemplos

en los cuales es muy diftcilla creación de una tabla, por tanto se requiere el uso de fórmulas. El

siguiente ejemplo ilustra este caso.

El gerente de créditos de Dollar- Wise Department Store recolecta datos.sobre 100 de sus

clientes. De los 60 hombres, 40 tienen tarjetas de crédito (C ). De las 4(} mujeresr'Sfl tienen

tarjeta de crédito (C). Diez de los hombres tienen saldos vencidos (B), mientras que 15 de las

mujeres tienen saldos vencidos (8). El gerente de crédito desea determinar la probabilidad de

que un cliente seleccionado al azar sea:

a. Una mujer con tarjeta de crédito.

b. Una mujer con un saldo.

c. Un hombre sin un saldo.

d. Un hombre con un saldo.

Solución

1

P (A n B) = P(A) X P(B lA)

Page 2: Trabajo de Probabilidades

Crear una tabla de probabilidad es difícil ya que existen tres factores: género, tarjeta de

crédito y saldo en la tarjeta. El uso de la fórmula previa sea quizá el modelo preferido, como se

muestra a continuación:. í a. P(W n C) = P(W) x P(C I W). Claramente P(W) = 40/100. Además, de las 40 muje re \ 30

tienen tarjetas de crédito. Por tanto, dado que el cliente es una mujer, la probabilidad

de que tenga una tarjeta de crédito es P(C I W) = 30/40. Entonces: P(W n C) =

P(W) x P(C I W) = (40/100) X (30/40) =0.30

b. P(WnB) ==P(W) xP(B I W). De las 40 mujeres, 15 tienen saldos. Dado que el cliente es

una mujer, la probabilidad de que tenga un saldo es de 15/40. De manera que

P(W n B) = P(W) x P(B I W) = (40/100)(15/40) =0.15.

c. P(MnB) = P(M) x P(B IM). Debido a que 50 de los 60 hombres no tienen saldos,

P(B I M)= 50/60. Entonces, P(M nB) = P(M) x P(B I M) = (60/100).(50/60) = 0.50.

d. P(MnB):=P(M) x P(B I M). De los 60 hombres, 10 tienen saldos. P(B IM) = 10/60. Así,

P(MnB) = P(M) x P(B 1M) =(60/100)(10/60)= 0.10.

Interpretación

Pueden determinarse las probabilidades de otros eventos conjuntos que ayudarían al

gerente de crédito a determinar las políticas de la tienda y a incrementar las ventas.

La Distribución Normal

La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre

(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más

profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más

comúnmente, como la "campana de Gauss". La distribución de una variable normal está

completamente determinada por dos parámetros, su media y su desviación estándar. Lo cual

determina la curva en forma de campana. Así, se dice que una característica sigue una

distribución normal de media y varianza.

2

Page 3: Trabajo de Probabilidades

Al igual que ocurría con un histograma, en el que el área de cada rectángulo es proporcional

al número de datos en el rango de valores correspondiente si, en el eje horizontal se levantan

perpendiculares en dos puntos a y b, el área bajo la curva delimitada por esas líneas indica la

probabilidad de que la variable de interés, X, tome un valor cualquiera en ese intervalo. Puesto

que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se

extienden asintóticamente hacia los ejes, cuando una variable siga una distribución normal,

será mucho más probable observar un dato cercano al valor medio que uno que se encuentre

muy alejado de éste.

Importancia de la Distribución Normal

• Existen numerosas variables que parecen seguir una forma similar a la distribución

normal (pesos, alturas, coeficientes intelectuales, calificaciones en exámenes, entre

otros.)

• La distribución muestral de muchos estadígrafos muestrales como la media tienen

una distribución aproximadamente normal e independiente de la configuración de la

población, si los datos son suficientemente numerosos.

• Es una excelente aproximación a otras distribuciones muestrales como la de Poisson

y Binomial, por ejemplo.Propiedades de la distribución normal.

Propiedades de la Distribución Normal

La distribución normal posee ciertas propiedades importantes que conviene destacar:

I. Tiene una única moda, que coincide con su media y su mediana.

II. La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre – infinito

y + infinito es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1.

III. Es simétrica con respecto a su media. Según esto, para este tipo de variables existe

una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar

un dato menor.

IV. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es

igual a una desviación típica. Cuanto mayor sea, más aplanada será la curva de la

densidad.

V. El área bajo la curva comprendida entre los valores situados aproximadamente a dos

desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de

posibilidades de observar un valor comprendido en el intervalo .3

Page 4: Trabajo de Probabilidades

VI. La forma de la campana de Gauss depende de los parámetros media y desviación

estándar. La media indica la posición de la campana, de modo que para diferentes valores

de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación

estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor, más

se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño

de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al

valor medio de la distribución.

Como se deduce de este último apartado, no existe una única distribución normal, sino una

familia de distribuciones con una forma común, diferenciadas por los valores de su media y su

varianza. De entre todas ellas, la más utilizada es la distribución normal estándar, que

corresponde a una distribución de media 0 y varianza 1. La curva normal o campana de

Gauss se concibe como un histograma donde el número de intervalos aumenta de forma

indefinida, disminuyendo progresivamente su amplitud.

Esta propiedad resulta especialmente interesante en la práctica, ya que para una distribución

N (0,1) existen tablas publicadas a partir de las que se puede obtener de modo sencillo la

probabilidad de observar un dato menor o igual a un cierto valor z, y que permitirán resolver

preguntas de probabilidad acerca del comportamiento de variables de las que se sabe o se

asume que siguen una distribución aproximadamente normal. La distribución normal es una

distribución continua (no discreta). Se utiliza para reflejar la distribución de variables tales

como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. Tales

variables continuas generalmente son el resultado de la medida.

Asi pues, tiene muchas y muy importantes propiedades, como, por ejemplo:

• La altura máxima la alcanza en el punto central, cuyo valor (valor máximo) se sitúa en

la media de la distribución.

• La curva es simétrica con respecto al eje vertical que pasa por la media.

• En cualquier distribución normal, la media, la moda y la mediana tienen el mismo valor.

5

4

3

4

Page 5: Trabajo de Probabilidades

2

1

5

Page 6: Trabajo de Probabilidades

0-3 -2 -1 0

1 2 3

Dependiendo de la media y de la desviación típica existen infinitas curvas normales pero

todas ellas equivalentes. Sin embargo, la distribución con la que habitualmente se trabaja en la

normal típica, es aquella que tiene de media 0 y de desviación típica 1.

La Función Normal

Es una curva lisa, de forma acampanada y unimodal como se presenta en la siguiente figura:

Se dice que una variable x numérica de experimentación con media aritmética

probabilística y desviación estándar probabilística positiva sigue una distribución normal o

es una variable normal si tiene definida una función densidad de probabilidad dada por:

En las fórmulas anteriores intervienen las siguientes constantes:

Aproximadamente 3.141592

Aproximadamente 2.718281

Parámetro desviación estándar probabilística de x (variables normales diferentes

pueden tener distintas desviaciones estándar probabilísticas, pero para cada variable normal,

su desviación estándar probabilística es constante).

Parámetro media aritmética de probabilística de x (variables normales diferentes pueden

tener distinta medias aritméticas probabilísticas, pero para cada variable normal su media

aritmética probabilística es constante).

6

Page 7: Trabajo de Probabilidades

Distribución Normal Estandar o Tipificada

Una variable de experimentación es estándar o tipificada si su media aritmética probabilística

es cero (0) y su desviación estándar probabilística es uno (1). Si una variable de

experimentación x es normal y tipificada, su función de densidad de probabilidad se denomina

normal estándar o normal tipificada y se ajusta a la fórmula:

Curva Normal Tipificada

Con el fín de suprimir la individualidad de cada una de las distribuciones señaladas

gráficamente, se convierte a la curva normal, en un modelo matemático con características

fijas y definidas y así se hace posible el cálculo de probabilidades. Este proceso se conoce

con el nombre de tipificación de la curva normal. Para lo cual se supone:

a) La media o promedio de la población es cero =0

b) La desviación estándar igual a uno

c) La variable independiente x, se transforma en un valor z.

-3 -2 -1 0 1 2 3

Desviación normal estándar 7

Page 8: Trabajo de Probabilidades

Fórmulas de cálculo se reproducen a continuación como las fórmulas:

Característica de la curva normal tipificada

a) Es simétrica respecto a su media (50% a la derecha y 50% a la izquierda de la media)

b) El área encerrada es 1 o 100%

c) La media, mediana y moda son iguales.

Ejemplos de los casos más frecuentes del cálculo de probabilidades de intervalos.

 

 

 

 

8

Page 9: Trabajo de Probabilidades

 

 

 

 

 

 

9

Page 10: Trabajo de Probabilidades

Calculos de Área bajo la curva normal

La curva normal representa un histograma en el que el intervalo es infinitamente pequeño. Al

igual que en el histograma, para averiguar la proporción de elementos que obtienen

puntaciones inferiores o superiores a una dada, bastará con saber la proporción del área de la

parte referida.

Cuando utilizamos “z” hacemos comparables todas las puntuaciones. Cuando tenemos

una “z” sabemos el área que ocupa expresada en porcentajes. Para ello, hay que buscar el

valor de “z” en la tabla anexa (áreas bajo la curva normal).

Para su cálculo, en todos los casos los casos que se ilustran a continuación, seguiremos

el siguiente proceso:

1º Dibujar la curva con una distribución normal.

2º Representar los datos que tenemos en la curva normal.

3º Calcular la puntuación típica “z”.

4º Establecer el valor del porcentaje de “z”, en la tabla anexa.

Caso 1: Cálculo del número de individuos que quedan por encima y por debajo de

una puntuación directa

Dado un test que nos ofrece una Media de 50 y una Desviación típica de 6 y suponiendo

que la muestra se distribuye normalmente, debemos averiguar las frecuencias en % por

encima y por debajo del valor X1= 60. ¿Cuál es el número de individuos en % que quedan por

encima y por debajo de la puntuación?

X 1= 6

50

10

Page 11: Trabajo de Probabilidades

X = 50 1,6

Hallamos el valor Z asociado a la puntuación directa según la fórmula de cálculo:

X 1−X 60 - 50z =

s=

6= 1,67

Buscamos esa Z en la tabla anexa y localizamos el área:

1,67 0,4525 que en % es igual a 45,25% de los individuos. Es el número de sujetos que

hay entre la Χ y la Z=1,67. (la parte rayada). Si al 45,25% de los casos le

sumamos el 50% obtenemos el 95,25%, deduciendo que la puntuación obtenida por

el sujeto se encuentra por encima del 95,25% de los casos y por debajo del 4,75%

(100%-95,25%).

Caso 2: Cálculo del número de individuos comprendidos entre dos

puntuaciones directas

Teniendo en cuenta los siguientes datos: Media=50, Desviación Típica=6, X1=45,

X2=35, averiguar el porcentaje de individuos que tienen puntuaciones comprendidas entre

X1 y X2.

X 1= 4

X 2= 35

-2.5 -0.8 X = 50

Hallamos los valores Z asociados a cada puntuación directa según la fórmula de cálculo y

buscamos las áreas asociadas en la tabla pertinente:

z = X 1− X

1 sz

11

Page 12: Trabajo de Probabilidades

= X 2− X

2 s-5

=6

= - 0. 83

-15= = - 2. 5

6

29,67%

49,38%

12

Para calcular el número de sujetos entre las dos puntuaciones hay que restar los dos

porcentajes obtenidos:

49,38% - 29,67% = 19, 71 %

Page 13: Trabajo de Probabilidades

Caso 3: Cálculo de una puntuación directa a partir de un área determinada

¿Cuál es la puntuación que deja por debajo el 75 % de los casos teniendo en cuenta los

siguientes datos: Media=59, Desviación típica: 6?

75%

X = 50

Como el 75% de los casos no se puede buscar en la tabla de las áreas, buscamos el 25%

(dado que son valores simétricos) que, aproximadamente, es 24,86. Esto es igual a Z=0,67.

Despejando:

0,67 =

X 1− 5

6

X1 - 50 = 0,67 (6)

X1 - 50 = 4,02

X1= 4,02 + 50 = 54,02

Caso 4: Cálculo de las puntuaciones directas que comprenden un área determinada

Averiguar las puntuaciones que hay que obtener a ambos lados de la media para que el

área comprendida entre ambos puntos, contenga al 50% de los casos, sabiendo que la Media

es 50 y la Desviación Típica 6.

25% 25%

X = 50

Buscamos el 25% en la tabla de áreas bajo la curva normal que, aproximadamente, es

24,86 %, cuyo valor asociado de Z es 0,67.

Page 14: Trabajo de Probabilidades

Despejando en la fórmula de cálculo de las puntuaciones Z obtendremos las

puntuaciones directas:

X1 - 50 = 0,67 (6)

X1 - 50 = 4,02

X1= 4,02 + 50 = 54,02 por encima

---------------------

X2 - 50 = - 0,67 (6)

X2 - 50 = - 4,02

X2= - 4,02 + 50 = 45,98 por debajo

Caso 5: Cálculo del área comprendía por encima y por debajo de una puntuación directa

Hallar la probabilidad en porcentaje (%) de que un valor escogido al azar sea inferior a X1=

60, conociendo los siguientes datos: Media=50, Desviación típica=6.

45,25%50 X 1 = 60

X = 50

z = 60 – 5 = 1,67 45,25 %

6

La probabilidad es: 50% + 45,25% = 95,25%

Page 15: Trabajo de Probabilidades

Caso 6: Cálculo de un área comprendida entre dos puntuaciones directas

Hallar la probabilidad en porcentaje (%) de que un individuo escogido al azar obtenga

una puntuación comprendida entre X1 y X2, teniendo en cuenta los siguientes datos:

Media=50, Desviación típica=6, X1=39 y X2=62.

- 1,83 X = 50 2

Hallamos:

z 1

= 39 − 50 =

s

-11

= - 1.83 6

46,64%

z = 62 − 50=

12= 2 47,72%

s

Para calcular el número de sujetos entre las dos puntuaciones hay que:

46,64% + 47,72% = 94,36 %

14

Page 16: Trabajo de Probabilidades

3

X

Introducción a las medidas de forma: asimetría y curtosis

Además de las medidas de tendencia central y dispersión, se utilizan otros dos tipos

de medidas que nos ayudarán a describir mejor las variables: la asimetría y la curtosis.

El índice de asimetría representa el grado en el que los datos de una distribución de

frecuencias se reparten por encima y por debajo de la tendencia central. La distribución

normal es simétrica y tiene un valor de asimetría igual a 0. Una distribución que tenga una

asimetría positiva significativa tiene una cola derecha larga.

Una distribución que tenga una asimetría negativa significativa tiene una cola izquierda

larga. Como regla aproximada, un valor de la asimetría mayor que el doble de su error

típico se asume que indica una desviación de la simetría.

Índices:

As

X - MoS X

Q -Q − Q -Q

As 3 2 2 1

Q 3 -Q1

As z 3 ∑ ( X i −X )

n ⋅ S3

15

Page 17: Trabajo de Probabilidades

A B C

X 0 1 2 3 4 5 6

Interpretación:

A. Si As > 0: Asimetría positivaB. Si As = 0: SimetríaC. Si As < 0: Asimetría negativa

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la

derecha y negativo cuando existe asimetría a la izquierda.

El índice de curtosis representa el grado de apuntamiento de una distribución de

frecuencias. Para una distribución normal, el valor del estadístico de curtosis es 0 y

diremos que ésta es mesocúrtica. Una curtosis positiva indica que las observaciones se

concentran más y presentan colas más largas que las de una distribución normal, así como

su apuntamiento; se trata de una distribución leptocúrtica. Una curtosis negativa indica que

las observaciones se agrupan menos y presentan colas más cortas, siendo la distribución

platicúrtica.

Índice de curtosis:

Page 18: Trabajo de Probabilidades

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen

3 tipos de distribuciones según su grado de curtosis:

Page 19: Trabajo de Probabilidades
Page 20: Trabajo de Probabilidades
Page 21: Trabajo de Probabilidades
Page 22: Trabajo de Probabilidades