View
2
Download
0
Category
Preview:
Citation preview
MATERIA: BIOESTADÍSTICA
AUTOR: DR. GERARDO DE JESÚS SOSA SANTILLÁN
FECHA DE ELABORACIÓN: ENERO 2016
1
FUNDAMENTOS DE
PROBABILIDAD Y ESTADÍSTICA
Dr. Gerardo de Jesús Sosa Santillán
Departamento de Biotecnología
Facultad de Ciencias Químicas
Universidad Autónoma de Coahuila.
2
I. Introducción
3
“Hay tres tipos de mentiras: las mentiras, las
mentiras infames, y las mentiras estadísticas”
-Benjamin Desraelí, 1766-1848, estadista inglés-
4
> Conjunto de métodos científicos ligados a la toma, organización,
recopilación, presentación y análisis de datos, tanto para la deducción de
conclusiones como para tomar decisiones razonables de acuerdo con
tales análisis.
>Arte de la decisión en presencia de incertidumbre.
>Ciencias que sirve para demostrar que dos personas han comido 1/2
pollo cada una, cuando en realidad una ha comido uno y la otra
ninguno.
Tres definiciones de estadística
5
•La estadística desempeña un papel fundamental y cada vez más relevante en prácticamente todas las áreas de la ciencia. •Etimológicamente, la palabra estadística significa “cifras relacionadas con el Estado”.
•La estadística es concebida popularmente como conjuntos de cifras o gráficas, asociadas generalmente con promedios.
6
•La estadística es concebida popularmente como conjuntos de cifras o gráficas, asociadas generalmente con promedios. •Como procedimiento de toma de decisiones, la estadística es de importancia creciente en varios campos, por ejemplo, en la producción industrial en masa, medicina y biología, economía, política, psicología, análisis de opinión pública y otras ciencias sociales, agricultura, meteorología, física, química e ingeniería.
7
CLASIFICACIÓN
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA DESCRIPTIVA
A partir del cálculo de probabilidades y datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
8
Relación entre estadística y probabilidad:
•La probabilidad es el estudio de fenómenos puramente aleatorios, mientras que la estadística se puede describir como la ciencia o el arte de reunir y analizar datos e inferir consecuencias a partir de estos elementos. •El azar afecta tanto a la reunión de datos como a su análisis y se debe tener en cuenta al hacer inferencias.
9
SEMBLANZA HISTÓRICA DE LA ESTADÍSTICA.
•Se cree que los orígenes de la estadística están ligados al antiguo Egipto y a los censos chinos hace unos 4000 años, aproximadamente. •Desde esa época, diversos estados realizaron estudios sobre algunas características de sus poblaciones, sus riquezas, posesiones, etc. •En 1662, John Graunt, un mercader Inglés, publicó un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro tenia conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadística moderna.
10
•La palabra estadística comenzó a usarse en el siglo XVIII, en Alemania, en relación a estudios donde los grandes números, que representaban datos, eran de importancia para el estado. Sin embargo, la estadística moderna se desarrolló en el siglo XX a partir de los estudios de Karl Pearson.
•Hoy la estadística tiene gran importancia, no sólo por que presenta información, sino que además permite inferir y y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia.
11
•Girolamo Cardano (1501-1576). La Teoría de probabilidad tuvo su origen en apuestas en juegos de azar. •Pascal (1623-1705) y Fermat (1601-1665). Desarrollaron la Teoría de la Probabilidad. •Jakob Bernoulli (1654-1705). De los primeros en estudiar la probabilidad matemática. •Laplace (1749-1827) y Gauss (1777-1855). Ecuación de la curva normal, conocida en la actualidad como curva de Gauss o campana de Gauss.
12
•Charles Lyell en el siglo XIX encontró aplicación de la estadística a un problema de geología. •Darwin (1809-1882) y Mendel (1866) realizaron trabajos netamente estadísticos. •Karl Pearson (1857-1936). Considerado el padre de la estadística. Fundador de la revista “Biometrika” y de la Escuela de Estadística en Cambridge, Inglaterra. A él se debe el estudio de la bondad de ajuste con la X2 y el coeficiente de correlación entre dos variables.
13
W.S. Gosset (1876-1937). Estadística de muestras pequeñas. La “t de student”, herramienta básica para los estadísticos y experimentadores. Ronald Alymer Fisher (1890-1962). Genetista y estadístico. Prueba de F para probar hipótesis acerca de dos varianzas de muestras pequeñas. Prueba de Z de Fisher, para probar hipótesis acerca del coeficiente de correlación lineal. William Feller . Teorema del Límite Central.
14
•1834. Se crea la primera sociedad científica específica en estadística: “Royal Statistical Society”, que en 1838 crea la primera revista de estadística, “Journal of Royal Statistical Society”. •1839. Se crea en USA la American Statistical Association (ASA), que en 1841 crea la revista “Journal of American Statistical Association”. •1853. Primer Congreso Internacional de Estadística, Bruselas Bélgica. •1885. Se crea el International Statistical Institute (ISI).
15
•1940. Se crea el Instituto Interamericano de Estadística (IASI). •1953. El IASI crea el Centro Interamericano de enseñanza Estadística, Económica y Financiera, que en 1962 se transformó en el Centro Interamericano de enseñanza de la Estadística (CIENES), cuya sede desde esa fecha y hasta la actualidad funciona en Santiago de Chile.
16
La estadística en la investigación científica.
•La estadística interviene en la investigación y/o el método científico a través de la experimentación y la observación. •Los científicos deben ser capaces de observar un suceso o un conjunto de eventos como resultado de un plan o diseño. Esto es el experimento, la sustancia del método científico. •El diseño experimental es un campo de la estadística; cuando se aplica en ciencias de la vida, se denomina bioestadística.
17
•La evaluación objetiva de una hipótesis presenta problema. Puesto que no es posible observar todos los eventos concebibles, existirá variación entre los que son observados. •El científico razona de lo particular a lo general. Este proceso es de inferencia incierta. •Este tipo de procesos nos permite desaprobar hipótesis incorrectas, pero no permite aprobar hipótesis correctas. Lo único que se puede dar como demostración es una comprobación fuera de duda razonable. •El azar entra en juego en la obtención de la información y es la causa de la incertidumbre. El estadístico realiza una medición objetiva y precisa de la incertidumbre de las inferencias.
18
•El uso de la estadística como herramienta de la investigación no puede separarse de la planeación general del proyecto de investigación. •El método estadístico apropiado debe formar parte integral del diseño total. •Un proyecto de investigación debe ser diseñado y planificado antes de efectuarse. Los datos no deben ser obtenidos con la convicción de que un método estadístico estará automáticamente disponible para analizarlos. •En muchas ocasiones el estadístico se ve en la necesidad de comunicar al investigador que sus esfuerzos fueron desperdiciados porque no hay una manera legítima de analizar sus datos.
19
Etapas de una investigación estadística
1. Formulación del problema.
2. Diseño del experimento.
3. Colección de datos y experimentación.
4. Tabulación y descripción de los resultados.
5. Inferencias estadística y formulación de la
respuesta.
20
1. Formulación del problema
- Crear conceptos precisos, formular preguntas claras, imponer limitaciones adecuadas al problema.
- La calidad de las conclusiones estadísticas depende de la precisión de los datos, que a su vez dependen dela exactitud en la formulación del problema.
21
2. Diseño del experimento.
- Obtener un máximo de información empleando un mínimo de costo y tiempo.
- Debemos determinar tamaño de la muestra, cantidad y tipo de datos a obtener.
- Establecer el método matemático que se empleará en la última etapa para analizar los datos.
- Debe tenerse cuidado al planificar y diseñar un experimento, de otro modo no se alcanzará ninguna conclusión válida.
22
3. Colección de datos y experimentación.
- Métodos usados para obtener información pertinente.
- Esta es la parte que más tiempo consume en toda investigación.
- Debe sujetarse a reglas esctrictas.
- Cuanto menos opiniones impongamos, serán mejores los resultados.
23
4. Tabulación y descripción de los resultados.
- Ordenación de los datos en forma legible e ilustración con representaciones gráficas. - Cálculo de parámetros descriptivos.
24
5. Inferencia estadística y formulación de la respuesta.
- Al aplicar el método estadístico seleccionado en la etapa 2, se obtienen conclusiones acerca de la población a partir de la muestra. Esto es la inferencia estadística.
- Toma de decisiones y formulación de respuestas.
25
- No existe una fórmula en estadística que tome en cuenta todas las situaciones prácticas concebibles.
- Es necesario adquirir conocimientos generales de los métodos más importantes para la inferencia estadística.
- En cada caso práctico debe estudiarse con cuidado la naturaleza del problema específico, y sólo así se podrá escoger el método apropiado.
26
II. FUNDAMENTOS DE PROBABILIDAD.
27
Espacio de muestreo
El conjunto de todos los resultados posibles de un experimentos estadístico se llama espacio muestral o espacio de muestreo y se representa con el símbolo S.
El espacio muestral S de los resultados posibles cuando se lanza al aire una moneda se puede escribir como:
S={A, S}
28
Considere el experimento de lanzar un dado. Si nos interesamos en el número que muestra en la cara superior, el espacio muestral sería: S1={1,2,3,4,5,6} Si nos interesamos sólo en si el número es par o impar, el espacio muestral es simplemente: S2={par, impar}
29
El ejemplo anterior ilustra el hecho de que se puede usar más de un espacio muestral para describir los resultados de un experimento. En general es deseable utilizar el espacio muestral que dé mayor información acerca de los resultados del experimento. En este caso S1 proporciona más información que S2.
30
•En algunos experimentos es útil listar los elementos del espacio muestral de forma sistemática mediante un diagrama de árbol. •Por ejemplo, un experimento consiste en lanzar una moneda y después lanzarla una segunda vez si sale cara. Si en el primer lanzamiento sale cruz, entonces se lanza un dado una vez.
¿Cuál es el espacio muestral para este experimento?
31
HH
HT
H
H
T
T1
T2
T3
T4
T5
T6
1
2
3
4
5
6
T
Primer resultado
Segundo resultado
Punto de la muestra
S={HH, HT, T1, T2, T3, T4, T5, T6}
32
Ejemplo: Suponga que seleccionamos tres artículos de forma aleatoria de un proceso de fabricación. Cada artículo se inspecciona y se clasifica como defectuoso, D, o sin defectos, N. Realice un diagrama de árbol y determine el espacio muestral S para este caso.
S= {DDD, DDN, DND, DNN, NDD, NDN, NND, NNN}
33
Cuando en un espacio muestral hay un número grande o infinito de puntos muestrales, la descripción es mejor con un enunciado o regla. Por ejemplo: Si los resultados posibles de un experimento son el conjunto de ciudades en el mundo con una población de más de 1 millón, el espacio muestral sería:
S={X/X es una ciudad con una población de más de 1 millón}
34
De manera similar, si S es el conjunto de todos los puntos (x,y) sobre la frontera o el interior de un círculo de radio 2, con centro en el origen, escribimos:
S={(x,y)/x2+y2≤4}
El método de la regla tiene ventajas prácticas, en particular para los muchos experimentos donde un listado se vuelve una tarea tediosa.
35
Ejercicio 1. Liste los elementos de cada uno de los espacios
muestrales siguientes: a) El conjunto de enteros entre 1 y 50, divisibles
entre 8.
b) El conjunto S={x/x2+4x-5=0}
Donde
c) El conjunto S={x/x es un continente}
a
acbbx
2
42
36
Ejercicio 2. ¿Cuáles de los siguientes eventos son iguales? a) A={1,3}
b) B={x/x es un número en un dado}
c) C={x/x2-4x+3=0}
d) D={x/x es el número de caras cuando se lanzan 6
monedas}
37
Ejercicio 3. Un experimento implica lanzar un par de dados, uno
verde y uno rojo, y registrar los números que salen. Si “x” es el resultado en el dado verde y “y” es el resultado en el dado rojo, describa el espacios muestral S:
a) Mediante la lista de los elementos (x,y)
b) Mediante el uso del método de la regla.
38
Respuestas
Ejercicio 1. a) S={8,16,24,32,40,48}
b) S={1,-5}
c) S={América, Asia, Europa, Africa, Oceanía}
Ejercicio 2. A=C
39
Ejercicio 3: a) S={(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5)(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} b) S={(x,y)/”x” es el número en el dado verde y “y” es el número en el dado rojo}
40
Eventos y Probabilidad de Eventos
-Para cualquier experimento podemos estar interesados en la ocurrencia de ciertos eventos más que en el resultado de un evento específico.
- Por ejemplo, podemos estar interesados en el evento A en el que el resultado cuando se lanza un dado sea divisible entre 3.
- Esto ocurrirá si el resultado es un elemento del subconjunto A={3,6} del espacio muestral S={1,2,3,4,5,6}
41
Para cada evento se asigna una colección de puntos muestrales que constituye un subconjunto del espacio muestral. Este subconjunto representa la totalidad de los elementos para los que el evento es cierto. Podemos entonces definir un evento como un subconjunto de un espacio muestral.
42
Por ejemplo: Dado el espacio muestral S={t/t≥0}, donde t es la vida en años de cierto componente electrónico, entonces el evento A de que el componente falle antes de que finalice el quinto año es el subconjunto: A={t/0≤t≤5}
43
Un evento puede ser un subconjunto que incluya todo el espacio muestral S; o un subconjunto de S que se denomina conjunto vacío, que se denota por el símbolo ø, que no contiene elemento alguno. Por ejemplo: Si A={x/x es un factor par de 7} Entonces B debe ser un conjunto vacío, pues los únicos factores posibles de 7 son los números nones 1 y 7.
44
Considere un experimento donde se registran los hábitos de fumar de los empleados de una empresa. Sea el subconjunto de los fumadores un evento. Entonces la totalidad de los no fumadores corresponde a un evento diferente, también subconjunto de S, que se denomina complemento. Entonces el complemento de un evento A con respecto a S es el subconjunto de todos los elementos de S que no están en A. Denotamos el complemento de A como A’.
45
Ejemplo: Un experimento consiste en lanzar un dado y después lanzar una moneda una vez si el número en el dado es par. Si el número en el dado es impar la moneda se lanza dos veces. Sea H la notación para cara y T la notación para cruz. El espacio muestral S, es: S={1HH,1HT,1TH,1TT,2H,2T,3HH,3HT,3TH,3TT,4H,4T,5HH,5HT,5TH,5TT,6H,6T}
46
a) Liste los elementos que correspondan el evento A de que salga en el dado un número menor a 3.
b) Liste los elementos que correspondan al evento B de que ocurran dos cruces.
c) Liste los elementos que corresponden al evento A’
d) Liste los elementos que correspondan al evento B’
A={1HH,1HT,1TH,1TT,2H,2T}
B={1TT,3TT,5TT}
S={3HH,3HT,3TH,3TT,4H,4T,5HH,5HT,5TH,5TT,6H,6T}
S={1HH,1HT,1TH,2H,2T,3HH,3HT,3TH,4H,4T,5HH,5HT,5TH,6H,6T}
47
Probabilidad de un evento
¿Qué queremos decir cuando hacemos afirmaciones como: “Juan probablemente ganará el torneo de tenis”, o “Tengo una oportunidad de 50% de obtener un número para cuando lanzo un dado”?
En cada caso expresamos un resultado del cual no estamos seguros, pero debido a la información del pasado o a partir de una comprensión de la estructura del experimento, tenemos algún grado de confianza en la validez de la afirmación.
48
Consideremos aquellos experimentos para los cuales S tiene un número finito de elementos. -La probabilidad de ocurrencia de un evento que resulta de tal experimento estadístico se evalúa por medio de un conjunto de números reales denominados probabilidades que van de 0 a 1.
- Para todo punto en el espacio muestral asignamos una probabilidad tal que la suma de todas las probabilidades es 1.
- Un evento altamente probable tendrá una probabilidad cercana a 1.
- Un evento altamente improbable tendrá una probabilidad cercana a 0.
49
- Para encontrar la probabilidad de un evento A se suman todas las probabilidades que se asignan a los puntos muestrales en A. esta suma se denomina probabilidad de A y se denota como P(A).
- Entonces la probabilidad de un evento A es la suma de las probabilidades de todos los puntos muestrales en A. Por tanto:
0≤P(A)≤1, P(ø)=0 y P(S)=1
50
Ejemplo: Se lanza dos veces una moneda. ¿Cuál es la probabilidad de que ocurra al menos una cara? S={HH,HT,TH,TT} -Asignamos una probabilidad w a cada uno de los puntos muestrales. Entonces 4w=1 o w=1/4.
- Si A representa el evento de que ocurra al menos 1 cara, entonces:
A={HH,HT,TH} y P(A)=1/4+1/4+1/4=3/4=0.75
51
Ejemplo. Se carga un dado de forma que sea dos veces más probable que salga un número para que uno non. Si E es el evento de que ocurra un numero menor que 4 en un solo lanzamiento del dado, encuentre P(E). S={1,2,3,4,5,6}
P(par)=2w; P(non)=w entonces 9w=1 o w=1/9
E={1,2,3} y P(E)=1/9+2/9+1/9=4/9=0.44
52
Si un experimento puede tener como resultado cualquiera de N diferentes resultados igualmente probables, y si exactamente n de estos resultados corresponden al evento A, entonces la probabilidad del evento A es:
P(A)=n/N
53
Ejemplo: Un surtido de dulces contiene 6 mentas, 4 chiclosos y 3
chocolates. Si una persona hace una selección alaetoria de uno de los dulces, encuntre la probabilidad de sacar:
a) Una menta.
b) Un chicloso o un chocolate
P(M)=6/13=0.46
P(T U C)=7/13=0.54
54
Relaciones entre eventos
Consideremos ahora ciertas operaciones con eventos que tendrán como resultado la formación de nuevos eventos. Estos nuevos eventos serán subconjuntos del mismo espacio muestral que los eventos dados. Por ejemplo, en el lanzamiento de un dado podemos hacer que A sea el evento de que ocurra un número par y B el evento de que aparezca un número mayor que 3. Entonces los subconjuntos A={2,4,6} y B={4,5,6} son subconjuntos del mismo espacio muestral S={1,2,3,4,5,6}
55
Nótese que A y B ocurrirán ambos en un lanzamiento dado si el resultado es un elemento del subconjunto {4,6}, que es precisamente la intersección de A y B. Entonces, la intersección de dos eventos A y B, denotada mediante el símbolo A ∩ B, es el evento que contiene a
todos los elementos que son comunes a A y a B. Dos eventos A y B son mutuamente excluyentes si A ∩
B=ø, es decir, si no tienen elementos en común.
56
En el experimento de lanzamiento de un dado si: A={2,4,6} y B={4,5,6} Podemos interesarnos en que ocurra A o B, o en que ocurran A y B. Tal evento, que se llama la unión de A y B, ocurrirá si el resultado es un elemento del subconjunto {2,4,5,6}. Entonces la unión de dos eventos A y B, que se denota mediante el símbolo A∪B, es el evento que contiene todos
los elementos que pertenecen a A o B, o a ambos.
57
La relación entre eventos y el correspondiente espacio muestral se puede ilustrar de forma gráfica mediante diagramas de Venn. En un diagrama de Venn se representa el espacio muestral como un rectángulo y los eventos con círculos trazados dentro del rectángulo.
58
1
2
3 4
5
6 7
A B
C
S En esta figura se observa que: A ∩ B= regiones 1 y 2
B ∩ C= regiones 1 y 3
A∪C= regiones 1,2,3,4,5,7
B’ ∩ C= regiones 7 y 4
A ∩ B ∩ C=región 1
(A∪B) ∩ C’=regiones 2, 6 y 7
Y así sucesivamente…
59
Dado el siguiente diagrama de Venn:
A
B
C
S
Podemos ver que:
- Los eventos A, B y C, son subconjuntos del espacio muestral S.
- El evento B es un subconjunto del evento A.
- El evento B ∩ C=ø y por ello B y C son mutuamente excluyentes.
- El evento A ∩ C tiene al menos un elemento.
- El evento A∪B=A
60
Varios resultados que derivan de las definiciones precedentes, y que se pueden verificar de forma fácil mediante diagramas de Venn, son los siguientes:
1. A ∩ ø = ø
2. A∪ø = A
3. A ∩ A’ = ø
4. A∪A’ = S
5. S’ = ø
6. ø’ = S 7. (A’)’ = A 8. (A ∩ B)’ = A’∪B’
9. (A∪B)’ = A’ ∩ B’
61
Suma de probabilidades
Si A y B son cualquiera de dos eventos, entonces.
P(A∪B)=P(A)+P(B)-P(A ∩ B)
Si A y B son mutuamente excluyentes, entonces:
P(A∪B)=P(A)+P(B)
62
Si A1, A2,…An es una partición de un espacio muestral S, entonces:
P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)=P(S)=1
Para 3 eventos A, B y C:
P(A∪B∪C)=P(A)+P(B)+P(C)-P(A∩B)-P(A∩C)-P(B∩C)
63
Ejemplo: La probabilidad de que un estudiante apruebe matemáticas es 2/3 y a probabilidad de que apruebe inglés es 4/9. Si la probabilidad de aprobar ambos cursos es ¼. ¿Cuál es la probabilidad de que el estudiante apruebe al menos uno de estos cursos?
Si M es el evento de aprobar matemáticas y E el evento de aprobar inglés, entonces tenemos que: P(M∪E)=P(M)+P(E)-P(M∩E)=2/3+4/9-1/4= 31/36
64
A menudo es más difícil calcular la probabilidad de que ocurra un evento que la probabilidad de que el evento no ocurra. Si este es el caso para algún evento A, simplemente encontramos primero P(A’) y después encontramos P(A) por sustracción:
Si A y A’ son eventos complementarios, entonces P(A)+P(A’)=1
65
Probabilidad condicional.
La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió algún evento A se llama probabilidad condicional y se denota por P(B/A), lo cual por lo general se lee “la probabilidad de que ocurra B dado que ocurrió A”, o simplemente “la probabilidad de B dado A”.
)(
)()/(
AP
BAPABP
66
Ejemplo: La probabilidad de que un vuelo programado
normalmente salga a tiempo es P(D)=0.83; la probabilidad de que llegue a tiempo es de P(A)=0.82; y la probabilidad de que salga y llegue a tiempo es P(D∩A)=0.78
Encuentre la probabilidad de que un avión: a) Llegue a tiempo dado que salió a tiempo
b) Salió a tiempo, dado que llegó a tiempo
67
94.083.0
78.0
)(
)()/(
DP
ADPDAP
a)
95.082.0
78.0
)(
)()/(
AP
ADPADP
b)
68
Teorema de la multiplicación
Si en un experimento pueden ocurrir los eventos A y B, entonces:
P(A∩B)=P(A)P(B/A)
69
Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se seleccionan dos fusibles al azar y se separan de la caja uno después del otro sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles sean defectuosos?
P(A∩B)= P(A)P(B/A)=(1/4)(4/19)=1/19
70
Si en el ejemplo anterior el primer fusible se reemplaza y los fusibles se reacomodan por completo antes de que se extraiga el segundo, entonces P(B/A)=P(B)=1/4 y los eventos Ay B son independientes. Por tanto:
Dos eventos A y B son independientes si y sólo si P(A∩B)=P(A)P(B)
71
Ejercicios
Ejercicio 1. ¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados? Ejercicio 2. Si la probabilidad de que una persona compre un automóvil nuevo elija el color verde, blanco, rojo o azul son, respectivamente, 0.09, 0.15, 0.21 y 0.23. ¿Cuál es la probabilidad de que un comprador dado adquiera un automóvil nuevo que tenga uno de estos colores?
72
Ejercicio 3. Determinar la probabilidad de extraer un rey, un as, un 3 de diamantes o un 7 de tréboles en una sola extracción de una baraja de 52 cartas. Ejercicio 4. ¿Cuál es la probabilidad de obtener un cerrojo no defectuoso al extraerlo de una población si de 600 ya examinados 12 fueron defectuosos?
73
Ejercicio 5. Se lanza un par de dados y se definen los siguientes
eventos: A={La suma de los dados es 6} B={Aparece por lo menos un 2} a) ¿Cuál es la probabilidad de que la suma de los dados
sea 6 si apareció por lo menos un 2?
b) ¿Cuál es la probabilidad de que aparezca por lo menos un 2 si la suma de los dados fue 6?
74
Respuestas
Ejercicio 1. P(A∪B)=P(A)+P(B)=6/36+2/36= 2/9
Ejercicio 2. P(V∪B∪R∪A)=P(V)+P(B)+P(R)+P(A)=0.09+0.015+0.
21+0.23=0.68
75
Ejercicio 3. P(A∪B∪C∪D)=P(A)+P(B)+P(C)+P(D)=4/52+4/52+1
/52+1/52)=10/52=0.1923
Ejercicio 4. P(A)=? P(A’)=12/600 Entonces P(A)=1-P(A’)=1-12/600 P(A)=588/600=0.98
76
Ejercicio 5. a)
11
2
36
1136
2
)(
)()/(
BP
BAPBAP
5
2
36
536
2
)(
)()/(
AP
BAPABP
b)
77
Regla de Bayes.
- Una generalización al caso en que un espacio muestral se parte en k subconjuntos la cubre el siguiente teorema, llamado en ocasiones teorema de la probabilidad total o regla de eliminación.
78
Ejemplo: En cierta planta de montaje tres máquinas, B1, B2 y B3, montan 30%, 45% y 25% de los productos, respectivamente. Se sabe por la experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora suponga que se selecciona de forma aleatoria un producto terminado, ¿cuál es la probabilidad de que esté defectuoso? Solución: Considere los eventos siguientes: A: el producto está defectuoso, B1: el producto está ensamblado por la máquina B1, B2: el producto está ensamblado por la máquina B2, B3: el producto está ensamblado por la máquina B3.
79
Al aplicar la regla de eliminación podemos escribir: P(A)=P(B1)P(A/B1)+P(B2)P(A/B2)+P(B3)P(A/B3) P(A)=(0.3)(0.02)+(0.45)(0.03)+(0.25)(0.02) P(A)=0.0245
80
Suponga que consideramos ahora el problema de encontrar la probabilidad condicional P(B1/A) en el ejemplo anterior. En otras palabras, suponga que se seleccionó un producto de forma aleatoria y es defectuoso. ¿Cuál es la probabilidad de que este producto fuera hecho por la máquina B1?
Preguntas de este tipo se pueden contestar mediante el uso del teorema siguiente, que se llama Regla de Bayes.
81
Si los eventos B1, B2,…,Bk constituyen una partición del espacio muestral S donde P(B1)≠0 para i=1,2,…k, entonces,
para cualquier evento A en S tal que P(A)≠0:
Para r=1,2,…k
82
Con referencia al problema anterior, si se elige al azar un producto y se encuentra que es defectuoso, ¿cuál es la probabilidad de que esté ensamblado por la máquina B3?
83
84
Ejemplo: La proporción de personas en una comunidad que tiene cierta enfermedad es 0.005. Está disponible una prueba para diagnosticar la enfermedad. Si una persona la padece, la probabilidad de que la prueba dé señal positiva es de 0.99. Si una persona no está enferma, la probabilidad de que la prueba dé una señal positiva es de 0.01. Si una persona sale positiva en la prueba, ¿cuál es la probabilidad de que la persona realmente esté enferma?
85
86
- Sólo aproximadamente la tercera parte de los que resultan positivos en la prueba están realmente enfermos. - La prueba es bastante exacta.
- ¿Por qué una proporción grande de pruebas resulta positiva
cuando en realidad se está libre de la enfermedad?
- Esto ocurre porque la enfermedad es rara, sólo el 0.5% de la población la padece.
- Para enfermedades raras, muchas pruebas médicas resultarán en falsos positivos a pesar de ser muy exactas.
- Por esta razón, cuando una prueba sale positiva, se hace generalmente una segunda prueba antes de confirmar el diagnóstico.
87
III. ESTADÍSTICA DESCRIPTIVA BÁSICA.
88
Conceptos Básicos.
Estadística. La ciencia de recolectar, clasificar, describir e interpretar datos numéricos.
Estadística Descriptiva. Parte de la estadística dedicada a la recolección, presentación y descripción de datos numéricos.
Estadística inferencial. Parte de la estadística encargada de interpretar los valores que se obtienen a partir de las técnicas descriptivas para posteriormente tomar decisiones en base a los resultados.
89
Población. Colección completa de individuos, objetos o medidas que tienen una característica en común.
El concepto de población es la idea fundamental más importante de la estadística
La población debe definirse cuidadosamente, en cada caso, a fin de poder determinar la pertenencia a ella.
90
Muestra. Es un subconjunto de la población; es decir, una muestra se compone de algunos de los individuos, objetos o medidas de una población.
Datos. Comprenden el conjunto de valores asignados a la variable de respuesta para cada elemento perteneciente a la muestra.
91
Experimento. Una actividad planificada cuyos resultados producen un conjunto de datos.
Parámetro. Una característica medible de una población completa. En estadística se acostumbra asignar a los parámetros un nombre simbólico, representado por una letra griega (como µ ó σ).
92
Estadístico. Es la medida de una característica relativa a una muestra. La mayoría de los estadísticos muestrales se encuentran por medio de una fórmula y suele asignárseles nombres simbólicos que son letras del alfabeto latino (como X o S).
Variable. Una característica de cada elemento individual de una población o de una muestra. El valor de la variable será la medida de la característica que interesa. También se le llama variable de respuesta.
93
CLASIFICACION DE VARIABLES
CUALITATIVAS CUANTITATIVAS
NOMINAL ORDINAL DISCRETO CONTINUO
ATRIBUTOS NUMERICO
94
De acuerdo a la escala de medición usada se clasifica en:
VARIABLE CUALITATIVA O CATEGÓRICA.
Nominal Ordinal
VARIABLE CUANTITATIVA O ESTADÍSTICA:
Continúa Discreta
95
VARIABLE CUALITATIVA
Son aquellas variables que no aparecen en forma numérica, sino como categorías o atributos y tiene sentido cuando se usa bajo escala nominal u ordinal.
EJEMPLOS: Lugar de Residencia, Idioma, Sexo, Religión, Categoría
Ocupacional, Nivel de Educación de las PERSONAS. Actividad Económica, Condición Jurídica, Año de Inicio
Actividades de EMPRESAS. Materiales de Techo, Piso y Paredes; Régimen de Tenencia,
Estado de Conservación y Tipo de las VIVIENDAS.
96
Ejemplo cualitativa nominal
Religión:
Católica
Protestante
Ateo
Musulmana
Mormon
Religion:
Ateo
Mormon
Católica
Protestante
Musulmana
Nótese que el orden de las religiones como se han presentado no afectan en nada. Las dos presentaciones son validas.
97
Ejemplo cualitativa ordinal
Nivel Educativo:
Maestría
Primaria
Sin Estudio
Secundaria
Universitaria
Doctorado
Nivel Educativo:
Sin Estudio
Primaria
Secundaria
Universitaria
Maestría
Doctorado
Nótese que el orden del nivel educativo como se ve en el primer cuadro si afecta la presentación. En tanto en el segundo hay un orden correlativo
98
VARIABLE CUANTITATIVA
Son las que tienen por modalidades cantidades numéricas, por lo que puede ser medida directamente en la práctica, usando bajo un intervalo o de razón.
Ejemplo: La variable que a cada persona le hace corresponder un INGRESO, es una variable cuantitativa.
DISCRETA, son las que al tomar valores, estos solamente pueden ser representados con números enteros y generalmente es resultado de conteos.
CONTÍNUA, cuando la variable toma cualquier valor real dentro de un intervalo dado, generado al efectuar operaciones de medición.
99
VARIABLE DISCRETA: Ejemplos
Número de clientes por día de un Banco. Número de ventas diarias de una Empresa. Número de vuelos por día en el Aeropuerto. Número de accidentes por día. Número de personas por hogar. Número de pacientes por hospital. Número de hijos por mujer. Número de cuartos por vivienda. Número de nacimientos por día de maternidad. Número de alumnos desaprobados por curso.
100
VARIABLE CONTÍNUA : Ejemplos
Persona: Estatura, peso, etc. Ingreso, gastos, etc. Hogar: Ingresos por hogar. Gastos por hogar en alimentación. Monto de alquiler por hogar. Establecimiento comercial: Valor de las ventas por establecimiento. Valor de las compras por establecimiento. Gastos (electricidad, agua, teléfono)
101
REPRESENTACIÓN DE DATOS ESTADÍSTICOS
102
•Textual.
Empleo de palabras y cifras combinadas en un texto para informar los datos obtenidos. Es el más difícil de seguir para el lector; para el redactor tiene la ventaja de que puede influenciar al lector.
•Tabular.
Presentación de los datos por medio de una tabla o cuadro. Es el método más imparcial para presentar la información ya que muestra los datos crudos, dejando al lector la tarea de interpretarlos sin hacer sugerencias ni comentarios.
103
•Gráfico. Es el método de presentación de información más simple para el lector,
porque se puede captar la tendencia de los datos de un solo vistazo. Su desventaja más
notoria es la pérdida de precisión y exactitud en comparación con la tabla.
•Al crear un gráfico es importante seguir los consejos de los expertos:
Conviene hacer varios modelos diferentes en borrador antes del definitivo.
La disposición del gráfico debe ser de izquierda a derecha.
Debe colocarse siempre el cero de la escala.
Para la comparaciones conviene usar sólo una dimensión, antes de dos o tres.
En los gráficos de porcentaje acumulativo además del nivel cero se debe colocar el
100%.
La línea más gruesa de todas debe ser la del gráfico.
La línea de ayuda visual del gráfico debe ser la más fina de todas.
Debe tener un título claro, conciso y completo.
Debe colocarse siempre la escala empleada y las unidades de las magnitudes
mostradas.
La escala del gráfico debe adaptarse para que incluya toda la información.
No se debe utilizar un gráfico para mostrar la información de un modo tendencioso.
Si un gráfico no resulta claro para el autor, mucho menos lo será para el lector.
104
ESTADÍSTICA DESCRIPTIVA
DATOS CUALITATIVOS
Nominal
Gráficos
Diagramas de Barras
Diagramas de Sectores
Ordinal
Contingencia
Tablas
Frecuencia
Se miden en escala
Se representan en
105
DATOS CUANTITATIVOS
Discretos Continuos
Se dividen en
Se miden en escalas
Intervalos Razón
Se representan en Se resumen en medidas de
ESTADÍSTICA DESCRIPTIVA
Moda
Mediana
Media
Diagramas de
Dispersión
Boxplot
Histogramas
Frecuencia no
Agrupada
Frecuencia
Agrupada
Variabilidad Centralidad Tablas Gráficos
Coeficiente de
Variación
Rango
Varianza
106
REPRESENTACIÓN TABULAR
CLASE FRECUENCIA FRECUENCIA RELATIVA FRECUENCIA
ACUMULADA
FRECUENCIA RELATIVA
ACUMULADA
Bachiller 40 0,33 40 0,33
Técnico 27 0,23 67 0,56
Tecnólogo 27 0,23 94 0,78
Profesional 20 0,17 114 0,95
Posgrado 6 0,05 120 1,00
107
DIAGRAMA DE BARRAS
0
5
10
15
20
25
30
35
40
45
Bachiller Técnico Tecnólogo Profesional Posgrado
108
Gráfico circular
FRECUENCIAS RELATIVAS
0.33
0.23
0.23
0.17
0.05
Bachiller
Técnico
Tecnólogo
Profesional
Posgrado
109
TABLAS DE CONTINGENCIA
La empresa del ejemplo anterior consta de tres plantas y sus empleados están distribuidos de la siguiente forma:
110
0
2
4
6
8
10
12
14
16
18
Planta A Planta B Planta C
Bachiller
Técnico
Tecnólogo
Profesional
Posgrado
Diagrama de Barras:
111
0
5
10
15
20
25
30
35
40
45
Planta A Planta B Planta C
Posgrado
Profesional
Tecnólogo
Técnico
Bachiller
Diagrama de Barras:
112
113
•Gráficos cronológicos:
114
115
Abusos que se pueden cometer con la Estadística
Conclusiones erróneas debido a que los datos son numéricamente insuficientes.
Representaciones gráficas engañosas (escalas).
Datos muestrales no representativos:
Muestra que no incluye a elementos de toda la población.
Ciertas categorías de personas no responden correctamente.
Respuestas voluntarias (sesgadas).
116
Organización de los datos
Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.
117
Formas de organizar los datos:
Un arreglo: es la forma más sencilla de organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.
Poco práctica cuando se tiene una gran cantidad de datos.
118
Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.
Clase Pto.
Medio
fi Fi fri FRi
119
La Distribución de Frecuencias:
Se recomienda su uso cuando se tienen grandes cantidades de datos (n).
Su construcción requiere, en primer lugar, la selección de los límites de los intervalos de clase.
Para definir la cantidad de intervalos de clase (k), se puede usar:
La regla de Sturges: k = 1 + 3.3log(n)
k = n
120
La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.
La amplitud de todas las clases deberá ser la misma.
Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una cifra
significativa más que los datos en bruto.
121
Determinar:
Punto medio = (Li+Ls)/2.
Frecuencia absoluta de la clase (fi).
Frecuencia acumulada de la clase (Fi).
Frecuencia relativa de la clase (fri):
fri = fi/n
Frecuencia relativa acumulada de la clase (FRi).
122
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
a) Construya una distribución de frecuencias.
b) ¿Qué puede concluir de estos datos?
123
Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:
Histogramas.
Polígono de frecuencias.
Ojiva o Polígono de frecuencias acumuladas.
124
Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos:
Histogramas.
Polígono de frecuencias.
Ojiva o Polígono de frecuencias acumuladas.
125
Histograma
126
Tem
a 2
. Esta
dís
tica D
escrip
tiva
Histograma y Polígono de Frecuencias
127
Ojiva
128
Medidas de tendencia central o posición
Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.
Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.
Las medidas de tendencia central más importantes son:
Media: Aritmética y Aritmética ponderada.
Mediana.
Moda.
129
Media Aritmética
Es la suma de todas las observaciones dividida entre el número total de observaciones.
Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable.
130
Cálculo de la media aritmética
Para datos no agrupados:
n
x
X
n
i
i 1
Para datos agrupados:
n
fm
X
k
i
ii 1
Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases
131
Mediana
Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.
Divide al conjunto de datos en dos partes iguales.
Cálculo de la mediana
Para datos no agrupados:
Si n es impar: posición donde se ubica la mediana es igual a (n+1)/2.
Si n es par: (n+1)/2 no es entero, por lo tanto la mediana será igual al promedio de las dos posiciones centrales.
132
Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2.
Cmxf
xFn
LmMdm
m
)(
)(2
11
Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.
133
Moda
Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal, bimodal o multimodal.
Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.
134
Cálculo de la moda
Para datos no agrupados: es simplemente la observación que más se repite.
Para datos agrupados:
CmLimMo21
1
Donde: Lim: límite inferior de la clase modal. 1: diferencia entre fi de la clase modal y la anterior. 2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).
135
Relación entre la media, la mediana y la moda
Cuando los datos son sesgados es mejor emplear la Md
136
Propiedades, ventajas y desventajas de la media
Propiedades:
La suma de las diferencias entre las media muestral y el valor de cada observación es cero.
La media de una constante es la constante.
Si todas las observaciones xi se multiplican por una constante a, la media también se debe multiplicar por ese mismo valor constante.
137
Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción.
La media de la suma de dos variables es igual a la suma de sus medias.
138
Ventajas:
Emplea en su cálculo toda la información disponible.
Se expresa en las mismas unidades que la variable en estudio.
Es el centro de gravedad de toda la distribución, representando a todos los valores observados.
Es un valor único.
139
Se trata de un concepto familiar para la mayoría de las personas.
Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.
140
Desventajas:
Se ve adversamente afectada por valores extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan clases de extremo abierto, tanto superior como inferior.
141
Ventajas y desventajas de la mediana
Ventajas:
Fácil de calcular si el número de observaciones no es muy grande.
No se ve influenciada por valores extremos, ya que solo influyen los valores centrales.
Fácil de entender.
142
Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.
Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal.
143
Desventajas:
No utiliza en su “cálculo” toda la información disponible.
No pondera cada valor por el número de veces que se ha repetido.
Hay que ordenar los datos antes de determinarla.
144
Ventajas y desventajas de la moda
Ventajas:
No requiere cálculos.
Puede usarse para datos tanto cuantitativos como cualitativos.
Fácil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo abierto.
145
Desventajas:
Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.
No utiliza toda la información disponible.
No siempre existe, si los datos no se repiten.
146
En ocasiones, el azar hace que una sola observación no representativa sea el valor más frecuente del conjunto de datos.
Difícil de interpretar si los datos tiene 3 o más modas.
147
Medidas de dispersión, variación o variabilidad.
Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.
Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.
148
Rango.
Varianza.
Desviación Típica o estándar.
Coeficiente de variación.
Las medidas de dispersión más comunes son:
149
Rango (amplitud o recorrido):
Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.
Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.
R=Xmax-Xmin
150
Casi no se emplea debido a que depende únicamente de dos valores.
No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.
Notación: R
151
Varianza
Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.
Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.
Notación: s2, 2, var(X)
152
Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.
21
2
2
1
2
2
xn
x
s
n
xx
s
n
i
i
n
i
i
Para datos NO agrupados:
153
Para datos agrupados en una distribución de frecuencias:
21
2
2
1
2
2
xn
fm
s
n
fxm
s
k
i
ii
k
i
ii
154
Desviación Típica
Es la raíz cuadrada de la varianza.
Notación: s, .
2ss
155
Coeficiente de Variación
Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.
No tiene dimensiones.
Notación: CV
%100x
sCV
156
Ventajas y Desventajas del Rango
Ventajas:
Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).
Fácil de calcular.
157
Desventajas:
No es una medida de dispersión con respecto al centro de la distribución.
Solo emplea dos valores en su cálculo.
No se puede calcular en distribuciones de límite de clase abierto.
158
Propiedades, Ventajas y Desventajas de la Varianza
Propiedades:
1. Siempre es mayor o igual a cero y menor que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a Y=a+bX, la
varianza de Y será Var(Y) = b2Var(X)
159
Ventajas:
Es útil cuando se compara la variabilidad de dos o más conjuntos de datos.
Utiliza toda la información disponible.
Desventajas:
No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos.
Difícil de interpretar por tener sus unidades elevadas al cuadrado.
160
Ventajas y Desventajas de la Desviación Típica
Ventajas:
Esta expresada en las mismas unidades que la variable en estudio.
Utiliza todas las observaciones en su cálculo.
Fácil de interpretar.
Desventajas:
No tiene.
161
Ventajas y Desventajas del Coeficiente de Variación
Ventajas:
Es la única medida de dispersión que permite comparar el nivel de dispersión de dos muestras de variables diferentes.
Emplea toda la información disponible en su cálculo.
Fácil de calcular.
162
Desventaja:
No es una medida de dispersión con respecto al centro de la distribución de los datos.
163
Medidas de Forma
Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran.
Medidas de forma
-Asimetría
-Kurtosis o apuntamiento
Coeficiente de Pearson Coeficiente de Fisher
164
Asimetría
Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos.
165
Coeficiente de Asimetría de Pearson:
Fácil de calcular e interpretar.
Cálculo:
s
MdXASP
3
o Interpretación:
ASP
= 0, X=Md Simétrica > 0, X>Md Asimétrica Positiva < 0, X<Md Asimétrica Negativa
166
Coeficiente de Asimetría de Fisher:
No es de fácil cálculo, pero si su interpretación.
3
1
3
3
1
3
ns
fxM
ASF
ns
Xx
ASF
k
i
ii
n
i
i
Datos NO agrupados
Datos Agrupados
167
o Interpretación:
ASF
= 0, Simétrica > 0, Asimétrica Positiva < 0, Asimétrica Negativa
168
Kurtosis
Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).
Se definen tres tipos de distribución según su grado de Kurtosis:
169
Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable.
Leptocúrtica: grado de concentración elevado.
Platicúrtica: grado de concentración reducido.
170
3
3
4
1
4
4
1
4
ns
fXM
CK
ns
Xx
CK
k
i
ii
n
i
i
Datos No Agrupados
Datos Agrupados
Interpretación:
CK
=0 Mesocúrtica >0 Leptocúrtica <0 Platicúrtica
171
Ejercicio 1
30 55 44 60 43 72 47 65 67 40
59 58 14 32 58 46 41 35 68 50
59 21 42 45 41 48 28 47 77 60
30 57 45 49 33 48 47 52 38 61
54 42 54 42 49 51 39 60 61 63
Supóngase que 50 estudiantes han presentado su examen de admisión a la U.A. de C. Las calificaciones individuales se presentan en la siguiente tabla.
172
a) Construya una tabla de distribución de frecuencias.
b) Construya un histograma de frecuencias, un polígono de frecuencias relativas y una ojiva.
c) Calcule la media y la desviación estándar para los datos agrupados.
173
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
a) Calcule la media aritmética, la varianza, la desviación estándar y el coeficiente de variación.
Ejercicio 2. Dada la siguiente serie de datos.
1
DISTRIBUCIONES
DE PROBABILIDAD
Dr. Gerardo de Jesús Sosa Santillán
Departamento de Biotecnología
Facultad de Ciencias Químicas
Universidad Autónoma de Coahuila.
2
INTRODUCCIÓN
3
- La inferencia estadística consiste en extraer una muestra de una población y analizar sus datos para aprender acerca de ello.
- Muchas veces se tiene un conocimiento superficial de la función de masa de probabilidad o de la función densidad de probabilidad de la población.
- En estos casos se hace una aproximación mediante una de muchas familias comunes de curvas o funciones.
4
Definición
Una tabla, gráfica o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de probabilidad de la variable aleatoria. Al conjunto de pares ordenados (x,f(x)) donde x es el conjunto de valores de una variable aleatoria y f(x) las probabilidades asignadas a x, se le llama función de probabilidad (para variables discretas), y función densidad de porbabilidad (para variables continuas).
5
Distribuciones de Probabilidad
Distribuciones discretas
Distribución Binomial
Distribución Poisson
Distribuciones continuas
Distribución Exponencial
Distribución Normal
6
Dato histórico
El cálculo de probabilidades tuvo un
notable desarrollo con el trabajo del
matemático suizo Jacob Bernoulli (1654-1705).
Bernoulli definió el proceso conocido por su
nombre el cual establece las bases para el
desarrollo y utilización de la distribución binomial.
7
Propiedades de un experimento de Bernoulli
1 - En cada prueba del experimento sólo hay dos posibles resultados: éxitos o fracasos.
2 - El resultado obtenido en cada prueba es independiente de los resultados obtenidos en pruebas anteriores.
3 - La probabilidad de un suceso es constante, la representamos por p, y no varía de una prueba a otra. La probabilidad del complemento es 1- p y la representamos por q .
Si repetimos el experimento n veces podemos
obtener resultados para la construcción de la
distribución binomial.
8
La distribución binomial
La distribución de probabilidad binomial es un ejemplo de distribución de probabilidad discreta.
Esta formada por una serie de experimentos de Bernoulli. Los resutados de cada experimento son mutuamente excluyentes.
Para contruirla necesitamos:
1 - la cantidad de pruebas n
2 - la probabilidad de éxitos p
3 - utilizar la función matemática.
9 9
Utilidad
La distribución binomial se utiliza en situaciones cuya solución tiene dos posibles resultados.
Por ejemplo:
Al nacer un bebé puede ser varón o hembra.
En el deporte un equipo puede ganar o perder.
En pruebas de cierto o falso sólo hay dos alternativas.
10 10
Utilidad
También se utiliza cuando el resultado se puede reducir a dos opciones.
Por ejemplo:
Un tratamiento médico puede ser efectivo o inefectivo.
La meta de producción o ventas del mes se pueden o no lograr.
En pruebas de selección múltiple, aunque hay cuatro o cinco alternativas, se pueden clasificar como correcta o incorrecta.
Estos ejemplos los podemos considerar como
“experimentos de Bernoulli”
11
La función P(x=k)
La función de probabilidad de la distribución Binomial, también denominada Función de la distribución de Bernoulli: k - es el número de aciertos. n - es el número de experimentos. p - es la probabilidad de éxito, como por ejemplo, que salga "cara" al lanzar la moneda. 1-p - también se le denomina como “q ”
12
Ejemplo1 de la función F(x=k)
¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?
El número de aciertos k es 6. Esto es x=6
El número de experimentos n son 10
La probabilidad de éxito p, es decir, que salga "cara" al lanzar la moneda es 50% ó 0.50
La fórmula quedaría:
P (k = 6) = 0.205
Es decir, que la probabilidad de obtener 6 caras al lanzar 10 veces una moneda es de 20.5% .
13
Ejemplo 2 de la función F(x=k)
¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces?
El número de aciertos k es 4. Esto es x=4
El número de experimentos n son 8
La probabilidad de éxito p (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0.1666)
La fórmula queda:
P (k = 4) = 0.026
Es decir, que la probabilidad de obtener cuatro veces el números 3 al tirar un dado 8 veces es de 2.6%.
14
17
Características de la distribución binomial
n = 5 p = 0.1
n = 5 p = 0.5
Media
= E(X) = n p
= 5 · 0.1 = 0.5
= 5 · 0.5 = 0.25
Desviación estándar
0
.2
.4
.6
0 1 2 3 4 5
X
P(X)
.2
.4
.6
0 1 2 3 4 5
X
P(X)
0
1.1)5.01(5.05
67.0)1.01(1.05
)1(
pnp
15
Ejercicio de prueba #1
Un comerciante de verduras tienen conocimiento de que el 10% de la caja está descompuesta. Si un comprador elige 4 verduras al azar, encuentre la probabilidad de que.
a) las 4 estén descompuestas.
b) de 1 a 3 estén descompuestas.
Para resolver la pregunta “b” repase el
modulo de las reglas de probabilidad.
En este caso se resuelve sumando las
probabilidades P(x=1) + P(x=2) + P(x=3)
= 0.6561 + 0.2916 + 0.0486
16
Ejercicio de prueba #2
En pruebas realizadas a un amortiguador para automóvil se encontró que el 20% presentaban fuga de aceite. Si se instalan 20 de estos amortiguadores, hallar la probabilidad de que,
a) 4 salgan defectuosos,
b) más de 5 tengan fuga de aceite.
c) de 3 a 6 amortiguadores salgan defectuosos.
d) Determine el promedio y la desviación estándar de amortiguadores con defectos.
La pregunta “b” debe sumar las probabilidades desde
P(x=6) en adelante.
En la “c” debe sumar P(x=3) + P(x=4) + P(x=5) + P(x=6).
17
Ejercicio de prueba #3
Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 10 alternadores de un lotes. Si el 15% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra,
a) ninguno esté defectuoso,
b) uno salga defectuoso,
c) al menos dos salgan defectuosos
d) más de tres estén con defectos
Para la pregunta “d” puede realizar la siguiente operación:
1 – [P(x=0) + P(x=1) + P(x=2)]
18
Ejercicio de prueba #4
Se lanza al aire ocho veces un dado. Determine la probabilidad de que no salgan más de dos números seis.
19
Ejercicio de prueba #5
Construya la gráfica de distribución de probabilidad binomial para: a) n=5, p=1/2
b) n= 8, p=1/3
20
La distribución de Poisson se llama así
en honor a su creador, el francés
Simeón Dennis Poisson (1781-1840),
Esta distribución de probabilidades fue
uno de los múltiples trabajos matemáticos
que Dennis completó en su productiva trayectoria.
Dato histórico
21
Utilidad
La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.
Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto.
Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña.
Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un segmento n dado como por ejemplo distancia, área, volumen o tiempo definido.
22
Ejemplos de la utilidad
La llegada de un cliente al negocio durante una hora.
Las llamadas telefónicas que se reciben en un día.
Los defectos en manufactura de papel por cada metro producido.
Los envases llenados fuera de los límites por cada 100 galones de producto terminado.
La distribución de Poisson se emplea para describir procesos con un elemento en común, pueden ser descritos por una variable aleatoria discreta.
23
Propiedades de un proceso de Poisson
1. La probabilidad de observar exactamente un éxito en el segmento o tamaño de muestra n es constante.
2. El evento debe considerarse un suceso raro.
3. El evento debe ser aleatorio e independiente de otros eventos
Si repetimos el experimento n veces podemos obtener
resultados para la construcción de la distribución de Poisson.
24
La distribución de Poisson
La distribución de probabilidad de Poisson es un ejemplo de distribución de probabilidad discreta.
La distribución de Poisson parte de la distribución binomial.
Cuando en una distribución binomial se realiza el experimento muchas veces, la muestra n es grande y la probabilidad de éxito p en cada ensayo es baja, es aquí donde aplica el modelo de distribución de Poisson.
Se tiene que cumplir que:
p < 0.10
p * n < 10
25
La función P(x=k)
Donde: P(X=K) es la probabilidad de ocurrencia cuando la variable discreta X toma un valor finito k. λ = Lambda es la ocurrencia promedio por unidad (tiempo, volumen, área, etc.). Es igual a p por el segmento dado. La constante e tiene un valor aproximado de 2.711828 K es el número de éxitos por unidad
26
Ejemplo1
La probabilidad de que haya un accidente en una compañía de manufactura es de 0.02 por cada día de trabajo. Si se trabajan 300 días al año, ¿cuál es la probabilidad de tener 3 accidentes?
Como la probabilidad p es menor que 0.1, y el producto n * p es menor que 10 (300 * 0.02 = 6), entonces, aplicamos el modelo de distribución de Poisson:
Al realizar el cómputo tenemos que P(x = 3) = 0.0892
Por lo tanto, la probabilidad de tener 3 accidentes laborales en 300 días de trabajo es de 8.9%.
27
Ejemplo 2
La probabilidad de que un producto salga defectuoso es de 0.012. ¿Cuál es la probabilidad de que entre 800 productos ya fabricados hayan 5 defectuosos?
En este ejemplo vemos nuevamente la probabilidad p menor que 0.1, y el producto n * p menor que 10, por lo que aplicamos el modelo de distribución de Poisson:
El resultado es P (x = 5) = 0.04602
Por lo tanto, la probabilidad de que haya 5 productos defectuosos entre 800 recién producidos es de 4.6%.
28
La media μ y la varianza σ2
17
Características de la distribución Poisson
k = 5 λ = 0.1
k = 5 λ = 0.5
Media
= E(X) = λ
Varianza
λ = σ2
0
.2
.4
.6
0 1 2 3 4 5
X
P(X)
.2
.4
.6
0 1 2 3 4 5
X
P(X)
0
29
Ejercicio de prueba #1
Un comerciante de verduras tiene conocimiento de que el 3% de la caja está descompuesta. Si un comprador elige 100 verduras al azar, encuentre la probabilidad de que,
a) las 4 estén descompuestas.
b) de 1 a 3 estén descompuestas
30
Ejercicio de prueba #2
En pruebas realizadas a un amortiguador para automóvil se encontró que el 0.04 presentaban fuga de aceite. Si se instalan 150 de estos amortiguadores, hallar la probabilidad de que,
a) 4 salgan defectuosos,
b) más de 5 tengan fuga de aceite.
c) de 3 a 6 amortiguadores salgan defectuosos.
d) Determine el promedio y la desviación estándar de amortiguadores con defectos.
31
Ejercicio de prueba #3
Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra,
a) ninguno esté defectuoso,
b) uno salga defectuoso,
c) al menos dos salgan defectuosos
d) más de tres estén con defectos
32
Ejercicio de prueba #4
La probabilidad de que un CD de música dure al menos un año sin que falle es de 0.95, calcular la probabilidad de que en una muestra de 15,
a) 12 duren menos de un año,
b) a lo más 5 duren menos de un año,
c) al menos 2 duren menos de un año.
33
Ejercicio de prueba #5
Si 8 de 100 viviendas violan el código de construcción. ¿cuál es la probabilidad de que un inspector de viviendas, que selecciona aleatoriamente a 50 de ellas, descubra que:
a) ninguna de las casas viola el código de construcción
b) una viola el código de construcción
c) dos violan el código de construcción
d) al menos tres violan el código de construcción
34
Distribuciones de Probabilidad
Distribuciones de
Probabilidad
Continuas
Binomial
Poisson
Distribuciones de
Probabilidad
Distribuciones de
Probabilidad
Discretas
Normal
35
La distribución normal
36
Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace- Gauss. Fue descubierta y publicada por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss (1809), en relación a la teoría de los errores de observación astronómica y física .
Pierre Simon de Laplace
(1749-1827)
Karl Gauss
(1777-1855)
37
Distribución normal o gaussiana
Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.
Su función de densidad es:
0) (σ
x -eπσ
xPσ)μ,N2
2
σ
μ)x
2
(
2
1)((
La curva normal adopta un número infinito de
formas, determinadas por sus parámetros μ y σ.
38
La familia de las distribuciones
de probabilidad normal
Cada una de las distribuciones puede
tener una media distinta (u)
y desviación estándar distinta (ơ).
No existe una sola distribución
de probabilidad normal, sino más bien
se trata de toda una “familia” de ellas.
Por tanto, eI número de distribuciones
normales es ilimitado.
39
40
Al variar los parámetros μ and σ, obtenemos diferentes
distribuciones normales
41
X
f(X)
μ
σ
Cambiando μ movemos la
distribución hacia la izquierda
o derecha.
Cambiando σ aumentamos o
disminuímos su altura..
42
La curva normal
tiene forma de
campana y un
sólo pico en el
centro de la
distribución.
La distribución de probabilidad normal y
la curva normal que la acompaña tienen
las siguientes características:
43
La media, la mediana y la moda de la
distribución son iguales y se ubican en el
pico.
Características (cont.)
44
Características (cont.)
La mitad del área
bajo la curva se
encuentra a la
derecha de este
punto central y la
otra mitad está a
la izquierda de
dicho punto.
Características (cont.)
Es simétrica en torno a su promedio. Si
se corta Ia curva normal de manera vertical
por el valor central, las dos mitades serán
como imágenes en un espejo.
46
Características (cont.)
La curva normal desciende suavemente en ambas
direcciones a partir del valor central.
Es asintótica, Ia curva se acerca cada vez más al
eje de X pero jamás llega a tocarlo. Es decir, las “colas” de
Ia curva se extienden de manera indefinida en ambas
direcciones.
47
Características (cont.)
48
La distribución de probabilidad
normal estándar
Sería físicamente imposible proporcionar
una tabla de probabilidades para cada
combinación de µ y Ơ.
Es posible utilizar un sólo miembro de Ia
familia de distribuciones normales para
todos los problemas en los que se aplica
Ia distribución normal.
49
La distribución de probabilidad
normal estándar
Tiene una media de 0 y una desviación
estándar de 1
Los valores mayores al promedio tienen
valores Z positivos y, valores menores al
promedio tendrán valores Z negativos.
Z
f(Z)
1
0
50
Utilizando un valor z, se convertirá, o
estandarizará, Ia distribución real a una
distribución normal estándar.
Transformamos unidades X en unidades Z
Todas las distribuciones normales pueden
convertirse a “distribución normal estándar”
restando Ia media de cada observación y
dividiendo por Ia desviación estándar.
51
Un valor z es Ia distancia a partir de
Ia media, medida en las unidades de
desviación estándar.
El valor z
52
Valor z es Ia distancia entre un valor
seleccionado (x) y Ia media (u),
dividida por la desviación estándar (ơ).
El valor z
53
Límites sigma
54
Límites dos sigma
55
Límites tres sigma
56
Al determinar el valor z empleando Ia fórmula
anterior, es posible encontrar eI área de
probabilidad bajo cualquier curva normal
haciendo referencia a Ia distribución normal
estándar en la tabla de z.
57
Tabla de z Áreas debajo de la
curva normal
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
58
Ejemplo:
Supongamos que se calculó el valor z y el
resultado es 1.91.
¿CuáI es eI área bajo la curva normal entre
u y X?
59
Baja por Ia columna de la tabla
encabezada con Ia Ietra z hasta llegar
a 1.9.
Luego muévete en dirección
horizontal a la derecha y lee Ia
probabilidad en Ia columna con el
encabezado 0.01.
Es 0.4719.
Utilizamos la tabla de z.
60
Esto significa que 47.19 por ciento
del área bajo Ia curva se encuentra
entre u y eI valor X,1.91
desviaciones estandar a la derecha
de Ia media.
Esta es Ia probabilidad de que una
observación esté entre 0 y 1.91
desviaciones estándar de Ia media.
61
Valor z calculado
Ejercicios:
Area bajo Ia curva
2.84
1.00
0.49
.4977
.3413
.1879
62
Ahora calcularemos eI valor z dada:
Ia media de Ia población, u,
la desviación estándar de ésta, ơ,
y una X seleccionada.
63
Ejercicios:
Los ingresos semanales de los gerentes de
nivel intermedio tienen una distribución
aproximadamente normal con una media de
$1,000.00 y una desviación estándar de
$100.00.
¿Cuál es el valor z para un ingreso X de
$1,100.00?
Y, ¿para uno de $900.00?
64
Para X = $1,100:
1100 – 1000
100
= 1.00
Utilizando la fórmula:
Para X = $900:
900 - 1000
100
= - 1.00
65
La z de 1.00 indica que un ingreso semanal de $1,100.00 para un gerente de nivel intermedio está una desviación estándar a la derecha de Ia media. La z de -1.00 indica que un ingreso de $900.00 está una desviación estándar a la izquierda de Ia media. Ambos ingresos ($1,100 y $900) están a Ia misma distancia ($100) de la media.
66
900 1,100 1,000
67
La primera aplicación de la distribución normal estándar es encontrar el área bajo la curva normal entre una media y un valor seleccionado, designado como X.
Utilizando la misma distribución que en el ejemplo anterior del ingreso semanal
(u = $1 000, ơ = $100) ¿Cuál es el área bajo la curva normal entre $1,000 y
$1,100?
68
La probabilidad asociada con el valor z de 1.00 se encuentra en la tabla de z. Para ubicar el área, desciende por la columna de la izquierda hasta 1.0. Luego muévete a la derecha y lee el área bajo la curva en la columna marcada 0.00.
Ya se calculó el valor z para $1,100 utilizando la fórmula: z = 1.00
Es 0.3413.
69
Utilizando nuevamente el ingreso medio de
$1,000 al mes y Ia desviación estándar de
$100 al mes:
1.¿Cuál es Ia probabilidad de que un ingreso
semanal específico elegido aI azar esté
entre 790 y 1,000 dólares?
Ejercicios:
70
Calculamos el valor z para $790 utilizando la fórmula:
790 – 1000 = - 210 = -2.10 100 100
Pregunta 1
71
900 1,100 1,000 -2.10
El signo negativo en 2.10 indica que el área está a la izquierda de la media.
72
El área bajo Ia curva normal entre u y X que
corresponde a un valor z de -2.10 es:
(tabla de z).
.4821
73
900 1,100 1,000 -2.10
.4821
|
|
|
74
2.¿CuáI es Ia probabilidad de que eI ingreso
sea menos de 790 dólares?
75
La media divide Ia curva normal en dos
mitades idénticas. El área bajo Ia mitad a Ia
izquierda de Ia media es 0.5 y eI área a Ia
derecha de Ia media es tambien 0.5.
0.5 0.5
76
Por tanto,
0.5000 - 0.4821 = 0.0179
77
900 1,100 1,000
|
.0179 |
|
.4821
|
|
|
-2.10
78
Una segunda aplicación de Ia distribución
normal estándar es:
combinar dos áreas:
- una a Ia derecha
- y Ia otra a Ia izquierda de Ia media.
79
Regresemos a Ia distribución de
ingresos semanales
(u = $1,000 ơ = $100)
¿CuáI es el área bajo Ia curva normal entre
$ 840 y $1,200?
80
Es necesario dividir la pregunta en dos partes.
Para el área entre $840 y la media de $1,000: 840 -1000 = -160 = 1.60 100 100
Para el área entre $1,200 y la media de $1,000: 1,200 -1000 = 200 = 2.00 100 100
81
El área bajo la curva para un valor z de -1.60
es:
El área bajo Ia curva para un valor z de 2.00
es
0.4452.
(Tabla de z).
Sumando las dos áreas:
0.4452+ 0.4772 = 0.9224
0.4772.
82
Así, Ia probabilidad de seleccionar un
ingreso entre $840 y $1,200 es 0.9224.
En otras palabras, 92.24 por ciento de los
gerentes tienen ingresos semanales entre
$840 y $1,200.
83
840 1,200 1,000
|
|
|
|
|
|
|
0.4452. 0.4772.
84
Otra aplicación de Ia distribución normal
estándar esi:
encontrar el área mayor o menor de
un valor específico.
Continuemos con Ia distribución de
ingresos semanales
(u = $1 000, ơ = $100)
¿qué porcentaje de los ejecutivos recibe
ingresos semanales de $1,245 o más?
86
Para el área entre $1,245 y Ia media de
$1,000:
1,245 -1000 = 245 = 2.45
100 100
87
El área bajo Ia curva para un valor z de 2.45
es
(de la tabla de z).
Restando: 0.5 - 0.4929 = 0.0071
0.4929.
88
Sólo el .71 por ciento de los gerentes tienen
ingresos semanales de $1,245 o más.
89
840 1,245 1,000
|
|
|
0.4929 0.0071
90
Otra aplicación de Ia distribución normal
estándar es:
determinar el área entre dos valores en el
mismo lado de la media.
91
Sigamos con Ia distribución de
ingresos semanales
(u = $1 000, ơ = $100)
¿CuáI es el área bajo Ia curva normal entre
$ 1,150 y $1,250?
92
Es necesario dividir Ia pregunta en dos partes.
Para el área entre $1,250 y Ia media de $1,000:
1,250 -1000 = 250 = 2.50
100 100
Para el área entre $1,150 y Ia media de $1,000:
1,150 -1000 = 150 = 1.50
100 100
93
El área bajo la curva para un valor z de 2.50
es:
El área bajo Ia curva para un valor z de 1.50
es
0.4938.
(de la tabla de z).
Restando las dos áreas:
0.4938 - 0.4332 = 0.0606
0.4332.
94
Así, Ia probabilidad de seleccionar un
ingreso entre $1,150 y $1,250 es 0.0606.
En otras palabras, 6.06 por ciento de los
gerentes tienen ingresos semanales entre
$1,150 y $1,250.
95
1,150 1,250 1,000
|
|
|
|
|
|
0.0606.
96
Para resumir, existen cuatro situaciones en
las que pudiera ser posible encontrar el área
bajo Ia distribución normal estándar.
1. Para encontrar el área entre u y z,
entonces es posible buscar directamente el
valor en Ia tabla.
2. Para encontrar el área más alIá (mayor o
menor) de z, entonces localice Ia
probabilidad de z en Ia tabla y reste ese
valor de 0.5000.
98
3. Para encontrar eI área entre dos puntos a
diferentes lados de Ia media, determine los
valores z y sume las áreas
correspondientes.
4. Para encontrar el área entre dos puntos
en el mismo lado de Ia media, determine los
valores z y reste el área menor de Ia mayor.
99
Una última aplicación de Ia distribución normal
supone encontrar el valor de Ia observación X
cuando se conoce eI porcentaje por encima o
por debajo de Ia observación.
100
Un fabricante de goma de auto desea establecer una garantía de millaje mínimo para su nueva goma MX100. Las pruebas revelan que el millaje promedio es de 47,900 millas, con una desviación estandar de 2,050 millas y una distribución normal.
Ejemplo:
El fabricante quiere establecer el millaje mínimo garantizado de modo que no se deba reemplazar más del 4 por ciento de las gomas.
¿Qué millaje minimo garantizado deberá anunciar el fabricante?
101
Utilizando Ia fórmula, X representa el millaje
mínimo garantizado
Z = X – 47900
2050
102
Existen dos incógnitas, z y X.
Para encontrar z, observemos que el área
bajo Ia curva normal a Ia izquierda de u es
0.5000.
El area entre u y X es 0.4600,
que se encuentra restando 0.5000 - 0.0400.
103
X 47,900
|
|
|
|
4%
0.04
0.4600
104
El área más cercana a 0.4600 es: 0.4599
Moviéndose a los márgenes de este valor se lee el
valor z. El valor es: 1.75
(de la tabla de z).
Debido a que el valor se encuentra a Ia
izquierda de Ia media, en realidad es
-1.75.
105
Sabiendo que la distancia entre u y X es -1.75 ơ, ahora es posible determinar X (el millaje minimo
garantizado):
-1.75 = X – 47900 2050
-1.75 (2050) = X – 47900
X = 47900 – 1.75 (2050) = 44312
106
El fabricante puede anunciar que
reemplazará en forma gratuita cualquier
goma que se desgaste antes de recorrer
44,312 millas y Ia empresa sabe que, bajo
este plan, debe reemplazar sólo el 4 por
ciento de las gomas.
Conclusión:
107
Otra aplicación de Ia distribución
normal consiste en comparar dos o
más observaciones que están en
distintas escalas o unidades.
Es decir, ambas observaciones se
encuentran en distribuciones distintas.
108
Un estudio de los internos en una
institución correccional evalúa Ia
responsabilidad social de los internos
de Ia prisión y de sus perspectivas de
rehabilitación cuando se les Iibere.
Ejemplo:
109
Las puntuaciones tienen una
distribución normal, con una media de
100 y una desviación estándar de 20.
Para medir su responsabilidad social,
se administró a cada interno una
prueba
110
Los psicólogos de Ia prisión calificaron
a cada interno respecto de las
perspectivas de rehabilitación.
Las calificaciones tienen tambien una
distribución normal, con una media de
500 y una desviación estándar de 100.
111
La calificación de Tora Carney en Ia
prueba de responsabilidad social fue
146, y en rehabilitación obtuvo una
puntuación de 335.
¿Cómo se compara Tora con otros
miembros del grupo en cuanto a
responsabilidad social y a Ia
perspectiva de rehabilitación?
112
Convertimos Ia puntuación de Ia
prueba de responsabilidad social, 146,
a un valor z utilizando Ia fórmula:
Pasos a seguir:
Z = 146 – 100
20
Z = 2.30
113
Convertimos Ia puntuación de Ia
prueba de responsabilidad social, 146,
a un valor z utilizando Ia fórmula:
Pasos a seguir:
Z = 146 – 100
20
Z = 2.30
114
Por lo tanto, en lo referente a
responsabilidad social, Tora Carney se
encuentra en el 1 por ciento más alto del
grupo.
Conclusión:
Sin embargo, al compararla con otras
internas, Tora se encuentra entre eI 5 por
ciento más bajo en cuanto a las
perspectivas de rehabilitación.
115
-1.65 2.30
|
|
|
|
|
|
|
0.4505 0.4893
0.0107 0.0495
Distribución Ji-Cuadrada o Chi-cuadrada o X2?.
Es una prueba útil para variables categóricas y
estadística, es aplicable cuando la variable
nominal está compuesto por dos o más categorías.
Tiene dos aplicaciones:
1. La prueba de bondad de ajuste Chi-cuadrada.
2. La prueba Chi-cuadrada de asociación.
Ambas pruebas se utilizan para determinar si las
frecuencias observadas (O) en las categorías
difieren significativamente de las frecuencias
esperadas (E).
117
Es una prueba estadística para evaluar hipótesis
acerca de la relación entre dos variables categóricas.
Símbolo: X2
Hipótesis a probar: Correlaciones
Variables
involucradas:
Dos variables (la prueba Chi-cuadrada no
considera relaciones causales).
Nivel de medición de
las variables
Nominal u ordinal (o intervalos o razón reducidas
a ordinales)
Procedimiento La Chi-cuadrada se calcula por medio de una
tabla de contingencia o tabulación cruzada, que
es una tabla de dos dimensiones y cada
dimensión contiene una variable. A su vez, cada
variable se subdivide en dos o más categorías.
118
Total de Fila x Total de ColumnaF. Esperada=
Total General
CARACTERÍSTICAS
1. La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1).
2. No tiene valores negativos. El valor mínimo es 0.
3. Todas las curvas son asimétricas
4. Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha.
5. Se utiliza para variables medidas en escala nominal u ordinal.
6. Las fórmulas son:
119
DISTRIBUCIONES CHI CUADRADO
120
Ejemplo 1. Variable, categoría y tabla de contingencia 2x2:
Sean las variables SEXO (Masculino y Femenino) y CANDIDATO
(“A” y “B”). La tabla de contingencia o tabulación cruzada es:
CANDIDATO
“A” “B”
Masculino
SEXO
Femenino
20 30
40 25
121
Variable
Categoría
CANDIDATO
“A” “B”
Masculino
SEXO
Femenino
20 30
40 25
122
Ejemplo 2. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.
NIVEL DE EDUCACIÓN
Primaria Secundaria
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
180 100
190 280
170 120
TABLA DE CONTINGENCIA
123
Tabla de frecuencias observadas (O):
NIVEL DE EDUCACIÓN TOTAL
Primaria Secundaria
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
180 100 280
190 280 470
170 120 290
TOTAL 540 500 1040
La Chi-cuadrada es una comparación entre las tablas
de frecuencias observadas y la denominada tabla de
frecuencias esperadas (la tabla que esperaríamos
encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas).
124
La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N.
NIVEL DE EDUCACIÓN
Marginal
de filas
Primaria Secundaria
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
(280)(540)/1040 (280)(500)/1040 280
(470)(540)/1040 (470)( 500)/1040 470
(290)(540)/1040 (290)(500)/1040 290
marginal de columnas 540 500 1040
Tabla de frecuencias esperadas (E):
125
Frecuencia observada:
NIVEL DE EDUCACIÓN TOTAL
Primaria Secundaria
APRENDIZ
AJE
Conceptual
Procedimental
Actitudinal
145,4 134,6 280
244,0 226,0 470
150,6 139,4 290
TOTAL 540 500 1040
NIVEL DE EDUCACIÓN TOTAL
Primaria secundaria
APRENDI
ZAJE
Conceptual
Procedimental
Actitudinal
180 100 280
190 280 470
170 120 290
TOTAL 540 500 1040
Frecuencia esperada:
Donde:
O: frecuencia observada
en cada celda
E: frecuencia esperada
en cada celda
126
E
EOX
2
2
Celda O E O-E (O-E)2 (O-E)2 / E
Conceptual/Primaria 180 145,4 34,6 1197,16 8,23
Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11
Actitudinal / Primaria 170 150,6 19,4 376,36 2,50
Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69
Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80
Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70
X2 = 47,33
Para saber si el valor de X2 es o no significativo, debemos
calcular los grados de libertad.
G.L. = (Nº de filas - 1)(Nº de columnas - 1).
127
Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces
G.L. = (3-1)(2-1) = 2.
Luego, acudimos a la “tabla de distribución de Chi-
cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó
= 0,01).
Si el valor obtenido de X2 es igual o superior al valor de la
“tabla”, decimos que las variables están relacionadas o no
son independientes.
Aplicación:
Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla
es 5,9915 (ver tabla).
X2Obtenido
= 47,33
X2Crítico = 5,9915
128
129
Prueba de hipótesis:
H0: No existe relación entre el aprendizaje y los
niveles de educación.
H1: Existe relación entre el aprendizaje y niveles de
educación.
X2obtenido X2
crítico entonces variables no son
independientes; es decir existe una relación entre
Aprendizaje y los niveles educativos
X2obtenido < X2
crítico entonces se rechaza la
hipótesis nula (H0), y por lo tanto se acepta la hipótesis
alterna (H1).
130
Establezca la Ho a ser probada; por ejemplo,
Ho: 1 = 2 = 0,5
Especifique el nivel de significancia α, por ejemplo: α = 0.5
Haga una tabla de frecuencias obtenidas
Deduzca las frecuencias esperadas a partir de Ho:
Calcule el grado de libertad: Producto de (categorías - 1)
Calcule el valor de X2 a partir de las frecuencias obtenidas y
frecuencias esperadas.
Mediante la tabla de X2 obtenga el valor teórico.
Compara dichos valores.
Establezca la conclusión con respecto a Ho:
Retenga Ho si valor de tabla > Valor calculado.
Retenga Ho si valor de tabla < Valor calculado.
Paso Nº 1
Paso Nº 2
Paso Nº 3
Paso Nº 4
131
Un politólogo cree que, durante los últimos años, la composición étnica
de la ciudad donde vive ha cambiado. Las cifras más actuales
(reunidas hace unos cuántos años) muestran que los habitantes de
dicha ciudad presentan la siguiente composición étnica: 53% noruegos,
32% suecos, 8% irlandeses, 5% alemanes y 2% italianos. Para verificar
esta idea, este científico social obtiene una muestra aleatoria de 750
habitantes, con los resultados que se presentan en la siguiente tabla:
Países Noruegos Suecos Irlandeses Alemanes Italianos
frecuencia 399 193 63 82 13
a). ¿Cuál es la hipótesis nula?
b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice = 0,05.
Ejercicio:
132
Una universidad está pensando en implantar uno de los tres sistemas de
calificaciones siguientes: (1) todas las calificaciones son aprobados-reprobado;
(2) todas las calificaciones están en el sistema 4.0 y (3) 90% de las
calificaciones están en el sistema 4.0 y 10% son a probados-reprobado. Se
realiza una encuesta para determinar si existe una relación entre el área de
interés de cada alumno y su presencia para algún sistema de calificación. Se
elige una muestra aleatoria de 200 estudiantes del área ingeniería, 200 de
ciencias, y 100 de bellas artes. Se pregunta a cada alumno cuál de los tres
calificaciones prefieren. Los resultados aparecen en la siguiente tabla:
Sistema de calificación
Aprobado-reprobado 4,0 4,0 y aprobado-reprobado
Bellas artes 26 55 19
Ciencias 24 118 58
Ingeniería 20 112 68
a). ¿Cuál es la hipótesis nula?
b). ¿Cuál es la hipótesis alterna?
c). ¿Cuál es la conclusión?. Utilice = 0,05.
Ejercicio:
133
DISTRIBUCIÓN “t” de STUDENT
- Utilizada por primera vez por W.S. Gosset (1908).
- Su uso potencial fue descrito por Fisher (1925).
- Se calcula restando al número de observaciones independientes en una muestra el número “k” de parámetros de la población.
- La distribución t es igual a la disribución X2 cuando los grados de libertad tienden a infinito.
134
Se puede probar que siendo `x el promedio de una muestra tomada de una población normal con media y varianza 2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1.
t =x -
s / n
Definiendo el estadístico t:
136
Características Distribución “t”
Tiene media igual 0, es asintótica al eje x y su dominio va de - a +;
El área bajo la curva desde - a + es igual a 1
0, 2 depende parámetro (grados libertad)
Varianza > 1, pero se aproxima a 1 cuando n
Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación
Entre las aplicaciones:
Estimación de intervalos de confianza para medias a partir de muestras pequeñas
Pruebas de hipótesis basadas en muestras < 30
137
Tabla de Distribución “t”
Valores de t a la derecha de los cuales se encuentra el (100 x )% área de la curva.
Localizamos la columna del valor de y fila del valor de . La intersección de la fila y la columna nos dará el valor de t.
138
H0: µ=µ0 es la hipótesis nula que se plantea en esta distribución. HA: µ≠ µ0
Si tc < tα (2), gl se acepta H0 tc > t α(2), gl se rechaza H0
139
Ejemplo 1.
Suponga que la edad promedio de muerte de ciertos mamíferos es de 22 años (µ) y que en una muestra de 25 individuos se obtuvieron los siguientes resultados:
17.2 18.0 18.7 19.8 20.3 20.9 21.0 21.7 22.3 22.6 23.1 23.4 23.8 24.2 25.8 26.0 26.3 27.2 27.6 28.1 28.6 29.3 30.1 35.1 24.6
Pruebe la hipótesis nula de que µ=µ0
140
Ejemplo 2.
Suponga que se toman 12 ratones y se examina el efecto que determinada dieta tiene sobre su ganancia de peso. Los datos obtenidos fueron los siguientes:
1.7 0.7 -0.4 -1.8 0.2 0.9 -1.2 -0.9 -1.8 -1.4 -1.8 -2.0
Pruebe la hipótesis nula de que µ=0
141
Distribución F de Fisher
El nombre de esta distribución se debe a R. A. Fisher, quién primero la desarrolló y describió. La prueba F se utiliza principalmente para probar la igualdad entre dos varianzas. Se puede observar, que esta prueba para la igualdad de varianzas se utiliza generalmente para probar la igualdad entre tres o más medias. Cuando se procede a realizar la inferencia estadística para probar igualdad entre 3 o más medias comúnmente se denomina análisis de varianza. El que implica medir la variabilidad de las medias de las muestras obtenidas a partir de las poblaciones problema.
142
Cuando se tiene interés en comparar varianzas, se puede recurrir a la variable aleatoria F, que es la razón de los estimadores insesgados de dos varianzas poblacionales esto es:
2
2
2
1
s
sF
143
La distribución F tiene dos parámetros: los números de grados de libertad que se denotan con el símbolo 1 y 2 .
El parámetro 1 está asociado con el numerador de la razón F; esto es s2
1, estimador insesgado de la varianza 2
1 de la población 1.
La varianza s21 , se obtiene a partir de una muestra
de n1 observaciones tomadas aleatoriamente a partir de la población 1.
144
Puesto que la suma de las desviaciones a partir
de la media muestral, al cuadrado, para s21 tiene
(n-1) grados de libertad, el parámetro 1 es igual
a (n1 - 1), así también el parámetro 2 es igual a
(n2 - 1), de modo semejante, 2 está asociado
con el denominador de la razón F; esto es, s22 ,
estimador insesgado para la varianza 22 de la
población 2.
145
La varianza s22 se obtiene a partir de una muestra de
n2 observaciones tomadas aleatoriamente a partir de la población 2.
La distribución F se denota con dos subíndices, el primero corresponde a 1 y el segundo a 2
146
Propiedades
El estadístico de prueba toma solamente valores no negativos, debido a que tanto numerador y denominador de la razón F son varianzas, las que NO pueden ser valores negativos.
El valor de F varía de cero a infinito, sin embargo en la práctica se considera a 1 como límite inferior del valor F, debido a que siempre es posible utilizar la mayor varianza muestral como numerador de forma que la relación F no sea menor que 1. El límite superior del valor F rara vez es de más de unos cuantos dígitos en la mayor parte de las situaciones. Ejemplo, una F(0.05;20;24) = 2.03 con un alfa =0.05.
147
La tabla F se construye en base a que el numerador de la razón F es mayor que el denominador, y luego los valores de F generalmente son mayores que 1 y tienden a 1 cuando tanto 1 y 2 tienden a infinito.
Bajo la Ho, de que las dos varianzas poblacionales son iguales, se espera que las varianzas de dos muestras cualesquiera tomadas respectivamente a partir de las dos poblaciones sean iguales también.
148
Sin embargo, a pesar que la hipótesis nula sea verdadera, debido a la naturaleza aleatoria del muestreo las dos varianzas muestrales es muy posible difieran una de otra. Mientras mayor sea la diferencia entre las dos varianzas muestrales, mayor será la magnitud en que el estadístico de prueba F esté por encima de 1. La hipótesis nula Ho, se rechaza solamente cuando el valor del estadístico de prueba F es suficientemente mayor que 1.
149
Nota: Cuando s21 es mayor que s2
2, no hay dificultad en
probar la hipótesis nula de Ho: 21 = 2
2 en contra de H1: 21
> 22 , pues sólo se divide la mayor varianza entre la menor
y después se compara con el valor de tabla, sin embargo, la
practica de considerar a s21 como numerador de la razón es
solamente adecuada cuando es la mayor de las dos varianzas
muestrales en una prueba de una cola.
150
Ejemplo:
Suponga que en un invernadero se ha determinado el porcentaje de germinación de semillas de ciertas plantas. Los resultados obtenidos fueron los siguientes:
41 34 33 36 40 25 31 37 34 30 38
Muestra 1
52 57 57 55 62 56 55 64
Muestra 2
Pruebe H0: Ambas muestras pertenecen a la misma población.
151
En caso de que la hipótesis nula sea aceptada, debe calcularse una varianza ponderada:
Donde:
Recommended