Captulo 2: Probabilidad
1
Manual Didctico de
Probabilidad y Estadstica Tronco Comn de Ingeniera de CITEC Valle de las Palmas
Centro de Ingeniera y Tecnologa Valle de las Palmas UABC, 2009
2
Manual Didctico de Probabilidad y Estadstica Tronco Comn de Ingeniera de CITEC Valle
de las Palmas
Captulo 2: Probabilidad
3
Contenido ............................................................................................................................................. 2
I. INTRODUCCION ............................................................................................................. 4
II. DESARROLLO DE UNIDADES ........................................................................................... 5
1.1. Poblacin y muestra .............................................................................................. 6
1.2. Inferencia estadstica ............................................................................................. 7
1.3. Tcnicas de muestreo ............................................................................................ 8
1.4. Niveles de medicin ..............................................................................................12
1.5 Distribucin de frecuencias ...........................................................................................14
1.6 Presentacin grafica de datos. ......................................................................................16
1.7 Medidas de tendencias controladas para datos agrupados y no agrupados, media,
mediana y media. ................................................................................................................23
III. REFERENCIAS ............................................................................................................23
4
I. INTRODUCCION
Descripcin del Manual Didctico en donde se resalten las competencias a lograr.
Acerca del Manual.-
PROPSITO GENERAL DEL CURSO
El curso de Probabilidad y Estadstica ubicado en el tronco comn de las ciencias de la
ingeniera, corresponde al rea de las ciencias bsicas de la ingeniera; y est orientado al
estudio de los fundamentos matemticos y metodologas de la probabilidad, estadstica
descriptiva e inferencial; para el estudio y caracterizacin de sistemas y procesos, apoyndose
en el uso de tecnologa y herramientas computacionales, para el clculo e interpretacin de
indicadores que sustentan la toma de decisiones y optimizacin de los mismos.
En esta unidad de aprendizaje se desarrollan habilidades en las tcnicas de muestreo,
representacin y anlisis de informacin, as como actitudes que favorecen el trabajo en
equipo; y proporciona las bases fundamentales para incursionar de manera competente en el
estudio de las metodologas para la optimizacin de sistemas y procesos en las disciplinas de
ciencias de la ingeniera.
COMPETENCIA (S) DEL CURSO
Estimar el comportamiento de sistemas y procesos de ingeniera, mediante la aplicacin de las
tcnicas y metodologas de estimacin e inferencia estadstica, as como el uso de herramientas
computacionales, para identificar reas de oportunidad que coadyuven a la solucin de
problemas del rea de ingeniera, con disposicin al trabajo colaborativo, objetividad,
honestidad y responsabilidad.
EVIDENCIA (S) DE DESEMPEO
Elaboracin, presentacin y exposicin de reportes de actividades orientadas al estudio del
comportamiento de un sistema o proceso, en el cual especifique la tcnica de muestreo
seleccionada, as como el desarrollo, metodologa, anlisis e interpretacin de resultados.
Captulo 2: Probabilidad
5
II. DESARROLLO DE UNIDADES
Unidad I: Estadstica descriptiva
Competencia de la Unidad.- Aplicar los conceptos fundamentales y herramientas de la
estadstica, para calcular los indicadores descriptivos y representacin grfica de un conjunto
de datos, mediante el uso de tecnologas y herramientas de cmputo, como antecedente al
estudio de las tcnicas inferenciales, de manera proactiva y responsable.
Introduccin
La estadstica descriptiva nace en el siglo XVIII a partir del anlisis de las unidades polticas,
donde se utilizaba para representar tablas y grficas de datos. Actualmente la estadstica
descriptiva juega un papel muy importante en la inferencia estadstica, en donde se intenta
llegar a conclusiones generales a partir de los datos generados en las muestras.
Algunos de los ejemplos en el campo de la ingeniera son: determinar el promedio de la
produccin en cada una de las lneas de ensamble, encontrar la temperatura promedio para
trabajar en condiciones ptimas sin generar mayores costos a la organizacin, entre algunos
otros.
Un ingeniero industrial que trabaja en el rea de calidad, debe tomar decisiones a partir de
inferencias estadsticas en menor o mayor medida y dependiendo del giro de la empresa,
tamao, entre otras consideraciones. Si a este ingeniero se le pide que establezca los criterios
de calidad en funcin de las necesidades de los clientes internos y externos, deber hacer uso
sin lugar a dudas de la estadstica descriptiva para llevar a cabo esta tarea.
Es importante sealar que si el ingeniero en cuestin no hace una recoleccin de datos
correcta, el resultado de la inferencia estadstica ser incorrecto y traer repercusiones
importantes para la organizacin. En la ingeniera y la direccin industrial, la estadstica ha
tenido un impacto muy importante, debido a los problemas de produccin, al uso eficiente de
materiales y mano de obra, a la investigacin bsica y el desarrollo de nuevos productos, por lo
que la estadstica se ha convertido en una herramienta vital para el ingeniero, y que sin estos
no podra apreciar, entender o aplicar gran parte del trabajo desarrollado en su rea de
trabajo.
Caso prctico:
El gerente de produccin de la Dalmon Carpet Company es responsable de la fabricacin de
alfombras en ms de 500 telares. Para no tener que medir la produccin diaria (en yardas) de
cada telar, toma una muestra de 30 telares cada da, con lo que llega a una conclusin respecto
a la produccin promedio de alfombras de las 500 mquinas.
6
La tabla que se presenta ms adelante exhibe la produccin de cada uno de los 30 telares de la
muestra. Estas cantidades son los datos sin procesar a partir de los cuales el director de
produccin de telares en su desempeo del da anterior.
Produccin en yardas de 30 telares para alfombra
16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3
Mediante los mtodos introducidos en este captulo, podemos ayudar al director de
produccin a llegar a la conclusin correcta.
Ejercicio 1. A partir de los conceptos de poblacin, muestra, variable discreta, variable
continua, medidas de tendencia central, tabla de frecuencias, sesgo, curtosis, asimetra, grfica
circular, histograma, ojiva, polgono de frecuencias, Pareto, construye un reporte apoyado de
Excel y Word para presentarlo al director de produccin.
1.1. Poblacin y muestra A partir del estudio de los fenmenos econmicos y sociales en pocas pasadas segn IRWIN
MILLER & JOHN E. FREUND (2004), se emple el trmino de poblacin para describir un
conjunto de datos. Hoy en da, y en particular en el mbito de la ingeniera se utiliza el trmino
poblacin para indicar un conjunto de nmeros, medidas u observaciones, y en la mayora de
los casos, se emplea una muestra de esa poblacin para determinar alguna caracterstica de un
producto fabricado, con la finalidad de hacer una inferencia a partir de la muestra seleccionada
de la poblacin.
Al recoger datos relativos a las caracterstica de un grupo de individuos u objetos, sean alturas
y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fbrica,
suele ser imposible nada practico observar todo un grupo, en especial si es muy grande, en
vez de examinar el grupo entero, llamado poblacin o universo, se examina una pequea parte
del grupo, llamada muestra.
Poblacin
Muestra
Captulo 2: Probabilidad
7
Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consiste en todas las
tuercas producidas por una fbrica un cierto da es finita, mientras que la determinada por
todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita.
Si una muestra es representativa de una poblacin, es posible inferir importantes conclusiones
sobre la poblacin a partir del anlisis de la muestra. La fase de la estadstica que trata con las
condiciones bajo las cuales tal diferencia es vlida se llama estadstica inductiva o inferencia
estadstica. Ya que dicha inferencia con es del todo exacta, el lenguaje de las probabilidades
aparecer a la establecer nuestras conclusiones.
La parte de la estadstica que solo se ocupa de describir y analizar un grupo dado, sin sacar
conclusiones sobre un grupo mayor, se llama estadstica descriptiva o deductiva.
Ejercicios de poblacin y muestra:
Instrucciones: De los siguientes enunciados diga cul es una poblacin o una muestra.
1. Seleccionar al azar a 5 estudiantes de un grupo de 50 estudiantes: 2. La produccin total de tela de una fbrica textil: 3. Los alumnos de 2 y 5 semestre del colegio de bachilleres: 4. Un camin repartidor de refrescos: 5. El nmero de llamadas que entran a un conmutador entre las 11:00 y las 13:00 horas: 6. El nmero total de llamadas al da en un conmutador: 7. Preguntar a todo el personal de una fbrica sobre el deseo de implantar el servicio de
comedor para sus empleados: 8. seleccionar a 25 personas de 1000 en una fbrica para preguntar por la comida que se
da diariamente: 9. Poco ms de 100 mil turistas ocuparon 80% de los 28 mil cuartos de hotel, con motivo
del puente de primavera quienes dejaron importantes ganancias a todos los prestadores de servicios, afirmo el secretario de turismo. Suponiendo que esos 22,400 cuartos de hotel son representativos del grupo de vacacionistas, a) Cul es la poblacin?, b) Cul es la muestra?
10. Al realizar un estudio entre los 9, 000,000 de jvenes entre los 15 y los 19 aos (1995) Al realizar un estudio en 225,000 jvenes del rea metropolitana se encontr que un 95% de ellos desean seguir estudiando la universidad, a) Cul es la poblacin?, b) Cul es la muestra? , c) Variable de inters y parmetro de inters:
1.2. Inferencia estadstica Estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una
muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.
8
Ejercicios Inferencia estadstica:
1. En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.
2. En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan ms a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. Explicar qu procedimiento de seleccin sera ms adecuado utilizar: muestreo con o sin reposicin. Por qu?
3. En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en el departamento de atencin al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores.
a. Qu tipo de muestreo deberamos utilizar para la seleccin de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados?
b. Qu nmero de trabajadores tendramos que seleccionar en cada departamento atendiendo a un criterio de proporcionalidad?
4. Sea la poblacin de elementos: {22,24, 26}. Calcule la varianza de la poblacin. 5. Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16
comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios:
6. 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. 7. Suponiendo que los precios de este producto se distribuyen segn una ley normal de
varianza 25 y media desconocida: Cul es la distribucin de la media muestral? 8. Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley
normal, con desviacin tpica 900 . En un estudio estadstico de las ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 y 5 839 . Cul ha sido la media de las ventas en estos nueve meses?
1.3. Tcnicas de muestreo Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no
aleatorio o de juicio y el muestreo aleatorio o de probabilidad (los elementos de la
poblacin son escogidos en la muestra). Una muestra seleccionada por muestreo de
juicio se basa en la experiencia de alguien con la poblacin.
I. Muestreo probabilstico:
Se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de
ser seleccionadas. Slo estos mtodos de muestreo probabilsticos nos aseguran la
representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de
los mtodos de muestreo probabilsticos encontramos los siguientes tipos:
Captulo 2: Probabilidad
9
Muestreo aleatorio simple. El procedimiento empleado es el siguiente:
1) se asigna un nmero a cada individuo de la poblacin.
2) A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros
aleatorios, nmeros aleatorios generadas con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar el tamao de muestra
requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica
cuando la poblacin que estamos manejando es muy grande.
Muestreo aleatorio sistemtico
Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los
dems hasta completar la muestra.
Ejemplo:
Si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra
de 25 elementos, en primer lugar debemos establecer el intervalo de seleccin que
ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando
aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes
elementos de la muestra.
2, 6, 10, 14,..., 98
k el resultado de dividir el tamao de la poblacin entre el tamao de la
muestra: k=
. El nmero i que empleamos como punto de partida ser un nmero
al azar entre 1 y k.
Muestreo aleatorio estratificado
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamao dado de la muestra.
Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen
gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por
ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo
que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
inters estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple
o el estratificado para elegir los elementos concretos que formarn parte de la
muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige
un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades,...).
Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de
individuos de cada estrato proporcional al nmero de componentes de cada estrato.
10
Ejemplo:
En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20.
Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la
D.
=
X = 6.6 = 7 trabajadores de A
=
X = 5 trabajadores de B
=
X = 5 5 trabajadores de C
=
X = 3.3 = 3 trabajadores de D
La distribucin de la muestra en funcin de los diferentes estratos se denomina
afijacin, y puede ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin.
Muestreo aleatorio por conglomerados. Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la poblacin que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son reas geogrficas suele hablarse de "muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
nmero de conglomerados (el necesario para alcanzar el tamao muestral
establecido) y en investigar despus todos los elementos pertenecientes a los
conglomerados elegidos.
II. Mtodos de muestreo no probabilsticos
A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente
costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para
realizar generalizaciones (estimaciones inferenciales sobre la poblacin), pues no se tiene
Captulo 2: Probabilidad
11
certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la
poblacin tienen la misma probabilidad de ser elegidos. En general se seleccionan a los
sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.
En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver los
problemas de representatividad aun en situaciones de muestreo no probabilstico, por ejemplo
los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la
poblacin.
Entre los mtodos de muestreo no probabilsticos ms utilizados en investigacin encontramos:
Muestreo por cuotas. Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de
individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de
25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se
eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo
se utiliza mucho en las encuestas de opinin.
Muestreo intencional o de conveniencia. Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
Tambin puede ser que el investigador seleccione directa e intencionadamente
los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar
como muestra los individuos a los que se tiene fcil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos).
Bola de nieve. Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
Muestreo Discrecional. A criterio del investigador los elementos son elegidos sobre lo que l cree que pueden aportar al estudio.
12
Ejercicios de tcnicas de muestreo:
1. un colegio tiene 120 alumnos de bachillerato. Se quiere extraer una muestra de 30 alumnos. Explica cmo se obtiene la muestra:
a) mediante muestreo aleatorio simple. b) mediante muestro aleatorio sistemtico.
2. Sea la poblacin de elementos: {22,24, 26}. a) Escriba todas las muestras posibles de tamao dos, escogidas mediante
muestreo aleatorio simple. b) Calcule la varianza de la poblacin.
3. La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m?
4. Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y media desconocida: Cul es la distribucin de la media muestral?
5. La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribucin normal con varianza 2 = 0,16 m2. construye un intervalo, de un 95% de confianza, para la media de las estaturas de la poblacin.
6. Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley normal, con desviacin tpica 900 . En un estudio estadstico de las ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 y 5 839 . Cul ha sido la media de las ventas en estos nueve meses?
1.4. Niveles de medicin
Escala de medicin: se entender por medicin al proceso de asignar el valor a una variable de un elemento en observacin. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razn. Las variables de las escalas nominal y ordinal se denominan categoras, por otra parte las variables de escala de intervalo o de razn se denominan variables numricas. Con los valores de las variables categricas no tiene sentido o no se puede efectuar operaciones aritmticas. Con las variables numricas s.
Escala nominal: usa nombres para establecer categoras. Puede usar nmeros por estos son de carcter simblico.
Captulo 2: Probabilidad
13
Ejemplo:
Nacionalidad
Uso de antojos
Numero de camiseta en un equipo de futbol.
Escala ordinal: tambin define categoras, pero establece una relacin > 0
14
Ejercicios de niveles de medicin:
Instrucciones: a qu nivel de medicin se refieren las siguientes variables:
1. Genero de entrevistado 2. Edad 3. Estado civil 4. Posee vehculo 5. Peridico preferido para leer noticias
1.5 Distribucin de frecuencias
Frecuencia: de un valor de una variable estadstica es el nmero de veces que se
observa dicho valor, o el nmero de casos clasificados en la clase definida por l.
Para agrupar los datos por su frecuencia
1) se ordenan los datos en orden creciente
2) se cuentan la frecuencia absoluta de cada valor.
TABLA 1
Demanda Frecuencia absoluta
59 1 60 2 61 0 62 3 63 1 64 0
Frecuencia total
7
Rango: es la diferencia entre el mayor y el menor de los valores obtenidos. En
nuestro ejemplo:
64-59 = 05
La distribucin de las frecuencias con que se presenta cada uno de los valores de la
variable puede relacionarse mediante lo que se denomina un diagrama de barras o
bastones, utilizando una frecuencia cartesiana sobre cuyo eje de abscisas se llevan
los valores de la variables, mientras que sus correspondientes frecuencias de
aparicin se llevan sobre el eje de ordenadas.
Captulo 2: Probabilidad
15
Frecuencia relativa: De un valor observado consiste en el consciente entre la frecuencia con que se presenta dicho valor y total de observaciones.
f =
f: frecuencia relativa
f: frecuencia absoluta correspondiente a cada valor i.
n: nmero total de observaciones
n=
Frecuencias agrupadas: Cuando un conjunto de datos estadsticos corresponde a muchas observaciones de los valores de una variable, el manejo de todos ellos puede resultar engorroso; por eso se ocurre a menudo a agrupar los datos en clases o categoras, cada una de ellas correspondiente a un grupo valores de la variable; se determina entonces la frecuencia con la que se presentan datos incluidos en cada una de las clases y se habla de frecuencia de clase.
Intervalo de clase: Para las variables cuantitativas, la agrupacin de frecuencias se hace dividiendo el rango de la variable en intervalos consecutivos que se acostumbran tomar de la misma amplitud. Eligiendo para nuestro ejemplo un tamao de clase igual a 3.
Los valores comprendidos entre: (59-61), (62-64), se conocen con el nombre de
intervalo de clase, siendo cada par de valores los lmites de clase.
TABLA 2
Intervalo de clase Frecuencia absoluta
59-61 3 62-64 4
Mtodo general para la distribucin de frecuencias
1) determine el mayor y el menor entre los datos registrados y as encontrar el rango.
2) dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao.
3) determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase.
16
Ejercicios de distribucin de frecuencias:
Instrucciones: Construir la tabla de distribucin de frecuencias para los siguientes
casos.
1. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7
1) El nmero de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
2) Las puntuaciones obtenidas por un grupo de en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
3) Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2
4) Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica. 3, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11, 34, 36, 12, 22, 17, 33, 43, 19, 48, 38, 25, 36, 32, 38, 28, 30, 36, 39, 40.
1.6 Presentacin grafica de datos.
Histograma o histograma de frecuencia. Consiste en un conjunto de rectngulos con:
a) Bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales
a los tamaos de los intervalos de clase
b) reas proporcionales a las frecuencias de clase.
Si los intervalos de calase tienen todos la misma anchura, las alturas iguales a las
frecuencias de clase. En caso de contrario, deben ajustarse las alturas.
Captulo 2: Probabilidad
17
Polgono de frecuencias. Sirve para mostrar la tendencia de la variable, se puede determinar a partir de un histograma uniendo los puntos medios superiores de cada rectngulo del histograma. Tambin, se determina el polgono uniendo los puntos formado por la marca de clase con la frecuencia absoluta del intervalo respectivo.
Frecuencias relativas. La frecuencia relativa de un clase es su frecuencia dividida por la por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. Por ejemplo, la frecuencia relativa de la clase 66-68 en la tabla es 42/100 = 42%. La suma de las frecuencias relativas de todas las clases da 1, o sea 100 por 100.
Si se sustituyen las grficas de la tabla por las correspondientes frecuencias
relativas, la tabla resultante se llama una distribucin de frecuencias relativas,
distribucin de porcentajes o tablas de frecuencias relativas.
La presentacin grafica de distribuciones de frecuencias relativas se puede
obtener del histograma o polgono de frecuencias sin ms que cambiar la escala
vertical de frecuencias a frecuencias relativas, manteniendo exactamente el mismo
diagrama. Los grficos resultante se llaman histogramas de frecuencias relativas (o
histogramas de porcentajes) y polgonos de frecuencias relativas (o polgonos de
porcentajes), respectivamente.
18
TABLA 3
Altura (in) Nmero de estudiantes
60-62 5 63-65 18 66-68 42 69-71 27 72-74 8 Total 100
Ojiva. Es un grfico de lnea que se disea utilizando en el eje horizontal las fronteras superiores de una distribucin de frecuencias. La informacin se obtiene de la columna de frecuencias acumuladas (absoluta o relativa). Las caractersticas son las siguientes:
En el eje horizontal se colocan las fronteras superiores de cada intervalo
Todos los puntos tienen la misma distancia en el eje X
Las lneas permanecen unidas
El primer extremo termina sobre el eje horizontal
Los datos son numricos o continuos
En el cambio de intervalo es posible colocar el valor de la frecuencia
absoluta o relativa para una mejor comprensin de los datos.
La forma general de una ojiva es la siguiente:
Para trazar ojiva calcular la frecuencia acumulada de la distribucin agregndole
una nueva columna a la derecha, el primer intervalo es el mismo valor de la
Captulo 2: Probabilidad
19
frecuencia absoluta, a partir del segundo se va acumulando con todos los intervalos
anteriores.
Diagrama de Pareto. Constituye uno sencillo y grafico mtodo de anlisis que permite discriminar entre las causas ms importantes de un problema.
Pasos a seguir para elaboracin de un diagrama de Pareto:
1) Seleccionar los datos que se van a analizar, as como el periodo de
tiempos al a que se refieren dichos datos.
2) Agrupar los datos por categoras, de acuerdo con un criterio de
terminado.
3) Tabular los datos comenzando por la categoras que contenga ms
elementos y siguiendo en orden descendente, calcular:
Frecuencia absoluta.
Frecuencia absoluta acumulada.
Frecuencia relativa unitaria.
Frecuencia relativa acumulada.
4) Dibujar el diagrama de Pareto. 5) Representar el grafico de barras
Correspondiente que, en el eje horizontal, aparecer tambin en orden descendente.
20
6) Delinear la cuerva acumulativa. Se dibuja un punto que se represente el total de cada categora. Tras la conexin de estos puntos se formara una lnea poligonal.
7) identificar el diagrama, etiquetndolo con datos como: ttulo, fecha de realizacin.
8) Analizar el diagrama de Pareto.
Grfico Circular. Se usan para mostrar el comportamiento de las frecuencias relativas, absolutas o porcentuales de las variables. Dichas frecuencias son representadas por medio de sectores circulares, proporcionales a las frecuencias.
El ngulo de cada sector mantiene la misma proporcin de 360 que la de la clase
representada respecto del tamao total de la muestra.
Ejemplo, si una clase corresponde al 25% del total de la muestra, le corresponder
un sector del crculo cuyo ngulo sea de 90, exactamente el 25% de 360.
El grfico siguiente, representa la respuesta de 1886 alumnos de Cuarto al
preguntrseles por su inters de seguir estudios universitarios.
Captulo 2: Probabilidad
21
De los 1886 alumnos encuestados, 1768 (93.74%) se interesa por seguir estudios
universitarios. Los restantes 118 (6.26%), no.Para construir el grfico circular,
debemos calcular el ngulo central del sector correspondiente a cada respuesta.
Para el caso de los 1768 Interesados en estudios universitarios su proporcin
respecto de la muestra total (93.74%) nos permite determinar que su ngulo del
centro es 337 28' 34.1'' y por lo tanto, el complemento a 360 (22 31' 25.9'')
representa a los No Interesados. Hecho este clculo, con un transportador se puede
hacer un grfico equivalente al de la siguiente figura.
Ejercicios de presentacin grafica de datos.
1. Hemos preguntado a 20 personas por el nmero medio de das que practican deporte a
la semana y hemos obtenido las siguientes respuestas:
N das (xi) frecuencia
absoluta (ni)
0 1 1 2 2 4 3 7 4 1 5 1 6 3 7 1
Total 20
22
Realiza en tu cuaderno el grafica de barras, el polgono de frecuencias y el diagrama de
sectores correspondiente, y comprueba en la escena los resultados.
2. Una encuesta realizada a 40 personas sobre su estado civil, obtuvo los siguientes
datos:
Realizar diagrama circular, grafica de barras, histograma de frecuencias, polgono de
frecuencia.
3. Concentracin de ozono, uno de los indicadores ms importante de la contaminacin en
grandes ciudades es la concentracin, medida en ppb, de ozono en la atmsfera. En cierto
sector de una ciudad se obtuvo informacin sobre ese contaminante, por medio de una
medicin efectuada diariamente a las 13:00 hrs. Esta se resumi en la siguiente tabla:
Concentracin de Ozono
Intervalos Frecuencias Absolutas
[ 0, 2] 8
[ 2, 4] 23
[ 4, 6] 53
[ 6, 8] 42
[ 8, 10] 22
[10, 12] 12
Compare las frecuencias por medio de un histograma.
4. Cada de un sistema computacional. Se tiene la informacin de 80 semanas de operacin
de un terminal de computacin conectado por va telefnica a un computador central,
donde se registr el nmero de cadas del sistema por semanas. Los datos son los
siguientes:
Estado civil F
Solteros 10
Casados 20
Viudos 4
Divorciados 6
Total 40
Captulo 2: Probabilidad
23
1 0 2 0 0 3 2 3 1 0 1 0 2 0 1 0 0 2 1 1 0 1 0 0 0 1 0 2 0 1 0 1 1 1 0 0 0 3 0 3 0 2 0 1 2 1 0 1 1 2 1 0 2 0 1 0 1 1 1 3 0 1 0 0 0 1 0 2 0 1 0 1 1 1 0 0 0 3 0 3
Tabule los datos y represente la distribucin mediante un grfico circular.
6. En la tabla se muestra una distribucin de frecuencia de los salarios semanales de 65 empleados de la empresa P&R. Determinar de esa tabla:
Salarios Nmero de Empleados
$250.00-$259.99 8
260.00-269.99 10
270.00-279.99 16
280.00-289.99 14
290.00-299.99 10
300.00-309.00 5
310.00-319.99 2
Total 65
La marca de clase(o punto medio) de la tercera clase.
Qu porcentaje de empleados que cobran menos de 280.00 a la semana?
7. Dada la informacin referente a la ubicacin de personas dentro de cuatro departamentos de una empresa, se pide:
a) Tabular la informacin.
b) Realizar grfico circular.
c) Indique frecuencias relativas porcentuales en cada grupo.
M A P CC A CC M P P M P CC M A M CC P P M P
A P A M M A M A P M M A CC A A M P M M P
Donde A abastecimiento; CC control de calidad; M mantencin; P produccin.
1.7 Medidas de tendencias controladas para datos agrupados y no agrupados, media, mediana y media.
Medidas de tendencia central y de dispersin
24
En todo anlisis y/o interpretacin se pueden utilizar diversas medidas descriptivas que
representan las propiedades de tendencia central, dispersin y forma para extraer y
resumir las principales caractersticas de los datos. Si se calculan a partir de una
muestra de datos, se les denomina; si estadsticos se les calcula a partir de una
poblacin se les denomina Parmetros.
Medidas de tendencia central
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse
alrededor de un punto "central" y por lo general es posible elegir algn valor que
describa todo un conjunto de datos. Un valor tpico descriptivo como ese es una
medida de tendencia central o "posicin". Las medidas de tendencia central a estudiar
son: media aritmtica, mediana y moda.
Media aritmtica
La (tambin denominada media) es la medida de tendencia central que se media
aritmtica utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de
un conjunto de datos, dividiendo despus ese total entre el nmero total de elementos
involucrados.
La media aritmtica de un conjunto de valores x, x., x se define como el cociente
entre la suma de los valores y el nmero de ellos. Su smbolo es si la media
aritmtica es de una muestra y si la media aritmtica es de una poblacin.
a) Para datos no agrupados:
=
=
b) Para datos agrupados:
Si los datos estn ordenados en tablas de frecuencia la media aritmtica se obtiene
como sigue:
Muestra
=
Captulo 2: Probabilidad
25
Poblacin
Donde:
x= marca de clase del intervalo i-simo
f= frecuencia del intervalo i-simo
n= nmero de datos de la muestra y N es el nmero de datos de la
poblacin
m= nmero de intervalos
Propiedades de la media aritmtica
Propiedad I: La media aritmtica de una constante es igual a la constante.
:
Valores: a a a a a
= =
= a
Por lo tanto =a
Propiedad 2: La media aritmtica de una variable ms una constante es igual a la media aritmtica de la variable ms la constante.
=
=
=
26
Propiedad 3: la media aritmtica de una variable por una constante es igual al producto de la constante por la variable.
=
= c
Propiedad 4: media ponderada
Ventajas y desventajas del uso de la media aritmtica
Ventajas Desventajas
Estable muestra a muestra No aplicable a atributos
Fcil clculo e interpretacin Influyen en su valor los valores extremos
Ejemplo:
1) De un grupo de contribuyentes se determin que el promedio de impuestos es
de $32.200. Determinar en cada uno de los siguientes casos, la nueva media
aritmtica:
a) Los impuestos aumentan en un 2 %
b) A los impuestos se les disminuye la cantidad de $2.300
c) A cada contribuyente, se le disminuye un 3 % y adems se le condona $2.550
Solucin:
a) La nueva media aritmtica es $ 32.844
b) La nueva media aritmtica es $29.900
c) La nueva media aritmtica es$ 28.684
Captulo 2: Probabilidad
27
Mediana
Es el valor que se encuentra en el centro de una secuencia ordenada de datos. La
mediana no se ve afectada por observaciones extremas en un conjunto de datos.
Por ello, cuando se presenta alguna informacin extrema, resulta apropiado utilizar
la mediana, y no la media, para describir el conjunto de datos. Su smbolo es Me.
Mediana para datos no agrupados
Se deben ordenar los datos de forma creciente o decreciente. Para
muestras con un nmero par de observaciones, la mediana es el dato que
queda en el centro de dicha ordenacin y para muestras con nmero impar
de observaciones la mediana es el promedio de los dos datos centrales.
Ejemplo:
1) Para muestra con nmero impar de datos: Me= x
Datos: 4, 7, 5, 6, 3, 2, 7
Datos ordenados: 2, 3, 4, 5, 6, 7, 7 Me= x
= x =5
2) Para muestra con nmero par de datos: Me=
Datos: 12, 15, 14, 16, 11, 10, 10, 13
Datos ordenados: 16, 15, 14, 13, 12, 11, 10, 10
Me=
=
=
= 12,5
Media para datos agrupados
Me= = L + (
)* a
Donde:
= primer intervalos cuya frecuencia acumulada supera a n/2
L = limite real inferior del intervalo de la media.
N = nmero de datos.
f - 1 = frecuencia absoluta del intervalo de la media.
A= amplitud del intervalo.
28
Ejemplo: Distribucin de frecuencias de la duracin, en horas, de uso continuo de 212
dispositivos electrnicos iguales, sometidos a un cierto control.
Duracin f F
350 399 4 4
400 449 6 10
450 499 9 19
500 549 20 39
550 599 31 70
600 649 80 150
650 699 42 192
700 749 10 202
750 799 8 210
800 849 2 212
Total 212
El intervalo donde se encuentra la Mediana es el primer intervalo en el cual:
F
En este caso,
106 < 150
6to intervalo: =6
A= 50
f=70 Me = 599, 5 + (
) * 50
f= 80 Me = 622 horas
L= 599,5
Captulo 2: Probabilidad
29
Moda
Es valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene
fcilmente a partir de un arreglo ordenado. A diferencia de la media aritmtica, la
moda no se afecta ante la ocurrencia de los valores extremos. Sin embrago, solo se
utiliza la moda para propsitos descriptivos porque es ms variable, para distintas
muestras, que las dems medidas de tendencia central. Un conjunto de datos
puede tener ms de una moda o ninguna. Su smbolo Mo.
a) Moda para datos no agrupados
Ejemplos:
1) Datos: 2, 4, 5, 6, 7, 7, 8, 7, 6 Mo = 7
2) Datos: 1, 1, 3, 1, 1, 2, 2, 4, 2, 3, 2, 5, 6 Mo = 1 y 2
3) Datos: 0, 0, 2, 3, 4, 5 Mo = 0
4) Datos: 0, 1, 2, 3, 4, 5 Mo = no existe
b) Moda para datos agrupados
Existe ms de una forma de calcular la moda:
Caso a) Mo = L + (
Donde:
= intervalo de mayor frecuencia absoluta.
L = limite real inferior del intervalo que contiene a la moda.
d = diferencia entre la frecuencia absoluta del intervalo de la moda y el
intervalo anterior: d = f -f = 1
d = diferencia entre la frecuencia absoluta del intervalo de la moda y el
intervalo posterior: d = f -f + 1
a= amplitud del intervalo.
Caso b) Mo = L + (
Donde: es el intervalo de mayor frecuencia absoluta.
30
Ejemplo:
Duracin f F
350 399 4 4
400 449 6 10
450 499 9 19
500 549 20 39
550 599 31 70
600 649 80 150
650 699 42 192
700 749 10 202
750 799 8 210
800 849 2 212
Total 212
Caso a) en este caso, el intervalo de mayor frecuencia absoluta es el 4to =4
f = 80 Mo = 499,5 + (
d = 80 9 = 71
d= 80- 31 = 49
L= 499,5 Mo = 529,08 horas
A = 50
Caso b)
= 4
f + 1 = f = 31
f - 1 = f = 9
L= 499,5
A= 50
Mo = 499,5 + (
Mo = 538,25 horas
Captulo 2: Probabilidad
31
Ejercicios de medidas de tendencias controladas para datos agrupados y no agrupados,
media, mediana y moda.
1. Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron
pesos de 60, 72, 55 y 65 kilos. Hallar el peso medio de los estudiantes.
2. Hallar la media, mediana y moda de la siguiente serie de nmeros: 3, 5, 2, 6, 5, 9,
5, 2, 8, 6.
3. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9. Calcular: La moda, la mediana y
la media.
4. En una industria dos operarios en siete das de trabajo, son capaces de producir,
por da, y en forma individual la siguiente cantidad de rboles para fresa de 250 mm
de longitud por 300 mm de dimetro.
Operario A 105 106 104 102 103 100 101
Operario B 103 102 107 101 105 102 103
Determine:
a) Produccin media de cada operario.
b) Moda del operario A.
c) Mediana del operario B.
5. En tres cursos de un mismo nivel los promedios de las calificaciones fueron y 5,6;
6,1 y 4,9; si los cursos tenan respectivamente 34; 30 y 36 alumnos, determine la
calificacin promedio de los tres cursos.
6. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9, 1.
Calcular: La moda, la mediana y la media.
7. De un total de datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7.
Hallar la media y la moda.
8. Las notas de un estudiante en sus certmenes han sido 84, 91, 72, 68, 87 y 78.
Hallar la media, la mediana y la moda.
32
1.8 Medidas de dispersin, rango, varianza y desviacin estndar.
Rango: Es la diferencia entre el mayo y el menor de los datos de una distribucin estadstica.
R= Xmax X min
Ejemplo: (4, 6, 9, 3, 7)
El menor valor es 3
El mayor es 9
Entonces el rango es 9-3 R=6
Ejercicios de rango
Instrucciones: Calcule el rango de los siguientes listado de nmeros.
1. 12, 2, 23, 23, 23, 12 ,123 , 12, 24
2. 12.4 , 12, 1.5, 45, 32, 23.4, 23
3. 2, 1, 34, 3, 44, 54, 44, 32, 234 ,23 ,23 ,434 ,32 ,34, 34
4. 3, 45, 54,45,4534,534,543,4534,3453,3455,676,756,5
5. 4545,5422,345,556,34,656,345,346,342,9067,5675
6. 12.3, 234.3, 34, 344.34, 344.5
Varianza: Es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica.
La varianza se representa por .
Captulo 2: Probabilidad
33
PASOS PARA CALCULAR A VARIANZA.
1. Decide que formula utilizar. Si bien ambas frmulas son correctas, la
frmula de acceso directo es generalmente ms fcil de usar ya que
requiere menos clculos.
s=
( -
2. calcula la suma de x. Suma todos los valores de x.
3. calcula la suma de los cuadrantes de x. Encuentra el cuadrante de cada
x y agrega estos valores.
4. Sustituye los valores en la ecuacin (N= nmero de punto de datos) y
resuelve la ecuacin. # interpreta los resultados. Por desgracia, debido a
que la unidad resultante se eleva al cuadrado, hace que cualquier
interpretacin no tenga sentido. Por lo general, la variacin entre los dos
conjuntos de datos se comparan y el numero menos indica una menor
variacin dentro de ese conjunto de datos.
Ejercicios de varianza.
Instrucciones: Calcule la varianza de los siguientes datos:
1) 9, 3, 8, 8, 9, 8, 9, 18
2)
xi fi (xi fi) xi2 fi
(10, 20) 15 1 15 225
(20, 30) 25 8 200 5000
(30,40) 35 10 350 12 250
(40, 50) 45 9 405 18 225
(50, 60 55 8 440 24 200
(60,70) 65 4 260 16 900
(70, 80) 75 2 150 11 250
3) 12, 6, 7, 3, 15, 10, 18, 5.
4) 2, 3, 6, 8, 11.
5) 12, 6, 7, 3, 15, 10, 18, 5.
34
Desviacin estndar:
=
Ejercicios de desviacin estndar.
Instrucciones: Calcule la DSTD de los siguientes datos.
1) 9, 3, 8, 8, 9, 8, 9, 18
2)
xi fi (xi fi) xi2 fi
(10, 20) 15 1 15 225
(20, 30) 25 8 200 5000
(30,40) 35 10 350 12 250
(40, 50) 45 9 405 18 225
(50, 60 55 8 440 24 200
(60,70) 65 4 260 16 900
(70, 80) 75 2 150 11 250
3) 12, 6, 7, 3, 15, 10, 18, 5.
4) 2, 3, 6, 8, 11.
5) 12, 6, 7, 3, 15, 10, 18, 5.
Captulo 2: Probabilidad
35
1.9 Sesgo y Curtosis
Sesgo:
Error que aparece en dicho resultado de alguna investigacin, esto puede deberse a
los factores que dependen de la recoleccin de datos que nos podran conducir a
conclusiones que pueden ser verdaderas o falsas de lo podramos llamar la
realidad.
Curtosis:
Este tipo de medida determina el grado de concentracin que presentan los valores
en la regin central de la distribucin. Por medio de esta podremos saber si existe
una gran concentracin de valores que podramos llamar: Leptocurtica, o una
concentracin normal de los datos que se le podra llamar: Mesocurtica y en el
ltimo caso una baja concentracin o aglomeracin de datos que le llamamos:
Platicurtica.
36
Unidad 2: Probabilidad
2.1 funcin e importancia de la probabilidad
La importancia de la probabilidad radica en que, mediante este recurso matemtico,
es posible ajustar de la manera ms exacta posible los imponderables debidos al azar
en los ms variados campos tanto de la ciencia como de la vida cotidiana.
En efecto, la probabilidad es una estrategia mediante la cual se intenta estimar la
frecuencia con la que se obtiene un cierto resultado en el marco de una experiencia en
la que se conocen todos los resultados posibles. As, el ejemplo ms tradicional
consiste en definir cul es la prevalencia de obtener un nmero al arrojar un dado.
Sobre seis resultados posibles (todas las caras), slo es posible lograr un nmero por
cada vez que el dado es arrojado. En este caso, la probabilidad puede expresarse como
uno en seis, un sexto, la sexta parte o, en trminos matemticos precisos, 0.16 16
2.2 clasificacin de la probabilidad
Probabilidad Clsica o a Priori
Si un suceso puede ocurrir de N maneras mutuamente excluyentes e igualmente
probables, y m de ellas poseen una caracterstica A
Ejemplo 1: P(de que salgan dos caras al tirar 2 monedas)
P(de que salga una cara al tirar 2 monedas )
Ejemplo 2: P(de que salga un varn al tomar 2 bebs y observar su sexo)
Captulo 2: Probabilidad
37
Ejercicios.
1. Supn que un cdigo "cohffkugjbnsta" de tres letras distintas seguidas de tres dgitos distintos. Calcula la probabilidad de que el cdigo
2. Se saca al azar una carta de una baraja corriente de 52 cartas. Encuentra la probabilidad de que la carta sea:
3. Calcula la probabilidad de que al tirar una moneda corriente 4 veces se obtenga: a) Que las 4 sean iguales
b) Que tengan ms caras que sellos
c) Exactamente 2 caras y no seguidas
d) Slo sea 1 sello
4. Una pareja de recin casados planea tener 3 hijos, encuentra la probabilidad de los siguientes eventos
a)Al menos 2 varones b)Exactamente 1 varn
Probabilidad subjetiva
Se basan en las creencias e ideas en que se realiza la evaluacin de las probabilidades y
se define como en aquella que un evento asigna el individuo basndose en la evidencia
disponible (el individuo asigna la probabilidad en base a su experiencia).
La probabilidad subjetiva puede tener forma de frecuencia relativa de ocurrencia
anterior o simplemente puede consistir en una conjetura inteligente N.
Para clarificar lo antes dicho un ejemplo muy comn es el pronstico del tiempo,
muchos individuos como nosotros realizamos una prediccin personal de cmo sern
las condiciones climticas para el da, basadas mas en nuestra experiencia personal
pero que muchas veces sustentamos en experiencia de eventos pasados.
La asignacin de probabilidad subjetiva se dan generalmente cuando los eventos
ocurren solo 1 vez y a lo mximo unas cuantas veces ms.
a)Comience con vocal b)Termine en nmero par
c)Contenga la letra B d)Tenga slo vocales y dgitos impares
a)Jota b)Figura
c)Negra d)Figura roja
38
2.3 EVENTOS Y EL ESPACIO MUESTRAL
Se obtienen datos al observar ya sea eventos no controlados en la naturaleza o situaciones
controladas en un laboratorio. Usamos el trmino experimento para describir cualquiera de los
dos mtodos de recoleccin de datos.
Definicin: Un experimento es el proceso mediante el cual se obtiene una observacin (o
medicin).
La observacin o medicin generada por un experimento puede o no producir un valor
numrico. A continuacin veamos algunos ejemplos de experimentos:
Registrar la calificacin de un examen
Medir la cantidad de lluvia diaria
Entrevistar a un dueo de casa para obtener su opinin sobre un reglamento para
distribuir por zonas un rea verde.
Probar una tarjeta de circuito impreso para determinar si es un producto defectuoso o
aceptable.
Lanzar al aire una moneda y observar el lado que aparece. Cuando se realiza un experimento, lo que observamos es un resultado llamado evento simple, con
frecuencia denotado por la mayscula E con un subndice.
Definicin: Un evento simple es el resultado que se observa en una sola repeticin del
experimento. Experimento: Lance un dado y observe el nmero que aparece en la
cara superior. Haga una lista de los eventos sencillos del experimento. Solucin Cuando el dado se lanza una vez, hay seis posibles resultados. Hay los eventos sencillos
citados a continuacin:
Evento E1: observar un 1 Evento E2: observar un 2 Evento E3: observar un 3
Evento E4: observar un 4 Evento E5: observar un 5 Evento E6: observar un 6.
Ahora podemos definir un evento como un conjunto de eventos sencillos, a menudo denotado
por una letra mayscula.
Definicin: Un evento es un conjunto de eventos sencillos.
Captulo 2: Probabilidad
39
Podemos definir los eventos A y B para el experimento de lanzar al aire un dado: A: observar un
nmero imparB: observar un nmero menor a 4
Como el evento A se presenta si la cara superior es 1, 3 o 5, es un conjunto de tres eventos
sencillos y escribimos A {E1, E3, E5}. Del mismo modo, el evento B ocurre si la cara superior es
1, 2 o 3 y est definido como una serie o conjunto de estos tres eventos sencillos: B {E1, E2,
E3}.
A veces, cuando ocurre un evento, significa que no puede ocurrir otro.
Definicin: Dos eventos son mutuamente excluyentes si, cuando ocurre un evento, los otros
no pueden ocurrir y viceversa.
En el experimento de lanzar al aire un dado, los eventos A y B no son mutuamente excluyentes,
porque tienen dos resultados en comn, si el nmero de la cara superior del dado es 1 o 3.
Ambos eventos, A y B, ocurrirn si se observa E1 o E3 cuando se realiza el experimento. En
contraste, los seis eventos simples E1, E2, . . . , E6 forman un conjunto de todos los resultados
mutuamente excluyentes del experimento. Cuando el experimento se realiza una vez, puede
ocurrir uno y slo uno de estos eventos sencillos.
Definicin: El conjunto de todos los eventos sencillos se denomina espacio muestral, S.
OPERACIN SOBRE EVENTOS:
Unin: se representa con el smbolo U
La unin entre dos conjuntos A y B, de define como los elementos que estn en A, o estn en B,
se representa por (AUB)
Interseccin: se representa con el smbolo
Se define como los elementos que estn en A y en B (AB)
Complemento
El complemento de un evento A se define como todos los elementos de que no estn en A.
se representa como Ac , A-
40
Diferencia:
La diferencia entre 2 conjuntos A y B, define como los elementos de A que no estn en B, se
representa como A-B, A\B
Ejemplo
= {1,2,3,4,5,6,7,8,9}
A={1,2,3,9,8} B={2,5,4,6,7}
Hallar: i) AUB ii) AB
i) AUB={1,2,3,4,5,6,7,8,9} =
ii) AB= {2}
TIPOS DE EVENTOS :
Eventos mutuamente excluyente (M.E): los cuales A y B son M.E sino tienen puntos mustrales
en comn.
Eventos independientes: los eventos A y B son independientes si la ocurrencia de a no afecta la
ocurrencia de B
Ejemplos
1.P(AUB)= P(A) + P(B) - P(AB)
A: aprobar matemtica
B: aprobar estadstica
2.P(A)=0.3 P(B)= 0.4 P(AB)= 0.125
a) cul es la probabilidad de aprobar al menos una de las dos materias ?
b) Cul es la probabilidad de aprobar exactamente una materia ?
c) cul es la probabilidad de reprobar las dos materias?
Resp a) P(AUB)= P(A) + P(B) - P(AB)
= 0.3 + 0.4 -0.125
= 0.57
Captulo 2: Probabilidad
41
Resp b) P(aprobar exactamente una materia)
= P(AUB) - P(AB)
= 0.57 - 0.125
=0.44
Resp c) P(AUB)c = 1 P(AUB)
= 1 0.57
= 0.43
Problemas
1. Las proporciones de fenotipos sanguneos A, B, AB y O en la poblacin de todos los de
raza caucsica en Estados Unidos se publican como .41, .10, .04 y .45,
respectivamente.1 Si al azar se escoge una persona de este origen tnico en la
poblacin, cul es la probabilidad de que l o ella tengan tipo de sangre A o tipo AB?
2. Un plato contiene un dulce amarillo y dos rojos. Usted cierra los ojos, del plato escoge
dos dulces, uno por uno y anota sus colores. Cul es la probabilidad de que ambos
dulces sean rojos?
3. Tiro de un dado Un experimento consiste en tirar un solo dado. stos son algunos
eventos:
A: observar un 2B: observar un nmero parC: observar un nmero mayor a 2 D: observar
A y BE: observar A o B o ambosF: observar A y C
3. Haga una lista de eventos sencillos del espacio muestral.
4. Haga una lista de eventos sencillos en cada uno de los eventos A al F.
5. Qu probabilidades debe asignar a los eventos sencillos?
6. Calcule las probabilidades de los seis eventos A al F sumando las probabilidades
apropiadas de evento simple.
4. Tiros libres Una jugadora de baloncesto acierta en 70% de sus tiros
Cuando ella lanza un par de tiros libres, los cuatro eventos sencillos posibles y tres de sus
probabilidades asociadas se dan en la tabla:
42
2.4 TECNICAS DE CONTEO.
El principio fundamental en el proceso de contar ofrece un mtodo general para contar el
nmero de posibles arreglos de objetos dentro de un solo conjunto o entre varios conjuntos.
Las tcnicas de conteo son aquellas que son usadas para enumerar eventos difciles de
cuantificar.
Para facilitar el conteo examinaremos las siguientes tcnicas.
PRINCIPIO DE LA MULTIPLICACION.
FORMULA.- N1 x N2 x ..........x Nr maneras o formas
Problema.
1) Se dispone de 3 vas para viajar de C1 a C2 y de 4 vas para viajar de C2 a C1. De cuntas
formas se puede organizar el viaje de ida y vuelta de C1 a C2.
Respuesta: (3) (4)=12
PRINCIPIO ADITIVO.
FORMULA.- M+N+.W maneras o formas.
Problema
2) Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede
seleccionar de entre las marcas Whirlpool, Easy y General Electric, cuando acude a hacer la
compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u 11
kilogramos), en cuatro colores diferentes y puede ser automtica o semiautomtica, mientras
que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15 kilogramos), en dos
colores diferentes y puede ser automtica o semiautomtica y la lavadora de la marca GE, se
presenta en solo un tipo de carga, que es de 11 kilogramos, dos colores diferentes y solo hay
semiautomtica. Cuntas maneras tiene esta persona de comprar una lavadora?
Captulo 2: Probabilidad
43
RESPUESTA:
M = Nmero de maneras de seleccionar una lavadora Whirlpool
N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General Electric
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
PRINCIPIO DE LA SUMA O ADICION.
FORMULA.- m+n maneras
Problema.
3) Una pareja que se tiene que casar, junta dinero para el enganche de su casa, en el
fraccionamiento lomas de la presa le ofrecen un modelo econmico un condominio, en el
fraccionamiento Playas le ofrecen un modelo econmico como modelos un residencial, un
californiano y un provenzal. Cuntas alternativas diferentes de vivienda le ofrecen a la pareja?
PRESA PLAYAS
Econmico Residencial
Condominio Californiano
Provenzal
44
RESPUESTA:
m=2 n=3
2+3= 5 maneras
PRINCIPIO DE PERMUTACION.
FORMULA.- nPr = n!/(n-r)!
Donde:
n= nmero total de objetos
r= nmero de objetos seleccionados
!= factorial, producto de los nmeros naturales entre 1 y n.
Problema.
4) Como se puede designar los cuatro primeros lugares de un concurso, donde existen 15
participantes?
RESPUESTA:
n P r = n! (n - r)! = 15! = 15*14*13*12 *11*10*9*8*7*6*5*4*3*2*1 (15-4)!
11*10*9*8*7*6*5*4*3*2*1 = 32760
PRINCIPIO DE COMBINACION.
FORMULA.- nCr = n!
Problema.
5) En una compaa se quiere establecer un cdigo de colores para identificar cada una de las
42 partes de un producto. Se quiere marcar con 3 colores de un total de 7 cada una de las
partes, de tal suerte que cada una tenga una combinacin de 3 colores diferentes. Ser
adecuado este cdigo de colores para identificar las 42 partes del producto?
Captulo 2: Probabilidad
45
RESPUESTA:
n C r = n! = 7! = 7! = 35
PROBLEMAS DE TECNICAS DE CONTEO:
1. De cuntas maneras se pueden acomodar en un estante 5 libros diferentes si se
toman todos a la vez?
2. De un grupo de 11 edecanes se deben seleccionar a cuatro para que asistan a una
exposicin. Determinar el nmero de selecciones distintas que se pueden hacer.
3. Un vendedor tiene una cartera de 15 empresas. Cuntas recorridos distintas puede
realizar para visitar a seis de estos clientes en un da determinado?
4. Un asesor financiero cuenta con ocho opciones para invertir y ofrece a sus clientes
carteras con cinco de estas opciones. Cuntas carteras diferentes puede ofrecer?
5. Una caja contiene ocho dulces de menta y cuatro de fresa
De cuantas maneras distintas se pueden tomar al azar cinco de estos dulces sin diferenciar el
color?
46
2.5 AXIOMAS
Los axiomas de probabilidad son las condiciones mnimas que deben verificarse para que una
funcin definida sobre un conjunto de sucesos determine consistentemente sus
probabilidades.
Primer axioma:
La probabilidad de que ocurra un evento A cualquiera se encuentra entre cero y uno.
0 p(A) 1
Ejemplo: La probabilidad de sacar par en un dado equilibrado es 0,5. P(A)=0,5
Segundo Axioma:
La probabilidad de que ocurra el espacio muestral d debe de ser 1.
p(d) = 1
Ejemplo: La probabilidad de sacar un nmero del 1 al 6 en un dado equilibrado es "1".
Tercer Axioma:
Si A y B son eventos mutuamente excluyentes, entonces la,
p(AB) = p(A) + p(B)
Captulo 2: Probabilidad
47
Ejemplo: La probabilidad de sacar en un dado "as" o sacar "nmero par" es la suma de las
probabilidades individuales de dichos sucesos.
Segn este axioma se puede calcular la probabilidad de un suceso compuesto de varias
alternativas mutuamente excluyentes sumando las probabilidades de sus componentes.
Generalizando:
Si se tienen n eventos mutuamente excluyentes o exclusivos A1, A2, A3,.....An, entonces;
p(A1A2.........An) = p(A1) + p(A2) + .......+ p(An)
Ejemplo:
Para el experimento aleatorio de tirar un dado, el espacio muestral es W = {1, 2, 3, 4, 5, 6}. En
este espacio el conjunto de sucesos es P(W) = {, {1}, {2}, ...{1,2}, {1,3}, ...{1,2,3,4,5,6}}. Para
establecer una probabilidad hay que asignar un nmero a todos esos sucesos.
Sin embargo si se ha asignado a los sucesos elementales p({1})= p({2})= ...= p({6})= 1/6, por la
propiedad ii), p.e. la probabilidad del suceso {1, 3} es p({1,3})= p({1})+ p({3})=2/6.
Nota: El suceso {1} es: "el resultado de tirar el dado es la cara 1", el suceso {1, 3} es: "el
resultado de tirar el dado es la cara 1, o la 3", el suceso {1, 3, 5} es: "el resultado de tirar el
dado es una cara impar".
TEOREMAS
TEOREMA 1. Si f es un evento nulo o vaco, entonces la probabilidad de que ocurra f debe ser
cero.
p(f)=0
48
Ejemplo: La probabilidad de que un estudiante sea mujer es "1 menos la probabilidad de que
no sea varn".
DEMOSTRACIN:
Si sumamos a un evento A cualquiera, como f y A son dos eventos mutuamente excluyentes,
entonces p(Af)=p(A) +p(f)=p(A). LQQD
TEOREMA 2. La probabilidad del complemento de A, Ac debe ser,
p(Ac)= 1 p(A).
DEMOSTRACIN:
Si el espacio muestral d, se divide en dos eventos mutuamente exclusivos, A y Ac luego d=AAc,
por tanto p(d)=p(A) + p(Ac) y como en el axioma dos se afirma que p(d)=1, por tanto, p(Ac)= 1 -
p(A) .LQQD
TEOREMA 3. Si un evento A B, entonces la p(A) p(B).
DEMOSTRACIN:
Si separamos el evento B en dos eventos mutuamente excluyentes, A y B \ A (B menos A), por
tanto, B=A(B \ A) y p(B)=p(A) +p(B \ A), luego entonces si p(B \ A)0 entonces se cumple que
p(A)p(B). LQQD
TEOREMA 4. La p( A \ B )= p(A) p(AB)
DEMOSTRACIN: Si A y B son dos eventos cualquiera, entonces el evento A se puede separar
en dos eventos mutuamente excluyentes, (A \ B) y AB, por tanto, A=(A \ B)(AB), luego
p(A)=p(A \ B) + p(AB), entonces, p(A \ B) = p(A) p(AB). LQQD
Captulo 2: Probabilidad
49
TEOREMA 5. Para dos eventos A y B, p(AB)=p(A) + p(B) p(AB).
DEMOSTRACIN:
Si AB = (A \ B) B, donde (A \ B) y B son eventos mutuamente excluyentes, por lo que p(A B)
= p(A \ B) + p(B) y del teorema anterior tomamos que p(A \ B) = p(A) p(AB), por tanto,
p(AB) = p(A) + p(B) p(AB). LQQD
PROBLEMAS:
1) Sea.
Calcule:
1 2 3
4
5 6 7
2) Una urna tiene ocho bolas rojas, 5 amarillas y siete verdes. Si se extrae una bola al azar
calcular la probabilidad de:
1) Sea roja.
2) Sea verde.
3) Sea amarilla.
4) No sea roja.
5) No sea amarilla.
50
2.6 PROBABILIDAD CONDICIONAL E INDEPENDENCIA
CONDICIONAL.- Si A y B son dos eventos, se define la probabilidad de A dado B como la
probabilidad de que ocurra el evento A cuando el evento B ya ocurri o se tiene la certeza de
que ocurrir, y se calcula como
P ( A B ) = P ( B )
P ( A B ) ; P ( B ) 0
De la misma manera, se define la probabilidad de B dado A como la probabilidad de que ocurra
el evento B cuando el evento A y ocurri o se tiene la certeza que de ocurrir. Esta probabilidad
se calcula como
P ( B A ) = P ( A )
P ( A B ) ; P ( A ) 0
Independiente: Dos eventos A y B son independientes si la probabilidad de A dado B es igual a
la probabilidad de A, y tambin la probabilidad de B dado A es igual a la probabilidad de B, es
decir, si la ocurrencia o no ocurrencia de un evento no modifica en nada la probabilidad de
ocurrencia de otro. Esto es, A y B son independientes si:
P ( A B ) = P ( A ) y tambin P ( B A ) = P ( B )
Ejemplo resuelto:
En una familia con dos hijos, se desea calcular las siguientes probabilidades:
A) La probabilidad de que los dos hijos sean varones.
B) La probabilidad de que si uno de los hijos es varn, los dos lo sean.
RESOLUCIN: Para poder resolver el problema es necesario empezar por definir algunos
eventos. Sean A: el evento de que los dos hijos sean varones, y B: el evento de que al menos
uno de los hijos sea varn.
a) Si observamos en el espacio muestral
S = { (h, h), (h, m), (m, h), (m, m) }
Y consideramos que todos los eventos simples son igualmente probables, es claro que
P ( A ) = 1 / 4 = 0.25 y P ( B ) = 3 / 4 = 0.75
Captulo 2: Probabilidad
51
b) Se desea calcular P ( A B ).
Utilizando la definicin de probabilidad condicional se obtiene
P ( A B ) = 1/3
PROBLEMAS:
Se lanzan dos dados balanceados y se definen los eventos
A: el resultado del lanzamiento del primer dado es par.
B: el resultado del lanzamiento del segundo dado es 4.
C: el resultado del lanzamiento del primer dado es 3.
Calcular:
a) P ( A || B ) f) P ( B )
b) P ( B || C ) g) P ( C )
c) P ( A || C )
d) P ( C || A )
e) P ( A )
2.7 TEOREMA DE BAYES.
Aplicando en el numerador la Regla de Multiplicacin P(Ai i) P(B|Ai) y en el
denominador el Teorema de Probabilidad Total P(B) = P(A1) P(B | A1) + P(A2) P(B | A2) + . . . +
P(An) P(B | An), obtenemos la ecuacin que representa al:
EJEMPLO:
Una fbrica que produce material para la construccin tiene 3 mquinas, a las que se les
denomina A, B y C. La mquina A produce tabique, la B adoqun y la C losetas. La mquina A
produce el 50% de la produccin total de la fbrica, la B el 30% y la C el 20%. Los porcentajes de
artculos defectuosos producidos por las mquinas son, respectivamente, 3%, 4% y 5%. Si se
selecciona un artculo al azar y se observa que es defectuoso, encontrar la probabilidad de que
sea un tabique.
52
Solucin:
Definamos el evento D como sea un artculo defectuoso. De acuerdo a esto tenemos que:
P(A) = 0.5 P(D | A) = 0.03
P(B) = 0.3 P(D | B) = 0.04
P(C) = 0.2 P(D | C) = 0.05
Si el artculo del que deseamos calcular la probabilidad es un tabique, significa que es
producido por la mquina A. Tambin observamos que en la solucin solamente participan los
artculos defectuosos, ya que se pone por condicin esta caracterstica. Por lo tanto:
PROBLEMAS :
1) A un congreso asisten 100 personas, de las cuales 65 son hombres y 35 son mujeres. Se
sabe que el 10% de los hombres y el 6% de las mujeres son especialistas en
computacin. Si se selecciona al azar a un especialista en computacin Cul es la
probabilidad de que sea mujer?
2) El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas.
El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas
tambin, mientras que los no ingenieros y los no economistas solamente el 20% ocupa
un puesto directivo. Cul es la probabilidad de que un empleado directivo elegido al
azar sea ingeniero?
Captulo 2: Probabilidad
53
3) La probabilidad de que haya un accidente en una fbrica que dispone de alarma es 0.1.
La probabilidad de que suene esta s se ha producido algn incidente es de 0.97 y la
probabilidad de que suene si no ha sucedido ningn incidente es 0.02.En el supuesto
de que haya funcionado la alarma, cul es la probabilidad de que no haya habido
ningn incidente?
4) Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y C con
2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos una bola. Si la bola ha
sido roja, cul es la probabilidad de haber sido extrada de la urna A?
5) En una clase hay 40 alumnos entre chicos y chicas, cuya cantidad puedes variar. Se
escoge una comisin de tres personas. Calcular
Probabilidad de que la formen dos hombres y una mujer.
Probabilidad de que la segunda persona elegida sea mujer
Probabilidad de obtener hombre, mujer y hombre, en este orden.
Si la segunda persona elegida ha sido una mujer, cual es la probabilidad de que
la primera fuera un hombre.
Captulo 3: Distribuciones de probabilidad
1
Captulo 3: Distribuciones de probabilidad
2
Captulo 3: Distribuciones de probabilidad
Distribucin de probabilidad normal
Ahora se calcular el valor (z) para una media poblacional , una desviacin estndar
poblacional y una x determinada.
Ejemplo
Los ingresos semanales de supervisores de turno en la industria del vidrio tienen una
distribucin normal con media $1000 (dlares) y una desviacin estndar $100. Cul es el
valor z correspondiente al ingreso de un supervisor que gana $1100 a la semana? Y para un
supervisor que tiene un ingreso semanal de $900?
Solucin
Utilizando la frmula (7.1), los valores z para los dos valores indicados de x ($1100 y $900) son:
El valor de z= 1.00 indica que el ingreso semanal de $1100 se encuentra a una desviacin
estndar sobre la media; una z = -1.00 indica que el ingreso de $900 se encuentra a una
desviacin estndar por debajo de la media. Observe que ambos ingresos ($1100 y $900) estn
a la misma distancia ($100) de la media.
reas bajo la curva normal
Antes de examinar diversos usos de la distribucin de probabilidad normal estndar, se
consideraran tres reas bajo la curva normal que sern muy utilizadas en los siguientes
captulos. En el captulo 4 estas reas tambin se conocen como la Regla Emprica.
1. Aproximadamente 68% del rea bajo la curva normal est entre la media ms una y
menos una desviacin estndar y se expresa 1.
2. Alrededor de 95% del rea bajo la curva normal est entre la media ms dos y
menos dos desviaciones estndar, lo que se expresa 2.
Para X = $1100:
= 1.00
Para X = $900
= -1.00
Captulo 3: Distribuciones de probabilidad
3
3. Prcticamente toda el rea bajo la curva normal est entre la media y tres
desviaciones estndar (a uno y otro lados del centro), es decir 3.
En trminos de porcentajes, lo anterior se indica grficamente as:
Transformar las mediciones a valores z(o desviaciones normales estndar) modifica las escalas.
Las conversiones se muestran en el siguiente diagrama. Por ejemplo, +1 se convierte en el
valor z de +1.00. De manera semejante, -2 se transforma en el valor z de -2.00. Observe que
el centro de la distribucin z es cero, lo que indica que no hay desviacin respecto a la media .
4
Ejemplo
Una prueba del tiempo de vida de bateras alcalinas tipo D, revelo que su tiempo medio de vida
es 19.0 horas (h). La distribucin de los tiempos de vida se aproxima a una distribucin normal.
La desviacin estndar de la distribucin es 1.2 h.
1. Entre qu par de valores falla alrededor de 68% de las bateras?
2. Entre qu par de valores falla aproximadamente 95% de las bateras?
3. Entre qu par de valores fallan prcticamente todas las bateras?
Solucin
Para responder a estas preguntas se pueden usar los resultados de la Regla Emprica.
1. Aproximadamente 68% de las bateras falla entre 17.8 h y 20.2 h, valores obtenidos de
19.0 1(1.2)h.
2. Alrededor de 95% de las bateras falla entre 16.6 h y 21.4 h, que se obtiene de 19.0
2(1.2)h.
3. Prcticamente todas las bateras fallan entre 15.4 h y 22.6 h, que se obtiene de 19.0
3(1.2)h.
Captulo 3: Distribuciones de probabilidad
5
Esta informacin se resume en el siguiente diagrama:
Auto examen 7.2
La distribucin de los ingresos anuales de un grupo de empleados a nivel gerencia media, en la
empresa Compton Plastics, sigue aproximadamente una distribucin normal con media $37200
(dlares) y desviacin estndar $800.
a) Entre qu par de cantidades esta aproximadamente 68% de los ingresos?
b) Entre cules dos valores se encuentra aproximadamente 95% de los ingresos?
c) Entre qu par de valores estn prcticamente todos los ingresos?
d) Cules son la mediana y la moda de los ingresos?
e) Es simetra de la distribucin de los ingresos?
6
Ejemplo
Refirase a la informacin sobre los ingresos semanales de los supervisores de turno en la
industria del vidrio. Los ingresos semanales siguen una distribucin normal con media $1000 y
desviacin estndar $100. Cul es la probabilidad de elegir a un supervisor de turno en la
industria del vidrio cuyo ingreso:
1. Est entre $790 y $1000?
2. Sea inferior a $790?
Solucin
Primero se calcula el valor de (z) que corresponde a un salario semanal de $790. De la frmula
7.1 se tiene que:
Consulte el apndice D. Bajando por el margen izquierdo se encuentra el rengln
correspondiente a 2.1 y recorriendo ese rengln se llega a la columna cuyo encabezado es 0.00.
El valor es 0.4821. Sin embargo, como la distribucin normal es simtrica, el rea entre 0 y una
z negativa es igual a la que existe entre 0 y z. La probabilidad de encontrar a un supervisor que
gane entre $790 y $1000 es de 0.4821.
z 0 0,01 0,02
2,0 0,4772 0,4778 0,4783
2,1 0,4821 0,4826 0,483
2,2 0,4861 0,4864 0,4868
2,3 0,4893 0,4896 0,4898
Ejercicios
1. Una poblacin tiene media 20.0 y desviacin estndar 4.0
a) Calcule el valor z correspondiente a 25.0
b) Qu proporcin de la poblacin est entre 20.0 y 25.0?
c) Qu proporcin de la poblacin es menor que 18.0?
Captulo 3: Distribuciones de probabilidad
7
2. Una poblacin normal tiene media 12.2 y desviacin estndar 2.5
a) Calcule el valor (z) correspondiente a 14.3
b) Qu proporcin de la poblacin est entre 12.2 y 14.3?
c) Qu proporcin de la poblacin es menor que 10.0?
3. Un estudio reciente de los sueldos por hora del personal de mantenimiento en aerolneas
importantes mostr que el salario medio por hora era $16.50 (dlares), con una desviacin
estndar de $3.50. Si se selecciona al azar un elemento de la tripulacin, Cul es la
probabilidad de que gane:
a) Entre $16.50 y $20.0 por hora?
b) ms de $20.00 por hora?
c) menos de $15.00 por hora?
4. La media de una distribucin normal es 400 libras (lb.). La desviacin estndar es 10 lb.
a) Cul es el rea entre 415 lb y la media de 400 lb?
b) Cul es el rea entre la media y 395 lb?
c) Cul es la probabilidad de seleccionar un valor al azar y encontrar que tiene un valor
inferior a 395 lb?
Una segunda aplicacin de la distribucin normal estndar es la combinacin de dos reas o
probabilidades, una est a la derecha y la otra a la izquierda de la media.
Ejemplo
Volviendo a la distribucin de ingresos semanales de los supervisores de turno de la industria
de vidrio. Los ingresos semanales siguen una distribucin normal con media $1000 (dlares),
desviacin estndar $100, Cul es el rea bajo la curva normal entre $840 y $1200 dlares?
Solucin
El problema se divide en dos partes. Para el rea entre $840 y la media $1000:
8
Para el rea entre la media de $1000 y $1200:
El rea bajo la curva para obtener un valor z de -1.60 es 0.4452 (tomada del apndice D). El
rea bajo la curva para z = 2.00, es 0.4772. Al sumar ambas reas se tiene:
0.4452+0.4772=0.9224. De esta forma, la probabilidad de seleccionar un ingreso entre $840 y
$1200 es 0.9224. En otras palabras, 92.24% de los supervisores tiene un ingreso semanal entre
$840 y $1200. Mostrado en un diagrama:
UNIDAD 4
Man
ual
Did
cti
co d
e P
rob
abili
dad
y E
stad
sti
ca
1
Capitulo 4: teora de estimacin
4.1 Estimacin para una variable
4.2 Distribuciones de Muestreo
4.2.2 Distribucin t-student
4.2.3 Distribucin ji-cuadrada
4.2.4 Distribucin Fisher
4.3 Estimacin por intervalos de confianza para una poblacin
4.3.1 Media
4.3.2 Proporcin
4.3.3 Varianza
4.4 Estimacin por intervalos de confianza para dos poblaciones
4.4.1 Diferencia de medias
4.4.2 Diferencia de proporciones
4.4.3 Razn de varianzas
Man
ual
Did
cti
co d
e P
rob
abili
dad
y E
stad
sti
ca
2
4.5 Estimacin para dos variables
Diagrama de dispersin
El diagrama de dispersin nos apoyar de manera visual para definir el tipo de relacin
involucrada en las variables de estudio. Para poder construirlo, primero localizamos los
valores de la variable independiente X sobre el eje horizontal y los de la variable
dependiente Y, sobre el eje vertical. Cada par, lo representaremos en el grfico mediante
un punto en el plano (X,Y).
Ejemplo: Supongamos que queremos encontrar la relacin que tienen los promedios de
calificacin obtenidos en la preparatoria con los obtenidos a nivel Universitario. Los datos
van del 0 al 10, este como calificacin mxima. Denotamos con X el promedio obtenido
en nivel preparatoria y Y el promedio obtenido en la Universidad. Podramos pensar que
si a un estudiante le va bien en la preparatoria, tambin le ir bien en la universidad.
Veamos si esto tiene o no relacin. Elaboramos un grfico de dispersin, tenemos los
siguientes datos:
Como mencionamos, cada punto en el plano del diagrama de dispersin viene dado por
(X,Y), por lo tanto, el primer punto de nuestro diagrama viene dado por el par: (3,5),
segundo punto: (2,4), tercer punto: (4,4), y as sucesivamente hasta llegar al dcimo y
ltimo punto en este ejemplo que sera (5,6).
Regresin lineal y coeficiente de regresin
La regresin lineal nos ayuda a estudiar la relacin existente entre variables. Este estudio,
nos permite realizar dos diferentes conclusiones. La primera, conocer si la relacin entre
dichas variables tiene o no, algn significado. Y la segunda es de predecir el
comportamiento de una variable dependiente (Y) con valores de una variable
Man
ual
Did
cti
co d
e P
rob
abili
dad
y E
stad
sti
ca
3
independiente (X), por ejemplo, si nos interesa saber o predecir la calificacin final de
cierto estudiante conociendo sus calificaciones anteriores, o bien, la talla de cierta
persona conociendo su estatura.
Esta relacin entre variables puede representarse grficamente mediante una lnea recta.
Para poder obtener los datos que nos ayudarn a concluir y graficar dichas variables es
necesaria una ecuacin de regresin lineal. La ecuacin la obtenemos con apoyo de los
datos obtenidos en una muestra. Uno de los mtodos ms comunes y sencillos de utilizar,
para obtener dicha ecuacin, es el mtodo de mnimos cuadrados.
El mtodo de mnimos cuadrados nos ayudar a que la recta de la ecuacin elegida sea
tal, que la suma de los cuadrados de las distancias verticales entre los puntos y la lnea
recta sea la ms pequea posible.
Entonces, una recta de regresin simple toma la forma: Donde:
a = La interseccin con el eje Y, es decir, es el punto donde la recta y el eje de las Y se
encuentran.
b = La pendiente de la recta, es decir, el cambio en la variable dependiente Y por cada
cambio de la variable independiente X.
Para poder obtener la ecuacin de regresin lineal simple tenemos que calcular los
valores para a y b con las siguientes frmulas:
Donde:
Y = El promedio o media de la variable dependiente Y.
X = El promedio o media de la variable independiente X.
n = El nmero total de observaciones que contiene la muestra.
X = Variable independiente.
Y = Variable dependiente.
Veamos el ejercicio 1: Supongamos que queremos predecir la calificacin de los
estudiantes de universidad conociendo los promedios de calificacin de la preparatoria
(en la escala de 0 10 puntos). Para esto, recopilamos informacin de 10 estudiantes.
Queremos llegar a la ecuacin de regresin lineal simple:
Man
ual
Did
cti
co d
e P
rob
abili
dad
y E
stad
sti
ca
4
Los valores que integran la muestra se muestran en la tabla.
Observando las frmulas comienzo a calcular los valores que se me estn pidiendo.
Vamos a calcular, primeramente, el valor de b. A la tabla anterior, que contiene los
datos de la muestra, le agrego dos nuevas columnas las cuales tendrn el cuadrado de
cada valor de X y la multiplicacin de ambas variables (XY).
Al finalizar con estas operaciones, realizo las sumatorias de los datos de cada columna
obteniendo los siguientes resultados:
Man
ual
Did
cti
co d
e P
rob
abili
dad
y E
stad
sti
ca
5
Calculamos los promedios de las variables X y Y:
Despejamos valores en las frmulas y obtenemos:
Y = 6.5
X = 6.3
n = 10
XY =452
2X =465
Recommended