7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
1/221
1
UNIVERSIDAD AUTNOMA DE QUERTARO
FACULTAD DE INGENIERA
PROBABILIDAD Y ESTADSTICA
GUA DEL MAESTRO
Que para obtener el ttulo de
Ingeniero Civil
PRESENTA:
Israel Luna Vaca
Asesor: M. en I. Pablo Talamantes Contreras
Fecha: Mircoles 11 de mayo del 2011.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
2/221
2
Llegar el da en el que el pensamiento
estadstico ser una condicin tan necesaria
para la convivencia eficiente como la
capacidad de leer y escribirH.G. Wells
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
3/221
3
Agradecimientos.
El autor ha intentado escribir esta gua de modo que suscite el inters del
instructor de la materia. En ninguna manera pretendo sustituir la libertad de
ctedra la consulta externa de textos sobre probabilidad y estadstica. La
intensin es permitir al profesor tener a la mano los temas que involucra el
programa de dicha materia. Muchas personas participaron directa oindirectamente en el desarrollo de este trabajo, y deseo expresarles mi
agradecimiento por sus comentarios y sugerencias que mucho he apreciado.
Especficamente, quiero dar las gracias a las siguientes personas por su
contribucin:
M. en I. Pablo Talamantes Contreras, catedrtico de la FI-UAQ.
M en C. Crisgono de Santiago Guerrero, catedrtico de la FI-UAQ.
Dra. Teresa Flores Guzmn, catedrtica de la FI-UAQ.
M.Q.Hernndez Garciadiego Cecilia, catedrtica de la FI-UAQ.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
4/221
4
NDICE
RECOMENDACIONES PARA EL PROFESOR8
COMPETENCIAS ACADMICAS...8
LINEAMIENTOS SUGERIDOS....9
UNIDAD I. INTRODUCCIN.
1.1Definicin...18
1.2Pasos para realizar un estudio estadstico......18
1.3Mtodo cientfico y estadstica.......20
1.4Poblacin y muestra.....21
1.5Variables, tipos de Variables......21
1.6Tablas de frecuencia24
1.7Grficos......28
UNIDAD 2. ESTADSTICA DESCRIPTIVA.
2.1Definicin y parmetros estadsticos..32
2.2Medidas de tendencia central..33
2.3Medidas de dispersin...40
2.4Medidas de posicin...44
2.5Asimetra y apuntamiento.............46
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
5/221
5
UNIDAD 3. REGRESIN Y CORRELACIN
3.1Diagramas de dispersin.54
3.2Covarianza.56
3.3Correlacin.57
3.4Regresin lineal simple61
UNIDAD 4. FUNDAMENTOS DE PROBABILIDAD
4.1Conjuntos y su lgebra66
4.2Experimentos aleatorios, espacios muestrales y eventos.71
4.3Teora fundamental del conteo..75
4.4Permutaciones y combinaciones...76
4.5Probabilidad..79
4.6Probabilidad condicional.85
4.7Independencia de eventos............87
4.8Probabilidad total.88
4.9Teorema de Bayes...91
UNIDAD 5. VARIABLES ALEATORIAS.
5.1Variables aleatorias discretas..99
5.2Variables aleatorias continuas103
5.3Medidas de tendencia central de una variable aleatoria105
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
6/221
6
5.4Medidas de dispersin de una variable aleatoria...109
5.5Medidas de posicin de una variable aleatoria....110
5.6Medidas de apuntamiento de una variable aleatoria........112
UNIDAD 6. MODELOS PROBABILSTICOS BSICOS.
6.1Distribuciones discretas115
Bernoulli.
Binomial.
Poisson.
Hipergeomtrica.
6.2Distribuciones continuas..131
Normal.
Chi-Cuadrada.
T de student.
Distribucin F.
UNIDAD 7. INTRODUCCIN A LA INFERENCIA ESTADSTICA.
7.1Propiedades de un estimador....155
7.2Teorema central del lmite..162
7.3Intervalos de confianza....167
7.4 Muestreo.176
7.5Tamao de la muestra.187
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
7/221
7
UNIDAD 8. PRUEBAS DE HIPTESIS.
8.1Ideas bsicas en una prueba de hiptesis..192
8.2Clasificacin de hiptesis..196
8.3Regin crtica y nivel de significancia..197
8.4Tipos de error..198
8.5Pruebas de hiptesis para muestras de la distribucin
normal..201
GLOSARIO DE TRMINOS.206
Apndice A..211
reas bajo la curva normal estndar de 0 a Z.
Apndice B..212
Valores percentiles para la distribucint de Student con grados de libertad.
Apndice C..213
Valores percentiles de para la distribucinChi cuadrado con grados de libertad.
Apndice D..214
Ordenadas y de la curva normal estndar.
NDICE DE TABLAS...215
NDICE DE ESQUEMAS....216
BIBLIOGRAFA....221
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
8/221
8
RECOMENDACIONES PARA EL PROFESOR.
La presente gua constituye un apoyo para el docente, ya que en sta se
presentan los contenidos mnimos para desarrollar en el curso de Probabilidad
y Estadstica establecido en la UAQ.
Utilizar la gua para tener un panorama general a la hora de planear el
curso.
Utilizar la gua como apoyo de las actividades a realizar en clase.
Consultar la gua para fijar un sistema de evaluacin que vaya acorde
con las necesidades del profesor.
Realizar algunas de las actividades sugeridas para los docentes y
alumnos que vayan acordes con las necesidades del profesor.
COMPETENCIAS ACADMICAS
Comprender el rol de la Probabilidad y la Estadstica en la resolucin deproblemas de ingeniera.
Utilizar el Mtodo cientfico, para poder aplicar el mtodo estadstico a
cualquier fenmeno natural o social que se presente.
Utilizar las herramientas que proporciona la Probabilidad y la Estadstica
para discernir con mayor eficacia cualquier fenmeno de tipo natural o
social.
Tener conocimiento de la importancia de la recoleccin de datos para el
buen desarrollo de la Estadstica.
Utilizar de manera adecuada la representacin grfica de un fenmeno
natural o social de acuerdo a la recoleccin de datos.
Comprender y discernir la veracidad de la informacin que recibe de los
diferentes medios informativos sobre un fenmeno social o natural.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
9/221
9
Comprender la interaccin de la Probabilidad y la Estadstica y otras
ciencias en la comprensin y anlisis de fenmenos naturales y sociales.
SUGERENCIAS
Revisar los conocimientos previos al iniciar un nuevo tema.
Realizar actividades con la finalidad de incentivar al alumno e
inducirlo al tema.
Analizar y discutir el tema mediante tcnicas grupales.
Realizar prcticas de laboratorio mediante cualquier software
estadstico tal como Excel, MINITAB, SPSS, que permitan al alumno
un aprendizaje significativo.
Incorporar en clase el uso de programas estadsticos presentes en
toda calculadora cientfica.
LINEAMIENTOS SUGERIDOS.
UNIDAD I: INTRODUCCIN
Para el profesor:
Establecer con la participacin del grupo, la manera como trabajar
durante el curso, sealando con claridad qu se espera de los alumnos,
del profesor y de la asignatura, as como dejando el claro los criterios de
evaluacin; para que sean congruentes con los objetivos de la
asignatura.
Identificar los conocimientos previos de los estudiantes mediante
algunas tcnicas didcticas conocidas.
Presentar ciertas problemticas que involucren el uso de la estadstica
en la ingeniera a travs de fenmenos sociales y/o naturales.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
10/221
10
Para el alumno:
Presentar por medio de ideas cmo se desea trabajar durante el curso ycmo se puede lograr una mejor participacin en el curso, y cmo
espera ser evaluado al final del curso.
Participar de manera colaborativa con sus compaeros para que se
logre en el grupo mejores resultados.
Identificar los diferentes usos de la Estadstica.
Realizar actividades ejercicios sugeridos en la gua o por el profesor.
Disear una encuesta o cuestionario.
Distribucin de frecuencias.
Para el profesor:
Guiar al alumno para que construya los diferentes tipos de mtodos
tabulares que existen en la Estadstica.
Resolver ejercicios que conlleven a los diferentes mtodos tabulares.
Proponer una serie de ejercicios para ser resueltos en clase y extra-
clase.
Proponer que el alumno mediante el programa Excel presente los datosrecolectados mediante los diferentes mtodos tabulares vistos en clase.
Para el alumno:
Investigar los diferentes mtodos tabulares que existen en la
Estadstica.
Diferenciar las ventajas y desventajas que tiene cada mtodo tabular y
sealar las caractersticas de cada uno.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
11/221
11
Realizar las actividades sugeridas por el docente.
Realizar en equipo las graficas en Excel de los datos que recolect enla encuesta y presentarlos mediante una tabla.
Representacin grfica
Para el profesor:
Guiar al alumno para que construya los diferentes tipos de grficas que
existen en la Estadstica.
Resolver ejercicios que conlleven a los diferentes mtodos grficos.
Proponer una serie de ejercicios para ser resueltos en clase y extra-
clase.
Proponer que el alumno grafique los datos que ya tabul en la encuesta
propuesta con anterioridad.
Proponer que el alumno mediante el programa Excel presente los datos
recolectados mediante los diferentes mtodos tabulares vistos en clase.
Para el alumno:
Investigar los diferentes mtodos grficos que existen en la Estadstica.
Diferenciar las ventajas y desventajas que tiene cada grfica y sealar
las caractersticas de cada una.
Realizar las actividades sugeridas por el docente.
Realizar en equipo las grficas en Excel de los datos que recolect en la
encuesta y presentarlos mediante una grfica.
UNIDAD II: ESTADSTICA DESCRIPTIVA.
Para el profesor:
Explicar qu es una medida de centralizacin y para qu sirve.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
12/221
12
Definir cada una de las medidas de centralizacin.
Diferenciar cada una de las medidas de centralizacin.
Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto
en clase.
Aplicar las medidas de centralizacin en la encuesta que se propuso en
clase.
Calcular y reflexionar sobre las posibilidades de su clculo mediante el
programa Excel las diferentes medidas de centralizacin vistas en clase.
Para el alumno:
Investigar las diferentes medidas de centralizacin que existen en la
estadstica.
Presentar un resumen de las diferentes medidas de centralizacin.
Aportar ideas o bien dudas durante la explicacin al profesor.
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Elaborar un formulario que sirva para resolver ejercicios de
Centralizacin.
UNIDAD III: REGRESIN Y CORRELACIN.
Para el profesor:
Explicar qu es un diagrama de dispersin y para qu sirve.
Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto
en clase.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
13/221
13
Proponer mediante el programa Excel ejercicios donde se identifique la
correlacin entre las variables X,Y y se muestre la recta de regresin
lineal.
Para el alumno:
Con la ayuda de Excel presentar los posibles casos de correlacin
usando diagramas de dispersin.
Presentar un resumen sobre la covarianza, desarrollar ejemplos en
clase.
Aportar ideas o bien dudas durante la explicacin al profesor.
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Resolver los ejercicios propuestos en la gua.
UNIDAD IV: FUNDAMENTOS DE PROBABILIDAD
Parte 1 Conjuntos.
Para el profesor:
Explicar cmo realizar las operaciones con conjuntos.
Explicar la utilizacin de los diagramas de Venn y sus aplicaciones.
Organizar equipos para fomentar la discusin y anlisis y generar
conclusiones.
Propondr ejercicios en clase y extra-clase para retroalimentar lo visto
en clase
Para el alumno:
Investigar todos los conceptos que involucran a la teora de conjuntos.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
14/221
14
Elaborar un mapa conceptual de todos los elementos de la teora de
conjuntos.
Aportar ideas o bien dudas durante la explicacin al profesor.
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Elaborar un formulario que sirva para identificar los diferentes smbolos
involucrados en la teora de conjuntos.
Parte 2 Probabilidad.
Para el profesor:
Explicar los diferentes enfoques de la teora de la probabilidad.
Desarrollar diversos problemas donde obtendr la probabilidad en base
a la definicin.
Explicar la relacin que existe entre la probabilidad y la teora de
conjuntos.
Propondr ejercicios en clase y extra-clase para retroalimentar lo visto
en clase.
Explicar la relacin que existe entre la probabilidad y la estadstica.
Para el alumno:
Identificar los principales conceptos de la teora de probabilidades y los
relacionar con la teora de conjuntos.
Elaborar un mapa conceptual relacionando lo antes mencionado.
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Resolver los ejercicios propuestos en la gua.
Elaborar un formulario que sirva para resolver ejercicios de Probabilidad.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
15/221
15
UNIDAD V: VARIABLES ALEATORIAS.
Para el profesor:
Explicar qu es una variable aleatoria y para qu sirve.
Definir y diferenciar entre variable aleatoria discreta y continua.
Desarrollar los temas de momentos con respecto a la media y con
respecto al origen.
Proponer ejercicios en la clase y extra-clase para retroalimentar lo vistoen clase.
Para el alumno:
Presentar un cuadro donde agrupe las principales caractersticas de
variable aleatoria y variable continua.
Investigar los momentos con respecto a la media y con respecto al
origen.
Aportar ideas o bien dudas durante la explicacin al profesor.
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Resolver los ejercicios propuestos en la gua.
UNIDAD VI: MODELOS PROBABILSTICOS BSICOS
Para el profesor:
Ensear y describir las condiciones para discriminar un modelo de otro a
la hora de resolver un problema de distribucin de probabilidad.
Coordinar a los alumnos en la presentacin de los principales modelos
probabilsticos por equipos en exposicin ante el grupo.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
16/221
16
Para el alumno:
Formar equipos y cada uno desarrollar y expondr ante la clase un
modelo probabilstico con aplicacin a un problema de ingeniera.
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Resolver los ejercicios propuestos en la gua.
UNIDAD VII: INTRODUCCIN A LA INFERENCIA ESTADSTICA.
Para el profesor:
Explicar los diferentes tipos de muestreo estadstico.
Sealar para qu sirve cada uno de los diferentes tipos de muestreo
estadstico.
Coordinar una sesin de preguntas y respuestas en base a una lectura
o artculo periodstico o de revista de divulgacin cientfica que involucre
inferencia estadstica.
Guiar a una discusin grupal.
Formar equipos de trabajo.
Guiar y asesorar a los equipos de trabajo para que ellos seleccionen
una muestra representativa.
Para el alumno:
Elaborar de forma individual un cuadro comparativo donde se presenten
los mtodos de muestreo, sus caractersticas y condiciones para su uso.
Discutir el cuadro comparativo de manera grupal y elaborar una
conclusin final.
Resolver los ejercicios propuestos por el profesor en clase y extra-
clase.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
17/221
17
Resolver los ejercicios propuestos en la gua.
UNIDAD VIII: PRUEBAS DE HIPTESIS.
Para el profesor:
Explicar qu es una prueba de hiptesis y para qu sirve.
Definir cada una de las medidas de variabilidad.
Diferenciar los tipos de hiptesis existentes.
Para el alumno:
Utilizar Excel para representar la prueba bilateral (2 colas), unilateral
izquierda (cola izquierda) y unilateral derecha (cola derecha).
Resolver los ejercicios propuestos por el profesor en clase y extra-clase.
Resolver los ejercicios propuestos en la gua.
Desarrollar por equipos y presentar en clase una prueba de hiptesis
aplicada a un problema de ingeniera segn preferencia del equipo.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
18/221
18
UNIDAD 1: INTRODUCCIN.
OBJETIVO: Conocer un panorama general de los fundamentos de la
estadstica y las representaciones grficas.
1.1 Definicin.
Estadstica.- La estadstica, en general, es la ciencia que trata de la
recopilacin, organizacin presentacin, anlisis e interpretacin de datos
numricos con el fin de realizar una toma de decisin ms efectiva (Ruiz
Muoz, 2004).
Para lograr este fin la estadstica se apoya en la teora de probabilidades y es
por ello que se tiene una estrecha relacin entre estos dos conceptos.
Esta se aplica en la ciencia moderna, administracin y en la vida cotidiana de
cualquier persona.
El papel fundamental de la estadstica es sin lugar a duda cuantificar la
incertidumbre.
Definicin 2.- Es un conjunto de tcnicas para la coleccin, manejo,
descripcin y anlisis de informacin, de manera que las conclusiones
obtenidas de ella tengan un grado de confiabilidad especificado (Irwin Miller,
1993).
1.2 Pasos para un estudio estadstico.
1.- Definir el tipo de proyecto a realizar:
Experimental.- Manejo de datos, existe manipulacin de datos.
Prospectivo.- Planea la investigacin y se ejecuta en un futuro
inmediato.
Retrospectivo.- Con bastante aplicacin en el mbito de la medicina. Losestudios retrospectivos se realizan basndose en observaciones
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
19/221
19
clnicas, o a travs de anlisis especiales, estos revisan situaciones
de exposicin a factores sospechosos, comparando grupos de
individuos enfermos (casos), con grupos de individuos sanos (controles).
A partir de la frecuencia observada en cada uno de los grupos expuestos
al factor en estudio se realiza un anlisis estadstico.
Longitudinal.- Aquello que se mide a lo largo del tiempo sobre la
poblacin que interesa.
Transversal.- Parecida a una encuesta, es una poblacin cambiante.
Descriptivo.- Una sola poblacin.
Comparativo.- Dos o ms poblaciones.
Se tienen que visualizar los alcances y limitaciones que se tendrn con
la investigacin que se est realizando (plantear la hiptesis).
2.- Cantidad de informacin necesaria.
3.- Forma de recoleccin.
4.- Tcnicas para adquirirla.
5.-Anlisis.
ESQUEMA 1.01 Anlisis descriptivo de los datos.
6.- Cuantificar el grado de incertidumbre mediante los principiosprobabilsticos.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
20/221
20
7.- Validacin de la hiptesis a travs de la inferencia estadstica o estadstica
inductiva que permiten llegar a conclusiones correctas.
1.3 Mtodo cientfico y estadstica.
Qu es el mtodo cientfico?
Definimos el Mtodo Cientfico como un mtodo o conjunto sistematizado de
procesos en los que se basa la ciencia para explicar cualquier fenmeno y las
leyes que los administran, las etapas de este son:
1. Formulacin de hiptesis
2. Obtencin de datos pertinentes al problema
3. Confrontacin de datos con las hiptesis
Las anteriores fases engloban el proceso de pasos de un estudio estadstico
por ello su papel es fundamental en este mtodo.
Estadstica presenta dos ramas principales:
Descriptiva.- Es un conjunto de tcnicas para la organizacin,
presentacin, grficas y clculo de cantidades representativas de un
grupo de datos (organiza y representa).
Inferencia estadstica.- Conjunto de tcnicas que permiten hacer
induccin en los que el grado de incertidumbre es cuantificable a travsde probabilidades.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
21/221
21
1.4 Poblacin y muestra.
Poblacin.- Cualquier conjunto de personas, objetos, ideas o acontecimientos
que se someten a la observacin estadstica de una o varias caractersticas
que comparten sus elementos y que permiten diferenciarlos. (AlejandroCrdoba, 2002)
Muestra.- Es la parte seleccionada de una poblacin en la que los elementos
que la componen no tienen ninguna caracterstica esencial que los distinga de
los restantes. Se utiliza cuando es necesario disponer de una parte
representativa de la
poblacin. (Alejandro
Crdoba, 2002).
En resumen: Un registro de
datos se conoce como
muestra y el conjunto de
todos los posibles registros se
le conoce como poblacin.
ESQUEMA 1.02 Proceso estadstico.
1.5 Variables y tipos de variables.
Variable.- "una variable es un smbolo, tal como X, Y, que puede tomar un
valor cualquiera de un conjunto determinado de ellos, llamado dominio de la
variable. Si la variable puede tomar solamente un valor, se llama constante."
(Murray R. Spiegel, 1992).
Es una caracterstica que al ser medida en diferentes individuos es susceptible
de adoptar diferentes valores.
Las variables segn la medicin pueden ser cuantitativas o cualitativas:
Cuantitativas.- Son las variables que se expresan mediante cantidadesnumricas.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
22/221
22
Cualitativas.- Son las variables que expresan distintas cualidades,
caractersticas o modalidad. Cada modalidad que se presenta se denomina
atributo o categora y la medicin consiste en una clasificacin de dichos
atributos. Las variables cualitativas pueden ser dicotmicas cuando slo
pueden tomar dos valores posibles como s y no, hombre y mujer o son
politmicas cuando pueden adquirir tres o ms valores.
Cuantitativas(Numricas)Kg, mts.,hrs.
Discretas(para contar)
Contnuas(para medir)
No existen posibilidades intermediasej. manzanas, habitantes.
Infinidad de valores intermedias.
ej. Estatura, espesor de hoja.
Nominales.
Jerarquizadas.
Condicin especfica del sujeto enestudio. ej. Domicilio, nacionalidad,religin.
Caracterstica de tamao u orden. ej.Chico, mediano, malo, bueno.
Cualitativas(Categoras)gero, moreno, etc..
ESQUEMA 1.03 Tipos de variables.
Ejercicio. Indica que variables son cualitativas y cuales cuantitativas.
1.- Comida Favorita.
Cualitativa.
2.- Profesin que te gusta.
Cualitativa.
3.- Nmero de goles marcados por tu equipo favorito en la ltima temporada.
Cuantitativa.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
23/221
23
4.- Nmero de alumnos de tu Instituto.
Cuantitativa.
5.- El color de los ojos de tus compaeros de clase.
Cualitativa.
6.- Coeficiente intelectual de tus compaeros de clase.
Cuantitativa
Ejemplo: La siguiente grafica representa en el eje vertical, el nmero de
personas de una poblacin con los pesos en kilogramos. Identifique losintervalos que se indican:
ESQUEMA 1.04 Clasificacin de personas por peso.
a). Entre 59 y 62 kg.
b). Mayor de 60kg.
c). Mayor o igual que 60kg.
d). Menor de 60kg.
e). Menor o igual que 60kg.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
24/221
24
Nota.- los pesos se estn considerando en kg enteros esto es un ajuste a la
medida exacta y se obtiene una variable discreta a partir de variables
continuas.
ESQUEMA 1.05 Variable discreta y continua.
La relacin entre las variables discretas y continuas es de gran importancia
dentro de la probabilidad y la estadstica.
1.6 Tabla de frecuencias
Los datos estadsticos, obtenidos de encuestas, experimentos, o cualquier
serie de medidas, son tan numerosos que virtualmente son poco tiles a menos
que se condensen en una forma conveniente.
Una tabla de distribucin de frecuencias divide los datos en un nmero
relativamente menor de clases haciendo una lista con el nmero deobservaciones que corresponden a cada clase. (Irwin Miller, 1993).
Es la forma ms comn de organizar un gran nmero de datos.
Conceptos fundamentales a conocer:
Nmero de clases.
Intervalo de la clase.
Frecuencia de elementos de cada clase
56.5 57 57.5 58 58.5 59 59.5 60 60.5 61 61.5 62 62.5
a)
b)
c)
d)
e)
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
25/221
25
Los elementos exactos
Las marcas de clase o vales representativos
Las frecuencias relativas
Las frecuencias acumuladas
Cuntas clases debern establecerse? El rango deber oscilar entre 5 y 20
clases.
La ley de Sturges determina el nmero de clases a travs de:
M= 1+ 3.3 logN
Donde
N= nmero total de datos
M= nmero de clases
Estas clases obtenidas son las recomendadas para iniciar la tabla de
frecuencias.
Cabe aclarar que en ocasiones el resultado de esta expresin es un nmero no
entero, por lo que se recomienda considerar el valor entero que ms se
aproxime a la cifra.
Calcular el rango que estas clases contendrn para agrupar los datos mismos
que se obtiene:
R=A/M = R=A/M
Donde:
R.- El rango de cada clase.
A.- La amplitud de datos.
M.- Nmero de clases.
La amplitud A.- Se define a travs de la diferencia del valor mximo menos el
valor mnimo de la coleccin de datos:A=Vmax- Vmin
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
26/221
26
Nota.- Se recomienda hacer los ajustes necesarios a fin de que el rango sea de
preferencia un nmero entero.
Con el valor del rango se definirn los valores de los lmites de cada clase.
Considerar el valor mnimo como lmite inferior y as sucesivamente hasta
llegar al lmite superior de la ltima clase, de acuerdo a las clases definidas.
Ley de parntesis.- Permite ubicar la pertenencia de un dato.
( ms del valor representado
[contiene al valor representado]
)menos del valor representado
Calcular el valor representativo o la marca de clase mediante
Donde
Li rango.- Lmite inferior del rango de la clase.
Ls rango.- Lmite superior de la clase.
Vm.- Valor medio representativo de la clase.
La distribucin de frecuencias consiste bsicamente en agrupar los valores
contenidos en la coleccin de datos de las clases ya definidas con sus
respectivos lmites.
TABLA 1.01 Edades recolectadas.
39 45 29 39 28 33
35 36 41 27 32 34
44 55 38 39 41 28
28 37 35 27 36 44
43 40 30 34 36 50
37 32 34 41 51 44
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
27/221
27
Ejemplo: Edades de 36 profesores de una facultad.
Calcular el nmero de clases recomendables para el diseo de la tabla de
frecuencias:
M= 1+3.3 Log N
N= 36
M= 6.13 = 6 clases
Clculo del rango o ancho de clase: R
Determinar la amplitud A:
A= 55-27=28
R= A/M = 28/6 = 4.66 = 5
Definir los lmites:
El lmite inferior estar asociado al valor mnimo.
Clase Rango-intervalo Xm
1 [27-32] 29.5
2 [32-37] 34.5
3 [37-42] 39.5
4 [42-47] 44.5
5 [47-52] 49.5
6 [52-57] 54.5
TABLA 1.02 Clasificacin por clases.
Definir el valor representativo (*) el valor que representara a cada clase en
todos los clculos.
Clasificar los datos en funcin de su valor, esto es ubicar los valores en la clase
que le corresponda.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
28/221
28
Conteo.
Obtener la frecuencia fi.- Es la cantidad de datos que pertenecen a
determinada clase.
Obtener la frecuencia relativa.- A la proporcin de valores que caen dentro de
un intervalo de clase se le denomina frecuencia relativa de ocurrencia (Daniel,
1987).
Fri= fi/N
Calcular la frecuencia acumulada.- fai.- Es el total acumulado hasta cada clase.
Evaluar la frecuencia relativa acumulada fari.- Es la proporcin o porcentualacumulado por cada clase.
xm conteo Fi fri fai Frai
1 29.5 IIII/IIII 9 0.25 9 0.25
2 34.5 IIII/IIII/I 11 0.30 20 0.55
3 39.5 IIII/III 8 0.22 28 0.774 44.5 IIII/ 5 0.14 33 0.91
5 49.5 II 2 0.06 35 0.97
6 54.5 I 1 0.03 36 1
36 1
TABLA 1.03 Frecuencias.
1.7 Grficos.- Valen ms que mil palabras
En comparacin de los datos que son ms difciles de comprender, las graficas
permiten una visualizacin integral del comportamiento de los datos de forma
ms objetiva.
Los grficos son representaciones visuales que emplean smbolos, barras,
polgonos y sectores, de los datos contenidos en tablas de frecuencias. (Vctor
Quesada, 2007).
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
29/221
29
Las ms comunes son: histograma, polgono, pastel, la ojiva, y el de cajas y
ejes, entre otras.
Histograma.- La grfica de la izquierda se denomina histograma; las alturas
de los rectngulos son proporcionales a las probabilidades correspondientes ylas bases se tocan en tal forma que no hay espacios vacos entre los
rectngulos que representan los valores sucesivos de la variable aleatoria. La
grfica de la derecha se denomina diagrama de barras, las alturas de los
rectngulos tambin son proporcionales a las probabilidades correspondientes,
pero son angostos y su ancho no tiene ningn significado.(Jos Muoz, 1987).
Histograma
0 1 2 3
0.1
0.2
0.3
0.4
0.5
x
f(x)
Diagrama de barras
0 1 2 3
0.1
0.2
0.3
0.4
0.5
x
f(x)
Grficas de distribucin de probabilidad
FI-UAQ
ESQUEMA 1.06 Comparacin histograma y diagrama de barras.
Polgono de frecuencias.- En l las frecuencias de clase son graficadas sobre
las marcas de clase, esto es, graficamos los puntos donde es lamarca de la clase de la i-sima clase y es la frecuencia correspondiente y lospuntos sucesivos son unidos por medio de lneas rectas despus de haber
agregado clases con frecuencia cero en los puntos lmite de la
distribucin.(Jos Muoz, 1987).
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
30/221
30
Grfica de pastel.- Si las frecuencias se expresan en porcentajes y stos
totalizan el 100%, el pastel o diagrama circular constituye un mtodo de
representacin adecuado. (G. Berry,1997).
FI-UAQ
25 %
18 % 8 %
12 %
4 %
18 %
GRFICA DE PASTEL
16 %
Ventas
Hugo
Juan
Alex
Mary
Jos
Lidia
Miriam
ESQUEMA 1.07 Grfica de pastel.
Ojiva o curva S.- Las distribuciones acumuladas por lo general se presentan
grficamente en forma de ojivas, lo cual es similar a los polgonos de
frecuencia, excepto en que graficamos las frecuencias acumuladas sobre las
fronteras de clase en lugar de graficar las frecuencias ordinarias sobre las
marcas de clase. Los puntos as determinados se unen otra vez mediante
segmentos rectilneos, como se muestra en la figura. (Jos Muoz, 1987).
.
Emisin de xido de azufre (tons)
4.95
f(x)
Ojiva
20
40
60
80
8.95 12.95 16.95 20.95 24.95 28.95 32.95
frecuenciaacumulada
FI-UAQ
ESQUEMA 1.08 Ojiva.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
31/221
31
Cajas y ejes.- Diagrama basado en cuartiles. Proporciona una visin general
de la simetra de la distribucin de los datos. En un solo eje se representa los
valores mnimo y mximo, la primera y tercera cuartila y la mediana. Si lamedia no est en el centro del rectngulo eso significa que la distribucin no es
simtrica. (Walter A. Rodrguez, 2008).Ejemplo de representacin horizontal.
FI-UAQ
24.520 33.5 39 45
Q 1X mn Q 2 Q 3 X mx
CAJAS Y EJES
ESQUEMA 1.09 Cajas y ejes, representacin horizontal.
FI-UAQ
Atpicos
50 % 95 %
Aosestudiados
Extremos0
10
15
20
Mediana
5
ESQUEMA 1.10 Cajas y ejes, representacin vertical
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
32/221
32
UNIDAD 2 ESTADSTICA DESCRIPTIVA.
OBJETIVO: Estudiar y analizar los elementos bsicos para describir patrones
generales y derivaciones de stos en un conjunto de datos especficos.
2.1 Definicin y parmetros estadsticos.
Los registros u observaciones efectuados proporcionan una serie de datos que
necesariamente deben ser ordenados y presentados de una manera inteligible.
La Estadstica Descriptiva desarrolla un conjunto de tcnicas cuya finalidad espresentar y reducir los diferentes datos observados. (Santiago Fernndez,
2002).
Mtodos tabulares y grficos.- Tabla de frecuencia, histograma, polgono, la
curva S, cajas y ejes y pastel.
Medidas descriptivas.-
Medidas de tendencia central.
Media, mediana, moda.
Medidas de dispersin.
Amplitud, varianza, desviacin estndar, coeficiente de variacin.
Medidas de posicin.
Cuartiles, centiles, deciles, sesgo, curtosis.
Medidas de asociacin se desarrollan en el Capitulo 3.
.-SIGMA.- indica la operacin de suma
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
33/221
33
As=
n
i
Xi
1
; es la suma de los nmeros :
2.2 Medidas de tendencia central.
Son indicadores estadsticos que muestran hacia qu valor (o valores) se
agrupan los datos. (Vctor Quesada, 2007).
Son tambin llamadas medidas de ubicacin y son las que refieren las medidas
que se sitan o tienen la tendencia a situarse en la parte central de la
distribucin de los datos.
Media ().- Es el promedio aritmtico de un grupo de datos que se determinamediante la suma de los valores de los datos, dividida por el nmero de
valores.
Dados los nnmeros , la media aritmtica se define simplementecomo:
Donde
.- media muestral..- suma de los valores.
n.- nmero de datos de la muestra.
Desventaja.- La media por ser un punto de equilibrio de los datos, es muy
sensible a la presencia de observacin extrema.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
34/221
34
Ejemplo.- Se presentan los volmenes de venta de energa elctrica en una
agencia por cada da durante 13 das, dado el valor en miles de pesos. Calcular
el promedio de ventas durante el periodo.
7, 5, 8, 9, 6, 10, 9, 4, 5, 6, 7, 6, 6
Media para datos agrupados:
Ejemplo.- Calcular la media de los datos agrupados de la tabla de frecuencia
dada.
Mediana.- Es el valor central de mis datos, y se utiliza cuando existe asimetra
en la distribucin y en este caso la media no sera una buena medida de
tendencia central, ya que por ser el punto de equilibrio de los datos resulta muy
afectada por los valores extremos.
Mediana Me= .- Es el conjunto de nmeros ordenados de menor a mayor ydonde se ubicara el valor que se encuentre a la mitad.
Si n es un nmero non, solo habr un valor central si n es un nmero par habr
dos valores compatibles y la x se obtiene al calcular la media de estos.
Ejemplo: Calcular la mediana de los datos mostrados.
7 5 8 9 6 10 9 4 5 6 7 6 6
4 5 5 6 6 6 6 7 7 8 9 9 10
Observa el comportamiento con un valor extremo de los datos anteriores:
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
35/221
35
Por lo tanto la mediana representa el 50% de mi informacin
La mediana para datos agrupados: se localiza en aquella clase donde esta el
50% de mis datos. Para encontrar la clase de la mediana se deber observar la
frecuencia relativa acumulada e identificar aquella clase que agrupe el 50% demis datos y definirla en funcin de su valor para asignar Llc, M de clase LSc.
Moda:.- Es el valor (si existe) que ocurre con mayor frecuencia, si este valores nico se conoce como unimodal en caso de que se presenten 2 o ms
valores con la misma frecuencia mxima se dice que es bimodal o trimodal.
La moda es una medida de tendencia central poco usada debido a que puede
no existir o a menudo no es un valor nico.
Ejemplo: 7, 5, 8, 9, 6, 10, 9, 4, 5, 6, 7, 6, 6
La moda es
su frecuencia es 4
Para calcular la moda en datos agrupados solo se identificara la clase que
tenga mayor frecuencia y esta ser la clase modal y se asignara para ello la
marca de clase.
Cuando la distribucin de frecuencia es simtrica la ,,coincidirn.Ejemplo.- Sean las horas de trabajo empleados para realizar una encuesta.
6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1, 10.8,
Calcular, ,: , ,
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
36/221
36
Al comparar las medidas de tendencia central se pueden presentar 3 casos.
.- En este caso se dice que tiene asimetra hacia la derecha, esto esque el histograma o polgono de frecuencia presenta una cola extendida hacia
la derecha.
Ejedesime
tra.
Curva de asimetra positiva.
FI UAQ
ESQUEMA 2.01 Asimetra positiva.
Si la relacin se invierteAhora si.- la distribucin es simtrica
Curva simtrica
FI.UAQ
ESQUEMA 2.02 Curva simtrica.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
37/221
37
Ancdota para reflexionar en clase:
Confundir media y mediana, es una moda?
A B
Media
Media
medianamoda
FI-UAQ
ESQUEMA 2.03 Ilustracin media, mediana y moda.
En una nota informativa se encontr el comentario de un presidente
con el subsiguiente comentario burln del periodista. Quin estaba
ms errado?
El presidente se ha mostrado muy consternado al comprobar
el resultado de una estadstica fiable, segn la cual la mitad de
los ciudadanos tiene una inteligencia por debajo de la media.
No soy capaz de recordar si era inteligencia, nivel cultural u otra cosa similar,
en todo caso era una cualidad positiva la que se estaba midiendo. El resto de la
noticia era una mofa hacia el compungido presidente, que se poda resumir as:
Qu burro el presidente, no sabe que por definicin de la media, eso debeocurrir necesariamente!
Es una confusin muy comn. Adems socialmente es muy excusable. Hoy en
da es incluso de buen tono exhibir ignorancia en cuestin de nmeros, y no
digamos de estadsticas. Es sin embargo ah donde nos engaan todos los
das. El anumerismo (de los dems, claro est) es una de las mejores
herramientas de manipulacin.
http://tiopetrus.blogia.com/2003/100301-confundir-media-y-mediana-es-una-moda-.phphttp://tiopetrus.blogia.com/2003/100301-confundir-media-y-mediana-es-una-moda-.phphttp://tiopetrus.blogia.com/2003/100301-confundir-media-y-mediana-es-una-moda-.php7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
38/221
38
En el caso que nos ocupa, a mi no me queda claro que la estulticia presidencial
estuviera por encima de la media, ni que la del comentarista estuviera por
debajo.
Para empezar, debiera comentar que la intuicin no es una herramienta de fiaren matemticas. Es tan importante como la inspiracin en los poetas, pero no
ms. No creo que con inspiracin se pueda componer una gran obra, sino con
mucho trabajo y sudor. Posiblemente el presidente caa en un error, pero el
comentarista caa en otro con total certeza. Vamos a explicarlo. Debido a una
cosa muy interesante y muy profunda de la que me gustara hablar mas
adelante y que se llama el Teorema central del lmite, estamos acostumbrados
a las distribuciones simtricas, como la de la figura A. En ellas coincide lamedia (que todo el mundo sabe lo que es), la moda (que es el valor con mayor
frecuencia observado) y la mediana, que es el valor que deja tantas
observaciones por arriba como por debajo. Si la distribucin no es simtrica,
tenemos situaciones como la de la figura B. La media est desplazada respecto
a las dems medidas centrales, y es claro que en este segundo caso ms de la
mitad de la poblacin est por debajo de la media. Siempre ser la mediana,
por su propia definicin la que estar centrada respecto al nmero deobservaciones a ambos lados, no la media.
Tena nuestro hipottico presidente motivos de pesar?
Pues segn se mire, s. Si la distribucin hubiera sido asimtrica en sentido
contrario a la de la figura B, ms de la mitad de la poblacin hubiera tenido una
inteligencia, cultura o educacin superior a la media, puesto que la mediana
sera de valor superior a la media. Esto supone un desplazamiento de la masa
total hacia valores ms altos, y es claramente positivo para la poblacin, si el
parmetro que se mide es una cualidad positiva para la misma. Eso no se
produca, pues la noticia implicaba una distribucin simtrica.
Se refera a eso el presidente?
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
39/221
39
Lo dudo.
Tena motivos de mofa el comentarista? Pues realmente, si los tena no era
por lo que l crea... HISTORIAS MATEMTICAS. Jess M. Landart.
2.3 Medidas de dispersin.
Las medidas anteriores no son suficientes para caracterizar la forma en que se
distribuye la informacin.
Este es el otro aspecto a considerar que debe tomarse en cuenta que es la
variabilidad de las observaciones.
Medidas de dispersin.- Son medidas que describen la variacin o variabilidad
de una coleccin de datos en funcin de sus valores medios.
Se clasifican en:
Amplitud, varianza, desviacin estndar y coeficiente de variacin.
Ejemplo.- Se tienen las dos muestras de una misma poblacin, calcular las
medidas de tendencia central.
A.- 0, 4, 5, 8, 11, 12, 16, 16, 0, 5, 5, 8, 8, 11, 11, 16, 17, 8, 8,
B.- 8, 8, 8, 10, 11, 7, 5, 6, 9, 3, 5, 6, 7, 9, 11, 13, 13, 16, 18
Medidas de tendencia
central A B
8.9 9.1 8 8 8 8
TABLA 2.01 Media, mediana y moda.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
40/221
40
Las medidas de dispersin nos ayudan a conocer que tan homogneos son los
datos, que tan variables son, que tan densos o que tan dispersos se
encuentran nuestros datos.
Amplitud, ventaja la facilidad con la que se calcula y es la diferencia entra lasobservaciones de mayor y menor valor numrico de nuestros datos.
La comparacin de cada uno de nuestros datos con la media=desviacin
media: es la suma del valor absoluto de las diferencias de cada valor respecto
de la media y se divide entre el nmero de datos, con esto se obtiene el
promedio de las diferencias de cada valor respecto a la media.
La desviacin media se representa por | | | | | |
| |
Varianza.- Es la media aritmtica del cuadrado de las desviaciones respecto a
la media de una distribucin estadstica.
La varianza se representa por
Caracterstica es que esta medida de dispersin no presenta su valor en las
unidades de la muestra por ello se emplea la medida de dispersin ms
utilizada que es:
Desviacin estndar: que es la raz cuadrada de la varianza.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
41/221
41
Ejemplo: Calcular la amplitud, la desviacin media, la varianza y la desviacin
estndar, para los pesos en Kg reportados de una muestra de 10 personas.
63, 52, 78, 49, 71, 62, 68, 48, 56, 67,
Ampli tud=30 s2=99.6 s= 9.98
Para datos agrupados:
Varianza: Varianza para datos agrupados
Desviacin estndar:
Calcular las medidas anteriores para los datos del ejemplo de la tabla de
frecuencia
Ejemplo: Determinar la desviacin estndar de las ventas de energa en miles
de pesos, de dos agencias cuyos datos son los siguientes:
Agencia A: 20, 16, 17, 16, 21
Agencia B: 18, 17, 18, 19, 18
SA= 2.0976 SB=O.6325 Ambas agencias tienen el mismo promedio de ventas pero la agencia B sus
ventas son ms estables, lo que se refleja en su S menor.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
42/221
42
Ejemplo: los siguientes datos representan los pesos y estaturas de estudiantes
de ingeniera.
Calcular las medidas de tendencia central y las medidas de
dispersin vistas.
Existe una regla emprica que relaciona la S con la
distribucin de una curva normal, esto es que los datos estn
uniformemente distribuidos a lo largo de la curva, mismo que
se hizo teorema que es actualmente uno de los ms
importantes de la estadstica.
Teorema de Tchebysheff
Si al valor de la media se le suma y se le resta el valor de S,
se tiene que dentro de esa rea est comprendido el 68.21%
de los datos.
Si al valor de la
, se le suma y resta 2 veces el valor de la S
se tendr el 95.46% de los datos.
TABLA 2.02 Pesos y estaturas. %Si al valor de la , se le suma y resta 3 veces el valor de la S, se tendr el99.73% de los datos.
%
Este teorema nos puede dar una idea de cunto va a valer la desviacin
estndar
Se garantiza que en 4S se tendr el 100% de todos los datos.
KG. CM.
1 63 162
2 52 158
3 78 167
4 49 151
5 71 162
6 62 168
7 68 167
8 48 153
9 58 152
10 67 173
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
43/221
43
Coeficiente de variacin.- C.V. Es un valor relativo expresado en porcentaje y
ayuda a comparar dos poblaciones o muestras, a fin de observar que tanto
vara una de otra. Esto es dos colecciones de datos pero relacionados con la
misma variable. El C.V. es tpicamente menor que 1.
En forma algebraica se expresa:
Ejemplo.- Calcular el coeficiente de variacin de los pesos y estaturas e indica
cual de los dos tiene mayor variacin.
CvX=16.25% Cvy=4.7%
Los pesos tienen una mayor variabilidad en las 10 personas consideradas.
Ejemplo.- En un proceso de certificacin, dos auditores A y B realizan
auditorias a diferentes facultades en periodos y tiempos iguales, despus de
tomar los datos y realizar un anlisis estadstico se llego al siguiente resultado:
el auditor A obtuvo un promedio de registros errneos auditados de 300 y una
S=10, el auditor B tuvo un promedio de registros errneos auditados de 150 y
una S= 9. Cul de los dos nos dar mayor certidumbre en la certificacin?
Va= 10/300=0.033
Vb= 9/150= 0.06
El B tiene mayor variacin que A.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
44/221
44
2.4 Medidas de posicin.
Determina la conformacin geomtrica de las distribuciones mostradas en un
polgono de frecuencias, su importancia radica en conocer cmo se comportan
los datos motivo de estudio a travs de las curvas de distribucin.
Cuartiles, centiles, y deciles.- Son medidas de posicin ms finas dentro de la
muestra.
Cuartiles.- Es la coleccin de datos dividida en cuatro partes y se obtiene su
ubicacin o posicin de estos por analoga el Q2= mediana cuyo valor se sita
justo a la mitad de los datos ordenados.
A
0
B
100%
Q1
25%
Q2 Q3
50% 75%
ESQUEMA 2.04 Cuartiles.
Deciles. Son los cuantiles que dividen una distribucin en 10 tantos o
intervalos, por lo que se tienen 9 puntos de divisin, los deciles, que originan
los 10 intervalos.
Los deciles, que se representan por y pueden ser marcados en una grficacomo la siguiente:
A
0
D1
10%
D2
20%
D3
30%
D4
40%
D5
50%
D6
60%
D7
70%
D8
80%
D9
90%
B
100%
ESQUEMA 2.05 Deciles.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
45/221
45
Centiles es la coleccin de datos dividida en cien partes, cada una de ellas
corresponde a un centil, por lo que se tienen 100 centiles, as, el centil 50 es
igual a la mediana.
La determinacin de los centiles se realiza mediante la expresin siguiente.
Donde
Cx.-Centil que se desea calcular.
X.- Nmero del centil.
L.- Lmite inferior de la clase.
I.- Amplitud del rango de la clase del centil.
N.- Nmero de datos.
100.- Cien centiles.
F.- Frecuencia acumulada de la clase anterior a la clase del centil.
Fi.- Frecuencia de la clase que contiene al centil.
Para identificar la clase que contiene al centil se emplea la relacin.
Y el resultado se buscara en la frecuencia acumulada el primer valor mayor al
obtenido y esta ser la clase del centil.
Para el clculo de los cuartiles se emplea una expresin anloga de la forma
siguiente.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
46/221
46
Donde
Qx.-Cuartil que se desea calcular.
X.-Nmero del cuartil.
N.-Nmero de datos.
I.- Amplitud del rango de la clase del cuartil.
L.- Lmite inferior de la clase del cuartil.
F.- Frecuencia acumulada de la clase anterior a la clase del cuartil.
Fi.- Frecuencia de la clase del cuartil.
QiQ3.- Es el rango intercuartlico rango intercuartil.
2.5 Asimetra y apuntamiento.
Sabemos cmo calcular valores alrededor de los cuales se distribuyen las
observaciones de una variable sobre una muestra y sabemos cmo calcular ladispersin que ofrecen los mismos con respecto al valor de central. Nos
proponemos dar un paso ms all en el anlisis de la variable. En primer lugar,
nos vamos a plantear el saber si los datos se distribuyen de forma simtrica
con respecto a un valor central, o si bien la grfica que representa la
distribucin de frecuencias es de una forma diferente del lado derecho que del
lado izquierdo.
Si la simetra ha sido determinada, podemos preguntarnos si la curva es ms o
menos apuntada (larga y estrecha). Este apuntamiento habr que medirlo
comparado a cierta distribucin de frecuencias que consideramos normal (no
por casualidad es ste el nombre que recibe la distribucin de referencia).
Estas ideas son las que vamos a desarrollar en lo que resta del captulo.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
47/221
47
Para saber si una distribucin de frecuencias es simtrica, hay que precisar con
respecto a qu. Un buen candidato es la mediana, ya que para variables
continuas, divide al histograma de frecuencias en dos partes de igual rea.
Podemos basarnos en ella para, de forma natural, decir que una distribucinde frecuencias es simtrica si el lado derecho de la grfica (a partir de la
mediana) es la imagen por un espejo del lado izquierdo.
Me Me
Cola
FI-UAQ
ESQUEMA 2.06 Distribucin de frecuencias simtrica y asimtrica.
Cuando la variable es discreta, decimos que es simtrica, si lo es con respectoa la media.
Observacin.
Se podra pensar que definir la simetra usando la mediana para
variables continuas y usando la media para variables discretas es una
eleccin arbitraria. En realidad esto no es as, pues si una variable es
continua, coinciden ambos criterios de simetra (con respecto a la mediay a la mediana). Es ms, se tiene que media y mediana coinciden para
distribuciones continuas simtricas. Por otro lado, en el caso de
variables discretas, la distribucin es simtrica si el lado derecho del
diagrama se obtiene por imagen especular desde la media. En este caso
coincide la media con la mediana si el nmero de observaciones es
impar.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
48/221
48
Si la variable es continua simtrica y unimodal, coinciden la media, la
mediana y la moda.
Dentro de los tipos de asimetra posible, vamos a destacar los dos
fundamentales:
Asimetra positiva:
Si las frecuencias ms altas se encuentran en el lado izquierdo de la media,
mientras que en derecho hay frecuencias ms pequeas (cola).
Asimetra negativa:
Cuando la cola est en el lado izquierdo.
MeMe
Asim. positiva Asim. negativa
FI-UAQ
ESQUEMA 2.07 Asimetra positiva y negativa.
Cuando realizamos un estudio descriptivo es altamente improbable que ladistribucin de frecuencias sea totalmente simtrica. En la prctica diremos que
la distribucin de frecuencias es simtrica si lo es de un modo aproximado. Por
otro lado, an observando cuidadosamente la grfica, podemos no ver claro de
qu lado estn las frecuencias ms altas. Conviene definir entonces unos
estadsticos que ayuden a interpretar la asimetra, a los que llamaremos
ndices de asimetra, y que denotaremos mediante . Vamos a definir acontinuacin algunos de los ndices de asimetra ms usuales como son el
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
49/221
49
ndice basado en los tres cuartiles, el momento de tercer orden y la distancia
entre la moda y la media o la media y la mediana.
Sesgo o Skewness.- Determina el grado de asimetra de la curva o polgono de
frecuencia. Si esta curva tiene la cola ms larga hacia la derecha se dice quetiene sesgo positivo o que est cargada hacia la derecha. Si la cola ms larga
la tiene hacia la izquierda se dice que tiene un sesgo negativo o que est
cargada hacia la izquierda.
Para determinar el valor del sesgo se emplea la expresin siguiente:
Si el sesgo = es una curva o simtrica
Curva simtrica.
Ejedesimetra.
FI-UAQ
ESQUEMA 2.08 Curva simtrica.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
50/221
50
Si el sesgo (-).- Entonces est cargada a la izquierda.
Curva de asimetra negativa.
E
jedesimetra.
FI-UAQ
ESQUEMA 2.09 Curva asimtrica negativa.
Si el sesgo (+).- Entonces est cargada a la derecha.
Ejedesimetra.
Curva de asimetra positiva.
FI UAQ
ESQUEMA 2.10 Curva asimtrica positiva
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
51/221
51
Nota.- El valor ms cercano a 0 tiende a la normal, por lo que el grado de
asimetra es menor que aquel que se aleja del cero. No importa el valor del
sesgo sino el sentido.
Ejemplo.- Tiempo aceptable en contrato y puesta en servicio de la luz. (Hastasu conexin).
El sesgo ayuda a definir especificaciones o niveles, mnimos mximos o
deseables.
Coeficiente de apuntamiento o Curtosis (K)
Determina el grado de pronunciamiento de la cspide de la curva o polgono de
frecuencias o histograma es una medida de Picudez
La interpretacin del resultado est dada: cuando
K= 0.26 curva mesocrtica forma: regular
Curva mesocrticaFI-UAQ
ESQUEMA 2.11 Curva mesocrtica.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
52/221
52
K= < 0.20 curva leptocrtica forma: punta
Curva leptocrtica.FI-UAQ
ESQUEMA 2.12 Curva leptocrtica.
K > 0.26 curva platicrtica forma: plana
Curva platicrtica. FI-UAQ
ESQUEMA 2.13 Curva platicrtica.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
53/221
53
Para determinar el valor se usa la expresin siguiente:
Donde:
K.- coeficiente de Curtosis
Q3.- Cuartil 3.
Q1.-Cuartil 1.
C90.- Centil noventa o percentil 90.
C10.- centil 10 o percentil 10
Ejemplo analizar las 72 lecturas del consumo de energa en industrias por hora
en Watts.
Xi F F
1 27-31 29 16 16
2 31-35 33 17 33
3 35-39 37 20 53
4 39-43 41 10 63
5 43-47 45 6 69
6 47-51 49 2 71
7 51-55 53 1 72
TABLA 2.03. Consumo de energa.
Calcular:
M de tendencia central
M de dispersin
M de posicin o de forma
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
54/221
54
UNIDAD 3: REGRESIN Y CORRELACIN.
OBJETIVO: Estudiar y analizar el comportamiento de dos o ms muestras.
La credibilidad de cualquier inferencia realizada utilizando la metodologa
estadstica depende fuertemente de que se cumplan las suposiciones bajo las
cuales se derivan las tcnicas usadas.(Infante y Zrate de L, 1990).
3.1 Diagrama de dispersin:
Se usan en el anlisis de correlacin dentro de las tcnicas estadsticas para
identificar la relacin que existe entre dos variables.
Cuando se trata del anlisis de dos variable se llama anlisis bivariado
Por lo tanto el anlisis de correlacin ser un anlisis de ese tipo.
Al analizar el comportamiento de dos variables y se muestra a travs del
diagrama de dispersin que, una variable tiene influencia sobre a otra se dice
que existe correlacin, desde el punto de vista matemtico una variable es
dependiente y la otra ser independiente.
Ejemplo. Si se tiene un terreno, donde se tienen plantados determinados tipos
de vegetales, stos son alimentados con una mnima cantidad de agua que
constantemente produce bajo rendimiento en la cosecha. Si a esta plantacin
se le suministra una mayor cantidad de agua, la cosecha tendr un rendimiento
mayor dado que el agua es un elemento indispensable para el crecimiento de
los vegetales. Si incrementamos el volumen de agua an mas se observar
que el rendimiento de la cosecha se incrementar, (Entendemos que existe un
punto de equilibrio en el suministro de agua, de lo contrario podemos caer en el
error de suministrar agua en exceso e inundar la plantacin, situacin negativa
para la cosecha).
De lo anterior se deduce que la variable volumen de agua tiene influencia sobre
la variable rendimiento de la cosecha, por lo tanto existe una correlacin, una
forma de demostrarlo es construyendo el diagrama de dispersin, tomando
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
55/221
55
datos de la variable volumen de agua (x) y datos de la variable rendimiento de
la cosecha (y).
Se construye una tabla donde se muestra los pares ordenados y se grafican
dentro de un eje de coordenadas mostrando slo los puntos de stos.
Y los resultados posibles de un diagrama de dispersin son:
x
y
No hay correlacin.
x
Hay correlacin positiva.
x
Hay correlacin negativa.
x
y
A. Correlacin perfecta negativa (-)B. Correlacin perfecta positiva (+).
A B
ESQUEMA 3.01 Diagramas de dispersin.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
56/221
56
3.2 Covarianza.
El anlisis de covarianza es una tcnica que combina los aspectos del anlisis
de varianza y de regresin, el cual consiste en elegir una o ms variables
adicionales o covariables que estn relacionadas con la variable respuesta. Lasobservaciones concomitantes pueden ser usadas para incrementar la precisin
de las comparaciones de tratamientos, previendo que las observaciones
concomitantes y las observaciones principales sobre las unidades
experimentales, pudiesen estar correlacionadas. (Cox, 1958).
Si Sxy> 0 hay dependencia directa (positiva), es decir, a grandes valores de
x corresponden grandes valores de y.
Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una
relacin lineal entre las dos variables estudiadas. Es decir, puede
directamente no haber relacin entre las variables, o bien existir una
relacin no lineal.
Si Sxy< 0 hay dependencia inversa o negativa, es decir, a grandes valores
de x corresponden pequeos valores de y.
Otro coeficiente ms usado y que se apoya en la covarianza es el coeficiente
de correlacin (r) que se calcula de la forma siguiente.
( )
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
57/221
57
Donde:
Scxy= covarianza
Donde:
r = coeficiente de correlacin serial
Scxy= Suma de cuadrados de xy (covarianza)
Scx= suma de cuadrados de x
Scy= suma de cuadrados de y
N= nmero de pares ordenados (pares de datos x, y)
3.3 Correlacin.
La correlacin indica la fuerza y la direccin de una relacin lineal entre dos
variables aleatorias. Se considera que dos variables cuantitativas estn
correlacionadas cuando los valores de una de ellas varan sistemticamente
con respecto a los valores homnimos de la otra: si tenemos dos variables (A y
B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B
y viceversa. La correlacin entre dos variables no implica, por s misma,
ninguna relacin de causalidad.
La relacin entre dos variables cuantitativas queda representada mediante la
lnea de mejor ajuste, trazada a partir de la nube de puntos. Los principales
http://es.wikipedia.org/wiki/Variable_aleatoriahttp://es.wikipedia.org/wiki/M%C3%ADnimos_cuadradoshttp://es.wikipedia.org/wiki/M%C3%ADnimos_cuadradoshttp://es.wikipedia.org/wiki/Variable_aleatoria7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
58/221
58
componentes elementales de una lnea de ajuste y, por lo tanto, de una
correlacin, son la fuerza, el sentido y la forma:
La fuerza extrema segn el caso, mide el grado en que la lnea
representa a la nube de puntos: si la nube es estrecha y alargada, se
representa por una lnea recta, lo que indica que la relacin es fuerte; si
la nube de puntos tiene una tendencia elptica o circular, la relacin es
dbil.
El sentido mide la variacin de los valores de B con respecto a A: si al
crecer los valores de A lo hacen los de B, la relacin es positiva; si al
crecer los valores de A disminuyen los de B, la relacin es negativa.
La forma establece el tipo de lnea que define el mejor ajuste: la lnea
rectal, la curva monotnica o la curva no monotnica.
Una vez construido el diagrama de dispersin y bajo el criterio de
comportamiento podremos decir si existe correlacin y de qu tipo o
simplemente no hay correlacin.
Si hay correlacin es necesario conocer que tanta correlacin existe, que me
permita tomar decisiones sobre la variable independiente y que logre buenos
resultados sobre la variable dependiente.
El resultado del coeficiente de correlacin r se basa en las siguientes
propiedades:
-Su valor se encuentra entre -1 y 1
-Si es mayor, ejemplo 1.3, indica que algo anda mal
-Si es mayor a indica que las variables crecen o decrecensimultneamente.
http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_no_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_no_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=17/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
59/221
59
-Si es menor a indica que cuando una crece la otra decrece yviceversa.
-Si su valor es aproximadamente 1 -1 existe una alta asociacin
entre las dos variables.
Anlisis de los parmetros anteriores
0
-0.7
-1
0.7
1
NULA CORRELACIN.
MALA CORRELACIN.
ALTA CORRELACIN. ALTA CORRELACIN.
Conclusin.- para un valor de r muy cercano a 1 -1 se tendr alta
correlacin entre las variables X y Y.
Ejemplo: En una planta generadora se cuenta con un grupo de motores que
con el paso del tiempo se registro su antigedad y los costos de mantenimiento
dan los resultados siguientes en miles de pesos:
MOTORES
Antigedad
(aos)
Costo de
Mantenimiento
1 8 276
2 9 543
3 3 69
4 5 120
5 8 378
6 6 246
7 7 351
8 4 147
9 3 192
10 11 423
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
60/221
60
11 5 330
12 10 315
13 11 543
14 10 456
TABLA 3.01 Registro de antigedad y mantenimiento.
Calcular el coeficiente de correlacin lineal y demostrar que tanta correlacin
existe entre estas 2 variables.
Resultados
AntigedadX Costo Y xy 100 4389 36009 820 1665099
Scxy= 4659
Scx= 105.71
Scy= 289147.50
Al sustituir los resultados anteriores en la ecuacin de rse obtuvo el
valor de:
COEFICIENTE DE CORRELACIN En conclusin se tiene una alta correlacin.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
61/221
61
ESQUEMA 3.02 Diagrama de dispersin.
3.4 Regresin lineal simple.
Con el fin de tener la posibilidad de hacer predicciones o estimacin sobre una
muestra de datos, se calcular y construir la recta de mejor ajuste,
empleando el anlisis de regresin lineal.
Para realizar dichas estimaciones es necesaria la construccin de la recta de
mejor ajuste cuya ecuacin es la siguiente:
DONDE:
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
62/221
62
Para conocer las constantes y se emplean las ecuaciones siguientes:
Para el ejemplo anterior tenemos:
Con las constantes determinadas tenemos que la recta de mejor ajuste ser:
Conociendo la ecuacin de la recta se podr construir esta asignando valores a
la variable dependiente (X) Y se obtiene el valor de la variable Y.
Si
x=2
Y=-1.2976 + 44.072(2)
Y= 86.8456
Si x=12
Y= -1.2976 + 44.072 (12)
Y= 527.56185
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
63/221
63
Los valores de x fueron asignados de acuerdo a la coleccin de datos y se
toman solo dos valores que son suficientes para construir la recta considerando
como aprecio los valores extremos que son 2 y 12 como caso postular de estacoleccin.
Se procede a construir la grafica en el diagrama de dispersin dando el
resultado siguiente:
ESQUEMA 3.03 Recta de regresin.
Ya con la recta trazada, es posible realizar algunas predicciones con base a los
resultados Ejemplo: si se tiene la entrada de un equipo con 8.7 aos de
antigedad podemos a travs de la recta estimar cual ser el costo de
mantenimiento, mediante la grafica anterior:
1.- Ubicar la edad 8.7 y trazar una recta hasta intersecar la recta de ajuste.
2.- A partir del punto de interseccin se traza otra lnea hacia la izquierda al eje
de mantenimiento.
3.- El punto donde cruza ser el costo especfico para la edad del equipo que
result 382.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
64/221
64
El resultado se conoce como una estimacin y es evidente que el resultado no
tendr la exactitud deseada, pero se considera aceptable como estimacin.
Ejercicio 1. Los datos siguientes fueron tomados de un estudio donde se
usaron mezclas de gasolina y una gasolina reformulada.
Motor 1 2 3 4 5 6 7 8 9 10
Edad 0 0 2 11 7 16 9 0 12 4
Base 1.72 4.38 4.06 126 531 57 337 344 74 124
Reformada 1.88 593 554 267 653 74 494 489 69 142
TABLA 3.02 Registro del tipo de gasolina.
Construir la grafica de dispersin y discutir en clase.
Ejercicio 2. La corrosin de las barras de acero de refuerzo es el problema de
durabilidad ms importante para las estructuras de concreto reforzado. La
carbonatacin del concreto resulta de una reaccin qumica que disminuye el
valor del pH lo suficiente para iniciar la corrosin de las barras.
Datos.
X.- Profundidad de la carbonatacin (mm).
Y.- Resistencia (MPa).
Los datos son de una muestra tomada de un determinado edificio.
x 8 15 16.5 20 20 27.5 30 30 33
y 22.8 27.2 23.7 17.1 21.5 18.6 16.1 23.4 13.4
x 38 40 45 50 50 55 55 59 65
y 19.5 12.4 13.2 11.4 10.3 14.1 9.7 12 6.8TABLA 3.03 Registro de carbonatacin y resistencia.
Construir la grfica de dispersin y discutir en clase.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
65/221
65
Ejercicio 3. Los datos siguientes muestran el nmero de milmetros de lluvia
mxima total en 30 meses que se han presentado en la ciudad de Adela Mara,
Argentina.
MESES 2005 2006 2007
ENERO 213 111 127
FEBRERO 48 185 171
MARZO 76 182 180
ABRIL 55 129 20
MAYO 10 7 14
JUNIO 2 5 31
JULIO 11 8 10
AGOSTO 29 0 0
SEPTIEMBRE 26 5 120
OCTUBRE 83 77 131
NOVIEMBRE 117 108 18
DICIEMBRE 40 184 97
Fuente: Gobierno de Argentina.
TABLA 3.04 Registro de mm de lluvia.
A travs de un anlisis estadstico determine:
- Grficos: Histograma, Ojiva, Cajas y ejes.
- Medidas de tendencia central
- Medidas de dispersin.
- Medidas de asociacin.
Calcular la correlacin y an si no existiera calcular la recta que mejor se
ajuste.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
66/221
66
UNIDAD 4: FUNDAMENTOS DE PROBABILIDAD
OBJETIVO: Anlisis y conocimiento de la probabilidad como una manera de
describir cuantitativamente los fenmenos aleatorios.
Abarcar la parte de la probabilidad que tiene relacin ms directa con
problemas de inferencia estadstica permite cuantificar el grado de
incertidumbre.
4.1 Conjuntos y su algebra.
Un evento es en realidad un conjunto, es por ello que la teora elemental de
conjuntos se puede usar para estudiar eventos.
Conjunto.-Una coleccin o agrupacin de objetos que tienen en comn alguna
propiedad. Tales objetos pueden ser materiales o tambin pueden ser
abstractos (como los nmeros). Se acostumbra usar letras maysculas del
alfabeto para designar conjuntos y letras minsculas para representar suselementos. (Marian Wisniewski, 2001).
Simbologa.
CONJUNTO
A= Los nombres de la clase de PYE
Son formas de representacin de conjuntos
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
67/221
67
DIAGRAMAS DE VENN- EULER
Son representaciones grficas de los eventos de un experimento. Usando
rectngulos para el espacio muestral y figuras circulares u ovaladas para los
eventos. (Olga Vladivmirovna, 2005).
U
A
B
FI-UAQ
ESQUEMA 4.01 Diagrama de Venn- Euler.
Las siguientes operaciones se usan para construir eventos nuevos a partir de
eventos determinados.
1.- La unin de dos eventos A y B se denota por AUB es el evento que consiste
en los resultados que estn ya sea en A B en ambos eventos.
(A U B) C U
A U B = U
A U = A
A U B = B U A
ESQUEMA 4.02 ConjuntoA U B.
UA B
FI-UAQ
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
68/221
68
2.- La interseccin de dos eventos A y B se denota es el evento queconsiste en los resultados que estn tanto en A como en B (elementos
comunes de los eventos).
ESQUEMA 4.03 Conjunto
3.- Complemento.- son los elementos del universo que no pertenecen al
conjunto A y se denota .
ESQUEMA 4.04 Conjunto
UA B
FI-UAQ
UA B
FI-UAQ
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
69/221
69
La diferencia de A y B se denota como A/B y es el conjunto de elementos que
pertenecen a A pero al conjunto B.
UA B
FI-UAQ
ESQUEMA 4.05 Conjunto
EJEMPLO: Dados los siguientes conjuntos
A= {1,2,3,4,5} B= {1,3,5,7,9} C={2,4,6,8,10}
Definir el universo y encontrar:
EJEMPLO: Dados los conjuntos.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
70/221
70
Definir Universo y encontrar.
Ejercicio resuelto: Se realizo una encuesta a 1000 personas en relacin a sus
adquisiciones en distintas libreras, los resultados de la investigacin fueron los
siguientes:
300 personas compraron en la librera A
200 en la librera B
250 en la librera C
50 en la librera B y A
75 en la librera A y C
60 en la librera B y C
25 en las 3 libreras
ESQUEMA 4.06 Ejercicio resuelto.
Con la ayuda del Diagrama de Venn-Euler. Indicar:
a) Cuntas personas no compraron en ninguna de las 3 libreras.
410.
b) Cuantas compraron nicamente en la A.
200.
200 25
25
50 35
140
115
410
A B
C
FI-UAQ
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
71/221
71
c) Cuntas compraron solamente en la B.
115.
Ejercicio. Dibujar en diagrama de Venn-Euler lo siguiente:
a) b) c)
Lo anteriormente expuesto se liga con las leyes de probabilidad ya que se
tienen ms facilidades para interpretar.
4.2 Experimentos aleatorios, espacios mustrales y eventos.
Azar y desconocimiento.- Seleccionar un articulo sin verlo no se sabe si es B
M
Azar e incertidumbre.- Cuando desconocemos el posible resultado de un gran
negocio exitoso o de fracaso.
Experimento.- Proceso mediante el cual obtenemos una observacin y puede
ser aleatorio o determinstico.
Aleatorio.- No se sabe que va a ocurrir, aquel cuyos resultados no pueden
producirse antes de su realizacin y estn sujetos al azar.
Determinstico.- Aquel cuyo resultado siempre es el mismo.
Espacio muestral.- Es el conjunto de todos los posibles resultados de un
experimento probabilstico y se denota por S. Los elementos de un espacio
muestral se llaman puntos muestrales. (Olga Vladimirovna, 2005).
El espacio muestral obliga a tener mucha claridad en la poblacin objetivo
cuando est bien definido.
Ejemplo: cul es tu opinin del gobierno que sale?
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
72/221
72
Tipos de espacio muestral.
NOTA: Cuando se tenga una observacin se debe tener lugar donde caiga
esta.
1.- Ejemplo: Se toma un litro de leche y se desea determinar el porcentaje de
agua por volumen, definir el espacio muestral.
2.- Ejemplo: En una muestra de sangre se desea determinar el nmero de
glbulos blancos y rojos por: definir el E.M.Existen 2 caractersticas x, y
3.- Cual es el tiempo que tarda un corredor en recorrer 100 m y cul es su
capacidad respiratoria.
2 variables
(T, Cr)
Definir cul es un EM discreto y cual es un EM continuo de los ejemplos
anteriores.
El ejemplo 2: espacio bidimensional discreto.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
73/221
73
El ejemplo 3: espacio bidimensional continuo.
Para cualquier experimento es de gran importancia especificar el espacio
muestral, ya que algunos subconjuntos interesan ms que otros.
Ejemplo: Ms del 80% de agua est presente en la leche esto es inaceptable
por lo que se define un subconjunto A en donde ACEM.
EM = {x / 80% < x < 100%} No es leche.
A ESTE TIPO DE CONJUNTOS SE LE CONOCE COMO EVENTOS EN EL
ESPACIO MUESTRAL.
Es claro que para determinar al EM en un experimento aleatorio es necesario
entender perfectamente.
1.- Qu se va a hacer?
2.- Qu se va a observar o contar?
Ejemplo: Si un juego consiste en tirar todos los volados que hagan falta hasta
obtener tres guilas seguidas o hasta que sean 15 volados si nos fijamos en el
numero de volados requeridos el EM seria 3, 4, 5,, 15 pero si nos fijamos en
el nmero de sellos entonces el EM ser 0, 1, 2,,15
En conclusin: Cuando se tiene un EM se le llama formalmente evento a
cualquier subconjunto del EM.
Del ejemplo anterior el EM 3,4,5 ,,15 un evento de estos seria 3,5,7,,15
evento en el que el numero de tiros es non.
Si al hacer los volados nos queda:
AASAASSSAAA
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
74/221
74
Han cado 3 guilas seguidas el evento si se realiza ya que el nmero
necesario para ellos fueron 11 y es non.
En cambio si resulta: SSSAAA como han cado 3 guilas seguidas, se detiene
pero el evento no se realizo por sexto.
Por lo general conviene subdividir el EM. en un cierto nmero de eventos
E1,E2,E3..En. Una regla es que para cualquier par de eventos porser stos eventos independientes o excluyentes.
Particiones
Es posible definir particiones sobre el espacio muestral. Formalmente
hablando, una particin sobre el EM se define como un conjunto numerable:
A esta subdivisin se le conoce como particin de un espacio muestral.
E2 E3
E4
E1
E5
FI-UAQESQUEMA 4.07 Particin de un espacio muestral.
http://es.wikipedia.org/wiki/Partici%C3%B3n_(matem%C3%A1ticas)http://es.wikipedia.org/wiki/Partici%C3%B3n_(matem%C3%A1ticas)7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
75/221
75
Ejemplo: El experimento consiste en medir el % de humedad relativa en un
invernadero.
EM= { x / 0
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
76/221
76
4.4 Permutaciones y combinaciones.
PERMUTACIN.
Arreglos sin repeticin: Permutaciones.(Olga Vladimirovna, 2005).
Dado un conjunto finito con todos sus elementos diferentes, llamamos
permutacin a cada una de las posibles ordenaciones de los elementos de
dicho conjunto.
n= objetos P(n, r)= n(n-1)(n-2),(n-r+1)
r= forma
Permutacin Lineal.-
Si r=n tenemos que P(n, r) = n!
Si se tienen 4 chips distintos a,b,c,d y se toman uno a la vez tendramos 4
posibilidades de suceso del E. M.
Si consideramos que tomamos 2 a la vez el resultado sera ab, ba, ca, ac, ad,
da, bc, cb, bd, db, cd, dc. E.M. = 12
Se observa que:
ab y ba tienen diferente orden ac y ab tendrn diferente contenido.
Ejemplo 1. De cuntas formas diferentes pueden ocuparse una gerencia y
una subgerencia si existen 8 candidatos que pueden ocupar indistintamente la
gerencia o la subgerencia.
http://es.wikipedia.org/wiki/Conjuntohttp://es.wikipedia.org/wiki/Conjunto7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
77/221
77
Ejemplo 2. Si en una carrera de 400 metros participan 12 atletas. De cuantas
formas distintas podrn ser premiados los 3 primeros lugares con medalla de
oro, plata y bronce.
Ejemplo 3. Cuantos nmeros de los 3 dgitos se pueden formar con los 6
dgitos siguientes 146789.
Ejercicio propuesto: Cuantos nmeros de 3 dgitos diferentes r se puedenformar con los dgitos siguientes.
1, 4, 7, 8, 9, 5.
Cuantos son menores que 600
Cuantos son nones
Cuantos son mltiplos de 5
Permutaciones circulares.
Ahora estudiaremos algunos ejemplos de arreglos circulares, sabemos que si
queremos sentar a cuatro personas una al lado de la otra en fila, el nmero de
arreglos que podemos hacer es 4!; ahora bien, si las queremos sentar al
rededor de una mesa circular, de cuntas formas lo podemos hacer?
Observemos los siguientes arreglos:
1
A
DB
C
2
A
D
B C 3
A
D
B
C 4
A
D
BC 5
A
D
B
C 6
A
D B
C
FI-UAQ
ESQUEMA 4.08 Permutaciones circulares.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
78/221
78
Por cada una de las permutaciones o arreglos circulares tenemos 4 de ellos
diferentes en fila; esto es, el arreglo circular 1 puede leerse en sentido contrario
a las agujas del reloj de las siguientes formas: ABCD, BCDA, CDAB, y DABC,
que son 4 arreglos diferentes si fueran en filas; pero es un solo arreglo circular.
Entonces, en lugar de tener 4! que es el nmero de arreglos en fila, tenemos
solamente . En consecuencia se puede establecer
PERMUTACIONES CIRCULARES
"El nmero de permutaciones circulares de n elementos tomados todos
a la vez es (n - 1) !" y lo denotaremos por
Pcir,n = (n - 1)!
Investigar.- Permutacin con repeticin
COMBINACIN.- Es una forma en la que pueden presentarse los objetos y en
la que el orden de aparicin no importa.
Ejemplo la multiplicacin de los dgitos 2,5,8 el resultado es el mismo.
La formula general de las combinaciones viene dada:
n.- nmero total de objetos
r.- nmero de objetos a considerar
El nmero de objetos tomados a la vez.
De cuantas maneras puede elegirse un comit de 4 personas de un club de 15
miembros.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
79/221
79
De cuantas maneras puede seleccionarse un comit de 5 hombres y 4 mujeres
de un grupo de 10 hombres y 8 mujeres.
Ejercicio.
Cuantas palabras de 5 letras 3 consonantes diferentes y 2 vocales diferentes
se pueden formar con un alfabeto que consta de 27 letras de los cuales 5 son
vocales.
Cuantas contienen la letra B y C Cuantas empiezan con B y contienen a C Cuantas empiezan con B y terminan con S Ejemplo. En una caja hay 39 esferas, mezcladas con los nmeros del 1 al 39.
Si se toman al azar 6 esferas diga cuntas formas diferentes pueden resultar.
Si se considera el orden de aparicin: Si no se considera el orden de aparicin:
4.5 Probabilidad.
Esta surge de los juegos de azar, cartas, dados, monedas, etc. Y est
relacionada con las tcnicas de conteo.
Para conocer una probabilidad es necesario conocer el espacio muestral (E.M.)
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
80/221
80
Una de las maneras de conocer el EM es a travs del diagrama de rbol, este
ayuda a conocer todas las formas posibles en que se da un experimento.
Ejemplo: Moneda, lanzar dado.
Una probabilidad Priori es conocida de antemano, se sabe que es lo que va a
ocurrir.
Las leyes de probabilidad sirven para los fenmenos aleatorios.
Axiomas de Probabilidad
1.- P(U) = 1 P(E.M.) = 1
2.- P(A)= 0 y 1 para cada evento de A
3.- P(A U B)= P(A)+P (B) si son mutuamente excluyentes
Por lo tanto:
Calcular la probabilidad de al lanzar 3 veces una moneda, el resultado sean 2guilas seguidas.
A= {AAA, AAS, ASA, ASS, SAA, SAS, SSA, SSS}
1 2 3 4 5 6 7 8
ESQUEMA 4.09 Espacio muestral.
Ahora, si se supone que la moneda presenta un espacio muestral cuyos
resultados anteriores tienen las siguientes probabilidades:
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
81/221
81
Recordando que la sumatoria de los puntos muestrales da como resultado el
espacio muestral: Si el evento A es el de calcular la probabilidad de que al lanzar 3 veces una
moneda, se presente en el primer lanzamiento guila.
Calcular la probabilidad de que al lanzar un par de dados sus nmeros sean
iguales.
Ahora, si el evento A es la suma de los nmeros de los 2 dados sea 7. Cul
ser su probabilidad?
Es evidente que el conteo de puntos muestrales, es sencillo, pero a medida
que ste resulta ms complejo, se hace necesario el apoyo de los mtodos
combinatorios.
Teoremas de probabilidad.
1.- Si es el conjunto vaco 2.- 3.- 4.-
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
82/221
82
5.- Ejemplo. Si A y B son mutuamente excluyentes y se conoce la P(A)=0.20 y P
(B)=0.30
Si no son mutuamente excluyentes se tiene que Ejemplo 1. Una caja contiene 6 resistencias con un voltaje de 10 volts, 3
resistencias con un voltaje de 50 volts y una resistencia con un voltaje de 100
volts.
a) Determine la probabilidad de que, al extraer al azar una de stas
resistencias, ste tenga un voltaje de 50 de 100 volts.
( )
Otra solucin sera
Eventos independientes es cuando no se ven afectados por otros.
b) Determine la probabilidad de que al extraer 2 de stos, ambos
sean de 10 volts.
La primera resistencia deber de ser de 10 volts.
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
83/221
83
Pero tambin la segunda resistencia debe ser de 10 volts.
La probabilidad de que los 2 eventos se presenten
simultneamente es la multiplicacin de ambas.
Evento dependiente. Cuando un evento afecta la probabilidad de
que suceda otro.
Ejemplo 2. Un enorme plato giratorio de madera est dividido en 58 sectores
circulares (rebanadas) del mismo tamao de los cuales 14 son azules, 23 son
rojos y 21 son verdes. Si se lanzan 2 dardos, diga cul es la probabilidad de
que:
a) Ambos dardos peguen en sectores azules.
b) Ningn dardo pegue en sector azul.
c) Uno los 2 dardos peguen en sectores azules.
Ejercicio 1. Un campamento tiene a la mano 1 caja con 20 lmparas que no
han sido utilizadas desde el verano anterior. 3 lmparas se quedaron a la
intemperie durante el invierno, por lo tanto ya no sirven. Si se seleccionaron 4
lmparas al azar, Cul es la probabilidad de que estn buenas?
7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok
84/221
84
n=17, r=4
Ejercicio 2. Se va a seleccionar por lote a un comit de 4 personas a partir de
un grupo de 8 hombres, 2 de los cuales son hermanos:
a) Cul es la probabilidad de que los hermanos estn en el comit?
b) Cul es la probabilidad de que por lo menos1 hermano est en el
comit?
Ejercicio3.Se va a seleccionar por lote un comit de 5 hombres a partir de un
grupo de 8 norteamericanos, 5 ingleses y 3 mexicanos. Cul es la
probabilidad de que el comit est compuesto por 2 norteamericanos, 2
britnicos y 1 mexicano?
Ejercicio 4. De un grupo de 100 estudiantes universitarios, 60 estudiaron
biologa, 15 biologa y geologa, 20 geologa, 7 biologa y topografa, 10
topografa, 3 geologa y topografa y 3 estudiaron las 3 materias. Si se
selecciona al azar un estudiante, Cul es la probabilidad de