Transcript
  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    1/221

    1

    UNIVERSIDAD AUTNOMA DE QUERTARO

    FACULTAD DE INGENIERA

    PROBABILIDAD Y ESTADSTICA

    GUA DEL MAESTRO

    Que para obtener el ttulo de

    Ingeniero Civil

    PRESENTA:

    Israel Luna Vaca

    Asesor: M. en I. Pablo Talamantes Contreras

    Fecha: Mircoles 11 de mayo del 2011.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    2/221

    2

    Llegar el da en el que el pensamiento

    estadstico ser una condicin tan necesaria

    para la convivencia eficiente como la

    capacidad de leer y escribirH.G. Wells

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    3/221

    3

    Agradecimientos.

    El autor ha intentado escribir esta gua de modo que suscite el inters del

    instructor de la materia. En ninguna manera pretendo sustituir la libertad de

    ctedra la consulta externa de textos sobre probabilidad y estadstica. La

    intensin es permitir al profesor tener a la mano los temas que involucra el

    programa de dicha materia. Muchas personas participaron directa oindirectamente en el desarrollo de este trabajo, y deseo expresarles mi

    agradecimiento por sus comentarios y sugerencias que mucho he apreciado.

    Especficamente, quiero dar las gracias a las siguientes personas por su

    contribucin:

    M. en I. Pablo Talamantes Contreras, catedrtico de la FI-UAQ.

    M en C. Crisgono de Santiago Guerrero, catedrtico de la FI-UAQ.

    Dra. Teresa Flores Guzmn, catedrtica de la FI-UAQ.

    M.Q.Hernndez Garciadiego Cecilia, catedrtica de la FI-UAQ.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    4/221

    4

    NDICE

    RECOMENDACIONES PARA EL PROFESOR8

    COMPETENCIAS ACADMICAS...8

    LINEAMIENTOS SUGERIDOS....9

    UNIDAD I. INTRODUCCIN.

    1.1Definicin...18

    1.2Pasos para realizar un estudio estadstico......18

    1.3Mtodo cientfico y estadstica.......20

    1.4Poblacin y muestra.....21

    1.5Variables, tipos de Variables......21

    1.6Tablas de frecuencia24

    1.7Grficos......28

    UNIDAD 2. ESTADSTICA DESCRIPTIVA.

    2.1Definicin y parmetros estadsticos..32

    2.2Medidas de tendencia central..33

    2.3Medidas de dispersin...40

    2.4Medidas de posicin...44

    2.5Asimetra y apuntamiento.............46

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    5/221

    5

    UNIDAD 3. REGRESIN Y CORRELACIN

    3.1Diagramas de dispersin.54

    3.2Covarianza.56

    3.3Correlacin.57

    3.4Regresin lineal simple61

    UNIDAD 4. FUNDAMENTOS DE PROBABILIDAD

    4.1Conjuntos y su lgebra66

    4.2Experimentos aleatorios, espacios muestrales y eventos.71

    4.3Teora fundamental del conteo..75

    4.4Permutaciones y combinaciones...76

    4.5Probabilidad..79

    4.6Probabilidad condicional.85

    4.7Independencia de eventos............87

    4.8Probabilidad total.88

    4.9Teorema de Bayes...91

    UNIDAD 5. VARIABLES ALEATORIAS.

    5.1Variables aleatorias discretas..99

    5.2Variables aleatorias continuas103

    5.3Medidas de tendencia central de una variable aleatoria105

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    6/221

    6

    5.4Medidas de dispersin de una variable aleatoria...109

    5.5Medidas de posicin de una variable aleatoria....110

    5.6Medidas de apuntamiento de una variable aleatoria........112

    UNIDAD 6. MODELOS PROBABILSTICOS BSICOS.

    6.1Distribuciones discretas115

    Bernoulli.

    Binomial.

    Poisson.

    Hipergeomtrica.

    6.2Distribuciones continuas..131

    Normal.

    Chi-Cuadrada.

    T de student.

    Distribucin F.

    UNIDAD 7. INTRODUCCIN A LA INFERENCIA ESTADSTICA.

    7.1Propiedades de un estimador....155

    7.2Teorema central del lmite..162

    7.3Intervalos de confianza....167

    7.4 Muestreo.176

    7.5Tamao de la muestra.187

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    7/221

    7

    UNIDAD 8. PRUEBAS DE HIPTESIS.

    8.1Ideas bsicas en una prueba de hiptesis..192

    8.2Clasificacin de hiptesis..196

    8.3Regin crtica y nivel de significancia..197

    8.4Tipos de error..198

    8.5Pruebas de hiptesis para muestras de la distribucin

    normal..201

    GLOSARIO DE TRMINOS.206

    Apndice A..211

    reas bajo la curva normal estndar de 0 a Z.

    Apndice B..212

    Valores percentiles para la distribucint de Student con grados de libertad.

    Apndice C..213

    Valores percentiles de para la distribucinChi cuadrado con grados de libertad.

    Apndice D..214

    Ordenadas y de la curva normal estndar.

    NDICE DE TABLAS...215

    NDICE DE ESQUEMAS....216

    BIBLIOGRAFA....221

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    8/221

    8

    RECOMENDACIONES PARA EL PROFESOR.

    La presente gua constituye un apoyo para el docente, ya que en sta se

    presentan los contenidos mnimos para desarrollar en el curso de Probabilidad

    y Estadstica establecido en la UAQ.

    Utilizar la gua para tener un panorama general a la hora de planear el

    curso.

    Utilizar la gua como apoyo de las actividades a realizar en clase.

    Consultar la gua para fijar un sistema de evaluacin que vaya acorde

    con las necesidades del profesor.

    Realizar algunas de las actividades sugeridas para los docentes y

    alumnos que vayan acordes con las necesidades del profesor.

    COMPETENCIAS ACADMICAS

    Comprender el rol de la Probabilidad y la Estadstica en la resolucin deproblemas de ingeniera.

    Utilizar el Mtodo cientfico, para poder aplicar el mtodo estadstico a

    cualquier fenmeno natural o social que se presente.

    Utilizar las herramientas que proporciona la Probabilidad y la Estadstica

    para discernir con mayor eficacia cualquier fenmeno de tipo natural o

    social.

    Tener conocimiento de la importancia de la recoleccin de datos para el

    buen desarrollo de la Estadstica.

    Utilizar de manera adecuada la representacin grfica de un fenmeno

    natural o social de acuerdo a la recoleccin de datos.

    Comprender y discernir la veracidad de la informacin que recibe de los

    diferentes medios informativos sobre un fenmeno social o natural.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    9/221

    9

    Comprender la interaccin de la Probabilidad y la Estadstica y otras

    ciencias en la comprensin y anlisis de fenmenos naturales y sociales.

    SUGERENCIAS

    Revisar los conocimientos previos al iniciar un nuevo tema.

    Realizar actividades con la finalidad de incentivar al alumno e

    inducirlo al tema.

    Analizar y discutir el tema mediante tcnicas grupales.

    Realizar prcticas de laboratorio mediante cualquier software

    estadstico tal como Excel, MINITAB, SPSS, que permitan al alumno

    un aprendizaje significativo.

    Incorporar en clase el uso de programas estadsticos presentes en

    toda calculadora cientfica.

    LINEAMIENTOS SUGERIDOS.

    UNIDAD I: INTRODUCCIN

    Para el profesor:

    Establecer con la participacin del grupo, la manera como trabajar

    durante el curso, sealando con claridad qu se espera de los alumnos,

    del profesor y de la asignatura, as como dejando el claro los criterios de

    evaluacin; para que sean congruentes con los objetivos de la

    asignatura.

    Identificar los conocimientos previos de los estudiantes mediante

    algunas tcnicas didcticas conocidas.

    Presentar ciertas problemticas que involucren el uso de la estadstica

    en la ingeniera a travs de fenmenos sociales y/o naturales.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    10/221

    10

    Para el alumno:

    Presentar por medio de ideas cmo se desea trabajar durante el curso ycmo se puede lograr una mejor participacin en el curso, y cmo

    espera ser evaluado al final del curso.

    Participar de manera colaborativa con sus compaeros para que se

    logre en el grupo mejores resultados.

    Identificar los diferentes usos de la Estadstica.

    Realizar actividades ejercicios sugeridos en la gua o por el profesor.

    Disear una encuesta o cuestionario.

    Distribucin de frecuencias.

    Para el profesor:

    Guiar al alumno para que construya los diferentes tipos de mtodos

    tabulares que existen en la Estadstica.

    Resolver ejercicios que conlleven a los diferentes mtodos tabulares.

    Proponer una serie de ejercicios para ser resueltos en clase y extra-

    clase.

    Proponer que el alumno mediante el programa Excel presente los datosrecolectados mediante los diferentes mtodos tabulares vistos en clase.

    Para el alumno:

    Investigar los diferentes mtodos tabulares que existen en la

    Estadstica.

    Diferenciar las ventajas y desventajas que tiene cada mtodo tabular y

    sealar las caractersticas de cada uno.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    11/221

    11

    Realizar las actividades sugeridas por el docente.

    Realizar en equipo las graficas en Excel de los datos que recolect enla encuesta y presentarlos mediante una tabla.

    Representacin grfica

    Para el profesor:

    Guiar al alumno para que construya los diferentes tipos de grficas que

    existen en la Estadstica.

    Resolver ejercicios que conlleven a los diferentes mtodos grficos.

    Proponer una serie de ejercicios para ser resueltos en clase y extra-

    clase.

    Proponer que el alumno grafique los datos que ya tabul en la encuesta

    propuesta con anterioridad.

    Proponer que el alumno mediante el programa Excel presente los datos

    recolectados mediante los diferentes mtodos tabulares vistos en clase.

    Para el alumno:

    Investigar los diferentes mtodos grficos que existen en la Estadstica.

    Diferenciar las ventajas y desventajas que tiene cada grfica y sealar

    las caractersticas de cada una.

    Realizar las actividades sugeridas por el docente.

    Realizar en equipo las grficas en Excel de los datos que recolect en la

    encuesta y presentarlos mediante una grfica.

    UNIDAD II: ESTADSTICA DESCRIPTIVA.

    Para el profesor:

    Explicar qu es una medida de centralizacin y para qu sirve.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    12/221

    12

    Definir cada una de las medidas de centralizacin.

    Diferenciar cada una de las medidas de centralizacin.

    Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto

    en clase.

    Aplicar las medidas de centralizacin en la encuesta que se propuso en

    clase.

    Calcular y reflexionar sobre las posibilidades de su clculo mediante el

    programa Excel las diferentes medidas de centralizacin vistas en clase.

    Para el alumno:

    Investigar las diferentes medidas de centralizacin que existen en la

    estadstica.

    Presentar un resumen de las diferentes medidas de centralizacin.

    Aportar ideas o bien dudas durante la explicacin al profesor.

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Elaborar un formulario que sirva para resolver ejercicios de

    Centralizacin.

    UNIDAD III: REGRESIN Y CORRELACIN.

    Para el profesor:

    Explicar qu es un diagrama de dispersin y para qu sirve.

    Proponer ejercicios en la clase y extra-clase para retroalimentar lo visto

    en clase.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    13/221

    13

    Proponer mediante el programa Excel ejercicios donde se identifique la

    correlacin entre las variables X,Y y se muestre la recta de regresin

    lineal.

    Para el alumno:

    Con la ayuda de Excel presentar los posibles casos de correlacin

    usando diagramas de dispersin.

    Presentar un resumen sobre la covarianza, desarrollar ejemplos en

    clase.

    Aportar ideas o bien dudas durante la explicacin al profesor.

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Resolver los ejercicios propuestos en la gua.

    UNIDAD IV: FUNDAMENTOS DE PROBABILIDAD

    Parte 1 Conjuntos.

    Para el profesor:

    Explicar cmo realizar las operaciones con conjuntos.

    Explicar la utilizacin de los diagramas de Venn y sus aplicaciones.

    Organizar equipos para fomentar la discusin y anlisis y generar

    conclusiones.

    Propondr ejercicios en clase y extra-clase para retroalimentar lo visto

    en clase

    Para el alumno:

    Investigar todos los conceptos que involucran a la teora de conjuntos.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    14/221

    14

    Elaborar un mapa conceptual de todos los elementos de la teora de

    conjuntos.

    Aportar ideas o bien dudas durante la explicacin al profesor.

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Elaborar un formulario que sirva para identificar los diferentes smbolos

    involucrados en la teora de conjuntos.

    Parte 2 Probabilidad.

    Para el profesor:

    Explicar los diferentes enfoques de la teora de la probabilidad.

    Desarrollar diversos problemas donde obtendr la probabilidad en base

    a la definicin.

    Explicar la relacin que existe entre la probabilidad y la teora de

    conjuntos.

    Propondr ejercicios en clase y extra-clase para retroalimentar lo visto

    en clase.

    Explicar la relacin que existe entre la probabilidad y la estadstica.

    Para el alumno:

    Identificar los principales conceptos de la teora de probabilidades y los

    relacionar con la teora de conjuntos.

    Elaborar un mapa conceptual relacionando lo antes mencionado.

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Resolver los ejercicios propuestos en la gua.

    Elaborar un formulario que sirva para resolver ejercicios de Probabilidad.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    15/221

    15

    UNIDAD V: VARIABLES ALEATORIAS.

    Para el profesor:

    Explicar qu es una variable aleatoria y para qu sirve.

    Definir y diferenciar entre variable aleatoria discreta y continua.

    Desarrollar los temas de momentos con respecto a la media y con

    respecto al origen.

    Proponer ejercicios en la clase y extra-clase para retroalimentar lo vistoen clase.

    Para el alumno:

    Presentar un cuadro donde agrupe las principales caractersticas de

    variable aleatoria y variable continua.

    Investigar los momentos con respecto a la media y con respecto al

    origen.

    Aportar ideas o bien dudas durante la explicacin al profesor.

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Resolver los ejercicios propuestos en la gua.

    UNIDAD VI: MODELOS PROBABILSTICOS BSICOS

    Para el profesor:

    Ensear y describir las condiciones para discriminar un modelo de otro a

    la hora de resolver un problema de distribucin de probabilidad.

    Coordinar a los alumnos en la presentacin de los principales modelos

    probabilsticos por equipos en exposicin ante el grupo.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    16/221

    16

    Para el alumno:

    Formar equipos y cada uno desarrollar y expondr ante la clase un

    modelo probabilstico con aplicacin a un problema de ingeniera.

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Resolver los ejercicios propuestos en la gua.

    UNIDAD VII: INTRODUCCIN A LA INFERENCIA ESTADSTICA.

    Para el profesor:

    Explicar los diferentes tipos de muestreo estadstico.

    Sealar para qu sirve cada uno de los diferentes tipos de muestreo

    estadstico.

    Coordinar una sesin de preguntas y respuestas en base a una lectura

    o artculo periodstico o de revista de divulgacin cientfica que involucre

    inferencia estadstica.

    Guiar a una discusin grupal.

    Formar equipos de trabajo.

    Guiar y asesorar a los equipos de trabajo para que ellos seleccionen

    una muestra representativa.

    Para el alumno:

    Elaborar de forma individual un cuadro comparativo donde se presenten

    los mtodos de muestreo, sus caractersticas y condiciones para su uso.

    Discutir el cuadro comparativo de manera grupal y elaborar una

    conclusin final.

    Resolver los ejercicios propuestos por el profesor en clase y extra-

    clase.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    17/221

    17

    Resolver los ejercicios propuestos en la gua.

    UNIDAD VIII: PRUEBAS DE HIPTESIS.

    Para el profesor:

    Explicar qu es una prueba de hiptesis y para qu sirve.

    Definir cada una de las medidas de variabilidad.

    Diferenciar los tipos de hiptesis existentes.

    Para el alumno:

    Utilizar Excel para representar la prueba bilateral (2 colas), unilateral

    izquierda (cola izquierda) y unilateral derecha (cola derecha).

    Resolver los ejercicios propuestos por el profesor en clase y extra-clase.

    Resolver los ejercicios propuestos en la gua.

    Desarrollar por equipos y presentar en clase una prueba de hiptesis

    aplicada a un problema de ingeniera segn preferencia del equipo.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    18/221

    18

    UNIDAD 1: INTRODUCCIN.

    OBJETIVO: Conocer un panorama general de los fundamentos de la

    estadstica y las representaciones grficas.

    1.1 Definicin.

    Estadstica.- La estadstica, en general, es la ciencia que trata de la

    recopilacin, organizacin presentacin, anlisis e interpretacin de datos

    numricos con el fin de realizar una toma de decisin ms efectiva (Ruiz

    Muoz, 2004).

    Para lograr este fin la estadstica se apoya en la teora de probabilidades y es

    por ello que se tiene una estrecha relacin entre estos dos conceptos.

    Esta se aplica en la ciencia moderna, administracin y en la vida cotidiana de

    cualquier persona.

    El papel fundamental de la estadstica es sin lugar a duda cuantificar la

    incertidumbre.

    Definicin 2.- Es un conjunto de tcnicas para la coleccin, manejo,

    descripcin y anlisis de informacin, de manera que las conclusiones

    obtenidas de ella tengan un grado de confiabilidad especificado (Irwin Miller,

    1993).

    1.2 Pasos para un estudio estadstico.

    1.- Definir el tipo de proyecto a realizar:

    Experimental.- Manejo de datos, existe manipulacin de datos.

    Prospectivo.- Planea la investigacin y se ejecuta en un futuro

    inmediato.

    Retrospectivo.- Con bastante aplicacin en el mbito de la medicina. Losestudios retrospectivos se realizan basndose en observaciones

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    19/221

    19

    clnicas, o a travs de anlisis especiales, estos revisan situaciones

    de exposicin a factores sospechosos, comparando grupos de

    individuos enfermos (casos), con grupos de individuos sanos (controles).

    A partir de la frecuencia observada en cada uno de los grupos expuestos

    al factor en estudio se realiza un anlisis estadstico.

    Longitudinal.- Aquello que se mide a lo largo del tiempo sobre la

    poblacin que interesa.

    Transversal.- Parecida a una encuesta, es una poblacin cambiante.

    Descriptivo.- Una sola poblacin.

    Comparativo.- Dos o ms poblaciones.

    Se tienen que visualizar los alcances y limitaciones que se tendrn con

    la investigacin que se est realizando (plantear la hiptesis).

    2.- Cantidad de informacin necesaria.

    3.- Forma de recoleccin.

    4.- Tcnicas para adquirirla.

    5.-Anlisis.

    ESQUEMA 1.01 Anlisis descriptivo de los datos.

    6.- Cuantificar el grado de incertidumbre mediante los principiosprobabilsticos.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    20/221

    20

    7.- Validacin de la hiptesis a travs de la inferencia estadstica o estadstica

    inductiva que permiten llegar a conclusiones correctas.

    1.3 Mtodo cientfico y estadstica.

    Qu es el mtodo cientfico?

    Definimos el Mtodo Cientfico como un mtodo o conjunto sistematizado de

    procesos en los que se basa la ciencia para explicar cualquier fenmeno y las

    leyes que los administran, las etapas de este son:

    1. Formulacin de hiptesis

    2. Obtencin de datos pertinentes al problema

    3. Confrontacin de datos con las hiptesis

    Las anteriores fases engloban el proceso de pasos de un estudio estadstico

    por ello su papel es fundamental en este mtodo.

    Estadstica presenta dos ramas principales:

    Descriptiva.- Es un conjunto de tcnicas para la organizacin,

    presentacin, grficas y clculo de cantidades representativas de un

    grupo de datos (organiza y representa).

    Inferencia estadstica.- Conjunto de tcnicas que permiten hacer

    induccin en los que el grado de incertidumbre es cuantificable a travsde probabilidades.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    21/221

    21

    1.4 Poblacin y muestra.

    Poblacin.- Cualquier conjunto de personas, objetos, ideas o acontecimientos

    que se someten a la observacin estadstica de una o varias caractersticas

    que comparten sus elementos y que permiten diferenciarlos. (AlejandroCrdoba, 2002)

    Muestra.- Es la parte seleccionada de una poblacin en la que los elementos

    que la componen no tienen ninguna caracterstica esencial que los distinga de

    los restantes. Se utiliza cuando es necesario disponer de una parte

    representativa de la

    poblacin. (Alejandro

    Crdoba, 2002).

    En resumen: Un registro de

    datos se conoce como

    muestra y el conjunto de

    todos los posibles registros se

    le conoce como poblacin.

    ESQUEMA 1.02 Proceso estadstico.

    1.5 Variables y tipos de variables.

    Variable.- "una variable es un smbolo, tal como X, Y, que puede tomar un

    valor cualquiera de un conjunto determinado de ellos, llamado dominio de la

    variable. Si la variable puede tomar solamente un valor, se llama constante."

    (Murray R. Spiegel, 1992).

    Es una caracterstica que al ser medida en diferentes individuos es susceptible

    de adoptar diferentes valores.

    Las variables segn la medicin pueden ser cuantitativas o cualitativas:

    Cuantitativas.- Son las variables que se expresan mediante cantidadesnumricas.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    22/221

    22

    Cualitativas.- Son las variables que expresan distintas cualidades,

    caractersticas o modalidad. Cada modalidad que se presenta se denomina

    atributo o categora y la medicin consiste en una clasificacin de dichos

    atributos. Las variables cualitativas pueden ser dicotmicas cuando slo

    pueden tomar dos valores posibles como s y no, hombre y mujer o son

    politmicas cuando pueden adquirir tres o ms valores.

    Cuantitativas(Numricas)Kg, mts.,hrs.

    Discretas(para contar)

    Contnuas(para medir)

    No existen posibilidades intermediasej. manzanas, habitantes.

    Infinidad de valores intermedias.

    ej. Estatura, espesor de hoja.

    Nominales.

    Jerarquizadas.

    Condicin especfica del sujeto enestudio. ej. Domicilio, nacionalidad,religin.

    Caracterstica de tamao u orden. ej.Chico, mediano, malo, bueno.

    Cualitativas(Categoras)gero, moreno, etc..

    ESQUEMA 1.03 Tipos de variables.

    Ejercicio. Indica que variables son cualitativas y cuales cuantitativas.

    1.- Comida Favorita.

    Cualitativa.

    2.- Profesin que te gusta.

    Cualitativa.

    3.- Nmero de goles marcados por tu equipo favorito en la ltima temporada.

    Cuantitativa.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    23/221

    23

    4.- Nmero de alumnos de tu Instituto.

    Cuantitativa.

    5.- El color de los ojos de tus compaeros de clase.

    Cualitativa.

    6.- Coeficiente intelectual de tus compaeros de clase.

    Cuantitativa

    Ejemplo: La siguiente grafica representa en el eje vertical, el nmero de

    personas de una poblacin con los pesos en kilogramos. Identifique losintervalos que se indican:

    ESQUEMA 1.04 Clasificacin de personas por peso.

    a). Entre 59 y 62 kg.

    b). Mayor de 60kg.

    c). Mayor o igual que 60kg.

    d). Menor de 60kg.

    e). Menor o igual que 60kg.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    24/221

    24

    Nota.- los pesos se estn considerando en kg enteros esto es un ajuste a la

    medida exacta y se obtiene una variable discreta a partir de variables

    continuas.

    ESQUEMA 1.05 Variable discreta y continua.

    La relacin entre las variables discretas y continuas es de gran importancia

    dentro de la probabilidad y la estadstica.

    1.6 Tabla de frecuencias

    Los datos estadsticos, obtenidos de encuestas, experimentos, o cualquier

    serie de medidas, son tan numerosos que virtualmente son poco tiles a menos

    que se condensen en una forma conveniente.

    Una tabla de distribucin de frecuencias divide los datos en un nmero

    relativamente menor de clases haciendo una lista con el nmero deobservaciones que corresponden a cada clase. (Irwin Miller, 1993).

    Es la forma ms comn de organizar un gran nmero de datos.

    Conceptos fundamentales a conocer:

    Nmero de clases.

    Intervalo de la clase.

    Frecuencia de elementos de cada clase

    56.5 57 57.5 58 58.5 59 59.5 60 60.5 61 61.5 62 62.5

    a)

    b)

    c)

    d)

    e)

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    25/221

    25

    Los elementos exactos

    Las marcas de clase o vales representativos

    Las frecuencias relativas

    Las frecuencias acumuladas

    Cuntas clases debern establecerse? El rango deber oscilar entre 5 y 20

    clases.

    La ley de Sturges determina el nmero de clases a travs de:

    M= 1+ 3.3 logN

    Donde

    N= nmero total de datos

    M= nmero de clases

    Estas clases obtenidas son las recomendadas para iniciar la tabla de

    frecuencias.

    Cabe aclarar que en ocasiones el resultado de esta expresin es un nmero no

    entero, por lo que se recomienda considerar el valor entero que ms se

    aproxime a la cifra.

    Calcular el rango que estas clases contendrn para agrupar los datos mismos

    que se obtiene:

    R=A/M = R=A/M

    Donde:

    R.- El rango de cada clase.

    A.- La amplitud de datos.

    M.- Nmero de clases.

    La amplitud A.- Se define a travs de la diferencia del valor mximo menos el

    valor mnimo de la coleccin de datos:A=Vmax- Vmin

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    26/221

    26

    Nota.- Se recomienda hacer los ajustes necesarios a fin de que el rango sea de

    preferencia un nmero entero.

    Con el valor del rango se definirn los valores de los lmites de cada clase.

    Considerar el valor mnimo como lmite inferior y as sucesivamente hasta

    llegar al lmite superior de la ltima clase, de acuerdo a las clases definidas.

    Ley de parntesis.- Permite ubicar la pertenencia de un dato.

    ( ms del valor representado

    [contiene al valor representado]

    )menos del valor representado

    Calcular el valor representativo o la marca de clase mediante

    Donde

    Li rango.- Lmite inferior del rango de la clase.

    Ls rango.- Lmite superior de la clase.

    Vm.- Valor medio representativo de la clase.

    La distribucin de frecuencias consiste bsicamente en agrupar los valores

    contenidos en la coleccin de datos de las clases ya definidas con sus

    respectivos lmites.

    TABLA 1.01 Edades recolectadas.

    39 45 29 39 28 33

    35 36 41 27 32 34

    44 55 38 39 41 28

    28 37 35 27 36 44

    43 40 30 34 36 50

    37 32 34 41 51 44

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    27/221

    27

    Ejemplo: Edades de 36 profesores de una facultad.

    Calcular el nmero de clases recomendables para el diseo de la tabla de

    frecuencias:

    M= 1+3.3 Log N

    N= 36

    M= 6.13 = 6 clases

    Clculo del rango o ancho de clase: R

    Determinar la amplitud A:

    A= 55-27=28

    R= A/M = 28/6 = 4.66 = 5

    Definir los lmites:

    El lmite inferior estar asociado al valor mnimo.

    Clase Rango-intervalo Xm

    1 [27-32] 29.5

    2 [32-37] 34.5

    3 [37-42] 39.5

    4 [42-47] 44.5

    5 [47-52] 49.5

    6 [52-57] 54.5

    TABLA 1.02 Clasificacin por clases.

    Definir el valor representativo (*) el valor que representara a cada clase en

    todos los clculos.

    Clasificar los datos en funcin de su valor, esto es ubicar los valores en la clase

    que le corresponda.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    28/221

    28

    Conteo.

    Obtener la frecuencia fi.- Es la cantidad de datos que pertenecen a

    determinada clase.

    Obtener la frecuencia relativa.- A la proporcin de valores que caen dentro de

    un intervalo de clase se le denomina frecuencia relativa de ocurrencia (Daniel,

    1987).

    Fri= fi/N

    Calcular la frecuencia acumulada.- fai.- Es el total acumulado hasta cada clase.

    Evaluar la frecuencia relativa acumulada fari.- Es la proporcin o porcentualacumulado por cada clase.

    xm conteo Fi fri fai Frai

    1 29.5 IIII/IIII 9 0.25 9 0.25

    2 34.5 IIII/IIII/I 11 0.30 20 0.55

    3 39.5 IIII/III 8 0.22 28 0.774 44.5 IIII/ 5 0.14 33 0.91

    5 49.5 II 2 0.06 35 0.97

    6 54.5 I 1 0.03 36 1

    36 1

    TABLA 1.03 Frecuencias.

    1.7 Grficos.- Valen ms que mil palabras

    En comparacin de los datos que son ms difciles de comprender, las graficas

    permiten una visualizacin integral del comportamiento de los datos de forma

    ms objetiva.

    Los grficos son representaciones visuales que emplean smbolos, barras,

    polgonos y sectores, de los datos contenidos en tablas de frecuencias. (Vctor

    Quesada, 2007).

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    29/221

    29

    Las ms comunes son: histograma, polgono, pastel, la ojiva, y el de cajas y

    ejes, entre otras.

    Histograma.- La grfica de la izquierda se denomina histograma; las alturas

    de los rectngulos son proporcionales a las probabilidades correspondientes ylas bases se tocan en tal forma que no hay espacios vacos entre los

    rectngulos que representan los valores sucesivos de la variable aleatoria. La

    grfica de la derecha se denomina diagrama de barras, las alturas de los

    rectngulos tambin son proporcionales a las probabilidades correspondientes,

    pero son angostos y su ancho no tiene ningn significado.(Jos Muoz, 1987).

    Histograma

    0 1 2 3

    0.1

    0.2

    0.3

    0.4

    0.5

    x

    f(x)

    Diagrama de barras

    0 1 2 3

    0.1

    0.2

    0.3

    0.4

    0.5

    x

    f(x)

    Grficas de distribucin de probabilidad

    FI-UAQ

    ESQUEMA 1.06 Comparacin histograma y diagrama de barras.

    Polgono de frecuencias.- En l las frecuencias de clase son graficadas sobre

    las marcas de clase, esto es, graficamos los puntos donde es lamarca de la clase de la i-sima clase y es la frecuencia correspondiente y lospuntos sucesivos son unidos por medio de lneas rectas despus de haber

    agregado clases con frecuencia cero en los puntos lmite de la

    distribucin.(Jos Muoz, 1987).

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    30/221

    30

    Grfica de pastel.- Si las frecuencias se expresan en porcentajes y stos

    totalizan el 100%, el pastel o diagrama circular constituye un mtodo de

    representacin adecuado. (G. Berry,1997).

    FI-UAQ

    25 %

    18 % 8 %

    12 %

    4 %

    18 %

    GRFICA DE PASTEL

    16 %

    Ventas

    Hugo

    Juan

    Alex

    Mary

    Jos

    Lidia

    Miriam

    ESQUEMA 1.07 Grfica de pastel.

    Ojiva o curva S.- Las distribuciones acumuladas por lo general se presentan

    grficamente en forma de ojivas, lo cual es similar a los polgonos de

    frecuencia, excepto en que graficamos las frecuencias acumuladas sobre las

    fronteras de clase en lugar de graficar las frecuencias ordinarias sobre las

    marcas de clase. Los puntos as determinados se unen otra vez mediante

    segmentos rectilneos, como se muestra en la figura. (Jos Muoz, 1987).

    .

    Emisin de xido de azufre (tons)

    4.95

    f(x)

    Ojiva

    20

    40

    60

    80

    8.95 12.95 16.95 20.95 24.95 28.95 32.95

    frecuenciaacumulada

    FI-UAQ

    ESQUEMA 1.08 Ojiva.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    31/221

    31

    Cajas y ejes.- Diagrama basado en cuartiles. Proporciona una visin general

    de la simetra de la distribucin de los datos. En un solo eje se representa los

    valores mnimo y mximo, la primera y tercera cuartila y la mediana. Si lamedia no est en el centro del rectngulo eso significa que la distribucin no es

    simtrica. (Walter A. Rodrguez, 2008).Ejemplo de representacin horizontal.

    FI-UAQ

    24.520 33.5 39 45

    Q 1X mn Q 2 Q 3 X mx

    CAJAS Y EJES

    ESQUEMA 1.09 Cajas y ejes, representacin horizontal.

    FI-UAQ

    Atpicos

    50 % 95 %

    Aosestudiados

    Extremos0

    10

    15

    20

    Mediana

    5

    ESQUEMA 1.10 Cajas y ejes, representacin vertical

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    32/221

    32

    UNIDAD 2 ESTADSTICA DESCRIPTIVA.

    OBJETIVO: Estudiar y analizar los elementos bsicos para describir patrones

    generales y derivaciones de stos en un conjunto de datos especficos.

    2.1 Definicin y parmetros estadsticos.

    Los registros u observaciones efectuados proporcionan una serie de datos que

    necesariamente deben ser ordenados y presentados de una manera inteligible.

    La Estadstica Descriptiva desarrolla un conjunto de tcnicas cuya finalidad espresentar y reducir los diferentes datos observados. (Santiago Fernndez,

    2002).

    Mtodos tabulares y grficos.- Tabla de frecuencia, histograma, polgono, la

    curva S, cajas y ejes y pastel.

    Medidas descriptivas.-

    Medidas de tendencia central.

    Media, mediana, moda.

    Medidas de dispersin.

    Amplitud, varianza, desviacin estndar, coeficiente de variacin.

    Medidas de posicin.

    Cuartiles, centiles, deciles, sesgo, curtosis.

    Medidas de asociacin se desarrollan en el Capitulo 3.

    .-SIGMA.- indica la operacin de suma

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    33/221

    33

    As=

    n

    i

    Xi

    1

    ; es la suma de los nmeros :

    2.2 Medidas de tendencia central.

    Son indicadores estadsticos que muestran hacia qu valor (o valores) se

    agrupan los datos. (Vctor Quesada, 2007).

    Son tambin llamadas medidas de ubicacin y son las que refieren las medidas

    que se sitan o tienen la tendencia a situarse en la parte central de la

    distribucin de los datos.

    Media ().- Es el promedio aritmtico de un grupo de datos que se determinamediante la suma de los valores de los datos, dividida por el nmero de

    valores.

    Dados los nnmeros , la media aritmtica se define simplementecomo:

    Donde

    .- media muestral..- suma de los valores.

    n.- nmero de datos de la muestra.

    Desventaja.- La media por ser un punto de equilibrio de los datos, es muy

    sensible a la presencia de observacin extrema.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    34/221

    34

    Ejemplo.- Se presentan los volmenes de venta de energa elctrica en una

    agencia por cada da durante 13 das, dado el valor en miles de pesos. Calcular

    el promedio de ventas durante el periodo.

    7, 5, 8, 9, 6, 10, 9, 4, 5, 6, 7, 6, 6

    Media para datos agrupados:

    Ejemplo.- Calcular la media de los datos agrupados de la tabla de frecuencia

    dada.

    Mediana.- Es el valor central de mis datos, y se utiliza cuando existe asimetra

    en la distribucin y en este caso la media no sera una buena medida de

    tendencia central, ya que por ser el punto de equilibrio de los datos resulta muy

    afectada por los valores extremos.

    Mediana Me= .- Es el conjunto de nmeros ordenados de menor a mayor ydonde se ubicara el valor que se encuentre a la mitad.

    Si n es un nmero non, solo habr un valor central si n es un nmero par habr

    dos valores compatibles y la x se obtiene al calcular la media de estos.

    Ejemplo: Calcular la mediana de los datos mostrados.

    7 5 8 9 6 10 9 4 5 6 7 6 6

    4 5 5 6 6 6 6 7 7 8 9 9 10

    Observa el comportamiento con un valor extremo de los datos anteriores:

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    35/221

    35

    Por lo tanto la mediana representa el 50% de mi informacin

    La mediana para datos agrupados: se localiza en aquella clase donde esta el

    50% de mis datos. Para encontrar la clase de la mediana se deber observar la

    frecuencia relativa acumulada e identificar aquella clase que agrupe el 50% demis datos y definirla en funcin de su valor para asignar Llc, M de clase LSc.

    Moda:.- Es el valor (si existe) que ocurre con mayor frecuencia, si este valores nico se conoce como unimodal en caso de que se presenten 2 o ms

    valores con la misma frecuencia mxima se dice que es bimodal o trimodal.

    La moda es una medida de tendencia central poco usada debido a que puede

    no existir o a menudo no es un valor nico.

    Ejemplo: 7, 5, 8, 9, 6, 10, 9, 4, 5, 6, 7, 6, 6

    La moda es

    su frecuencia es 4

    Para calcular la moda en datos agrupados solo se identificara la clase que

    tenga mayor frecuencia y esta ser la clase modal y se asignara para ello la

    marca de clase.

    Cuando la distribucin de frecuencia es simtrica la ,,coincidirn.Ejemplo.- Sean las horas de trabajo empleados para realizar una encuesta.

    6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1, 10.8,

    Calcular, ,: , ,

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    36/221

    36

    Al comparar las medidas de tendencia central se pueden presentar 3 casos.

    .- En este caso se dice que tiene asimetra hacia la derecha, esto esque el histograma o polgono de frecuencia presenta una cola extendida hacia

    la derecha.

    Ejedesime

    tra.

    Curva de asimetra positiva.

    FI UAQ

    ESQUEMA 2.01 Asimetra positiva.

    Si la relacin se invierteAhora si.- la distribucin es simtrica

    Curva simtrica

    FI.UAQ

    ESQUEMA 2.02 Curva simtrica.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    37/221

    37

    Ancdota para reflexionar en clase:

    Confundir media y mediana, es una moda?

    A B

    Media

    Media

    medianamoda

    FI-UAQ

    ESQUEMA 2.03 Ilustracin media, mediana y moda.

    En una nota informativa se encontr el comentario de un presidente

    con el subsiguiente comentario burln del periodista. Quin estaba

    ms errado?

    El presidente se ha mostrado muy consternado al comprobar

    el resultado de una estadstica fiable, segn la cual la mitad de

    los ciudadanos tiene una inteligencia por debajo de la media.

    No soy capaz de recordar si era inteligencia, nivel cultural u otra cosa similar,

    en todo caso era una cualidad positiva la que se estaba midiendo. El resto de la

    noticia era una mofa hacia el compungido presidente, que se poda resumir as:

    Qu burro el presidente, no sabe que por definicin de la media, eso debeocurrir necesariamente!

    Es una confusin muy comn. Adems socialmente es muy excusable. Hoy en

    da es incluso de buen tono exhibir ignorancia en cuestin de nmeros, y no

    digamos de estadsticas. Es sin embargo ah donde nos engaan todos los

    das. El anumerismo (de los dems, claro est) es una de las mejores

    herramientas de manipulacin.

    http://tiopetrus.blogia.com/2003/100301-confundir-media-y-mediana-es-una-moda-.phphttp://tiopetrus.blogia.com/2003/100301-confundir-media-y-mediana-es-una-moda-.phphttp://tiopetrus.blogia.com/2003/100301-confundir-media-y-mediana-es-una-moda-.php
  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    38/221

    38

    En el caso que nos ocupa, a mi no me queda claro que la estulticia presidencial

    estuviera por encima de la media, ni que la del comentarista estuviera por

    debajo.

    Para empezar, debiera comentar que la intuicin no es una herramienta de fiaren matemticas. Es tan importante como la inspiracin en los poetas, pero no

    ms. No creo que con inspiracin se pueda componer una gran obra, sino con

    mucho trabajo y sudor. Posiblemente el presidente caa en un error, pero el

    comentarista caa en otro con total certeza. Vamos a explicarlo. Debido a una

    cosa muy interesante y muy profunda de la que me gustara hablar mas

    adelante y que se llama el Teorema central del lmite, estamos acostumbrados

    a las distribuciones simtricas, como la de la figura A. En ellas coincide lamedia (que todo el mundo sabe lo que es), la moda (que es el valor con mayor

    frecuencia observado) y la mediana, que es el valor que deja tantas

    observaciones por arriba como por debajo. Si la distribucin no es simtrica,

    tenemos situaciones como la de la figura B. La media est desplazada respecto

    a las dems medidas centrales, y es claro que en este segundo caso ms de la

    mitad de la poblacin est por debajo de la media. Siempre ser la mediana,

    por su propia definicin la que estar centrada respecto al nmero deobservaciones a ambos lados, no la media.

    Tena nuestro hipottico presidente motivos de pesar?

    Pues segn se mire, s. Si la distribucin hubiera sido asimtrica en sentido

    contrario a la de la figura B, ms de la mitad de la poblacin hubiera tenido una

    inteligencia, cultura o educacin superior a la media, puesto que la mediana

    sera de valor superior a la media. Esto supone un desplazamiento de la masa

    total hacia valores ms altos, y es claramente positivo para la poblacin, si el

    parmetro que se mide es una cualidad positiva para la misma. Eso no se

    produca, pues la noticia implicaba una distribucin simtrica.

    Se refera a eso el presidente?

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    39/221

    39

    Lo dudo.

    Tena motivos de mofa el comentarista? Pues realmente, si los tena no era

    por lo que l crea... HISTORIAS MATEMTICAS. Jess M. Landart.

    2.3 Medidas de dispersin.

    Las medidas anteriores no son suficientes para caracterizar la forma en que se

    distribuye la informacin.

    Este es el otro aspecto a considerar que debe tomarse en cuenta que es la

    variabilidad de las observaciones.

    Medidas de dispersin.- Son medidas que describen la variacin o variabilidad

    de una coleccin de datos en funcin de sus valores medios.

    Se clasifican en:

    Amplitud, varianza, desviacin estndar y coeficiente de variacin.

    Ejemplo.- Se tienen las dos muestras de una misma poblacin, calcular las

    medidas de tendencia central.

    A.- 0, 4, 5, 8, 11, 12, 16, 16, 0, 5, 5, 8, 8, 11, 11, 16, 17, 8, 8,

    B.- 8, 8, 8, 10, 11, 7, 5, 6, 9, 3, 5, 6, 7, 9, 11, 13, 13, 16, 18

    Medidas de tendencia

    central A B

    8.9 9.1 8 8 8 8

    TABLA 2.01 Media, mediana y moda.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    40/221

    40

    Las medidas de dispersin nos ayudan a conocer que tan homogneos son los

    datos, que tan variables son, que tan densos o que tan dispersos se

    encuentran nuestros datos.

    Amplitud, ventaja la facilidad con la que se calcula y es la diferencia entra lasobservaciones de mayor y menor valor numrico de nuestros datos.

    La comparacin de cada uno de nuestros datos con la media=desviacin

    media: es la suma del valor absoluto de las diferencias de cada valor respecto

    de la media y se divide entre el nmero de datos, con esto se obtiene el

    promedio de las diferencias de cada valor respecto a la media.

    La desviacin media se representa por | | | | | |

    | |

    Varianza.- Es la media aritmtica del cuadrado de las desviaciones respecto a

    la media de una distribucin estadstica.

    La varianza se representa por

    Caracterstica es que esta medida de dispersin no presenta su valor en las

    unidades de la muestra por ello se emplea la medida de dispersin ms

    utilizada que es:

    Desviacin estndar: que es la raz cuadrada de la varianza.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    41/221

    41

    Ejemplo: Calcular la amplitud, la desviacin media, la varianza y la desviacin

    estndar, para los pesos en Kg reportados de una muestra de 10 personas.

    63, 52, 78, 49, 71, 62, 68, 48, 56, 67,

    Ampli tud=30 s2=99.6 s= 9.98

    Para datos agrupados:

    Varianza: Varianza para datos agrupados

    Desviacin estndar:

    Calcular las medidas anteriores para los datos del ejemplo de la tabla de

    frecuencia

    Ejemplo: Determinar la desviacin estndar de las ventas de energa en miles

    de pesos, de dos agencias cuyos datos son los siguientes:

    Agencia A: 20, 16, 17, 16, 21

    Agencia B: 18, 17, 18, 19, 18

    SA= 2.0976 SB=O.6325 Ambas agencias tienen el mismo promedio de ventas pero la agencia B sus

    ventas son ms estables, lo que se refleja en su S menor.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    42/221

    42

    Ejemplo: los siguientes datos representan los pesos y estaturas de estudiantes

    de ingeniera.

    Calcular las medidas de tendencia central y las medidas de

    dispersin vistas.

    Existe una regla emprica que relaciona la S con la

    distribucin de una curva normal, esto es que los datos estn

    uniformemente distribuidos a lo largo de la curva, mismo que

    se hizo teorema que es actualmente uno de los ms

    importantes de la estadstica.

    Teorema de Tchebysheff

    Si al valor de la media se le suma y se le resta el valor de S,

    se tiene que dentro de esa rea est comprendido el 68.21%

    de los datos.

    Si al valor de la

    , se le suma y resta 2 veces el valor de la S

    se tendr el 95.46% de los datos.

    TABLA 2.02 Pesos y estaturas. %Si al valor de la , se le suma y resta 3 veces el valor de la S, se tendr el99.73% de los datos.

    %

    Este teorema nos puede dar una idea de cunto va a valer la desviacin

    estndar

    Se garantiza que en 4S se tendr el 100% de todos los datos.

    KG. CM.

    1 63 162

    2 52 158

    3 78 167

    4 49 151

    5 71 162

    6 62 168

    7 68 167

    8 48 153

    9 58 152

    10 67 173

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    43/221

    43

    Coeficiente de variacin.- C.V. Es un valor relativo expresado en porcentaje y

    ayuda a comparar dos poblaciones o muestras, a fin de observar que tanto

    vara una de otra. Esto es dos colecciones de datos pero relacionados con la

    misma variable. El C.V. es tpicamente menor que 1.

    En forma algebraica se expresa:

    Ejemplo.- Calcular el coeficiente de variacin de los pesos y estaturas e indica

    cual de los dos tiene mayor variacin.

    CvX=16.25% Cvy=4.7%

    Los pesos tienen una mayor variabilidad en las 10 personas consideradas.

    Ejemplo.- En un proceso de certificacin, dos auditores A y B realizan

    auditorias a diferentes facultades en periodos y tiempos iguales, despus de

    tomar los datos y realizar un anlisis estadstico se llego al siguiente resultado:

    el auditor A obtuvo un promedio de registros errneos auditados de 300 y una

    S=10, el auditor B tuvo un promedio de registros errneos auditados de 150 y

    una S= 9. Cul de los dos nos dar mayor certidumbre en la certificacin?

    Va= 10/300=0.033

    Vb= 9/150= 0.06

    El B tiene mayor variacin que A.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    44/221

    44

    2.4 Medidas de posicin.

    Determina la conformacin geomtrica de las distribuciones mostradas en un

    polgono de frecuencias, su importancia radica en conocer cmo se comportan

    los datos motivo de estudio a travs de las curvas de distribucin.

    Cuartiles, centiles, y deciles.- Son medidas de posicin ms finas dentro de la

    muestra.

    Cuartiles.- Es la coleccin de datos dividida en cuatro partes y se obtiene su

    ubicacin o posicin de estos por analoga el Q2= mediana cuyo valor se sita

    justo a la mitad de los datos ordenados.

    A

    0

    B

    100%

    Q1

    25%

    Q2 Q3

    50% 75%

    ESQUEMA 2.04 Cuartiles.

    Deciles. Son los cuantiles que dividen una distribucin en 10 tantos o

    intervalos, por lo que se tienen 9 puntos de divisin, los deciles, que originan

    los 10 intervalos.

    Los deciles, que se representan por y pueden ser marcados en una grficacomo la siguiente:

    A

    0

    D1

    10%

    D2

    20%

    D3

    30%

    D4

    40%

    D5

    50%

    D6

    60%

    D7

    70%

    D8

    80%

    D9

    90%

    B

    100%

    ESQUEMA 2.05 Deciles.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    45/221

    45

    Centiles es la coleccin de datos dividida en cien partes, cada una de ellas

    corresponde a un centil, por lo que se tienen 100 centiles, as, el centil 50 es

    igual a la mediana.

    La determinacin de los centiles se realiza mediante la expresin siguiente.

    Donde

    Cx.-Centil que se desea calcular.

    X.- Nmero del centil.

    L.- Lmite inferior de la clase.

    I.- Amplitud del rango de la clase del centil.

    N.- Nmero de datos.

    100.- Cien centiles.

    F.- Frecuencia acumulada de la clase anterior a la clase del centil.

    Fi.- Frecuencia de la clase que contiene al centil.

    Para identificar la clase que contiene al centil se emplea la relacin.

    Y el resultado se buscara en la frecuencia acumulada el primer valor mayor al

    obtenido y esta ser la clase del centil.

    Para el clculo de los cuartiles se emplea una expresin anloga de la forma

    siguiente.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    46/221

    46

    Donde

    Qx.-Cuartil que se desea calcular.

    X.-Nmero del cuartil.

    N.-Nmero de datos.

    I.- Amplitud del rango de la clase del cuartil.

    L.- Lmite inferior de la clase del cuartil.

    F.- Frecuencia acumulada de la clase anterior a la clase del cuartil.

    Fi.- Frecuencia de la clase del cuartil.

    QiQ3.- Es el rango intercuartlico rango intercuartil.

    2.5 Asimetra y apuntamiento.

    Sabemos cmo calcular valores alrededor de los cuales se distribuyen las

    observaciones de una variable sobre una muestra y sabemos cmo calcular ladispersin que ofrecen los mismos con respecto al valor de central. Nos

    proponemos dar un paso ms all en el anlisis de la variable. En primer lugar,

    nos vamos a plantear el saber si los datos se distribuyen de forma simtrica

    con respecto a un valor central, o si bien la grfica que representa la

    distribucin de frecuencias es de una forma diferente del lado derecho que del

    lado izquierdo.

    Si la simetra ha sido determinada, podemos preguntarnos si la curva es ms o

    menos apuntada (larga y estrecha). Este apuntamiento habr que medirlo

    comparado a cierta distribucin de frecuencias que consideramos normal (no

    por casualidad es ste el nombre que recibe la distribucin de referencia).

    Estas ideas son las que vamos a desarrollar en lo que resta del captulo.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    47/221

    47

    Para saber si una distribucin de frecuencias es simtrica, hay que precisar con

    respecto a qu. Un buen candidato es la mediana, ya que para variables

    continuas, divide al histograma de frecuencias en dos partes de igual rea.

    Podemos basarnos en ella para, de forma natural, decir que una distribucinde frecuencias es simtrica si el lado derecho de la grfica (a partir de la

    mediana) es la imagen por un espejo del lado izquierdo.

    Me Me

    Cola

    FI-UAQ

    ESQUEMA 2.06 Distribucin de frecuencias simtrica y asimtrica.

    Cuando la variable es discreta, decimos que es simtrica, si lo es con respectoa la media.

    Observacin.

    Se podra pensar que definir la simetra usando la mediana para

    variables continuas y usando la media para variables discretas es una

    eleccin arbitraria. En realidad esto no es as, pues si una variable es

    continua, coinciden ambos criterios de simetra (con respecto a la mediay a la mediana). Es ms, se tiene que media y mediana coinciden para

    distribuciones continuas simtricas. Por otro lado, en el caso de

    variables discretas, la distribucin es simtrica si el lado derecho del

    diagrama se obtiene por imagen especular desde la media. En este caso

    coincide la media con la mediana si el nmero de observaciones es

    impar.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    48/221

    48

    Si la variable es continua simtrica y unimodal, coinciden la media, la

    mediana y la moda.

    Dentro de los tipos de asimetra posible, vamos a destacar los dos

    fundamentales:

    Asimetra positiva:

    Si las frecuencias ms altas se encuentran en el lado izquierdo de la media,

    mientras que en derecho hay frecuencias ms pequeas (cola).

    Asimetra negativa:

    Cuando la cola est en el lado izquierdo.

    MeMe

    Asim. positiva Asim. negativa

    FI-UAQ

    ESQUEMA 2.07 Asimetra positiva y negativa.

    Cuando realizamos un estudio descriptivo es altamente improbable que ladistribucin de frecuencias sea totalmente simtrica. En la prctica diremos que

    la distribucin de frecuencias es simtrica si lo es de un modo aproximado. Por

    otro lado, an observando cuidadosamente la grfica, podemos no ver claro de

    qu lado estn las frecuencias ms altas. Conviene definir entonces unos

    estadsticos que ayuden a interpretar la asimetra, a los que llamaremos

    ndices de asimetra, y que denotaremos mediante . Vamos a definir acontinuacin algunos de los ndices de asimetra ms usuales como son el

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    49/221

    49

    ndice basado en los tres cuartiles, el momento de tercer orden y la distancia

    entre la moda y la media o la media y la mediana.

    Sesgo o Skewness.- Determina el grado de asimetra de la curva o polgono de

    frecuencia. Si esta curva tiene la cola ms larga hacia la derecha se dice quetiene sesgo positivo o que est cargada hacia la derecha. Si la cola ms larga

    la tiene hacia la izquierda se dice que tiene un sesgo negativo o que est

    cargada hacia la izquierda.

    Para determinar el valor del sesgo se emplea la expresin siguiente:

    Si el sesgo = es una curva o simtrica

    Curva simtrica.

    Ejedesimetra.

    FI-UAQ

    ESQUEMA 2.08 Curva simtrica.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    50/221

    50

    Si el sesgo (-).- Entonces est cargada a la izquierda.

    Curva de asimetra negativa.

    E

    jedesimetra.

    FI-UAQ

    ESQUEMA 2.09 Curva asimtrica negativa.

    Si el sesgo (+).- Entonces est cargada a la derecha.

    Ejedesimetra.

    Curva de asimetra positiva.

    FI UAQ

    ESQUEMA 2.10 Curva asimtrica positiva

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    51/221

    51

    Nota.- El valor ms cercano a 0 tiende a la normal, por lo que el grado de

    asimetra es menor que aquel que se aleja del cero. No importa el valor del

    sesgo sino el sentido.

    Ejemplo.- Tiempo aceptable en contrato y puesta en servicio de la luz. (Hastasu conexin).

    El sesgo ayuda a definir especificaciones o niveles, mnimos mximos o

    deseables.

    Coeficiente de apuntamiento o Curtosis (K)

    Determina el grado de pronunciamiento de la cspide de la curva o polgono de

    frecuencias o histograma es una medida de Picudez

    La interpretacin del resultado est dada: cuando

    K= 0.26 curva mesocrtica forma: regular

    Curva mesocrticaFI-UAQ

    ESQUEMA 2.11 Curva mesocrtica.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    52/221

    52

    K= < 0.20 curva leptocrtica forma: punta

    Curva leptocrtica.FI-UAQ

    ESQUEMA 2.12 Curva leptocrtica.

    K > 0.26 curva platicrtica forma: plana

    Curva platicrtica. FI-UAQ

    ESQUEMA 2.13 Curva platicrtica.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    53/221

    53

    Para determinar el valor se usa la expresin siguiente:

    Donde:

    K.- coeficiente de Curtosis

    Q3.- Cuartil 3.

    Q1.-Cuartil 1.

    C90.- Centil noventa o percentil 90.

    C10.- centil 10 o percentil 10

    Ejemplo analizar las 72 lecturas del consumo de energa en industrias por hora

    en Watts.

    Xi F F

    1 27-31 29 16 16

    2 31-35 33 17 33

    3 35-39 37 20 53

    4 39-43 41 10 63

    5 43-47 45 6 69

    6 47-51 49 2 71

    7 51-55 53 1 72

    TABLA 2.03. Consumo de energa.

    Calcular:

    M de tendencia central

    M de dispersin

    M de posicin o de forma

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    54/221

    54

    UNIDAD 3: REGRESIN Y CORRELACIN.

    OBJETIVO: Estudiar y analizar el comportamiento de dos o ms muestras.

    La credibilidad de cualquier inferencia realizada utilizando la metodologa

    estadstica depende fuertemente de que se cumplan las suposiciones bajo las

    cuales se derivan las tcnicas usadas.(Infante y Zrate de L, 1990).

    3.1 Diagrama de dispersin:

    Se usan en el anlisis de correlacin dentro de las tcnicas estadsticas para

    identificar la relacin que existe entre dos variables.

    Cuando se trata del anlisis de dos variable se llama anlisis bivariado

    Por lo tanto el anlisis de correlacin ser un anlisis de ese tipo.

    Al analizar el comportamiento de dos variables y se muestra a travs del

    diagrama de dispersin que, una variable tiene influencia sobre a otra se dice

    que existe correlacin, desde el punto de vista matemtico una variable es

    dependiente y la otra ser independiente.

    Ejemplo. Si se tiene un terreno, donde se tienen plantados determinados tipos

    de vegetales, stos son alimentados con una mnima cantidad de agua que

    constantemente produce bajo rendimiento en la cosecha. Si a esta plantacin

    se le suministra una mayor cantidad de agua, la cosecha tendr un rendimiento

    mayor dado que el agua es un elemento indispensable para el crecimiento de

    los vegetales. Si incrementamos el volumen de agua an mas se observar

    que el rendimiento de la cosecha se incrementar, (Entendemos que existe un

    punto de equilibrio en el suministro de agua, de lo contrario podemos caer en el

    error de suministrar agua en exceso e inundar la plantacin, situacin negativa

    para la cosecha).

    De lo anterior se deduce que la variable volumen de agua tiene influencia sobre

    la variable rendimiento de la cosecha, por lo tanto existe una correlacin, una

    forma de demostrarlo es construyendo el diagrama de dispersin, tomando

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    55/221

    55

    datos de la variable volumen de agua (x) y datos de la variable rendimiento de

    la cosecha (y).

    Se construye una tabla donde se muestra los pares ordenados y se grafican

    dentro de un eje de coordenadas mostrando slo los puntos de stos.

    Y los resultados posibles de un diagrama de dispersin son:

    x

    y

    No hay correlacin.

    x

    Hay correlacin positiva.

    x

    Hay correlacin negativa.

    x

    y

    A. Correlacin perfecta negativa (-)B. Correlacin perfecta positiva (+).

    A B

    ESQUEMA 3.01 Diagramas de dispersin.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    56/221

    56

    3.2 Covarianza.

    El anlisis de covarianza es una tcnica que combina los aspectos del anlisis

    de varianza y de regresin, el cual consiste en elegir una o ms variables

    adicionales o covariables que estn relacionadas con la variable respuesta. Lasobservaciones concomitantes pueden ser usadas para incrementar la precisin

    de las comparaciones de tratamientos, previendo que las observaciones

    concomitantes y las observaciones principales sobre las unidades

    experimentales, pudiesen estar correlacionadas. (Cox, 1958).

    Si Sxy> 0 hay dependencia directa (positiva), es decir, a grandes valores de

    x corresponden grandes valores de y.

    Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una

    relacin lineal entre las dos variables estudiadas. Es decir, puede

    directamente no haber relacin entre las variables, o bien existir una

    relacin no lineal.

    Si Sxy< 0 hay dependencia inversa o negativa, es decir, a grandes valores

    de x corresponden pequeos valores de y.

    Otro coeficiente ms usado y que se apoya en la covarianza es el coeficiente

    de correlacin (r) que se calcula de la forma siguiente.

    ( )

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    57/221

    57

    Donde:

    Scxy= covarianza

    Donde:

    r = coeficiente de correlacin serial

    Scxy= Suma de cuadrados de xy (covarianza)

    Scx= suma de cuadrados de x

    Scy= suma de cuadrados de y

    N= nmero de pares ordenados (pares de datos x, y)

    3.3 Correlacin.

    La correlacin indica la fuerza y la direccin de una relacin lineal entre dos

    variables aleatorias. Se considera que dos variables cuantitativas estn

    correlacionadas cuando los valores de una de ellas varan sistemticamente

    con respecto a los valores homnimos de la otra: si tenemos dos variables (A y

    B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B

    y viceversa. La correlacin entre dos variables no implica, por s misma,

    ninguna relacin de causalidad.

    La relacin entre dos variables cuantitativas queda representada mediante la

    lnea de mejor ajuste, trazada a partir de la nube de puntos. Los principales

    http://es.wikipedia.org/wiki/Variable_aleatoriahttp://es.wikipedia.org/wiki/M%C3%ADnimos_cuadradoshttp://es.wikipedia.org/wiki/M%C3%ADnimos_cuadradoshttp://es.wikipedia.org/wiki/Variable_aleatoria
  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    58/221

    58

    componentes elementales de una lnea de ajuste y, por lo tanto, de una

    correlacin, son la fuerza, el sentido y la forma:

    La fuerza extrema segn el caso, mide el grado en que la lnea

    representa a la nube de puntos: si la nube es estrecha y alargada, se

    representa por una lnea recta, lo que indica que la relacin es fuerte; si

    la nube de puntos tiene una tendencia elptica o circular, la relacin es

    dbil.

    El sentido mide la variacin de los valores de B con respecto a A: si al

    crecer los valores de A lo hacen los de B, la relacin es positiva; si al

    crecer los valores de A disminuyen los de B, la relacin es negativa.

    La forma establece el tipo de lnea que define el mejor ajuste: la lnea

    rectal, la curva monotnica o la curva no monotnica.

    Una vez construido el diagrama de dispersin y bajo el criterio de

    comportamiento podremos decir si existe correlacin y de qu tipo o

    simplemente no hay correlacin.

    Si hay correlacin es necesario conocer que tanta correlacin existe, que me

    permita tomar decisiones sobre la variable independiente y que logre buenos

    resultados sobre la variable dependiente.

    El resultado del coeficiente de correlacin r se basa en las siguientes

    propiedades:

    -Su valor se encuentra entre -1 y 1

    -Si es mayor, ejemplo 1.3, indica que algo anda mal

    -Si es mayor a indica que las variables crecen o decrecensimultneamente.

    http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_no_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_no_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Curva_monot%C3%B3nica&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=L%C3%ADnea_rectal&action=edit&redlink=1
  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    59/221

    59

    -Si es menor a indica que cuando una crece la otra decrece yviceversa.

    -Si su valor es aproximadamente 1 -1 existe una alta asociacin

    entre las dos variables.

    Anlisis de los parmetros anteriores

    0

    -0.7

    -1

    0.7

    1

    NULA CORRELACIN.

    MALA CORRELACIN.

    ALTA CORRELACIN. ALTA CORRELACIN.

    Conclusin.- para un valor de r muy cercano a 1 -1 se tendr alta

    correlacin entre las variables X y Y.

    Ejemplo: En una planta generadora se cuenta con un grupo de motores que

    con el paso del tiempo se registro su antigedad y los costos de mantenimiento

    dan los resultados siguientes en miles de pesos:

    MOTORES

    Antigedad

    (aos)

    Costo de

    Mantenimiento

    1 8 276

    2 9 543

    3 3 69

    4 5 120

    5 8 378

    6 6 246

    7 7 351

    8 4 147

    9 3 192

    10 11 423

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    60/221

    60

    11 5 330

    12 10 315

    13 11 543

    14 10 456

    TABLA 3.01 Registro de antigedad y mantenimiento.

    Calcular el coeficiente de correlacin lineal y demostrar que tanta correlacin

    existe entre estas 2 variables.

    Resultados

    AntigedadX Costo Y xy 100 4389 36009 820 1665099

    Scxy= 4659

    Scx= 105.71

    Scy= 289147.50

    Al sustituir los resultados anteriores en la ecuacin de rse obtuvo el

    valor de:

    COEFICIENTE DE CORRELACIN En conclusin se tiene una alta correlacin.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    61/221

    61

    ESQUEMA 3.02 Diagrama de dispersin.

    3.4 Regresin lineal simple.

    Con el fin de tener la posibilidad de hacer predicciones o estimacin sobre una

    muestra de datos, se calcular y construir la recta de mejor ajuste,

    empleando el anlisis de regresin lineal.

    Para realizar dichas estimaciones es necesaria la construccin de la recta de

    mejor ajuste cuya ecuacin es la siguiente:

    DONDE:

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    62/221

    62

    Para conocer las constantes y se emplean las ecuaciones siguientes:

    Para el ejemplo anterior tenemos:

    Con las constantes determinadas tenemos que la recta de mejor ajuste ser:

    Conociendo la ecuacin de la recta se podr construir esta asignando valores a

    la variable dependiente (X) Y se obtiene el valor de la variable Y.

    Si

    x=2

    Y=-1.2976 + 44.072(2)

    Y= 86.8456

    Si x=12

    Y= -1.2976 + 44.072 (12)

    Y= 527.56185

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    63/221

    63

    Los valores de x fueron asignados de acuerdo a la coleccin de datos y se

    toman solo dos valores que son suficientes para construir la recta considerando

    como aprecio los valores extremos que son 2 y 12 como caso postular de estacoleccin.

    Se procede a construir la grafica en el diagrama de dispersin dando el

    resultado siguiente:

    ESQUEMA 3.03 Recta de regresin.

    Ya con la recta trazada, es posible realizar algunas predicciones con base a los

    resultados Ejemplo: si se tiene la entrada de un equipo con 8.7 aos de

    antigedad podemos a travs de la recta estimar cual ser el costo de

    mantenimiento, mediante la grafica anterior:

    1.- Ubicar la edad 8.7 y trazar una recta hasta intersecar la recta de ajuste.

    2.- A partir del punto de interseccin se traza otra lnea hacia la izquierda al eje

    de mantenimiento.

    3.- El punto donde cruza ser el costo especfico para la edad del equipo que

    result 382.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    64/221

    64

    El resultado se conoce como una estimacin y es evidente que el resultado no

    tendr la exactitud deseada, pero se considera aceptable como estimacin.

    Ejercicio 1. Los datos siguientes fueron tomados de un estudio donde se

    usaron mezclas de gasolina y una gasolina reformulada.

    Motor 1 2 3 4 5 6 7 8 9 10

    Edad 0 0 2 11 7 16 9 0 12 4

    Base 1.72 4.38 4.06 126 531 57 337 344 74 124

    Reformada 1.88 593 554 267 653 74 494 489 69 142

    TABLA 3.02 Registro del tipo de gasolina.

    Construir la grafica de dispersin y discutir en clase.

    Ejercicio 2. La corrosin de las barras de acero de refuerzo es el problema de

    durabilidad ms importante para las estructuras de concreto reforzado. La

    carbonatacin del concreto resulta de una reaccin qumica que disminuye el

    valor del pH lo suficiente para iniciar la corrosin de las barras.

    Datos.

    X.- Profundidad de la carbonatacin (mm).

    Y.- Resistencia (MPa).

    Los datos son de una muestra tomada de un determinado edificio.

    x 8 15 16.5 20 20 27.5 30 30 33

    y 22.8 27.2 23.7 17.1 21.5 18.6 16.1 23.4 13.4

    x 38 40 45 50 50 55 55 59 65

    y 19.5 12.4 13.2 11.4 10.3 14.1 9.7 12 6.8TABLA 3.03 Registro de carbonatacin y resistencia.

    Construir la grfica de dispersin y discutir en clase.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    65/221

    65

    Ejercicio 3. Los datos siguientes muestran el nmero de milmetros de lluvia

    mxima total en 30 meses que se han presentado en la ciudad de Adela Mara,

    Argentina.

    MESES 2005 2006 2007

    ENERO 213 111 127

    FEBRERO 48 185 171

    MARZO 76 182 180

    ABRIL 55 129 20

    MAYO 10 7 14

    JUNIO 2 5 31

    JULIO 11 8 10

    AGOSTO 29 0 0

    SEPTIEMBRE 26 5 120

    OCTUBRE 83 77 131

    NOVIEMBRE 117 108 18

    DICIEMBRE 40 184 97

    Fuente: Gobierno de Argentina.

    TABLA 3.04 Registro de mm de lluvia.

    A travs de un anlisis estadstico determine:

    - Grficos: Histograma, Ojiva, Cajas y ejes.

    - Medidas de tendencia central

    - Medidas de dispersin.

    - Medidas de asociacin.

    Calcular la correlacin y an si no existiera calcular la recta que mejor se

    ajuste.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    66/221

    66

    UNIDAD 4: FUNDAMENTOS DE PROBABILIDAD

    OBJETIVO: Anlisis y conocimiento de la probabilidad como una manera de

    describir cuantitativamente los fenmenos aleatorios.

    Abarcar la parte de la probabilidad que tiene relacin ms directa con

    problemas de inferencia estadstica permite cuantificar el grado de

    incertidumbre.

    4.1 Conjuntos y su algebra.

    Un evento es en realidad un conjunto, es por ello que la teora elemental de

    conjuntos se puede usar para estudiar eventos.

    Conjunto.-Una coleccin o agrupacin de objetos que tienen en comn alguna

    propiedad. Tales objetos pueden ser materiales o tambin pueden ser

    abstractos (como los nmeros). Se acostumbra usar letras maysculas del

    alfabeto para designar conjuntos y letras minsculas para representar suselementos. (Marian Wisniewski, 2001).

    Simbologa.

    CONJUNTO

    A= Los nombres de la clase de PYE

    Son formas de representacin de conjuntos

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    67/221

    67

    DIAGRAMAS DE VENN- EULER

    Son representaciones grficas de los eventos de un experimento. Usando

    rectngulos para el espacio muestral y figuras circulares u ovaladas para los

    eventos. (Olga Vladivmirovna, 2005).

    U

    A

    B

    FI-UAQ

    ESQUEMA 4.01 Diagrama de Venn- Euler.

    Las siguientes operaciones se usan para construir eventos nuevos a partir de

    eventos determinados.

    1.- La unin de dos eventos A y B se denota por AUB es el evento que consiste

    en los resultados que estn ya sea en A B en ambos eventos.

    (A U B) C U

    A U B = U

    A U = A

    A U B = B U A

    ESQUEMA 4.02 ConjuntoA U B.

    UA B

    FI-UAQ

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    68/221

    68

    2.- La interseccin de dos eventos A y B se denota es el evento queconsiste en los resultados que estn tanto en A como en B (elementos

    comunes de los eventos).

    ESQUEMA 4.03 Conjunto

    3.- Complemento.- son los elementos del universo que no pertenecen al

    conjunto A y se denota .

    ESQUEMA 4.04 Conjunto

    UA B

    FI-UAQ

    UA B

    FI-UAQ

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    69/221

    69

    La diferencia de A y B se denota como A/B y es el conjunto de elementos que

    pertenecen a A pero al conjunto B.

    UA B

    FI-UAQ

    ESQUEMA 4.05 Conjunto

    EJEMPLO: Dados los siguientes conjuntos

    A= {1,2,3,4,5} B= {1,3,5,7,9} C={2,4,6,8,10}

    Definir el universo y encontrar:

    EJEMPLO: Dados los conjuntos.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    70/221

    70

    Definir Universo y encontrar.

    Ejercicio resuelto: Se realizo una encuesta a 1000 personas en relacin a sus

    adquisiciones en distintas libreras, los resultados de la investigacin fueron los

    siguientes:

    300 personas compraron en la librera A

    200 en la librera B

    250 en la librera C

    50 en la librera B y A

    75 en la librera A y C

    60 en la librera B y C

    25 en las 3 libreras

    ESQUEMA 4.06 Ejercicio resuelto.

    Con la ayuda del Diagrama de Venn-Euler. Indicar:

    a) Cuntas personas no compraron en ninguna de las 3 libreras.

    410.

    b) Cuantas compraron nicamente en la A.

    200.

    200 25

    25

    50 35

    140

    115

    410

    A B

    C

    FI-UAQ

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    71/221

    71

    c) Cuntas compraron solamente en la B.

    115.

    Ejercicio. Dibujar en diagrama de Venn-Euler lo siguiente:

    a) b) c)

    Lo anteriormente expuesto se liga con las leyes de probabilidad ya que se

    tienen ms facilidades para interpretar.

    4.2 Experimentos aleatorios, espacios mustrales y eventos.

    Azar y desconocimiento.- Seleccionar un articulo sin verlo no se sabe si es B

    M

    Azar e incertidumbre.- Cuando desconocemos el posible resultado de un gran

    negocio exitoso o de fracaso.

    Experimento.- Proceso mediante el cual obtenemos una observacin y puede

    ser aleatorio o determinstico.

    Aleatorio.- No se sabe que va a ocurrir, aquel cuyos resultados no pueden

    producirse antes de su realizacin y estn sujetos al azar.

    Determinstico.- Aquel cuyo resultado siempre es el mismo.

    Espacio muestral.- Es el conjunto de todos los posibles resultados de un

    experimento probabilstico y se denota por S. Los elementos de un espacio

    muestral se llaman puntos muestrales. (Olga Vladimirovna, 2005).

    El espacio muestral obliga a tener mucha claridad en la poblacin objetivo

    cuando est bien definido.

    Ejemplo: cul es tu opinin del gobierno que sale?

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    72/221

    72

    Tipos de espacio muestral.

    NOTA: Cuando se tenga una observacin se debe tener lugar donde caiga

    esta.

    1.- Ejemplo: Se toma un litro de leche y se desea determinar el porcentaje de

    agua por volumen, definir el espacio muestral.

    2.- Ejemplo: En una muestra de sangre se desea determinar el nmero de

    glbulos blancos y rojos por: definir el E.M.Existen 2 caractersticas x, y

    3.- Cual es el tiempo que tarda un corredor en recorrer 100 m y cul es su

    capacidad respiratoria.

    2 variables

    (T, Cr)

    Definir cul es un EM discreto y cual es un EM continuo de los ejemplos

    anteriores.

    El ejemplo 2: espacio bidimensional discreto.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    73/221

    73

    El ejemplo 3: espacio bidimensional continuo.

    Para cualquier experimento es de gran importancia especificar el espacio

    muestral, ya que algunos subconjuntos interesan ms que otros.

    Ejemplo: Ms del 80% de agua est presente en la leche esto es inaceptable

    por lo que se define un subconjunto A en donde ACEM.

    EM = {x / 80% < x < 100%} No es leche.

    A ESTE TIPO DE CONJUNTOS SE LE CONOCE COMO EVENTOS EN EL

    ESPACIO MUESTRAL.

    Es claro que para determinar al EM en un experimento aleatorio es necesario

    entender perfectamente.

    1.- Qu se va a hacer?

    2.- Qu se va a observar o contar?

    Ejemplo: Si un juego consiste en tirar todos los volados que hagan falta hasta

    obtener tres guilas seguidas o hasta que sean 15 volados si nos fijamos en el

    numero de volados requeridos el EM seria 3, 4, 5,, 15 pero si nos fijamos en

    el nmero de sellos entonces el EM ser 0, 1, 2,,15

    En conclusin: Cuando se tiene un EM se le llama formalmente evento a

    cualquier subconjunto del EM.

    Del ejemplo anterior el EM 3,4,5 ,,15 un evento de estos seria 3,5,7,,15

    evento en el que el numero de tiros es non.

    Si al hacer los volados nos queda:

    AASAASSSAAA

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    74/221

    74

    Han cado 3 guilas seguidas el evento si se realiza ya que el nmero

    necesario para ellos fueron 11 y es non.

    En cambio si resulta: SSSAAA como han cado 3 guilas seguidas, se detiene

    pero el evento no se realizo por sexto.

    Por lo general conviene subdividir el EM. en un cierto nmero de eventos

    E1,E2,E3..En. Una regla es que para cualquier par de eventos porser stos eventos independientes o excluyentes.

    Particiones

    Es posible definir particiones sobre el espacio muestral. Formalmente

    hablando, una particin sobre el EM se define como un conjunto numerable:

    A esta subdivisin se le conoce como particin de un espacio muestral.

    E2 E3

    E4

    E1

    E5

    FI-UAQESQUEMA 4.07 Particin de un espacio muestral.

    http://es.wikipedia.org/wiki/Partici%C3%B3n_(matem%C3%A1ticas)http://es.wikipedia.org/wiki/Partici%C3%B3n_(matem%C3%A1ticas)
  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    75/221

    75

    Ejemplo: El experimento consiste en medir el % de humedad relativa en un

    invernadero.

    EM= { x / 0

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    76/221

    76

    4.4 Permutaciones y combinaciones.

    PERMUTACIN.

    Arreglos sin repeticin: Permutaciones.(Olga Vladimirovna, 2005).

    Dado un conjunto finito con todos sus elementos diferentes, llamamos

    permutacin a cada una de las posibles ordenaciones de los elementos de

    dicho conjunto.

    n= objetos P(n, r)= n(n-1)(n-2),(n-r+1)

    r= forma

    Permutacin Lineal.-

    Si r=n tenemos que P(n, r) = n!

    Si se tienen 4 chips distintos a,b,c,d y se toman uno a la vez tendramos 4

    posibilidades de suceso del E. M.

    Si consideramos que tomamos 2 a la vez el resultado sera ab, ba, ca, ac, ad,

    da, bc, cb, bd, db, cd, dc. E.M. = 12

    Se observa que:

    ab y ba tienen diferente orden ac y ab tendrn diferente contenido.

    Ejemplo 1. De cuntas formas diferentes pueden ocuparse una gerencia y

    una subgerencia si existen 8 candidatos que pueden ocupar indistintamente la

    gerencia o la subgerencia.

    http://es.wikipedia.org/wiki/Conjuntohttp://es.wikipedia.org/wiki/Conjunto
  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    77/221

    77

    Ejemplo 2. Si en una carrera de 400 metros participan 12 atletas. De cuantas

    formas distintas podrn ser premiados los 3 primeros lugares con medalla de

    oro, plata y bronce.

    Ejemplo 3. Cuantos nmeros de los 3 dgitos se pueden formar con los 6

    dgitos siguientes 146789.

    Ejercicio propuesto: Cuantos nmeros de 3 dgitos diferentes r se puedenformar con los dgitos siguientes.

    1, 4, 7, 8, 9, 5.

    Cuantos son menores que 600

    Cuantos son nones

    Cuantos son mltiplos de 5

    Permutaciones circulares.

    Ahora estudiaremos algunos ejemplos de arreglos circulares, sabemos que si

    queremos sentar a cuatro personas una al lado de la otra en fila, el nmero de

    arreglos que podemos hacer es 4!; ahora bien, si las queremos sentar al

    rededor de una mesa circular, de cuntas formas lo podemos hacer?

    Observemos los siguientes arreglos:

    1

    A

    DB

    C

    2

    A

    D

    B C 3

    A

    D

    B

    C 4

    A

    D

    BC 5

    A

    D

    B

    C 6

    A

    D B

    C

    FI-UAQ

    ESQUEMA 4.08 Permutaciones circulares.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    78/221

    78

    Por cada una de las permutaciones o arreglos circulares tenemos 4 de ellos

    diferentes en fila; esto es, el arreglo circular 1 puede leerse en sentido contrario

    a las agujas del reloj de las siguientes formas: ABCD, BCDA, CDAB, y DABC,

    que son 4 arreglos diferentes si fueran en filas; pero es un solo arreglo circular.

    Entonces, en lugar de tener 4! que es el nmero de arreglos en fila, tenemos

    solamente . En consecuencia se puede establecer

    PERMUTACIONES CIRCULARES

    "El nmero de permutaciones circulares de n elementos tomados todos

    a la vez es (n - 1) !" y lo denotaremos por

    Pcir,n = (n - 1)!

    Investigar.- Permutacin con repeticin

    COMBINACIN.- Es una forma en la que pueden presentarse los objetos y en

    la que el orden de aparicin no importa.

    Ejemplo la multiplicacin de los dgitos 2,5,8 el resultado es el mismo.

    La formula general de las combinaciones viene dada:

    n.- nmero total de objetos

    r.- nmero de objetos a considerar

    El nmero de objetos tomados a la vez.

    De cuantas maneras puede elegirse un comit de 4 personas de un club de 15

    miembros.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    79/221

    79

    De cuantas maneras puede seleccionarse un comit de 5 hombres y 4 mujeres

    de un grupo de 10 hombres y 8 mujeres.

    Ejercicio.

    Cuantas palabras de 5 letras 3 consonantes diferentes y 2 vocales diferentes

    se pueden formar con un alfabeto que consta de 27 letras de los cuales 5 son

    vocales.

    Cuantas contienen la letra B y C Cuantas empiezan con B y contienen a C Cuantas empiezan con B y terminan con S Ejemplo. En una caja hay 39 esferas, mezcladas con los nmeros del 1 al 39.

    Si se toman al azar 6 esferas diga cuntas formas diferentes pueden resultar.

    Si se considera el orden de aparicin: Si no se considera el orden de aparicin:

    4.5 Probabilidad.

    Esta surge de los juegos de azar, cartas, dados, monedas, etc. Y est

    relacionada con las tcnicas de conteo.

    Para conocer una probabilidad es necesario conocer el espacio muestral (E.M.)

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    80/221

    80

    Una de las maneras de conocer el EM es a travs del diagrama de rbol, este

    ayuda a conocer todas las formas posibles en que se da un experimento.

    Ejemplo: Moneda, lanzar dado.

    Una probabilidad Priori es conocida de antemano, se sabe que es lo que va a

    ocurrir.

    Las leyes de probabilidad sirven para los fenmenos aleatorios.

    Axiomas de Probabilidad

    1.- P(U) = 1 P(E.M.) = 1

    2.- P(A)= 0 y 1 para cada evento de A

    3.- P(A U B)= P(A)+P (B) si son mutuamente excluyentes

    Por lo tanto:

    Calcular la probabilidad de al lanzar 3 veces una moneda, el resultado sean 2guilas seguidas.

    A= {AAA, AAS, ASA, ASS, SAA, SAS, SSA, SSS}

    1 2 3 4 5 6 7 8

    ESQUEMA 4.09 Espacio muestral.

    Ahora, si se supone que la moneda presenta un espacio muestral cuyos

    resultados anteriores tienen las siguientes probabilidades:

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    81/221

    81

    Recordando que la sumatoria de los puntos muestrales da como resultado el

    espacio muestral: Si el evento A es el de calcular la probabilidad de que al lanzar 3 veces una

    moneda, se presente en el primer lanzamiento guila.

    Calcular la probabilidad de que al lanzar un par de dados sus nmeros sean

    iguales.

    Ahora, si el evento A es la suma de los nmeros de los 2 dados sea 7. Cul

    ser su probabilidad?

    Es evidente que el conteo de puntos muestrales, es sencillo, pero a medida

    que ste resulta ms complejo, se hace necesario el apoyo de los mtodos

    combinatorios.

    Teoremas de probabilidad.

    1.- Si es el conjunto vaco 2.- 3.- 4.-

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    82/221

    82

    5.- Ejemplo. Si A y B son mutuamente excluyentes y se conoce la P(A)=0.20 y P

    (B)=0.30

    Si no son mutuamente excluyentes se tiene que Ejemplo 1. Una caja contiene 6 resistencias con un voltaje de 10 volts, 3

    resistencias con un voltaje de 50 volts y una resistencia con un voltaje de 100

    volts.

    a) Determine la probabilidad de que, al extraer al azar una de stas

    resistencias, ste tenga un voltaje de 50 de 100 volts.

    ( )

    Otra solucin sera

    Eventos independientes es cuando no se ven afectados por otros.

    b) Determine la probabilidad de que al extraer 2 de stos, ambos

    sean de 10 volts.

    La primera resistencia deber de ser de 10 volts.

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    83/221

    83

    Pero tambin la segunda resistencia debe ser de 10 volts.

    La probabilidad de que los 2 eventos se presenten

    simultneamente es la multiplicacin de ambas.

    Evento dependiente. Cuando un evento afecta la probabilidad de

    que suceda otro.

    Ejemplo 2. Un enorme plato giratorio de madera est dividido en 58 sectores

    circulares (rebanadas) del mismo tamao de los cuales 14 son azules, 23 son

    rojos y 21 son verdes. Si se lanzan 2 dardos, diga cul es la probabilidad de

    que:

    a) Ambos dardos peguen en sectores azules.

    b) Ningn dardo pegue en sector azul.

    c) Uno los 2 dardos peguen en sectores azules.

    Ejercicio 1. Un campamento tiene a la mano 1 caja con 20 lmparas que no

    han sido utilizadas desde el verano anterior. 3 lmparas se quedaron a la

    intemperie durante el invierno, por lo tanto ya no sirven. Si se seleccionaron 4

    lmparas al azar, Cul es la probabilidad de que estn buenas?

  • 7/16/2019 GUA PROBABILIDIAD Y ESTADSTICAok

    84/221

    84

    n=17, r=4

    Ejercicio 2. Se va a seleccionar por lote a un comit de 4 personas a partir de

    un grupo de 8 hombres, 2 de los cuales son hermanos:

    a) Cul es la probabilidad de que los hermanos estn en el comit?

    b) Cul es la probabilidad de que por lo menos1 hermano est en el

    comit?

    Ejercicio3.Se va a seleccionar por lote un comit de 5 hombres a partir de un

    grupo de 8 norteamericanos, 5 ingleses y 3 mexicanos. Cul es la

    probabilidad de que el comit est compuesto por 2 norteamericanos, 2

    britnicos y 1 mexicano?

    Ejercicio 4. De un grupo de 100 estudiantes universitarios, 60 estudiaron

    biologa, 15 biologa y geologa, 20 geologa, 7 biologa y topografa, 10

    topografa, 3 geologa y topografa y 3 estudiaron las 3 materias. Si se

    selecciona al azar un estudiante, Cul es la probabilidad de