61
Universidad Autónoma De Querétaro Escuela De Bachilleres Cuadernillo de trabajo: Probabilidad y Estadística. Material elaborado por: MDM. Noemí Gabriela Lara Sáenz Estudiante: _________________________________________________ Grupo: _______ Querétaro, Querétaro, enero 2020

Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

Universidad Autónoma De Querétaro

Escuela De Bachilleres

Cuadernillo de trabajo:

Probabilidad y Estadística.

Material elaborado por:

MDM. Noemí Gabriela Lara Sáenz

Estudiante: _________________________________________________ Grupo: _______

Querétaro, Querétaro, enero 2020

Page 2: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

2

Universidad Autónoma de Querétaro Escuela de Bachilleres, Plantel Sur

Programa

NOMBRE DE LA ASIGNATURA: Matemáticas VI

SEMESTRE: SEXTO

HORAS POR SEMANA: 5 HORAS

CRÉDITOS: 8

PERFIL DEL DOCENTE: NOEMÍ GABRIELA LARA SÁENZ

MAESTRA EN DIDÁCTICA DE LAS MATEMÁTICAS-UNIVERSIDAD AUTONOMA DE QUERÉTARO

SEMESTRE: 2020-1

UNIDADES TEMÁTICAS

UNIDAD I. ESTADÍSTICA

En esta unidad pretendemos mostrar a la Estadística como una

herramienta de gran utilidad para la sociedad actual, en donde su

uso es indispensable para interpretar y analizar situaciones

cotidianas.

En ese sentido, es importante que el alumno conozca el

desarrollo histórico que dio origen a esta ciencia, así como los

conceptos básicos para la correcta interpretación de la misma.

Después de la interpretación de los conceptos, el alumno será

capaz de construir diferentes tipos de gráficos y calcular medidas

de tendencia central de manera manual y apoyándose de software

para el manejo de muchos datos.

Finalmente, al término del curso el alumno debe adquirir una visión general de las principales aplicaciones de las

Estadística y como ésta le pueden ser de gran utilidad para enfrentar los problemas que el mundo actual le plantea día a

día.

EXAMEN

Page 3: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

3

UNIDAD II. REGRESIÓN Y CORRELACIÓN LINEAL

En esta unidad se pretende que el alumno interprete de manera correcta los

conceptos de regresión y correlación lineal en la aplicación de algunas

situaciones referentes a actividades cotidianas o alguna otra área de

conocimiento como economía, ciencias de la salud, ingeniería, etc.

Por tanto es necesario que el alumno comprenda la utilidad de estas

herramientas estadísticas para la toma de decisiones como el obtener una

ecuación que nos permita "predecir" el valor de Y una vez conocidos los valores

de X1, X2… Xn.

EXAMEN

UNIDAD III. PROBABILIDAD

En esta unidad se busca que el alumno entienda el

concepto de probabilidad así como las herramientas que

son necesarias para situaciones específicas.

Por tanto, es necesario que el alumno entienda que la

probabilidad es simplemente qué tan posible es que ocurra

un evento determinado.

Se abordaran temas de conjuntos, análisis combinatorio

y temas de probabilidad.

EXAMEN

UNIDAD IV. MATEMÁTICAS FINANCIERAS

El propósito de esta unidad es que el alumno se familiarice y comprenda la

relación entre los factores involucrados en el cálculo de valor del dinero a través

del tiempo y que experimente cómo las matemáticas son base del conocimiento

científico que genera el desarrollo de nuestra sociedad.

EXAMEN

Page 4: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

4

De manera general el temario se presenta a continuación:

BIBLIOGRAFÍA 1. FREUND, John; SIMON Gary. 1994. “Estadística Elemental”. México. Ed. Prentice-Hall. 2. LINCOLN, L. Chao. 2003. “Introducción a la Estadística”. México. Ed. Continental 3. SÁNCHEZ, Octavio. 2007. “Probabilidad y Estadística”. México. Ed. Mc Graw-Hill.

VALUACIÓN*:

1. Calificación mínima para acreditar cada unidad: 6.0

2. Condiciones para exentar y no presentar examen final: acreditar TODAS las unidades o promedio mínimo de 8.0 o promedio mínimo de 7.6 con ninguna unidad reprobada.

3. Los exámenes se harán durante la misma semana terminada la unidad o a la siguiente semana.

4. Tienes dos oportunidades durante el curso (parciales y final) para acreditar.

5. Si no presentas un examen parcial repruebas la unidad respectiva (claro, a menos de causas de fuerza mayor, en la medida de lo posible, verificables y con aviso previo).

6. La evaluación incluye no sólo los exámenes, sino también, los eventuales trabajos, prácticas de laboratorio, actividades en clase, participaciones extra, trabajos colaborativos y sobretodo LA PARTICIPACIÓN EN EL CURSO. Esta última se tomará en cuenta sólo hasta la calificación final o para determinar si se presenta o no el examen final.

La participación en el curso tomará en cuenta aspectos como: actitud, participación en clase, contribuciones, calidad de las intervenciones.

7. Tu evaluación incluye las siguientes 4 dimensiones fundamentales de las matemáticas:

algorítmica (operaciones manuales y con software, capacidades mnemónicas, etc.)

estratégica (planteamiento y solución de problemas, uso de estrategias de solución, capacidades de argumentación,

etc.)

conceptual (aprendizaje de conceptos)

comunicativa (expresar tu propia opinión sobre hechos matemáticos, describir objetos matemáticos, definir,

comunicar a otros las propias soluciones, etc.)

Los exámenes parciales están sujetos a que haya disposición de tiemp0

Page 5: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

5

NOTAS SOBRE EL FUNCIONAMIENTO

DE LA CLASE Y SUGERENCIAS

1. LO MÁS IMPORTANTE: se aceptan sugerencias y críticas de tu parte. El éxito de nuestro curso depende de que exista una comunicación constante en ambos sentidos.

2. Las dudas más generales se resolverán en clase, las otras en ASESORÍA. El horario de asesoría presencial lo negociamos al inicio del semestre (con base en la disponibilidad de tiempo de tu profesor y de tu horario de clases).

3. Las matemáticas NO SE APRENDEN DE MEMORIA. Es más importante saber dónde hallar las cosas y como utilizarlas.

4. Regularmente habrá en las clases INTERROGACIONES ORALES lo que servirá para evaluar tu participación.

5. Trata de hacer tus TAREAS lo más rápido posible para que haya el necesario TIEMPO DE MADURACIÓN de los conceptos. Si no haces las tareas esto se reflejará en el examen.

6. El EXAMEN de cada unidad lo debes comenzar a preparar el día que iniciamos el estudio de la unidad respectiva:

está atento en clase y participa en la discusión;

después de clase repasa los conceptos que se estudiaron;

consulta si es necesario bibliografía adicional;

comienza a hacer tu tarea;

todas las dudas que tengas consúltalas con tus compañeros o con el profesor en la clase siguiente;

LO PEOR QUE PUEDES HACER es tratar de estudiar dos o tres días antes del examen: aprendes menos y corres el riesgo de reprobar la materia.

7. Trata de ENTENDER todos los conceptos y las proposiciones que estudiemos

a que se refieren;

en qué contexto surgen;

cuáles son los supuestos y;

cuáles las conclusiones.

De esta manera podrás aplicar dichos conceptos a la solución no sólo de ejercicios rutinarios sino incluso a ejercicios más

complejos y a la solución de problemas.

8. Buscaremos que trabajes en EQUIPO, de esta manera haces un menor esfuerzo, aprendes más rápido, te enseñas a colaborar con un grupo, conoces a otra gente y te conoces mejor a ti mismo. Sé responsable con el equipo: no esperes que los demás hagan lo que a ti te corresponde y no seas egoísta con tus compañeros que aprenden más lentamente que tú. Tú das algo a alguien y recibes algo de alguien. Al inicio del semestre se formarán equipos de trabajo que tendrán un mínimo de 2 integrantes y un máximo de 4 y deberán estar formados en la primera semana de clases.

9. Por respeto a los demás, queda ESTRICTAMENTE PROHIBIDO el uso de celulares durante la clase. Aprende a controlar

la tecnología: apaga tu celular antes de entrar a clase o al menos desactiva el tono del timbre.

10. Si te das de BAJA, por favor házmelo saber lo más rápido posible.

ACREDITACIÓN: Para la acreditación de la materia se seguirán los lineamientos institucionales establecidos por el Reglamento General de Exámenes establecido en la Ley Orgánica vigente (artículo 70. 71 y 74 del Reglamento de Estudiantes de la UAQ).

Derecho a calificación para acreditación: Asistencia mínima: 80% (se pasa lista al inicio de la clase) Tareas mínimas: 80% Calificación mínima aprobatoria para exentar: 8.0 (ocho punto cero) Calificación mínima aprobatoria en examen final: 6.0 (seis punto cero)

Page 6: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

6

PORCENTAJE DE EVALUACIÓN**: Parcial 1

Tareas: 10% Actividades en clase (exclusivas) 20% Prácticas de laboratorio 10% Examen 30% Examen práctico 30%

Parcial 2

Tareas: 10% Actividades en clase (exclusivas) 10% Prácticas de laboratorio 10% Examen 70%

Parcial 3

Tareas: 10% Actividades en clase (exclusivas) 20% Proyecto* 20% Examen* 50%

Parcial 4

Tareas: 10% Actividades en clase (exclusivas) 20% Examen 70%

Page 7: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

7

ASIGNATURA PARCIAL MAESTRA Noemí Gabriela Lara Sáenz

ESTUDIANTE GRUPO

FECHA DESCRIPCIÓN Y OBSERVACIONES (Número de actividad) CALIFICACIÓN DÉCIMAS

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

_____________________________________________________________________

Si pierdes este formato y tiene firmas de actividades, éstas ya no serán tomadas en cuenta.

¡CUIDA MUCHO ESTA HOJA, LAS FIRMAS NO SE REPONEN!

Page 8: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

8

Unidad I: Estadística. Desarrollo histórico.

Breve historia del desarrollo de la Estadística.

La Estadística, como todas las ciencias, no surgió de improviso, sino mediante un proceso largo de desarrollo y evolución,

desde hechos de simple recolección de datos hasta la diversidad y rigurosa interpretación de los datos que se dan hoy en

día.

La palabra estadística proviene del latín “statisticus” que significa “del Estado”; es decir, correspondiente al gobierno. Por

mucho tiempo, la estadística se refería a información numérica sobre los estados o territorios políticos. Como se conoce

hoy en día, requirió de varios siglos para desarrollarse y de la intervención de muchas personas, teniendo como impulso la

resolución de problemas prácticos planteados por la dinámica social de la época y teniendo siempre como objeto de estudio

a la variación, es decir, la motivación la ha constituido el análisis de los valores que toman las diferentes variables de estudio

a través de las cuales se analiza una población.

La historia de la estadística se puede resumir en tres etapas. A continuación se presentan los aspectos más importantes de

cada una:

Primera Etapa: Los Censos

Desde que los pueblos se organizaron como Estados, sus gobernantes necesitaron estar informados sobre aspectos

relativos a la cantidad o distribución de la información, nacimientos o defunciones, producción agrícola o ganadera, bienes

muebles, bienes inmuebles, efectivos militares, etc., con el objeto de recaudar impuestos o de analizar las condiciones de

vida de la población, la estadística se convierte entonces en un importante instrumento del Estado.

Desde el momento en que se constituye una autoridad política, la necesidad de realizar inventarios de una forma regular a

la población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos

administrativos.

Génesis de la Estadística: Con base en los descubrimientos y sus evidencias sobre la recolección de datos referentes a

población, bienes y producción, los orígenes de la estadística se remontan a civilizaciones muy antiguas tales como la

Babilónica (5,000 años a.C.), Egipcia (3,000 años a. C.), China (2,200 años a.C.), Hindú (400 años a.C.), Romana (400 años

a.C.), Griega (300 años a.C.). No hay que olvidar que fue un censo lo que motivó el viaje de José y María a Belén, trayecto

en el cual nace Jesús.

Por más de mil años, posteriores a la caída del imperio romano de occidente, se puede decir que, salvo excepciones

(Guillermo el conquistador, recopiló el libro del Gran Catastro, un documento de la propiedad, extensión y valor de las

tierras de Inglaterra, y los trabajos similares impulsados por Carlomagno en Francia), no se presentaron avances

significativos en el desarrollo de la estadística.

El primer censo del que se tiene noticia en México, data del año 1,116, cuando el rey Chichimeca Xólotl ordenó que fueran

contados todos sus súbditos, totalizando 3, 200,000 personas.

En 1794, según noticias enviadas al Virreinato, la Intendencia de Sonora, contaba con

20,473 varones y 17,832 mujeres, o sea un total de 38,305 individuos.

Segunda Etapa: De la descripción de los conjuntos a la Aritmética Política

La estadística da un gran salto cualitativo a mediados del siglo XVII, debido a que los datos recopilados empiezan a ser

utilizados por los bancos y por las nacientes compañías de seguros europeas; por otro lado, se inventa en Inglaterra el

concepto de “Aritmética Política” y se empiezan a “matematizar” otras disciplinas, que hasta entonces eran sólo

descriptivas, tales como la demografía, la economía y las ciencias sociales.

Para los aritméticos políticos, la estadística era el arte de gobernar, su función era de servir de ojos y oídos al gobierno. En

esta época proliferan las tablas numéricas, lo cual permitió observar la frecuencia de distintos sucesos y el descubrimiento

de leyes estadísticas. Son ejemplos notables los estudios de John Graunt sobre tablas de mortalidad y esperanza de vida, y

los de Edmund Halley para resolver el problema de las rentas vitalicias de las compañías de seguros.

Page 9: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

9

John Graunt encabeza una tendencia conocida como Estadística Investigadora. Buscaban fijar en números los fenómenos

sociales y políticos cuyas leyes empíricas procuraban. Para su tiempo esto fue atrevido, casi imposible; pero el mérito de

ellos es de ser los primeros en buscar las leyes cuantitativas que rigen la sociedad.

Gracias a Vito Seckendorff, y sobre todo de German Conring al que se le considera como fundador de la Estadística: la

descripción de los hechos notables de un Estado. Conring perfeccionó y mejoró notablemente la tendencia nueva,

sistematizando los conocimientos y los datos. El mejor de sus seguidores fue Godofredo Achenwall, quien consolidó

definitivamente los postulados de esta nueva ciencia y también de haberle dado el nombre de Estadística.

Tercera Etapa: Estadística y Cálculo de Probabilidades

Otro impulso más al desarrollo de la estadística y la probabilidad es debido a los trabajos realizados por Jakob Bernoulli y

Siméon Denis Poisson sobre las leyes de los grandes números. Este teorema fue el primer intento para deducir medidas

estadísticas a partir de probabilidades individuales. El problema de ajustar modelos matemáticos a datos recopilados,

recibió gran interés por extraordinarios matemáticos, durante los siglos XVIII y XIX, tales como Leonard Euler, Thomas

Simpson, Joseph Louis Lagrange, Adrien Legendre.

En particular Karl Friedrich Gauss y Pierre Simon de Laplace desarrollaron la teoría de los errores en las mediciones y junto

con Legendre, la teoría de los mínimos cuadrados, la estadística logra con estos descubrimientos, una relevancia científica

creciente.

Poco a poco se han creado sociedades e institutos estadísticos para organizar los datos seleccionados; la primera de ellas

surge en Francia en 1800. Esto ha permitido comparar las estadísticas de cada país con relación a los demás, con el propósito

de saber qué factores influyen en el crecimiento económico.

Esto promovió el surgimiento del primer congreso internacional de estadística, efectuado en Bruselas en 1853 y organizado

por Lambert Adolphe Jaques Quetelet, quien aplica la estadística a las ciencias sociales e implementa el método estadístico

de su época a las diversas ramas de la ciencia.

En 1882 se creó en nuestro país la Dirección General de Estadística (DGE), el antecedente de lo que hoy es el INEGI. El

decreto en cuestión hacía constar que esta oficina debía encargarse de “pedir, compilar, clasificar y publicar

periódicamente, por cuadros comparativos, todos los datos concernientes a este ramo”, refiriéndose a los de fomento,

colonización, industria y comercio.

Con el objetivo de homogenizar los métodos utilizados en la recopilación y procesamiento de la información, así como en

la interpretación de resultados, nace en 1885, el Instituto Internacional de Estadística, que invita a los gobiernos de todos

los países, al uso correcto de la estadística en la solución de problemas económicos y sociales.

Una vez sentadas las bases de la teoría de la probabilidad, el nacimiento de la estadística moderna y su empleo en el análisis

de experimentos, se puede situar en los trabajos de Francis Galton, concibiendo el método de regresión y correlación, y

Karl Pearson, que publicó en 1892 el libro The Grammar of Science, un clásico en la filosofía de la ciencia y fue él quien ideó

el conocido test de chi2. Pero es Ronald Arnold Fisher, sin lugar a dudas, la figura más influyente de la estadística moderna,

situándola como una poderosa herramienta para la planificación y análisis de experimentos. Fue pionero en el desarrollo

de numerosas técnicas de análisis estadísticos y en la introducción de métodos para la estimación de parámetros, desarrolló

la teoría de muestras pequeñas bajo normalidad, que con el nombre de análisis de varianza y covarianza, tuvo un gran

impacto en la teoría y aplicación de la estadística. Su libro Statistical Methods for Research Workers publicado en 1925 ha

sido probablemente el libro de estadística más utilizado durante mucho tiempo.

Un ejemplo evidente que muestra que los desarrollos de la estadística han surgido como respuesta a necesidades prácticas,

son los trabajos desarrollados por William Sealy Gosset abordando problemas sobre variedades de cebada y concibiendo

su famosa distribución “t de Student”, sus trabajos fueron completados y formalizados por Fisher.

El hijo de Karl Pearson, Egon Pearson y el matemático Jerzy Neyman pueden considerarse los fundadores de las pruebas

modernas de contraste de hipótesis.

Es importante citar la participación activa y fructífera de matemáticos y estadísticos rusos que con su aportación e influencia

han permitido desarrollar y formalizar los métodos y teorías de la probabilidad y la estadística, cabe destacar las figuras de

Pafnut Chebychev y Andrei Markov y posteriormente, Alexander Khinchi y Andrey Kolmogorov. Actualmente se puede decir

Page 10: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

10

que la Estadística es la ciencia que proporciona métodos para recopilar, organizar, presentar, resumir, analizar e interpretar

información y poder tomar decisiones con cierto grado de confiabilidad.

Hoy, la Estadística, junto con el cálculo de probabilidades, constituyen una rama fundamental de las matemáticas, con

aplicaciones en casi todas las actividades humanas: física, astronomía, biología, genética, medicina, agricultura, química, y

muchas más; en todas estas ciencias se hacen predicciones, encuestas, controles de calidad, estimaciones o verificaciones

de hipótesis con respecto a parámetros poblacionales, todo ello ha permitido lograr avances científicos y tecnológicos; que

a través de los años, han coadyuvado al desarrollo y bienestar social.

Tarea 1

Realiza lo que se te solicita:

1. Construye una infografía en la cual muestres los requerimientos o necesidades más importantes de la época que

impulsaron el desarrollo de la estadística, incluyendo fechas, e imágenes de los principales personajes que

intervinieron y que son citados a partir de la segunda etapa en el texto histórico anterior.

Toma al menos cinco personajes

2. Una vez que hayas elaborado la infografía, pégala en el siguiente espacio de manera que quede doblada en el

interior del cuadernillo de modo que no haya dificultad alguna al momento de mostrar tu trabajo.

Pega en este espacio tu infografía

Page 11: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

11

La estadística y su importancia.

Los conceptos y argumentos de la estadística se utilizan en la actualidad en un gran número de ocupaciones. Las técnicas

estadísticas constituyen una parte integral de las actividades de investigación en distintas áreas del saber humano. La

persona que comprenda los conceptos estadísticos y su metodología obtendrá mejor provecho de ellos.

La estadística día con a día gana terreno en su aplicación en toda actividad humana por simple que ésta sea.

La estadística se aplica en los programas de Gobierno, Ingeniería, Agronomía, Economía, Medicina, Biología, Psicología,

Pedagogía, Sociología, Física, Astronomía, Educación, etcétera; no hay alguna ciencia que no la requiera o profesión que no

la aplique.

A continuación se citan algunos ejemplos de la utilidad de la estadística:

1. En las agencias gubernamentales, tanto federales, estatales o municipales utilizan la estadística para realizar planes y

programas para el futuro.

2. En el campo de la ingeniería se aplica en muchas de sus actividades tales como:

• La planeación de la producción.

• El control de calidad.

• Las ventas.

• El almacén.

3. En la Sociología se aplica para comparar el comportamiento de grupos socioeconómicos y culturales y en el estudio de

su conducta.

4. En el campo económico su uso es fundamental para informar el desarrollo económico de una empresa o de un país que

da a conocer los índices económicos relativos a la producción, a la mano de obra, índices de precios para el consumidor, las

fluctuaciones del mercado bursátil, las tasas de interés, el índice de inflación, el costo de la vida, etcétera. Todos estos

aspectos que se estudian, se reportan e informan, no solamente describen el estado actual de la economía sino que trazan

y predicen el camino de las futuras tendencias. Así mismo sirve a los encargados de las agencias, para tomar decisiones

acertadas en sus operaciones.

5. En el campo demográfico la Estadística se aplica en los registros de los hechos de la vida diaria, tales como:

• Nacimientos.

• Defunciones.

• Matrimonios.

• Divorcios.

• Adopciones.

6. En materia de población los datos aportan una buena ayuda para fijar la política de estímulos al control de la natalidad,

dirigir la inmigración o emigración, establecer los planes de lucha contra las enfermedades epidémicas o plagas que azotan

los campos, etcétera.

7. En el campo educativo la Estadística contribuye al conocimiento de las condiciones fisiológicas, psicológicas y sociales de

los alumnos y de los profesores. Al perfeccionamiento de los métodos de enseñanza, de evaluación, a la efectividad de

programas de tutorías, la necesidad de reformas curriculares en función de los requerimientos sociales reales, etc.

8. En la industria la utilizan para el control de calidad, la implementación de incentivos a la producción, entre otros.

9. En la agricultura, se emplea en actividades como experimentos sobre la reproducción de plantas y animales entre otras

cosas. También se usa la Estadística para determinar los efectos de clases de semillas, insecticidas y fertilizantes en el

campo.

10. En la Biología se emplean métodos estadísticos para estudiar las reacciones de las plantas y los animales ante diferentes

períodos ambientales y para investigar la herencia. Las leyes de Mendel sobre la herencia en donde los factores hereditarios

se atribuyen a unidades llamadas genes y al estudio sistemático de los cruzamientos entre individuos portadores de genes

diferentes, lo que ha permitido precisar de qué manera los genes se separan o se reúnen en las generaciones sucesivas. La

verificación de las hipótesis formuladas por Mendel y sus continuadores necesitó el empleo de la Estadística.

Page 12: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

12

11. En la medicina, los resultados que se obtienen sobre la efectividad de fármacos se analizan por medio de métodos

estadísticos. Los médicos investigadores se ayudan del análisis estadístico para evaluar la efectividad de tratamientos

aplicados. La Estadística también se aplica en el establecimiento y evaluación de los procedimientos de medida o

clasificación de individuos con el propósito de establecer la especificidad y sensibilidad a las enfermedades.

Actividad 1

Con la lectura anterior y con los vídeos, responde las siguientes preguntas.

a) ¿Qué es lo más importante dentro de la Estadística? ¿Por qué?

___________________________________________________________________________________________

___________________________________________________________________________________________

___________________________________________________________________________________________

b) ¿Crees que los estudios citados en contexto, se pudieran realizar sin el uso de la estadística? ¿Por qué?

___________________________________________________________________________________________

___________________________________________________________________________________________

___________________________________________________________________________________________

c) Recorta de un medio de comunicación (periódico, revista, artículo de divulgación, redes sociales) una noticia

expresada con un gráfico o tabla estadística, así como el texto que le acompaña y pégala en este espacio. Analiza

la información y describe por escrito la utilidad de la estadística.

Page 13: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

13

Definición de conceptos básicos de Estadística.

Estadística.

La Estadística es la ciencia de la sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno.

Estadística descriptiva.

Es usada para recolectar, organizar y presentar en forma de tablas y graficas información de los datos muestrales.

Estadística inferencial.

Conjunto de técnicas y métodos que son usados para sacar conclusiones o interpretaciones generales acerca de una

población.

Población.

Es el conjunto de individuos, objetos o eventos que poseen

características comunes y sobre los cuales estamos

interesados en obtener conclusiones.

Muestra.

Es un subconjunto de la población.

-Debe ser representativo.

Variable.

Es una característica o atributo que

varía entre los diferentes individuos,

objetos o eventos de una población.

Dato.

Es un valor particular de la variable.

Este valor puede ser un número, una palabra o

un símbolo.

Experimento.

Es una actividad planeada

cuyos resultados producen

un conjunto de datos.

En los individuos de la población chilena, de uno a otro es variable:

El grupo sanguíneo {𝐴, 𝐵, 𝐴𝐵, 𝑂 +}

El número de hijos {1,2,3,4 … }

El nivel de felicidad “declarado” {𝐷𝑒𝑝𝑟𝑖𝑚𝑖𝑑𝑜, … , 𝑀𝑢𝑦 𝑓𝑒𝑙𝑖𝑧}

Parámetro.

Es un valor que se calcula para describir una característica

de una población completa.

Estadístico.

Es un valor que se calcula para describir una característica

de una muestra.

Censo:

Obtención de datos de cada uno de los miembros de una

población.

Encuesta:

Obtención de datos de los miembros que forman una

muestra.

Técnicas de muestreo

Muestreo aleatorio.

Se usa cuando a cada elemento de la población se le da la

misma oportunidad de ser elegido en una muestra.

Muestreo estratificado.

Se obtiene al estratificar la población y luego seleccionar un

número de elementos en proporción al tamaño de los

estratos de cada uno de los estratos, por medio de una

técnica de muestreo aleatorio.

Muestreo por conglomerados.

Consiste en dividir una población en grupos o

conglomerados, posteriormente se seleccionan

conglomerados al azar y se recolecta una muestra eligiendo

en forma aleatoria elementos de cada uno de ellos.

Muestreo sistemático.

Se usa cuando los datos de la población están ordenados

en forma numérica. La primera observación es elegida al

azar de entre los primeros elementos de la población y las

siguientes observaciones son elegidas guardando la misma

distancia entre sí.

Tipos de variables.

Page 14: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

14

Cualitativas.

Clasifica o describe a un elemento de una población.

Cuantitativas.

Describe de forma numérica a un elemento de la población.

Nominales.

Sus valores no se pueden

ordenar

Sexo Grupo sanguíneo Nacionalidad Fumar (si/no)

Ordinales.

Sus valores se pueden

ordenar

Mejoría de un tratamiento

Grado de satisfacción

Discretas.

Si toma valores enteros

Número de hijos Número de cumpleaños

Continuas.

Si entre dos valores, son

posibles infinitos valores

intermedios.

Edad Altura Ingreso familiar

Actividad 2

I. Para cada uno de los siguientes ejemplos donde se muestra la aplicación de la estadística en situaciones prácticas

determina qué tipo de estadística se utilizó.

a) Una muestra aleatoria de 10 latas de alimento, elegidos en los dos turnos de producción, pasan al departamento

de control de calidad para verificar los estándares establecidos. La variable a medir es el peso drenado del producto,

cuyos límites permitidos varían de 220 gr a 230 gr. La muestra arroja una media de 215 gr, razón por la cual se ha

tomado la decisión de detener la producción y revisar el proceso con el propósito de corregirlo y normalizar la

producción.

Tipo de estadística empleada________________________________

b) Se entrevista a cada alumno del grupo 504M con respecto a su número de hermanos, la siguiente tabla muestra

los resultados obtenidos:

Tipo de estadística empleada________________________________

c) El INEGI proporciona la siguiente información relativa a varios censos poblacionales en nuestro país.

Tipo de estadística empleada________________________________

Page 15: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

15

II. Completa las siguientes tablas con la información correcta.

a) Las variables corresponden a cada uno de los alumnos de un grupo de sexto semestre de este plantel.

Page 16: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

16

III. Responde lo que se solicita

a) Identifica el tipo de muestreo Aleatorio, Estratificado, Conglomerado, Sistemático.

Fichas de lotería o bolitas numeradas

Tabla de números aleatorios

Se seleccionan aleatoriamente elementos de cualquiera de:

Facultad de Ciencias políticas

Facultad de Química

Facultad de Psicología

PRÁCTICA 1. RECOLECCIÓN DE DATOS (INICIO DE EXAMEN PRÁCTICO)

Objetivo.

Aplicar los conceptos básicos de la estadística vistos en clase: población, muestra, variable, dato, experimento, técnicas de muestreo, variables cualitativas nominales, variables cualitativas ordinales, variables cuantitativas continuas y variables cuantitativas discretas; a partir de la elaboración y aplicación de una encuesta.

Desarrollo.

1. En pareja, piensen en un tema que sea de su interés y que consideren que sea de interés para la comunidad del plantel sur. Plantéenlo como objetivo.

2. Definan cuál es la población de interés, el método con el cuál seleccionarán la muestra, el tamaño de la muestra (mínimo 100) e identifiquen cuáles son las unidades experimentales.

3. Planteen 5 preguntas que ayuden a alcanzar su objetivo, de las cuales: dos correspondan a variables cuantitativas continuas, una a variable cuantitativa discreta, una a variable cualitativa nominal y una a variable cualitativa ordinal.

4. Para cada pregunta, identifica la variable y el tipo de variable que se está midiendo o conociendo.

5. Transcribe cada pregunta y todas las respuestas obtenidas a Word o a Excel y toma captura de pantalla para agregarlas al informe.

Page 17: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

17

Reporte

Nombre completo de los integrantes, empezando por apellidos.

________________________________________________________________

________________________________________________________________

Semestre _______ Grupo ______

Título de la investigación:

Objetivo:

Población: Tamaño de la muestra y justificación:

Técnica de muestreo:

CONTENIDO DE LA ENCUESTA

Pregunta Variable Clasificación

de la variable Respuestas esperadas

Anexar:

El cuadro anterior. Evidencia de la recopilación de datos. Evidencia de la transcripción de datos. Conclusión o reflexión de las actividades realizadas para la obtención de los datos.

Page 18: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

18

Tablas y gráficas estadísticas. En todo estudio o investigación estadística se requiere medir las características en los individuos, objetos o cosas de interés. Es indispensable y útil disponer de métodos que nos permitan organizar y presentar los datos que permitan conocer cómo se reparten éstos, entre los posibles valores que puede tomar la variable de interés. Por tanto, las representaciones tabulares y gráficas, brindan la oportunidad de procesar la información recopilada, aún más, se pueden convertir en instrumentos útiles, puesto que pueden expresar o transmitir, de manera rápida y sencilla, las tendencias o regularidades que manifiesten los datos.

Distribución de frecuencias. Son tablas donde los datos estadísticos aparecen bien organizados y distribuidos según su frecuencia, es decir, según las veces que se repite en la muestra. Con el análisis de las distribuciones de frecuencias se puede determinar la tendencia de la variable de estudio. Recordemos que la variable de estudio puede ser nominal, ordinal, discreta o continua, y que esta característica incidirá las construcciones de tablas estadísticas.

Tipos de frecuencia

Frecuencia absoluta (𝒇𝒊) Es el número de veces que un dato se repite dentro de un conjunto de datos. La forma de obtener la frecuencia absoluta no es otra que contando las veces que aparece el dato en un conjunto de datos. La suma de las frecuencias absolutas corresponde al número total de datos representados por la letra 𝑁.

Frecuencia relativa (𝒉𝒊) Es la proporción de veces que aparece ese dato con

respecto al total y se calcula dividiendo la frecuencia

absoluta (𝑓𝑖) de cada dato entre el número total de

datos 𝑁.

ℎ𝑖 =𝑓𝑖

𝑁

El valor de la frecuencia relativa siempre va a estar

entre 0 y 1.

La suma de todas las frecuencias relativas de todos los

datos de la muestra debe ser igual a 1.

Frecuencia absoluta acumulada (𝑭𝒊) Es la suma de las frecuencias absolutas. Se calcula sumando la frecuencia absoluta de un dato más la frecuencia absoluta del dato anterior. Por tanto la frecuencia absoluta acumulada del primer dato coincide con su frecuencia absoluta y la frecuencia absoluta acumulada del último dato coincide con el número total de dato.

Frecuencia relativa acumulada (𝑯𝒊) Es el mismo concepto que se tiene para la frecuencia

absoluta acumulada. Se pude obtener como el

cociente de la frecuencia absoluta acumulada (𝐹𝑖)

para cada dato entre el número total de datos 𝑁.

𝐻𝑖 =𝐹𝑖

𝑁

La frecuencia relativa acumulada del primer dato

coincide con su frecuencia relativa acumulada y es

igual a 1.

La presentación de los datos se hace en forma ordenada, por medio de una tabla, dependerá de los datos de que se trate, y si estos son cualitativos o cuantitativos como se muestra en la figura.

Figura 1 Ordenamiento de datos

Page 19: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

19

TABLAS DE FRECUENCIA PARA DATOS NO AGRUPADOS. Ejemplo 1 Construye una tabla de distribución de frecuencias para el siguiente caso. Se preguntó a un grupo de alumnos de primer año la preparatoria sur por la asignatura de su preferencia, arrojándose los siguientes resultados:

Tabla de frecuencias de Asignaturas favoritas.

Asignatura 𝒙𝒊

Frecuencia absoluta 𝒇𝒊

Frecuencia absoluta acumulada 𝑭𝒊

Frecuencia relativa 𝒉𝒊

Frecuencia relativa acumulada 𝑯𝒊

Ética y Valores Informática

Ingles

Matemáticas

Química Sociales

Taller de lectura

Total

Ejemplo 2 Construye una tabla de distribución de frecuencias para el siguiente caso. Cierta universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus alumnos, para lo cual aplicó un examen de C.I. a un grupo de 20 alumnos escogidos al azar, obteniendo los siguientes resultados:

Tabla de frecuencias de Coeficiente Intelectual.

C.I 𝒙𝒊

Frecuencia absoluta 𝒇𝒊

Frecuencia absoluta acumulada 𝑭𝒊

Frecuencia relativa 𝒉𝒊

Frecuencia relativa acumulada 𝑯𝒊

Page 20: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

20

Actividad extra para practicar. Los siguientes gráficos de barras representan el número de hermanos que tienen los alumnos de dos grupos de bachillerato: 501M y 502V, del Plantel de Nogales del Colegio de Bachilleres de Sonora.

a) Construye la tabla completa de la distribución de frecuencias para cada grupo.

En caso de que ambas tablas de frecuencias no quepan en la parte de debajo de esta hoja, realiza la otra tabla en la parte de atrás de esta misma hoja.

b) ¿En qué grupo hay más estudiantes? ¿Por qué? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

c) ¿Cuál es el porcentaje de hijos únicos en cada grupo? ________________________________________________________________________________________________________________________________________________________________________

d) ¿Cuál es el número de hermanos con mayor frecuencia en cada grupo? ________________________________________________________________________________________________________________________________________________________________________

e) ¿En qué son diferentes los grupos con respecto a esta variable de estudio? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Nombre: __________________________________________________________________________________ Practica de laboratorio: Datos no agrupados.

Page 21: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

21

TABLAS DE FRECUENCIA PARA DATOS AGRUPADOS. Se usa si las variables toman un número grande de valores o la variable es continua. En este tipo de tablas de frecuencia, se agrupan los valores en intervalos que tengan la misma amplitud denominadas clases. A cada clase se le asigna su frecuencia correspondiente. Para determinar los intervalos de una distribución de frecuencias es necesario seguir los pasos siguientes:

1. Ordenar los datos de menor a mayor. 2. Determinar la longitud de clase (Rango)

𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑖𝑛𝑖𝑚𝑜 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 3. Se establece el número de clases (intervalos) de acuerdo con la fórmula:

𝐾 = 1 + 3.3log (𝑁) Donde log (𝑁) es el logaritmo del número de datos. *Aconsejable que existan más de 5 clases y menos de 12 para determinar de mejor manera el comportamiento de los datos.

4. Se calcula el ancho que debe tener cada clase, es decir, la amplitud de clase.

𝐴 =𝑅

𝐾=

𝑅𝑎𝑛𝑔𝑜

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠

El ancho de clase se refiere a la longitud que existe entre el límite inferior y el límite superior de una clase.

5. Se ubican los límites de cada clase utilizando el valor de la amplitud de clase. 6. Se determina la marca de clase, que es el punto medio entre el límite inferior y superior. 7. Se determinan las diferentes frecuencias.

Ejemplo 3 Al Director del Departamento de Nómina de la empresa “CONDUMEX” le interesa efectuar un estudio de la antigüedad laboral de sus cuarenta y ocho trabajadores, para rendir un informe de forma resumida, por lo cual requiere efectuar un análisis del problema. Para esto recabó, de los expedientes de cada empleado, la siguiente información sobre los años de antigüedad:

13, 19, 22, 14, 13, 16, 19, 21, 23, 11, 27, 25, 17, 17, 13, 20, 23, 17, 26, 20, 24, 15, 20, 21, 23, 17, 29, 17, 19, 14, 20, 20, 10, 22, 18, 25, 16, 23, 19, 20, 21, 17, 18, 24, 21, 20, 19, 26.

Elabora una tabla de distribución de frecuencias para datos agrupados.

Page 22: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

22

Tabla de frecuencias de antigüedad laboral

Clase 𝒌

Antigüedad laboral 𝑳𝒊 − 𝑳𝒔

Marca de clase

𝒙�̅�

Frecuencia absoluta

𝒇𝒊

Frecuencia absoluta

acumulada 𝑭𝒊

Frecuencia relativa

𝒉𝒊

Frecuencia relativa

acumulada 𝑯𝒊

Ejemplo 4 El ácido úrico es un compuesto orgánico de carbono, nitrógeno, oxígeno e hidrógeno, éste es un desecho del metabolismo del cuerpo humano y se encuentra en la orina en pequeñas cantidades. También se puede decir que el ácido úrico son sustancias que se forman principalmente en el hígado a partir de los núcleos celulares animales como la carne o el pescado, y que se eliminan a través de la orina. Los valores normales en el caso de las hombres adultos, se encuentran en el intervalo es de 3.0 a 8.5 mg/dl. Los siguientes datos representan los niveles de ácido úrico de 20 pacientes varones adultos:

Construye una tabla de distribución de frecuencias

Tabla de frecuencias valores de ácido úrico en la sangre

Clase 𝒌

Antigüedad laboral 𝑳𝒊 − 𝑳𝒔

Marca de clase

𝒙�̅�

Frecuencia absoluta

𝒇𝒊

Frecuencia absoluta

acumulada 𝑭𝒊

Frecuencia relativa

𝒉𝒊

Frecuencia relativa

acumulada 𝑯𝒊

Page 23: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

23

Responde las siguientes preguntas con base en la tabla de distribución de frecuencias para datos agrupados del Ejemplo 4.

a) ¿Cuál es la variable es la que se analiza?______________________________ b) ¿Qué tipo de variable es?___________________________ c) ¿Qué medición es la menor?__________ d) ¿Cuál es la mayor?__________________ e) ¿En cuántas unidades variaron los datos de la cantidad de ácido úrico en la sangre de los varones

adultos?_______________________ Actividad extra para practicar. Para los siguientes datos, realiza lo que se pide.

I. Los pesos de 60 personas dados en kilogramos son:

Elabora una tabla de distribución de frecuencias para estos datos, agrupándolos en clases de amplitud 5.

Responde las siguientes preguntas. a) ¿Cuál es la variable es la que se analiza?______________________________ b) ¿Qué tipo de variable es?___________________________ c) ¿Qué medición es la menor?__________ d) ¿Cuál es la mayor?__________________ e) ¿En cuántas unidades variaron los datos?_______________________

II. En la oficina de un diario, el tiempo que tardan en imprimir la primera plana fue registrado durante 50

días. A continuación se transcriben los datos, aproximados a decimas de minuto:

Page 24: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

24

Construye la tabla completa de frecuencias para datos agrupados.

Responde las siguientes preguntas. a) ¿Cuál es la variable es la que se analiza?______________________________ b) ¿Qué tipo de variable es?___________________________ c) ¿Qué medición es la menor?__________ d) ¿Cuál es la mayor?__________________ e) ¿En cuántas unidades variaron los datos?_______________________

Práctica de laboratorio: Datos agrupados.

Page 25: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

25

Tipos de gráficos.

Existen muchos tipos de gráficas en las que se pueden representar los diferentes tipos de frecuencias absoluta,

con ellas se puede estimar algunos valores a través de una simple inspección visual.

Los diferentes tipos de gráficas que se pueden usar para representar las observaciones de un determinado

problema y la selección de este tipo, dependen de la variable en estudio:

Figura 2 Presentación de datos estadísticos.

Componentes de un gráfico.

Un gráfico, al igual que una tabla de distribución de frecuencias tiene sus componentes, que son las partes siguientes:

a) Título del gráfico. b) Cuerpo del gráfico:

Qué representa cada eje Tipo de unidades a utilizar Escala usada en cada eje

c) Pie del gráfico. La elección del gráfico estará en función del tipo de variable de estudio y de los objetivos que se deseen cubrir al

momento de presentar la información.

Histograma.

Un histograma es una representación gráfica de una distribución de frecuencias, utilizando barras para exhibir

las frecuencias relativas de ocurrencia de cada valor o grupo de valores en un conjunto de datos continuos.

Un histograma es utilizado para:

1) Resumir un conjunto de datos para una sencilla comprensión visual de sus características generales, tales

como valores típicos, variación y forma.

2) Detectar un comportamiento inesperado o valores inusuales en los datos.

Un histograma es una útil herramienta de diagnóstico para detectar valores periféricos, formas atípicas en el

histograma a menudo proveen importantes pistas hacia la naturaleza del sistema o proceso que generan los

datos.

Trazo de un histograma.

1) Se dibujan los ejes coordenados. 2) En el eje x se localizan las marcas de clase. 3) En el eje y se coloca la frecuencia relativa en porcentaje.

.

Presentación de datos.

Datos cualitativos

Diagrama de barras

Diagrama circular

Datos cuantitativos

HistogramaPoligono de frecuencias

Ojiva

Page 26: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

26

Ejemplo 5

La siguiente tabla muestra, de forma resumida los montos de cuentas por cobrar de 55 clientes de una empresa

comercial en febrero de 2011, traza su histograma y ofrece una conclusión acerca de lo que dicen los datos en su

forma gráfica.

Ejercicio extra para practicar.

Se ofrece una distribución de frecuencia del peso de 150 personas que utilizaron un elevador cierto día. Construye el histograma con esos datos y responde las siguientes preguntas:

a) ¿Cuál es la variable que se analiza?______________________________ b) ¿Qué tipo de variable es?___________________________ c) ¿Qué medición es la menor?__________ d) ¿Cuál es la mayor?__________________ e) ¿Qué infieres de la talla de las personas que subieron al elevador ese día?_________________________

____________________________________________________________________________________ f) ¿Cuál fue el promedio de la talla mayor?______________ g) ¿Cuál fue el promedio de la talla menor?______________ h) ¿Cuantas clases hay en la tabla?_______ i) ¿Cuál es la variación en peso para cada clase?___________

Page 27: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

27

Tabla de frecuencias para datos agrupados de la talla de algunas personas.

Peso fi

75-90 10

90-105 11

105-120 23

120-135 26

135-150 31

150-165 23

165-180 9

180-195 9

195-210 6

210-225 2

Page 28: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

28

Polígono de frecuencias.

En una gráfica de línea que sirve para representar la distribución de frecuencias de datos continuos. Al igual que el histograma, se utiliza para ver la forma de la distribución de los datos, así como la ubicación de la mayor concentración de estos. El polígono puede ser aproximado mediante una curva suavizada que suele llamarse curva de frecuencias. La forma de un polígono de frecuencias puede sugerir algún tipo de comportamiento, por ejemplo: la simetría, esto también conlleva a aproximar la curva que suavemente lo describe, ésta se conoce como campana de Gauss o curva normal. Por su importancia en el análisis estadístico son de interés los intervalos donde el área bajo la curva corresponde a determinados valores de probabilidad.

Figura 3 Curva de Gauss

Trazo de un polígono de frecuencias. 1) Se trazan los ejes coordenados. 2) Se dibuja un punto por cada coordenada. Las coordenadas son pares ordenados donde la abscisa es la

marca de clase y la ordenada es la frecuencia relativa porcentual. 3) Se unen los puntos. 4) Se cierran los extremos con el eje horizontal.

Ejemplo 6 La siguiente tabla muestra, de forma resumida los montos de cuentas por cobrar de 55 clientes de una empresa comercial en febrero de 2011, traza el polígono de frecuencias.

Page 29: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

29

Ejercicio extra para practicar.

Un agente de seguros tiene datos sobre la cantidad mensual de pólizas que vendió en los últimos 3 años. Sus datos los ha arreglado en la siguiente distribución de frecuencias. Construye el histograma con esos datos y responde las siguientes preguntas:

a) ¿Cuál es la variable que se analiza?______________________________ b) ¿Qué tipo de variable es?___________________________ c) ¿Qué medición es la menor?__________ d) ¿Cuál es la mayor?__________________ e) ¿Cuál fue el promedio de ventas mensuales más grande durante esos 3 años?________________ f) ¿Cuantas clases hay en la tabla?_______ g) ¿Cuál fue el total de pólizas vendidas durante esos 3 años?__________________

Tabla de frecuencias para datos agrupados de la venta de pólizas de seguros durante 3 años.

Ventas

mensuales fi

1000-1150 1

1150-1300 3

1300-1450 6

1450-1600 4

1600-1750 8

1750-1900 9

1900-2050 3

2050-2200 2

Page 30: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

30

Ojiva.

Es una gráfica de línea donde se representa la frecuencia relativa acumulada en porcentaje de datos continuos. Por tanto, es una curva ascendente o creciente que no toma valores negativos ni valores superiores a 100. Trazo de una ojiva.

1) Se dibujan los ejes coordenados. 2) Se dibuja un punto por cada coordenada. Las coordenadas son la marca de clase para el eje x y la

frecuencia relativa acumulada porcentual para el eje y. 3) Se unen los puntos.

Ejemplo 7 La siguiente tabla muestra, de forma resumida los montos de cuentas por cobrar de 55 clientes de una empresa comercial en febrero de 2011, traza la ojiva.

Page 31: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

31

Ejercicio extra para practicar.

Antes de construir una presa sobre un rio, se efectuaran una serie de pruebas para medir el flujo de agua que pasa por el lugar de la presa. Los resultados de las pruebas se usaron para preparar la siguiente distribución de frecuencia. Construye la gráfica de ojiva.

Tabla de frecuencias para datos agrupados del flujo de agua para la construcción de una presa.

Flujo del rio

(miles de

galones por

minuto)

fi

1001-1051 7

1051-1101 21

1101-1151 32

1151-1201 49

1201-1251 58

1251-1301 41

1301-1351 27

1351-1401 11

Da una conclusión del comportamiento de los datos según la ojiva que construiste. ________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Page 32: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

32

Diagrama de barras.

Se utilizan para representar una distribución de frecuencias de datos discretos o cualitativos. En el eje x se indican los valores o las cualidades y la altura (que corresponde al eje y) se coloca la frecuencia absoluta. Ejemplo 8 Se entrevistó a 20 jóvenes para conocer cuántos refrescos de cola se beben en un día. La distribución de frecuencias se presenta en la siguiente tabla. Construye su diagrama de barras.

Tabla de frecuencias del consumo de refrescos en algunos jóvenes.

Número de

refrescos de

cola

fi

0 2

1 4

2 4

3 3

4 3

5 4

Responde

a) ¿Cuál es la variable a analizar?_____________________________________ b) ¿Cómo clasificas a esa variable?____________________________________ c) De acuerdo al gráfico, ¿Cuál es la cantidad de refrescos que más consumen los jóvenes en un

día?______________ d) De los 20 jóvenes entrevistados, ¿Cuántos fueron los que no tomaron refresco ese día?_____________

Page 33: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

33

Ejemplo 9

La siguiente distribución de frecuencias muestra es estado civil de algunas personas. Construye su diagrama de barras.

Tabla de frecuencias del estado civil de algunas personas

Responde a) ¿Cuál es la variable a analizar?_____________________________________ b) ¿Cómo clasificas a esa variable?____________________________________ c) De acuerdo al gráfico, ¿Cuál es el estado civil que predomina?___________________________

Page 34: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

34

Diagrama de pastel o circular.

Se usa para representar una distribución de frecuencias para datos discretos o cualitativos y, como su nombre lo indica, hay que trazar un círculo en el que luego hay que dibujar divisiones que representan la frecuencia relativa porcentual. Ejemplo 10 La siguiente distribución de frecuencias muestra la preferencia de algunas asignaturas por los estudiantes de bachillerato, según tabla de distribución de frecuencias, construye su diagrama circular.

Tabla de frecuencias de preferencias en asignaturas

Responde a) ¿Cuál es la variable a analizar?_____________________________________ b) ¿Cómo clasificas a esa variable?____________________________________ c) De acuerdo al gráfico, ¿Cuál es la asignatura favorita de los estudiantes?___________________________ d) De acuerdo al gráfico, ¿Cuál es la asignatura menos favorita de los estudiantes?_____________________

Ejemplo 11 Se entrevistó a 20 jóvenes para conocer cuántos refrescos de cola se beben en un día. La distribución de frecuencias se presenta en la siguiente tabla. Construye su diagrama de pastel.

Tabla de frecuencias del consumo de refrescos en algunos jóvenes. Número de refrescos de

cola fi

0 2

1 4

2 4

3 3

4 3

5 4

Practica de laboratorio: Gráficas

Page 35: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

35

Actividad de tarea. I. Los siguientes datos representan las estaturas, en metros, de 45 estudiantes de bachillerato elegidos al

azar:

a) Determina el número de clases necesarios para resumir estos datos

K= b) Obtener el rango

R= c) Calcular la amplitud para cada intervalo

A= d) Construir las diferentes distribuciones de frecuencias e) Trazar el histograma f) Describe el comportamiento de las estaturas al analizar el histograma

_________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

g) ¿A qué factores puedes atribuir el comportamiento que observas? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Page 36: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

36

II. Los siguientes datos representan los niveles de hemoglobina (Hb) de 49 pacientes, la letra que aparece como subíndice representa el sexo de la persona (“F” femenino o “M” masculino).

a) Construye una tabla de distribución de frecuencias para datos agrupados para los niveles de hemoglobina

para mujeres y otra para hombres. b) Construye un histograma para cada tabla c) ¿Qué tipo de comportamiento presenta cada histograma?

_________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

d) Un nivel de hemoglobina se encuentra dentro del rango normal en la mujer si su valor está en el intervalo [12,16], ¿Qué porcentaje tiene niveles normales? ______________

e) En los hombres, en el intervalo de [13, 18] ¿Qué porcentaje lo cumplen? ______________

Page 37: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

37

III. Para cada una de las siguientes gráficas, determina lo que se indica posteriormente.

a) La población de estudio: _____________________________ b) El tipo de variable: _____________________________ c) Si consideras que se efectuó un censo o muestreo. Argumenta:

____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

IV. La siguiente tabla muestra de forma resumida, y de manera parcial los resultados de un estudio estadístico. Número de Balances Generales que realiza diariamente cada uno de los Contadores Públicos entrevistados.

a) ¿Cuál es la variable de estudio? _______________ b) ¿De qué tipo es? _______________ c) Completar la tabla. d) ¿Cuántos contadores públicos fueron entrevistados _______________ e) ¿Qué porcentaje de contadores realiza cuatro o más balances? _______________ f) ¿Cuántos contadores efectúan menos de tres balances generales? _______________ g) ¿Qué porcentaje de contadores realizan entre 2 y 5 balances? _______________ h) ¿Qué cantidad de contadores realiza menos de cinco balances? _______________ i) ¿Cuál es el número de balances generales más común? _______________ j) ¿Cómo describes el comportamiento de la variable de estudio?

________________________________________________________________________________________________________________________________________________________________________

Medidas de tendencia central para datos no agrupados.

Page 38: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

38

Son el centro de los datos, a estas les llamamos medidas de tendencia central de las cuales considerarán: la media, la moda y la mediana. Los estadísticos de tendencia central indican dónde se sitúa un grupo de datos. Media El promedio como un valor representativo de los datos es el valor alrededor del cual se agrupan los demás valores de la variable. Se calcula como:

�̅� =𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛

𝑁=

∑ 𝑥𝑖𝑛𝑖=1

𝑁

Donde 𝑥𝑖: representa cada uno de los datos ∑ 𝑥𝑖

𝑛𝑖=1 : representa la sumatoria de todos los valores, desde el primero hasta el n-ésimo

𝑁: es el número de datos en la muestra. Características de la Media:

1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta a la media. 2. Aunque es confiable porque refleja todos los valores del conjunto de datos, puede ser afectada por los

valores extremos, y de esa forma llega a ser una medida menos representativa, por lo que si la distribución es sesgada, la media aritmética no constituye un valor representativo.

Moda La moda de un conjunto es el valor que se repite con mayor frecuencia, se puede simbolizar con �̂�. Se considera el valor más típico de una serie de datos. La moda puede no existir o no ser única, en este caso se designan de modo general como bimodales o multimodales. Características de la Moda:

1. Representa más elementos que cualquier otro valor. 2. La moda no permite conocer la mayor parte de los datos. 3. Puede usarse para datos cuantitativos como cualitativos. 4. La moda como estadístico, varía mucho de una muestra a otra. 5. Cuando se tienen dos o más modas es difícil su interpretación.

Mediana La mediana de un conjunto de observaciones es el valor que divide el conjunto de datos en dos partes iguales. Se representa con el símbolo �̃�. Para determinar el valor de la mediana, es necesario ordenar todos los datos de menor a mayor y se debe tener en cuenta:

a) Si el número de datos 𝑁 es impar, la mediana es el valor de en medio. b) Si el número de datos 𝑁 es par, la mediana es el promedio de las dos observaciones de en medio.

Al contrario de la media, a la mediana no le afectan los valores extremos y es conveniente usarla como medida de tendencia central. Características de la mediana:

1. Es un promedio de posición no afectado por los valores extremos. 2. La mediana en caso de una distribución sesgada, no resulta desplazada del punto de tendencia central.

NOTA: POSICIÓN DE LA MEDIANA 𝑵+𝟏

𝟐

Ejemplo 11

Page 39: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

39

Las edades de las diez personas que acuden a solicitar empleo a una Institución Bancaria son las siguientes:

Determina las medidas de tendencia central para estos datos.

Media Mediana

Moda

Ejemplo 12 Se entrevistaron a 20 jóvenes con respecto al número de veces que acuden al cine cada mes. La siguiente tabla de distribución de frecuencias muestra, de forma resumida los datos obtenidos:

Determina las medidas de tendencia central.

Media Mediana

Moda

Ejemplo 13

Page 40: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

40

La siguiente distribución de frecuencias representa el número de balances generales realizados por un Contador Público a una empresa durante 25 días laborados.

Determina las medidas de tendencia central.

Media Mediana

Moda

Ejercicio extra para practicar.

Page 41: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

41

Resuelve los siguientes problemas apoyándote de las medidas de tendencia central. I. El problema de la campaña publicitaria.

Los siguientes datos corresponden al número de kilómetros recorridos por litro de gasolina en cinco pruebas para tres diferentes marcas de autos compactos:

a) Se te ha contratado para impulsar una campaña publicitaria para promocionar que el auto marca A es el

que ofrece el mayor rendimiento de kilometraje por litro de gasolina, ¿en qué medida de centralización te apoyarías? ¿Por qué? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

b) Considera ahora que eres el responsable de publicitar al auto marca C como el de mayor rendimiento de kilómetros por litro de gasolina, ¿En qué medida estadística basarás tu estrategia? ¿Por qué? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

c) Para el caso del auto compacto marca B, ¿Cuál es tu estrategia de publicidad? ________________________________________________________________________________________________________________________________________________________________________

d) Después de las consideraciones anteriores, si tienes que elegir sólo una de las marcas de auto como el de mayor rendimiento ¿Cuál eliges? ¿Por qué? ________________________________________________________________________________________________________________________________________________________________________

II. ¿Cuánto vale un café?

La respuesta no es tan sencilla. Un grupo de jóvenes con conocimientos de mercadotecnia para la pequeña y mediana empresa quieren abrir una cafetería en un nuevo sector del municipio de Querétaro, caracterizado por el desarrollo urbano y nuevos fraccionamientos. Al realizar un estudio, observan que en un radio de veinte minutos caminando desde el local donde quiere abrir el negocio, hay 10 lugares donde se puede adquirir un café con las mismas características al que desean promocionar. Conformaron la siguiente lista de precios:

a) Calcula la media, la moda y la mediana.

b) ¿Cuál precio consideras sea el más representativo para expresar, en lo general, el costo de un café?

c) Para que este nuevo establecimiento ofrezca a sus clientes precios competitivos, ¿qué precio sugieres por café? Toma como referencia una medida de tendencia central.

III. Deportes

Page 42: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

42

Siete jóvenes compitieron en la carrera de 100 metros planos. Los siguientes datos representan los tiempos, en segundos, que necesitaron para realizar el recorrido:

d) Determina las medidas de tendencia central para estos datos.

Media Mediana

Moda

IV. Materias reprobadas La siguiente tabla muestra los resultados de una encuesta aplicada a una muestra aleatoria de alumnos de un plantel de bachillerato.

a) ¿Tipo de variable de estudio?_____________ b) ¿Cuántos alumnos fueron entrevistados?_________________ c) Determina la media, la moda y la mediana del número de materias aprobadas.

Media Mediana

Moda

d) ¿Cuál consideras es la medida de centralización más adecuada para representar estos datos? ¿Por qué? ____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Medidas de dispersión para datos agrupados.

Page 43: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

43

Los estadísticos de tendencia central indican dónde se sitúa un grupo de datos; los de variabilidad o dispersión indican si esas puntuaciones o valores están próximas entre sí, o al contrario, están muy dispersas. Entre las medidas de dispersión o variación se abordará: el rango, la varianza, y desviación estándar. Rango Una medida razonable de la variabilidad es el rango de variación, que se obtiene de la resta del dato mayor y el dato menor. El rango se simboliza con R. Su fórmula de cálculo es R = dato mayor – dato menor Propiedades del rango:

1. Es fácil de calcular y sus unidades son las mismas que las de la variable. 2. No utiliza todas las observaciones (sólo dos de ellas).

Varianza Es la medida de dispersión más importante, pues tiene como base el promedio aritmético de las desviaciones (distancia de un valor con respecto a la media) elevado al cuadrado. En otras palabras, muestra que tan alejados o que tan cercanos están los datos respecto a la media. Para calcular la varianza se utilizan las siguientes formulas:

Si el dato de la varianza al ser comparado con el valor de la media varía mucho o poco se puede inferir que la dispersión de los datos es alta o baja. Desviación estándar Es la medida de dispersión más utilizada, ya que el resultado se expresa en las mismas medidas que los datos originales. La desviación estándar es la raíz cuadrada de la varianza.

Ejemplo 14

Page 44: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

44

Los siguientes datos representan la duración en segundos de 8 espacios comerciales televisivos, que fueron elegidos al azar y transmitidos por Univisión.

Calcula la media, la varianza y la desviación estándar.

Ejemplo 15 Se elige al azar una muestra de alumnas del quinto semestre próximas a graduar con el propósito de mandar hacer las zapatillas que portarán en la ceremonia de graduación. La siguiente tabla muestra de forma resumida en una distribución de frecuencias absolutas, los datos obtenidos:

Calcula la media, la varianza y la desviación estándar.

Medidas de tendencia central para datos agrupados.

Page 45: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

45

Otra forma en que pueden estar resumidos los datos es mediante distribuciones de frecuencias, en las cuales los valores de la variable se encuentran agrupados en intervalos de clase. Media Se obtiene al sumar todos los productos de la frecuencia absoluta por la marca de clase y dividir entre el total de datos, es decir:

�̅� = ∑𝑓𝑖 ∗ 𝑥�̅�

𝑁

𝑛

𝑖=1

Donde �̅�: media 𝑥�̅�: representa la marca de clase de cada uno de los datos 𝑓𝑖: frecuencia absoluta 𝑁: es el número de datos en la muestra. Mediana Se calcula considerando los siguientes casos:

1. La marca de clase que esté en la posición 𝑁+1

2 si es número de datos es impar.

2. El promedio de las marcas de clase ubicadas en los lugares 𝑁

2 y

𝑁

2+ 1, si 𝑁 es par.

Moda Es la marca de clase con la frecuencia más alta. Medidas de dispersión para datos agrupados. Varianza Para la varianza muestral

𝑠2 =∑ (𝑓𝑖 ∗ 𝑥�̅�

2) − 𝑁�̅�2𝑛𝑖=1

𝑁 − 1

Donde 𝑠2: representa la varianza 𝑓𝑖: frecuencia absoluta de cada clase 𝑥�̅�: marca de clase de cada dato �̅�: media 𝑁: total de datos Desviación estándar

Ejemplo 16

Page 46: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

46

La siguiente tabla muestra la distribución de frecuencias de la carga máxima en toneladas que soportan ciertos cables producidos por una compañía. Elabora su análisis estadístico considerando las medidas de tendencia central y de dispersión.

Tabla de frecuencias en toneladas que soportan algunos tipos de cables.

Máximo de carga en

toneladas

# de cables que soportan la

carga

𝑓𝑖 𝑥�̅� 𝑓𝑖 ∗ 𝑥�̅� 𝑓𝑖 ∗ 𝑥�̅�2

9.3-9.8

9.8-10.3 10.3-10.8

10.8-11.3

11.3-11.8

11.8-12.3 12.3-12.8

12.8-13.3

Análisis estadístico

Ejercicio extra para practicar.

Page 47: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

47

Page 48: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

48

Unidad II: Regresión y Correlación lineal. Introducción. En esta unidad se hará una breve introducción a los temas de Correlación y Regresión lineal de datos bivariados, donde aprenderás a calcular, por un lado, en qué medida se relacionan dos variables estadísticas, a través del coeficiente de correlación de Pearson y por otro desarrollarás un método general para calcular la ecuación de regresión lineal que nos llevará a la recta de mejor ajuste, misma que nos permitirá realizar ciertas predicciones estadísticas, a partir de los datos registrados en una tabulación. Al iniciar el estudio de la correlación y la regresión lineal, te darás cuenta que en el campo de la estadística existen situaciones que requieren el análisis de más de una variable estadística. Por ejemplo, te has preguntado si alguna vez ¿existe una relación entre la estatura y el peso?, ¿están relacionadas la edad y la resistencia física?, ¿influye la temperatura en el índice de criminalidad?, ¿tienden a tener mayor escolaridad las personas con altos ingresos en comparación con las de bajos ingresos? Así también, un profesor puede estar interesado en conocer de qué manera se puede predecir el rendimiento en álgebra basándose en el puntaje obtenido en una prueba de aptitud en dicha asignatura. Así mismo, el psicólogo deseará saber si existe alguna relación entre el concepto que un alumno tiene de sí mismo y su promedio en las asignaturas. También, el sociólogo puede estar interesado en saber qué clase de relación existe entre la tasa de delincuencia juvenil que hay en una comunidad y el grado de hacinamiento (acumulación de individuos) de los hogares que ahí se encuentran. Como observarás son muchas situaciones cotidianas que necesitan analizarse estadísticamente utilizando por lo menos dos variables estadísticas. En todos los ejemplos anteriores, deberás analizar los datos valiéndote de la correlación y la regresión lineal para obtener información acerca de los problemas planteados. Este análisis lo realizarás apoyándote en diagramas de dispersión, el cálculo del coeficiente de correlación de Pearson y la ecuación de mejor ajuste. Cabe destacar un punto esencial en el análisis, las variables involucradas no necesariamente tienen una relación causa-efecto por lo que deberá tomarse la información obtenida mediante esta herramienta con una óptica estrictamente estadística. Todas estas actividades te permitirán resolver problemas donde aplicarás la correlación y regresión lineal como instrumentos preliminares en la inferencia estadística. Correlación lineal En las diferentes áreas del conocimiento existen problemas que requieren el análisis de más de una variable, como por ejemplo; un agrónomo desea conocer si existe relación entre la cantidad de lluvia caída y el rendimiento de ciertos productos agrícolas, es decir, si es afectado desfavorablemente tanto por la excesiva lluvia (humedad), como por la excesiva sequía del suelo. Como te habrás dado cuenta, esta relación y las otras mencionadas en la introducción se pueden investigar por medio del análisis de correlación y/o regresión, simples o lineales, si la relación está limitada a dos variables (si fueran más de dos variables, este análisis de correlación y regresión sería múltiple). En esta unidad hablaremos de la correlación lineal cuyo objetivo principal es medir la intensidad de una relación lineal entre dos variables; la correlación lineal sirve para medir la relación entre dos variables. Después de leer lo anterior, te preguntarás, ¿cómo es que una medida puede representar una relación? En realidad el término medida de correlación lineal implica encontrar un valor numérico que exprese el grado de correspondencia o dependencia que existe entre dos variables estadísticas.

Page 49: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

49

Por ejemplo, la siguiente tabla muestra las cantidades vendidas (y) por 15 vendedores de una compañía en un periodo dado. La tabla también muestra el número de periodos (x) de experiencia que cada vendedor tiene.

Mostraremos la relación entre estas dos variables, gráficamente, para que te des cuenta de cómo están relacionadas estas variables. Más adelante, introduciremos el coeficiente de Pearson, y una fórmula para calcularlo, que nos indicará el grado de relación de estas variables. Grafiquemos los puntos para observar la relación entre estas variables.

Este diagrama sugiere que a medida que los valores X aumentan, también los valores Y aumentan. Además, aparece que los puntos se agrupan a lo largo de una línea recta. Por lo mismo decimos que hay una relación lineal entre los variables X y Y. Al hablar de la correlación lineal de dos variables es necesario distinguir dos casos: Correlación Positiva y Correlación Negativa. Correlación Positiva. Ocurre cuando al crecer (o decrecer) una de las variables, la otra también crece (o decrece). Por ejemplo: a medida que se eleva el nivel de vida de una población, tiende a aumentar el consumo de artículos que no son de primera necesidad. Correlación Negativa. Ocurre cuando al crecer alguna de las variables, la otra decrece o viceversa. Por ejemplo: a medida que se amplían los sistemas de salubridad y medicina preventiva, decrece el índice de mortalidad de las enfermedades infectocontagiosas. En el ejemplo anterior (las ventas) tenemos una correlación positiva. Estas dos correlaciones y otras más, se pueden mostrar utilizando los Diagramas de Dispersión.

Page 50: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

50

Diagramas de dispersión La forma más sencilla que tienen para predeterminar si existe o no correlación entre dos variables es construir un diagrama de dispersión. La dispersión de estos puntos tienen las siguientes formas generales:

Cuando los puntos se van localizando en los ejes coordenados de manera que veas que si los valores de la variable X (de predicción) aumentan y los valores de la variable Y (a predecir) también aumentan, entonces existe una Correlación Lineal Positiva.

Si los puntos se localizan en los ejes coordenados y observas que los valores de la variable X (de predicción) aumentan mientras que los valores de la variable Y (a predecir) decrecen, entonces existe una Correlación lineal negativa.

Cuando los puntos se localizan en el eje de coordenadas y observes que su relación no es lineal, es decir, aunque su patrón de dispersión está definido, estas variables presentan una relación no lineal.

Cuando los valores de la variable X (de predicción) tienen la misma probabilidad de aparecer aparcadas con valores de la variable Y (a predecir) o con valores pequeños de Y, decimos que no hay relación entre X y Y.

Los diagramas de dispersión que acabas de ver te muestran las diferentes relaciones entre la variable X (de predicción) y la variable Y (a predecir), por lo que podemos señalar que si tanto los valores de X como los valores de Y tienden a seguir un patrón recto, entonces existe una correlación lineal.

Page 51: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

51

Ejemplo 17 El Departamento de Ventas de una empresa realiza un análisis comparativo entre el volumen de pedidos levantados y el número de visitas efectuadas por sus 10 vendedores en un cierto periodo de tiempo. Todos los vendedores trabajan en zonas similares, en lo referente al número de clientes y al potencial de compra de dichos clientes. Los resultados de la comparación se muestran a continuación. Considera el número de visitas como la variable (X) y el monto de los pedidos como la variable (Y), construye el diagrama de dispersión correspondiente e infiere si existe algún tipo de correlación.

Ejemplo 18 Al efectuarse un estudio sobre la marca de cierto producto se encontró que 50 personas habían usado anteriormente dicha marca y la habían cambiado. La relación entre el tiempo que habían usado la marca, antes de sustituirla por otra, y el número de ex usuarios en cada caso, fue: Construye el diagrama de dispersión correspondiente e infiere si existe algún tipo de correlación.

Page 52: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

52

Ejemplo 19 Para apoyar la venta de un producto de consumo masivo en un mercado altamente competitivo, una empresa inició a comienzos de año una intensa campaña publicitaria y promocional. La comparación entre la inversión publicitaria y las ventas del producto en 12 meses se indican en la siguiente tabulación:

Construye el diagrama de dispersión e indica si existe alguna correlación entre las variables. ¿De qué tipo es la correlación?

Covarianza Los diagramas de dispersión son representaciones que nos ayudan a “ver” si existe una correlación entre las variables estadísticas que analizamos, sin embargo, para poder realizar una conclusión certera de esta relación es necesario basarnos en un valor numérico que nos diga con seguridad cuál y cómo es el tipo de asociación entre las variables estadísticas que se estudian. Para ello está la covarianza, la cual se calcula como:

𝑆𝑥𝑦 =∑ (𝑥𝑖 − �̅�)(𝑦𝑖 − �̅�)𝑛

𝑖=1

𝑁 − 1

Donde 𝑆𝑥𝑦: representa la covarianza

𝑥𝑖: cada dato de la variable de predicción 𝑦𝑖: cada dato de la variable a predecir �̅�: media de la variable de predicción �̅�: media de la variable a predecir 𝑁: total de datos

Page 53: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

53

La interpretación del valor de la covarianza es muy sencilla:

Si 𝑠𝑥𝑦 es cero, no existe relación

entre las variables.

Si 𝑠𝑥𝑦 es negativo, hay una relación

inversa entre las variables. Esto indica que cuando X aumenta de valor, Y disminuye, y viceversa.

Si 𝑠𝑥𝑦 es positiva, hay una relación

directa entre las variables. Esto indica que cuando X aumenta de valor, Y crece, y viceversa.

Coeficiente de correlación Aunque la covarianza indica el tipo de relación lineal que hay entre dos variables, no podemos saber la fortaleza de esa relación. Para eso debemos calcular otro valor, llamado coeficiente de correlación. El coeficiente de correlación se utiliza para medir la magnitud de la relación lineal entre dos variables, es decir, indica cuán fuerte o débil es una relación lineal. Se denota con la letra “r” y también se le conoce como “r” de Pearson, en honor a Karl Pearson. Se calcula de esta forma:

𝑟 =𝑠𝑥𝑦

𝑠𝑥𝑠𝑦

Donde: 𝑟: Coeficiente de correlación de Pearson. 𝑠𝑥𝑦: Covarianza entre las variables X y Y

𝑠𝑥: Desviación estándar de x (fórmula usada en la página 43) 𝑠𝑦: Desviación estándar de y (fórmula usada en la página 43)

El rango de valores del Coeficiente de Correlación de Pearson (r) está entre -1 y 1; los valores intermedios pueden interpretarse, de forma intuitiva de la esta manera:

Page 54: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

54

Gráficamente se verían así:

Correlación positiva perfecta. Correlación negativa perfecta. Correlación cero.

Coeficiente de determinación Cuando lo que interesa es analizar una relación de causalidad entre dos variables, primero debemos definir cuál de ellas es la variable Y (variable dependiente o variable a predecir), y cuál es la variable X (variable independiente o variable de predicción). La variable dependiente Y es la que se busca explicar; en términos estadísticos, es la que busca estimar o pronosticar. A su vez, la variable independiente X es la que brinda información para explicar Y y recibe el nombre de variable de predicción. Para saber si una variable X es “buena” para explicar la variable Y se calcula el coeficiente de determinación, que representaremos como 𝑟2 y que tiene las características siguientes: Es el cuadrado del coeficiente de correlación. Su rango de valores está entre 0 y1. No da ninguna información sobre la dirección de la relación entre las variables.

Cuanto más cerca esté de 1, la variable independiente X será una buena variable para explicar Y. Es decir, es un factor determinante para Y. En contraparte, conforme 𝑟2 se acerca a 0, indica que X no es un factor significativo para explicar Y.

Regresión lineal simple El término regresión fue introducido por Francis Galton (1822-1911). En general, el análisis de regresión se centra en la exploración, explicación y estudio de dependencia de una variable mediante una o más variables explicativas, de ahí el nombre del método de predicción basado en este modelo. El método de regresión lineal recibe este nombre porque:

Regresión: utilizaremos información pasada. Lineal: bajo el supuesto de que entre dos variables (X y Y) existe una relación lineal. Simple: usaremos solo una variable independiente para tratar de explicar la variable dependiente.

En otras palabras, ajustaremos una recta a los datos. Ajustar se refiere a construir la única recta que pase lo más cerca de todos los puntos ubicados en el diagrama de dispersión. Trazar rectas de manera aleatoria es una forma lenta de encontrar la que pase lo más cerca de todos los puntos, entonces, ¿cómo podría determinarse esa recta?

Page 55: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

55

Método de mínimos cuadrados. El análisis de regresión consiste en definir la variable independiente X que ayude a estimar la variable dependiente Y, siempre que exista una relación lineal entre ellas, además de que ambas variables deben ser cuantitativas. El método de mínimos cuadrados se usa para determinar la ecuación de la recta de regresión, es decir, por medio de él se encuentra la única recta que pasa lo más cerca que se puede de todos los puntos ubicados en el diagrama de dispersión. La ecuación del método de mínimos cuadrados es:

𝑌′ = 𝑏1𝑋 + 𝑏0 Donde: 𝑌′: Valor estimado de Y 𝑏0: Ordenada al origen; es el valor de 𝑌′ cuando X es igual a cero. 𝑏1: Pendiente de la recta; es el cambio en 𝑌′ cuando X aumenta en una unidad. Para obtener la pendiente y la ordenada al origen de dicha recta, llamada recta de regresión hay que minimizar el término:

∑(𝑌𝑖 − 𝑌𝑖′)2

𝑛

𝑖=1

Donde: 𝑌𝑖: El valor de i de Y (valor real) 𝑌𝑖

′: El valor i estimado de Y (valor sobre la recta de regresión), es decir, es la distancia que hay entre cada punto y la recta de regresión. Minimizando esas distancias se obtiene 𝑏0, la ordenada al origen, y 𝑏1, la pendiente de la recta. Así, las ecuaciones para determinar 𝑏0 y 𝑏1 son:

𝑏1 =𝑟𝑠𝑦

𝑠𝑥 𝑦 𝑏0 = �̅� − 𝑏1�̅�

Donde: 𝑟: Coeficiente de correlación. 𝑠𝑦: Desviación estándar muestral de Y

𝑠𝑥: Desviación estándar muestral de X �̅�: Media muestral de Y �̅�: Media muestral de X A 𝑏1 y 𝑏0 se les denomina coeficientes de regresión. De esta manera, utilizando la ecuación de regresión se estiman los valores de Y, es decir, solo debemos sustituir la variable independiente con algún valor y realizar los cálculos correspondientes.

Page 56: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

56

Ejemplo 20 Alicia es una persona que le gusta la lectura y la estadística. Un día, se pregunta si podría asociar el número de páginas de un libro con su precio; es decir, considera que el precio de un libro depende del número de páginas. Para comprobarlo, decide recopilar la información correspondiente de ocho libros y obtiene lo siguiente:

Título # de páginas Precio

El sueño del celta 464 $269

El asedio 736 $289

El perfume 232 $188

Cartas a una joven matemática 238 $219

La mano del fuego 368 $219

El psicoanalista 574 $165

Johnny Deep 192 $149 El lector 208 $113

Para el ejemplo calcula e interpreta: a) Diagrama de dispersión b) Covarianza ___________________________________________________________________________

________________________________________________________________________________________________________________________________________________________________________

c) Coeficiente de correlación de Pearson _____________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

d) Coeficiente de determinación ____________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

e) Modelo de regresión lineal ______________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

# de páginas Precio

464 $269

736 $289

232 $188 238 $219

368 $219

574 $165 192 $149

208 $113

Page 57: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

57

Page 58: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

58

Ejemplo 21 El Departamento de Ventas de una empresa realiza un análisis comparativo entre el volumen de pedidos levantados y el número de visitas efectuadas por sus 10 vendedores en un cierto periodo de tiempo. Todos los vendedores trabajan en zonas similares, en lo referente al número de clientes y al potencial de compra de dichos clientes. Los resultados de la comparación se muestran a continuación. Considera el número de visitas como la variable (X) y el monto de los pedidos como la variable (Y), construye el diagrama de dispersión correspondiente e infiere si existe algún tipo de correlación.

Calcula e interpreta:

a) Covarianza ___________________________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

b) Coeficiente de correlación de Pearson _____________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

c) Coeficiente de determinación ____________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

d) Modelo de regresión lineal ______________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

Page 59: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

59

Ejemplo 22 Los siguientes resultados muestran las puntuaciones obtenidas por 6 estudiantes tomados al azar en las asignaturas de idiomas y matemáticas

Para el ejemplo calcula e interpreta:

a) Diagrama de dispersión b) Covarianza ___________________________________________________________________________

________________________________________________________________________________________________________________________________________________________________________

c) Coeficiente de correlación de Pearson _____________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

d) Coeficiente de determinación ____________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

e) Modelo de regresión lineal ______________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

f) Haz una conjetura acerca de ¿cuánto obtendría en matemáticas un estudiante que hubiera obtenido 480 puntos en idiomas? _______________________________________________________________________________________________________________________________________________________________________

g) Si se considera el aprendizaje de las matemáticas como un problema de lenguaje ¿es razonable pensar que el buen manejo de otros idiomas facilitaría el manejo del lenguaje matemático? Explica. ________________________________________________________________________________________________________________________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

Page 60: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

60

Ejemplo 23 En una de las Secretarías del gobierno federal se ha implantado el sistema de retiro voluntario. Para analizar dicho proceso se toma una muestra aleatoria en los distintos departamentos, donde se relaciona el número de empleados que han renunciado y el número de años de servicio. Se pretende estimar cuántos trabajadores renunciarían en función de su antigüedad. Se obtuvieron los siguientes datos:

Para el ejemplo calcula e interpreta:

a) Diagrama de dispersión b) Covarianza ___________________________________________________________________________

________________________________________________________________________________________________________________________________________________________________________

c) Coeficiente de correlación de Pearson _____________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

d) Coeficiente de determinación ____________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

e) Modelo de regresión lineal ______________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________

f) Estima cuántos empleados renunciarían si tuvieran 14 o 17 años de servicio_______________________ ____________________________________________________________________________________ ____________________________________________________________________________________

Practica de laboratorio: Diagrama de dispersión.

Page 61: Cuadernillo de trabajo: Probabilidad y Estadística. · 2020-02-17 · para el manejo de muchos datos. ... De esta manera podrás aplicar dichos conceptos a la solución no sólo

61

Actividad extra. Realiza un mapa mental (con imágenes) o Infografía en la que resumas con conceptos más importantes de la Correlación y Regresión Lineal.