Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 1
Educación Superior
Abierta y a Distancia
Ingeniería en Tecnología Ambiental
Asignatura
Estadística Básica
Primer Trimestre
Alumno
xxxxxxx
xxxxxxxxxxxxx
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 2
UNIDAD 1: FUNDAMENTOS DE LA ESTADÍSTICA 3
ACTIVIDAD 2: DETERMINACIÓN DE MUESTRAS 3
ACTIVIDAD 3: PROBLEMAS: CIERRE DE LA UNIDAD 5
ACTIVIDAD 4. FORO: LA IMPORTANCIA DE LA ESTADÍSTICA 7
EVIDENCIA DE APRENDIZAJE 1 8
AUTORREFLEXIONES: UNIDAD 1. 9
AUTOEVALUACIÓN: UNIDAD 1 10
UNIDAD 2: REPRESENTACIÓN NUMÉRICA Y GRÁFICA DE DATOS 14
ACTIVIDAD 1: DATOS AGRUPADOS Y NO AGRUPADOS 14
ACTIVIDAD 2: FRECUENCIAS 16
ACTIVIDAD 3: INTERVALOS 18
ACTIVIDAD 4: GRÁFICAS 19
ACTIVIDAD 5: FORO USO COTIDIANO DE LA ESTADÍSTICA DESCRIPTIVA 24
EVIDENCIA DE APRENDIZAJE 2: REPRESENTACIÓN DE DATOS 25
AUTOEVALUACIÓN UNIDAD 2 27
AUTORREFLEXIONES: UNIDAD 2 30
UNIDAD 3: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 31
ACTIVIDAD 1: MEDIDAS DE TENDENCIA CENTRAL 31
ACTIVIDAD 2: MEDIDAS DE DISPERSIÓN 34
ACTIVIDAD 3: PROBLEMAS CON MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 37
EVIDENCIA DE APRENDIZAJE 3: MEDIDAS DE DISPERSIÓN Y TENDENCIA CENTRAL 41
AUTORREFLEXIONES: UNIDAD 3 58
EXAMEN FINAL 62
LITERATURA CONSULTADA 63
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 3
Unidad 1: Fundamentos de la Estadística
Actividad 2: Determinación de Muestras
Determina el tamaño de la muestra para cada uno de los ejemplos, tomando en cuenta que el valor de Z para el porcentaje de confianza del 95% es igual a 1.96. Explica tu procedimiento de sustitución de datos e incluye la fórmula que usaste para cada caso. 1. En una fábrica de alimentos para animales se producen diariamente 58500 sacos de
alimento de 5 kg. Para garantizar que el peso del contenido sea correcto, se toma aleatoriamente algunos sacos y se pesan. Se sabe que la variabilidad positiva es de p=0.7. Si se quiere garantizar un nivel de confianza de 95% y un porcentaje de error de 5%, ¿cuántos sacos se debe pesar? Fórmula para cuando se conoce la población: se coloca el índice de confianza en 1.96, ya que me están dando variabilidad positiva y negativa se sustituyen en la fórmula 0.7 y 0.3, la población es conocida por lo que hay que usar la cantidad 58500. n= (1.96*1.96)*(0.7*0.3)*58500 . 58500*(0.05*0.05)+ (1.96*1.96)*(0.7*0.3) n= (3.8416)*12285 . 146.25+ 0.806736 n= 47194.056 147.056726 n=320 sacos de alimento
2. Se desea realizar un estudio sobre la incidencia de complicaciones postoperatorias en mujeres. El estudio no tiene antecedentes, pero se desea garantizar un nivel de confianza de 95% y un porcentaje de error máximo de 10%, ¿cuál debe ser el tamaño de la muestra? Fórmula para cuando NO se conoce la población: En este caso no se conoce la población por lo que hay que usar la formula correspondiente, se utiliza variabilidad negativa y positiva de 0.5 ya que no me fueron proporcionadas en el texto del ejercicio.
n=(1.96*1.96)*(0.5*0.5) (0.1*0.1) n=(3.8416)*(0.25) (0.01) n=96 mujeres
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 4
3. Un estudio pretende estimar la cantidad de niños(as) que no tiene un nivel de nutrición adecuado, en determinada zona rural. Se sabe que hay 480 niños(as) en la zona. Calcula el tamaño de la muestra para garantizar un nivel de confianza del 95%, y un porcentaje de error de 4%. Fórmula para cuando se conoce la población: La población es conocida en 480 individuos por lo que se usa la formula correspondiente, no se proporciona variabilidad negativa y positiva por lo que se usa 0.5 para cada caso n= (1.96*1.96)*(0.5*0.5)*480 . 480*(0.04*0.04)+(1.96*1.96)*(0.5*0.5) n= (3.8416)*(0.25)*480 . 480*(0.0016)+ (3.8416)*(0.25) n= 460.992 1.7284 n=266 niños
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 5
Actividad 3: Problemas: Cierre de la unidad
1. Un lingüista quiere estudiar cuáles son las vocales más usadas dentro de las palabras
en un texto de alrededor de tres mil palabras. Contar palabra por palabra sería
demasiado trabajo. Por lo que se analizará un subconjunto representativo.
Resuelve las siguientes cuestiones:
a) ¿Cuál es la población de estudio? Las tres mil palabras
b) ¿Cuáles son los individuos de esa población? Cada una de las tres mil palabras
c) ¿De cuántos individuos consta la población? Numéralos comenzando por el 00: la
población consta de 3000 palabras del 0001 al 3000.
d) ¿Cuál es la variable o cuáles son las variables a estudiar? Las vocales más usadas
e) ¿Cuál debe ser el número de elementos necesarios para tomar una muestra
aleatoria simple tal que los resultados del estudio tengan un porcentaje de error
de 5% y un porcentaje de confianza de 95%? Para calcularlo, considera que Z= 1.96
y que la variabilidad positiva es igual a la negativa.
n=((1.96*1.96)*(0.5*0.5)*3000) / (3000*(0.05*0.5))+( (1.96*1.96)* (0.5*0.5)) n=((3.8416)*(0.25*3000)) / ((3000*0.0025)+( 3.8416*0.25)) n=2881.2 / 8.4604 n=340.55127 n=340 palabras
f) Con el resultado anterior:
Obtén la muestra a partir de una tabla de números aleatorios.
Elabora una lista de los datos obtenidos de la muestra de acuerdo con las
variables que señalaste en el inciso d. Resultados en la hoja de cálculo anexa,
(doble clic en el icono para abrirla)
Hoja de cálculo binaria de Microsoft Office Excel
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 6
2. Determina los elementos necesarios para saber cuál es el color que se presenta con
mayor frecuencia en los carros de tu colonia.
a) ¿Cuál es la población de tu estudio? Todos los carros de mi colonia
b) ¿Cuáles son los individuos de esa población? Cada uno de los carros
c) ¿Puedes determinar de cuántos individuos consta la población? Si es posible,
numéralos comenzando por 00. Si no es posible, explica por qué. Si es posible, si
contamos cada carro de la colonia lo cual es complicado y costoso en tiempo y
esfuerzo, ya que no está dado el valor de la población se puede manejar como
valor desconocido. Otra forma es hacer una estimación, por ejemplo, en mi colonia
las casas son de constructora, por lo que cada manzana tiene exactamente 40
casas y son 7.5 manzanas, si estimamos que en cada hogar tienen un vehículo
tendremos aproximadamente 300 vehículos en la colonia
d) ¿Cuál es la variable o cuáles son las variables a estudiar? El color de los carros
e) Obtén el número de elementos necesarios para tomar una muestra aleatoria
simple tal que los resultados del estudio tengan un porcentaje de error de 5% y un
porcentaje de confianza de 95%? Para calcularlo, considera que Z= 1.96 y que la
variabilidad positiva es igual a la negativa.
n=((3.8416)*(0.25)*(300)) / ((300*.0025)+(3.8416*0.25)) n=288.12 / 1.7104 n=168.451 n=168 carros
f) Con el resultado anterior:
Obtén la muestra a partir de una tabla de números aleatorios.
Elabora una lista de los datos obtenidos de la muestra de acuerdo con las
variables que señalaste en el inciso d.
Organiza los datos obtenidos en orden ascendente. Resultados en la hoja de
cálculo anexa, (doble clic en el icono para abrirla)
Hoja de cálculo binaria de Microsoft Office Excel
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 7
Actividad 4. Foro: La importancia de la estadística
El foro La importancia de la estadística tiene como propósito que reflexiones acerca de la
percepción que tienes sobre la estadística y su utilidad, y la compartas con tus
compañeros(as) de grupo y el (la) Facilitador(a). Responde las siguientes preguntas en el
foro:
¿Qué importancia tiene el uso de la estadística? La estadística es una ciencia de suma
importancia (y en muchas ocasiones considerada poco útil), ya que esta nos permite
conocer patrones de comportamiento de fenómenos tanto naturales como sociales. Así
como establecer reglas dentro de procesos importantes o críticos, por medio de la
estadística se pueden establecer cuáles son los valores para considerar que un proceso ha
alcanzado ciertas características consideradas críticas y en base a ello tomar acciones que
lo estabilicen a los valores considerados óptimos.
¿Quién usa la estadística y para qué la usa? La estadística tiene un amplio uso en todas
las ramas de la ciencia. En el campo de la salud, establece los parámetros que determinan
las condiciones óptimas de salubridad en la población, también establece los parámetros
considerados de alto riesgo en una situación de alerta sanitaria. En las disciplinas de
humanidades establece los rasgos de comportamiento de la población, aporta nuevos
parámetros y actualiza los ya existentes, todo esto con el fin de conocer de mejor manera
la distribución de las características más importantes de un grupo humano.
¿Qué utilidad le encuentras a esta asignatura? Específicamente para la carrera que he
seleccionado, Ingeniería en Tecnologías Ambientales, aporta herramientas sumamente
útiles, ya que en esta disciplina se deben hacer estudios relacionados con la calidad del
medio ambiente, estos estudios se realizan analizando variables que son de alto impacto
para la vida, tales como contaminación del aire, el agua y el suelo y los elementos que
forman esa contaminación. La estadística aporta el conocimiento necesario para
establecer valores a dichas variables, tales valores nos indican en qué momento las
condiciones son las más óptimas y en qué momento están fuera de las normas
establecidas.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 8
Evidencia de Aprendizaje 1
Descarga la base de datos Preferencias por carrera, disponible en la pestaña Material de
apoyo. En este documento encontrarás los resultados de la encuesta en que participaste
en la Actividad 1. Los resultados presentados son de todos los (las) alumnos(as) que
respondieron.
Determina lo siguiente:
¿Cuál es la población de estudio?: Todos los alumnos de ESAD de primer
cuatrimestre
¿Cuáles son los individuos de esa población? Las edades y las carreras de los
alumnos inscritos en el primer cuatrimestre
¿De cuántos individuos consta la población? Nombra el rango que abarca la
población (numéralos comenzando por el 1 y ocupa la cantidad de ceros necesaria
para completar los dígitos del número total de la población, por ejemplo del 0001
al 1845). 0001 al 5329
Obtén el número de elementos necesarios para seleccionar una muestra aleatoria
simple tal que los resultados del estudio tengan un porcentaje de error del 5% y un
porcentaje de confianza del 95%. Para ello considera que Z = 1.96 y que la
variabilidad positiva es igual a la negativa.
n=((1.96*1.96)*(0.5*0.5)*5329) / (5329*(0.05*0.05)+ (1.96*1.96)*( 0.5*0.5))
n=((3.8416*0.25)*5329) / ((5329*0.0025)+( 3.8416*0.25))
n=5117.9716 / 13.3225+.9604
n=5117.9716 / 14.2829
n=358.3286
n=358 alumnos
¿Cuál es la variable o cuáles son las variables a estudiar en esa muestra? La edad
de los alumnos
Obtén la muestra con base en la tabla de números aleatorios que tienes (no
olvides indicar el renglón que elegiste para comenzar a seleccionar los individuos
de la muestra) (ver archivo de Excel anexo, doble clic en el icono)
Hoja de cálculo binaria de Microsoft Office Excel
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 9
Autorreflexiones: Unidad 1.
1) ¿Cómo defines a la estadística? La estadística es la ciencia que nos sirve para analizar conjuntos o poblaciones desde un punto de vista matemático, esto con el fin de conocer sus características y particularidades de los individuos que la conforman, así como clasificar de diferentes formas dicha población.
2) ¿Qué es una población? La población es un conjunto de individuos o elementos que pueden ser analizados, clasificados y divididos en subgrupos o muestras que nos permiten conocerlos mejor.
3) ¿Cuál es la diferencia entre variable e individuos en una población? Los individuos son los elementos que conforman una población mientras que las variables son características ya sea de los individuos o de la misma población, cuando se toma una muestra se muestrean los individuos pero con el objetivo de analizar las variables o características que estos tienen respecto a la población que conforman.
4) ¿Cuáles son los pasos para obtener una muestra aleatoria simple? Primero, conocer que tan grande es la población de donde sacaremos la muestra. Segundo, debemos determinar un grado de error en la muestra. Tercero, determinar el grado de confianza que requerimos evitando con esto analizar la totalidad de la población. Cuarto, determinar la variabilidad positiva y negativa. En base a todo esto aplicar la fórmula correspondiente para determinar cuántos individuos debemos considerar en nuestra muestra.
5) ¿En qué consiste el porcentaje de confianza (Z) en una muestra? Representa la posibilidad de generalizar la muestra, es decir, que la muestra que tomaremos de una población determinada es representativa de la misma por lo que no es necesario analizar la población total (lo cual es muy costoso).
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 10
Autoevaluación: Unidad 1
Comenzado el domingo, 26 de junio de 2011, 13:57
Completado el domingo, 26 de junio de 2011, 14:00
Tiempo empleado 2 minutos 29 segundos
Calificación 10 de un máximo de 10 (100%)
Comentario - Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que te ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote.
Question1 Puntos: 1
Muestreo en el que todos los elementos tienen la misma probabilidad de ser elegidos y se eligen al azar:
Seleccione una respuesta.
a. Muestreo aleatorio simple ¡Correcto! El muestreo aleatorio simple es aquél en el que todos los elementos tienen las mismas posibilidades de ser elegidos.
b. Muestreo por selección intencionada
c. Muestreo sistemático
d. Muestreo estratificado
Correcto
Puntos para este envío: 1/1.
Question2 Puntos: 1
Número de hijos(as) en una familia, edad de los alumnos(as), peso y estatura son ejemplos de variables:
Seleccione una respuesta.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 11
a. Discretas
b. Nominales
c. Cualitativas
d. Cuantitativas ¡Correcto! Son ejemplos de variables cuantitativas porque se expresan mediante números.
Correcto
Puntos para este envío: 1/1.
Question3 Puntos: 1
Característica que se desea estudiar y se observa en una población o muestra:
Seleccione una respuesta.
a.Estadístico
b.Parámetro
c. Dato
d. Variable ¡Correcto! Las variables son las características que se desean estudiar de una determinada población o muestra. Pueden ser de cuatro tipos: nominales, ordinales, continuas y discretas.
Correcto
Puntos para este envío: 1/1.
Question4 Puntos: 1
Consiste en la presentación de datos en forma de tablas y gráficas:
Seleccione una respuesta.
a. Estadística inferencial
b. Estadística descriptiva ¡Correcto! La estadística descriptiva se define como los métodos de recopilación, caracterización y presentación de un conjunto de datos con el fin de describir algunas de sus características.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 12
c. Muestreo
d. Muestra aleatoria simple
Correcto
Puntos para este envío: 1/1.
Question5 Puntos: 1
Conjunto de todos los elementos que presentan una característica común:
Seleccione una respuesta.
a. Datos
b.Población ¡Correcto! La población es un conjunto de todos los elementos que presentan una característica común determinada, observable y medible.
c.Variable
d.Muestra
Correcto
Puntos para este envío: 1/1.
Question6 Puntos: 1
Estado civil, sexo, nivel educativo, calidad de la atención son tipos de variables:
Seleccione una respuesta.
a. Ordinales
b.Cualitativas ¡Correcto! Son ejemplo de variables cualitativas porque expresan cualidades que no son numéricas, pueden ser nominales u ordinales.
c.Cuantitativas
d. Continuas
Correcto
Puntos para este envío: 1/1.
Question7 Puntos: 2
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 13
Se van a estudiar las preferencias, en cuanto a carreras, de los (las) estudiantes que ingresaron al Curso Propedéutico de la ESAD para determinar cuáles carreras necesitan un mayor número de facilitadores(as). Para determinar el tamaño de la muestra utilizarías:
Seleccione una respuesta.
a. La fórmula
¡Correcto! La ESAD sabe con exactitud cuántos alumnos(as) ingresaron al Curso Propedéutico, esta fórmula se utiliza para obtener el número de la muestra cuando se conoce con exactitud la población de estudio.
b. Un método de muestreo no probabilístico
c. La fórmula
d. Un método de muestreo probabilístico
Correcto
Puntos para este envío: 2/2.
Question8 Puntos: 2
Un ecologista desea estudiar el promedio de vida de los delfines, en una zona en la cual se están aplicando con mayor rigor las normas de pesca desde hace aproximadamente 10 años, y comparar este promedio con el promedio de vida en una zona donde dichas reglas han sido aplicadas de una forma menos estricta. Para encontrar el tamaño de la muestra el ecologista debe aplicar en su investigación: Seleccione una respuesta.
a. La fórmula
b. Un método de muestreo no probabilístico
c. La fórmula
¡Correcto! En este caso, el investigador desconoce cuál es el tamaño exacto de la población de delfines y esta fórmula se utiliza para determinar el tamaño de la muestra cuando no se conoce con exactitud el tamaño de la población.
d. Un método de muestreo probabilístico
Correcto
Puntos para este envío: 2/2.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 14
Unidad 2: Representación numérica y gráfica de datos
Actividad 1: Datos agrupados y no agrupados
1. Datos Agrupados: Son aquellos datos que forman parte de una muestra y que han sido
contados, ordenas, clasificados. Por lo que se pueden representar por medio de grupos o
rangos. Una característica de estos datos es que presentan una frecuencia o número de
veces que un mismo dato se repite en la muestra.
Ejemplo 1: un grupo de 310 alumnos presentó examen de admisión para una universidad.
El encargado de selección de alumnos presenta a la dirección de la universidad una
tabulación o que contiene los totales obtenidos por alumnos representados en rangos:
En este ejemplo los datos que se están
presentando ya han sido previamente
contados, ordenados, clasificados, agrupados
y divididos en rangos por lo que presentan
una frecuencia representada por la columna
No. de alumnos.
Ejemplo 2: Una persona quiere saber las calificaciones que obtuvo durante sus estudios
universitarios, para esto obtiene de su Kardex las frecuencias de las mismas: 88; 88; 86;
100; 80; 87; 92; 97; 100; 93; 92; 98; 81; 90; 98; 89; 97; 81; 80; 100; 90; 100; 98; 90; 100;
85; 100; 100; 89; 95; 74; 81; 88; 87; 93; 76; 95; 82; 86; 86; 90; 74; 73; 93;
En este ejemplo se mencionan 44 calificaciones
correspondientes a 44 materias cursadas. Pero al agruparse por
frecuencias se forman 18 renglones donde se representan las
frecuencias en que las calificaciones se obtuvieron a lo largo de
los estudios, siendo el 100 la calificación que se presentó con
mayor frecuencia.
Puntaje No. de alumnos
0-5 30
6 30
7 150
8 50
9 40
10 10
Calificación Frecuencia
73 1
74 2
76 1
80 2
81 3
82 1
85 1
86 3
87 2
88 3
89 2
90 4
92 2
93 3
95 2
97 2
98 3
100 7
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 15
2. Datos no Agrupados: Son aquellos que aún no han sido clasificados o contados, los
datos no agrupados si bien pueden presentar un ordenamiento, no presentan una
frecuencia por lo que no pueden ser agrupados o representados en rangos hasta que sean
contados y clasificados. Los datos no agrupados son aquellos que resultan del muestreo
aleatorio inicial, a los cuales todavía no se les ha aplicado ningún formato, ordenamiento,
agrupación o tabulación.
Ejemplo 1: Una persona quiere saber los promedios que obtuvo durante sus estudios
universitarios, para esto obtiene de su Kardex las calificaciones, las cuales están
ordenadas por nombre de materia, el resultado es:
88; 88; 86; 100; 80; 87; 92; 97; 100; 93; 92; 98; 81; 90; 98; 89; 97; 81; 80; 100; 90; 100;
98; 90; 100; 85; 100; 100; 89; 95; 74; 81; 88; 87; 93; 76; 95; 82; 86; 86; 90; 74; 73; 93;
En este caso, las calificaciones no están ordenadas numéricamente y no presentan una
frecuencia aun cuando hay calificaciones repetidas, por lo que se considera que este
conjunto de datos no está agrupado.
Ejemplo 2: Un consultorio geriátrico guarda el peso de sus pacientes diario, la muestra
obtenida en un día determinado fue la sig.:
60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 63; 69; 80; 59; 66;
70; 67; 78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56; 65; 74;
En la muestra se encuentra el peso de 40 personas, en este caso, los pesos no están
clasificados por sexo o edad, ni ordenados, tampoco presentan una frecuencia, por lo que
se considera que los datos no están agrupados.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 16
Actividad 2: Frecuencias
En una gasolinera quieren saber cuántos empleados más deben contratar y para
qué turnos, para ello, registraron durante dos días la cantidad de litros de diesel
que se vende por hora en la gasolinera, el registro que obtuvieron fue el siguiente:
816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830
831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849
844 840 858 853 837 881 873 889 836 815
Elabora una tabla de frecuencias con los datos. Incluye, en la misma tabla, la
frecuencia absoluta, la frecuencia acumulada, la frecuencia relativa y la frecuencia
relativa acumulada.
(tabla en la sig. página)
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 17
Valores Frecuencia Absoluta
Frecuencia Acumulada
Frecuencia Relativa
Frecuencia Relativa Acumulada
810 2 2 0.04166 0.04166
815 2 4 0.04166 0.08333
816 1 5 0.02083 0.10416
830 3 8 0.06250 0.16666
831 1 9 0.02083 0.18750
833 2 11 0.04166 0.22916
835 3 14 0.06250 0.29166
836 2 16 0.04166 0.33333
837 2 18 0.04166 0.37500
839 1 19 0.02083 0.39583
840 3 22 0.06250 0.45833
844 3 25 0.06250 0.52083
849 2 27 0.04166 0.56250
853 2 29 0.04166 0.60416
856 2 31 0.04166 0.64583
858 2 33 0.04166 0.68750
860 1 34 0.02083 0.70833
869 1 35 0.02083 0.72916
873 2 37 0.04166 0.77083
881 2 39 0.04166 0.81250
883 1 40 0.02083 0.83333
884 2 42 0.04166 0.87500
889 6 48 0.12500 1.00000
48
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 18
Actividad 3: Intervalos
En una gasolinera quieren saber cuántos empleados nuevos deben contratar y
para qué turnos; para ello registraron durante dos días la cantidad de litros de
diesel que se venden por hora en la gasolinera. Dicho registro fue el siguiente:
816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830
831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849
844 840 858 853 837 881 873 889 836 815
Construye 10 intervalos de clase con los datos proporcionados y elabora la tabla de
frecuencias correspondiente. Incluye en la misma tabla la frecuencia absoluta la
frecuencia acumulada la frecuencia relativa y la frecuencia relativa acumulada.
Xn=810
X1=889
R=889-810
R=79
k=10
Amplitud=79/10
Amplitud=7.9
Intervalos Frecuencia Absoluta
Frecuencia Acumulada
Frecuencia Relativa
Frecuencia Relativa Acumulada
810-817 5 5 0.10416 0.10416
818-825 0 5 0 0.10416
826-833 6 11 0.125 0.22916
834-841 11 22 0.22916 0.45833
842-849 5 27 0.10416 0.5625
850-857 4 31 0.08333 0.64583
858-865 3 34 0.0625 0.70833
866-873 3 37 0.0625 0.77083
874-881 2 39 0.04166 0.8125
882-889 9 48 0.1875 1
48
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 19
Actividad 4: Gráficas
Los parámetros que has visto hasta aquí, la organización numérica de los datos en tablas y las representaciones gráficas de éstas, pueden ser realizados de forma manual, pero existen programas informáticos como Excel, software libre y programas especializados para estadística, que permiten realizar todos estos trabajos. Realiza la siguiente actividad:
1. Retoma los problemas que realizaste en la Actividad 2: Frecuencias, con los datos de la tabla elabora las gráficas que revisaste en este tema e inclúyelas en el mismo documento.
2. Comparte con tus compañeros(as) el procedimiento que seguiste para graficar los datos del problema, si utilizaste algún software comenta cuál. Agrega una conclusión sobre la utilidad de la representación gráfica de datos.
Procedimiento para crear las gráficas
Para hacer las gráficas utilicé Excel 2007. El procedimiento consistió en copiar la tabla donde tengo los valores de las frecuencias desde Word a Excel, después en la pestaña Insertar, seleccione el tipo de gráfica que deseo utilizar y fui seleccionando una por una los cuatro tipos de gráfica. Para dar valores se debe utilizar la pestaña Diseño y allí el botón Seleccionar Datos, allí se seleccionan los valores horizontales y verticales. Este procedimiento se debe repetir por cada una de las gráficas que tengamos. Finalmente copié y pegué cada gráfica desde Excel a Word utilizando la opción Pegar como Imagen JPG, de esta forma ya no es posible modificar la gráfica en Word.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 20
Valores y Frecuencias
Valores Frecuencia Absoluta Frecuencia Acumulada Frecuencia Relativa Frecuencia Relativa Acumulada
810 2 2 0.04166 0.04166
815 2 4 0.04166 0.08333
816 1 5 0.02083 0.10416
830 3 8 0.06250 0.16666
831 1 9 0.02083 0.18750
833 2 11 0.04166 0.22916
835 3 14 0.06250 0.29166
836 2 16 0.04166 0.33333
837 2 18 0.04166 0.37500
839 1 19 0.02083 0.39583
840 3 22 0.06250 0.45833
844 3 25 0.06250 0.52083
849 2 27 0.04166 0.56250
853 2 29 0.04166 0.60416
856 2 31 0.04166 0.64583
858 2 33 0.04166 0.68750
860 1 34 0.02083 0.70833
869 1 35 0.02083 0.72916
873 2 37 0.04166 0.77083
881 2 39 0.04166 0.81250
883 1 40 0.02083 0.83333
884 2 42 0.04166 0.87500
889 6 48 0.12500 1.00000
48 1
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 21
Histograma
Gráfica de Líneas
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 22
Gráfica de Barras
Gráfica de Áreas
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 23
Conclusiones
El uso de gráficas para representar la información estadística obtenida por medio del
muestreo es sumamente útil ya que ayuda a que las personas que verán e interpretaran
los datos obtenidos como rangos y frecuencias tengan una mejor comprensión de la
información.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 24
Actividad 5: Foro Uso Cotidiano de la Estadística Descriptiva
¿En qué casos de la cotidianeidad se utiliza la estadística descriptiva? La estadística en la
vida diaria la usamos muchas veces sin darnos cuenta, por ejemplo, en mi casa mis padres
saben en base a la propia experiencia cuanto tiempo dura el tanque de gas, cuanto es lo
que llega cada mes (aproximadamente) de electricidad, esto, en base a los datos que han
visto en los recibos durante varios años, el hecho de que por varios años el
comportamiento de estos servicios sea estable ha hecho que sin darse cuenta hagan uso
de la estadística, y con la información que ya tienen en la mente, cada mes hagan un
cálculo aproximado de lo que gastarán en servicios del hogar.
¿Has utilizado la estadística descriptiva? ¿Cómo? La he utilizado principalmente en el ambiente laboral, al desarrollar software se tiene que llevar un control estadístico de los errores detectados en los programas, durante el proceso de pruebas un programador debe detectar la cantidad de errores de un programa y relacionarlo con la cantidad de líneas totales del sistema en cuestión, permitiéndose como máximo 4 errores por cada mil líneas de código de programa. Los errores tienen clasificaciones y en base a estas cantidades y clasificaciones son las acciones que se toman para mejorar los sistemas.
¿Cuál es la utilidad de las técnicas de representación numérica y gráfica de datos en la vida cotidiana? Los usos son muy variados, ya que se pueden utilizar tanto en la vida laboral (que forma parte de la vida cotidiana de cada persona), como en los quehaceres diarios. Retomando el ejemplo que di en la pregunta uno, en base a la estadística es posible tener una previsión de los pagos que debemos hacer mes con mes de los servicios del hogar, ya que el comportamiento de estos servicios es siempre estable, salvo en situaciones de emergencia o “atípicas”. Por lo que también es posible graficar el comportamiento de estos servicios mes por mes y hacerlo anualizado.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 25
Evidencia de Aprendizaje 2: Representación de Datos
Representación de datos
Para generar la evidencia de aprendizaje de esta unidad realiza losiguiente:Retoma los datos de la muestra que obtuviste y organízalos en tablas dela siguiente manera:• Elabora una tabla de frecuencias por intervalos con la variable edad
para toda la muestra.• Para la variable carrera, elabora una tabla de frecuencias simple para
cada una de las carreras.• Elabora las gráficas correspondientes a cada una de las variables.
Organiza tu trabajo de la siguiente manera:• Incluye una presentación donde describas de dónde se obtuvieron los
datos y la finalidad del análisis de los mismos.• El procedimiento que seguiste para obtener la muestra.• Las tablas con una descripción.• Las gráficas con su respectiva descripción.
Representación de datos
Tabla de frecuencias por edades
Edad Frecuencia
N/A 3
17-26 89
27-36 161
37-46 74
47-56 27
57 o más 4
Total 358
Para obtener los intervalos deseexcel donde tengo la muestracopié la columna de edades a unahoja nueva y la ordene de menora mayor, luego hice el conteo delos intervalos haciendo la tablaque ven en la esquina superiorizquierda de esta diapositiva. Paraterminar inserte una gráfica debarras y tomé los datos de latabla que había creadopreviamente.
Gráfica por Edades
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 26
Representación de datos
Tabla de frecuencias por carreras
Carrera Frecuencia
Administración de empresas
turísticas 58
Desarrollo comunitario 31
Desarrollo de software 1
Gestión y administración de
PYME 144
Matemáticas 1
Mercadotecnia internacional 57
Seguridad pública 64
N/A 2
Total 358
Para obtener los intervalos deseexcel donde tengo la muestracopié la columna de edades a unahoja nueva y la ordene dealfabéticamente, luego hice elconteo de los intervalos haciendola tabla que ven en la esquinasuperior derecha de estadiapositiva. Para terminar inserteuna gráfica de barras y tomé losdatos de la tabla que habíacreado previamente.
Gráfica por Carreras
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 27
Autoevaluación Unidad 2
Comenzado el sábado, 30 de julio de 2011, 15:44
Completado el sábado, 30 de julio de 2011, 15:46
Tiempo empleado 1 minutos 39 segundos
Puntos 5/8
Calificación 6 de un máximo de 10 (63%)
Comentario - Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote.
Question 1
Puntos: 1 Conjunto de datos comprendidos entre dos números conocidos como límites Seleccione una respuesta.
a. Intervalo
b. Marca de clase
c. Rango
d. Frontera de clase Revisa nuevamente la definición de intervalo y los conceptos asociados a ella. El intervalo es el conjunto de números que se encuentran delimitados por otros dos
números dados. Incorrecto Puntos para este envío: 0/1.
Question 2 Puntos: 1
Es la diferencia entre el límite superior y el límite inferior del intervalo. Seleccione una respuesta.
a. Marca de clase
b. Amplitud del intervalo
c. Frontera de clase
d. Intervalo de clase ¡Correcto! La amplitud del intervalo se obtiene al restar el límite superior (Ls-Li). Correcto Puntos para este envío: 1/1.
Question 3 Puntos: 1
Este dato se obtiene cuando divides la frecuencia absoluta entre el número total del datos (N). Seleccione una respuesta.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 28
a. Frecuencia relativa
b. Frecuencia relativa acumulada
c. Intervalo
d. Frecuencia acumulada Revisa nuevamente las definiciones de frecuencias. La frecuencia relativa se
obtiene cuando divides la frecuencia absoluta entre N. También se puede presentar en términos de porcentaje. Incorrecto
Puntos para este envío: 0/1.
Question 4
Puntos: 1 Es la suma de las frecuencias hasta el renglón i. Seleccione una respuesta.
a. Frecuencia relativa acumulada
b. Intervalo
c. Frecuencia acumulada
d. Amplitud del intervalo ¡Correcto! La frecuencia acumulada es la que se obtiene cuando sumas las frecuencias absolutas hasta el renglón i, esto es, cuando sumas la frecuencia
absoluta del segundo renglón con la del primero. Esto se puede apreciar mejor en las tablas de datos. Correcto
Puntos para este envío: 1/1.
Question 5
Puntos: 1 Es la diferencia entre un histograma y una gráfica de barras: Seleccione una respuesta.
a. Las variables que representan
b. Separación entre las barras
c. Los datos que se grafican
d. El ancho de las barras ¡Correcto! El histograma y la gráfica de barras difieren en que, el primero no presenta separación entre las barras y la segunda sí.
Correcto Puntos para este envío: 1/1.
Question 6 Puntos: 1 Son las tablas en las que se pueden representar los datos relacionados con más de
una variable. Seleccione una respuesta.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 29
a. Tablas de doble entrada
b. Tablas de intervalos
c. Tablas de frecuencia
d. Tablas de datos Revisa nuevamente los diferentes tipos de tablas.
Incorrecto Puntos para este envío: 0/1.
Question 7 Puntos: 1 Es el número de veces que se repite un dato.
Seleccione una respuesta.
a. Frecuencia absoluta
b. Frecuencia acumulada
c. Intervalo
d. Frecuencia relativa ¡Correcto! El número de veces que se repite un dato, dentro de una serie, se llama
frecuencia o frecuencia absoluta. Correcto Puntos para este envío: 1/1.
Question 8 Puntos: 1
¿De qué depende la formación de intervalos? Seleccione una respuesta.
a. Del tamaño de la población
b. De la magnitud de las frecuencias absolutas
c. Del tipo de población que se analiza
d. De la decisión de quienes están analizando los datos
¡Correcto! La formación de intervalos depende del tamaño o rango de la población.
El número de intervalos que se formarán para analizar los datos lo determinan quienes trabajan esos datos.
Correcto Puntos para este envío: 1/1.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 30
Autorreflexiones: Unidad 2
Contesta las siguientes preguntas, guárdalas en el archivo correspondiente y envíalo a través de la herramienta autorreflexiones situada al final de las actividades de la unidad 2.
1.- Describe 2 métodos para recolectar información.
Encuesta: realizar un cuestionario a número determinado de individuos en una población, teniendo todos los individuos de la misma posibilidad de ser seleccionados para la encuesta.
Muestra Aleatoria: se determina el tamaño de la muestra y de manera aleatoria son seleccionados los individuos a analizar, en este caso también todos los individuos de una población tienen la misma posibilidad de ser seleccionados para su análisis.
2.- ¿En qué consiste la amplitud de un intervalo y cómo se determina dicha amplitud?
La amplitud se obtiene dividiendo el Recorrido de la muestra entre el número de intervalos que se deben tener. Es el dato que nos permite generar un rango para el análisis de los datos obtenidos en la muestra.
3.- ¿Qué es una frecuencia absoluta?
Es las veces que un dato se presentó en una muestra o población
4.- ¿Cuál es la diferencia entre datos agrupados y datos no agrupados?
Los datos agrupados presentan un ordenamiento así como una frecuencia de cuantas veces fueron identificados en la muestra o población, mientras que los datos no agrupados aunque pueden estar ordenados no presentan frecuencias
5.- ¿Cuál es la utilidad de las tablas de datos?
Una tabla de datos muestra los intervalos y frecuencias de una muestra o población, es muy útil para poder deducir el comportamiento de una población ya que los datos agrupados son una generalización de dicho comportamiento.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 31
Unidad 3: Medidas de Tendencia Central y Dispersión
Actividad 1: Medidas de Tendencia Central
NI Valores Frecuencia Absoluta Frecuencia
Acumulada Frecuencia Relativa
Frecuencia Relativa
Acumulada
1 810 2 2 0.04166 0.04166
2 815 2 4 0.04166 0.08333
3 816 1 5 0.02083 0.10416
4 830 3 8 0.0625 0.16666
5 831 1 9 0.02083 0.1875
6 833 2 11 0.04166 0.22916
7 835 3 14 0.0625 0.29166
8 836 2 16 0.04166 0.33333
9 837 2 18 0.04166 0.375
10 839 1 19 0.02083 0.39583
11 840 3 22 0.0625 0.45833
12 844 3 25 0.0625 0.52083
13 849 2 27 0.04166 0.5625
14 853 2 29 0.04166 0.60416
15 856 2 31 0.04166 0.64583
16 858 2 33 0.04166 0.6875
17 860 1 34 0.02083 0.70833
18 869 1 35 0.02083 0.72916
19 873 2 37 0.04166 0.77083
20 881 2 39 0.04166 0.8125
21 883 1 40 0.02083 0.83333
22 884 2 42 0.04166 0.875
23 886 4 46 0.08333 0.95833
24 889 2 48 0.125 1
48
816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840
844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853
837 881 873 889 836 815
(ejercicios en la sig. página)
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 32
Fórmula para calcular la Media de datos agrupados en frecuencias
µ=816+810+856+888+833+839+853+837+881+873+889+836+815+860+830+888+830+844+ 830+831+840+844+840+858+810+888+883+835+884+849+856+888+833+869+835+835+ 884+849+844+840+858+853+837+881+873+889+836+815 .
48 µ=40845/48
µ=850.9
Fórmula para calcular la Mediana de datos agrupados en frecuencias
NI Intervalos Frecuencia Absoluta
Frecuencia Acumulada
1 809-817 5 5
2 818-826 0 5
3 827-835 9 14
4 836-844 11 25
5 845-853 4 29
6 854-862 5 34
7 863-871 1 35
8 872-880 2 37
9 881-889 11 48
10 890-898 0 48
48 48
N/2=48/2=24 el intervalo es el número 4 ya que suma 25 e incluye el 24 Li = 836 Fi-1 = 14 fi = 11 ai = 8 Sustitución de valores: Me=836+24-14(8)= 836+10(8)= 836+80=836+7.2=843.2 11 11 11 Me=843.2
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 33
Fórmula para calcular la Moda de datos agrupados en frecuencias
NI Intervalos
Frecuencia Absoluta
Frecuencia Acumulada
1 809-817 5 5
2 818-826 0 5
3 827-835 9 14
4 836-844 11 25
5 845-853 4 29
6 854-862 5 34
7 863-871 1 35
8 872-880 2 37
9 881-889 11 48
10 890-898 0 48
48 48
Intervalo con mayor frecuencia absoluta 4 y 9, es un conjunto bimodal Primera moda Li = 836 fi = 11 Fi-1 = 9 Fi+1 = 4 ai = 8 Sustitución de valores Mo1=836+ 11- 9 (8)=836+ 2 (8)= 836+ 2 (8)= 836+(0.22(8))= 836+1.77=837.77 (11-9)+(11-4) 2+7 9 Mo1=837.77 Segunda moda Li = 881 fi = 11 Fi-1 = 2 Fi+1 = 0 ai = 8 Sustitución de valores Mo2=881+ 11- 2 (8)=881+ 9 (8)= 881+ 9 (8)= 881+(0.45(8))= 881+3.6=884.6 (11-2)+(11-0) 9+11 20 Mo2=884.6
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 34
Actividad 2: Medidas de Dispersión
NI Valores Frecuencia Absoluta Frecuencia
Acumulada Frecuencia Relativa
Frecuencia Relativa
Acumulada
1 810 2 2 0.04166 0.04166
2 815 2 4 0.04166 0.08333
3 816 1 5 0.02083 0.10416
4 830 3 8 0.0625 0.16666
5 831 1 9 0.02083 0.1875
6 833 2 11 0.04166 0.22916
7 835 3 14 0.0625 0.29166
8 836 2 16 0.04166 0.33333
9 837 2 18 0.04166 0.375
10 839 1 19 0.02083 0.39583
11 840 3 22 0.0625 0.45833
12 844 3 25 0.0625 0.52083
13 849 2 27 0.04166 0.5625
14 853 2 29 0.04166 0.60416
15 856 2 31 0.04166 0.64583
16 858 2 33 0.04166 0.6875
17 860 1 34 0.02083 0.70833
18 869 1 35 0.02083 0.72916
19 873 2 37 0.04166 0.77083
20 881 2 39 0.04166 0.8125
21 883 1 40 0.02083 0.83333
22 884 2 42 0.04166 0.875
23 886 4 46 0.08333 0.95833
24 889 2 48 0.125 1
48
816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840
844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853
837 881 873 889 836 815
(ejercicios en la sig. página)
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 35
Fórmula para calcular el Recorrido en un conjunto de datos
Re=889-810=79 Re=79
Fórmula para calcular la Varianza de datos no agrupados Varianza Media
µ=816+810+856+888+833+839+853+837+881+873+889+836+815+860+830+888+830+844+ 830+831+840+844+840+858+810+888+883+835+884+849+856+888+833+869+835+835+ 884+849+844+840+858+853+837+881+873+889+836+815 .
48 µ=40845/48
µ=850.9
=(816-850.9)^2+(810-850.9)^2+(856-850.9)^2+(888-850.9)^2+(833-850.9)^2+(839-850.9)^2+ (853-850.9)^2+(837-850.9)^2+(881-850.9)^2+(873-850.9)^2+(889-850.9)^2+(836-850.9)^2+ (815-850.9)^2+(860-850.9)^2+(830-850.9)^2+(888-850.9)^2+(830-850.9)^2+(844-850.9)^2+ (830-850.9)^2+(831-850.9)^2+(840-850.9)^2+(844-850.9)^2+(840-850.9)^2+(858-850.9)^2+ (810-850.9)^2+(888-850.9)^2+(883-850.9)^2+(835-850.9)^2+(884-850.9)^2+(849-850.9)^2+ (856-850.9)^2+(888-850.9)^2+(833-850.9)^2+(869-850.9)^2+(835-850.9)^2+(835-850.9)^2+ (884-850.9)^2+(849-850.9)^2+(844-850.9)^2+(840-850.9)^2+(858-850.9)^2+(853-850.9)^2+ (837-850.9)^2+(881-850.9)^2+(873-850.9)^2+(889-850.9)^2+(836-850.9)^2+(815-850.9) .
48
=1672.81+1672.81+1288.81+1288.81+1218.01+436.81+436.81+436.81+396.01+320.41+ 320.41+252.81+252.81+252.81+222.01+222.01+193.21+193.21+141.61+118.81+118.81+ 118.81+47.61+47.61+47.61+3.61+3.61+4.41+4.41+26.01+26.01+50.41+50.41+82.81+ 327.61+488.41+488.41+906.01+906.01+1030.41+1095.61+1095.61+1376.41+1376.41+ 1376.41+1376.41+1451.61+1451.61 .
48
= 26716.88/48
=556.60
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 36
Fórmula para calcular la Desviación Estándar en un conjunto de datos
Media µ=850.9
Varianza
=556.60
Desviación Estándar
=sqrt(556.60)
=23.69
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 37
Actividad 3: Problemas con Medidas de Tendencia Central y Dispersión
Instrucción: Realiza lo siguiente para cada problema.
Elabora las tablas de frecuencias correspondientes para obtener las medidas de
tendencia central y dispersión.
Medias de tendencia central y dispersión por frecuencias simples, para el problema 1.
Medidas de tendencia central y dispersión por intervalos para el problema 2.
1. Un profesor de educación física desea hacer un estudio sobre el desempeño de sus
alumnos(as) en la prueba de atletismo de 100 metros planos. Seleccionó una muestra de
20 alumnos(as) y registró los tiempos que éstos marcaron. Los tiempos, en segundos,
registrados fueron:
18.71, 21.41, 20.72, 28.1, 19.29, 22.43, 20.17, 23.71, 19.44, 20.55, 18.92, 20.33, 23.00,
22.85, 19.25, 21.77, 22.11, 19.77, 18.04, 21.12.
Medidas de Tendencia Central:
Media
µ= 18.71+21.41+20.72+28.1+19.29+22.43+20.17+23.71+19.44+20.55+
18.92+20.33+23.00, 22.85+19.25+21.77+22.11+19.77+18.04+21.12
20
µ= 421.69 / 20
µ= 21.0845
Mediana
Cantidad de datos par en el conjunto=20, los valores que separan en dos el conjunto son
20.55 y 20.72, suman 41.27, la mediana es 20.64
Me=20.64
Moda
El conjunto no tiene datos repetidos por lo que la frecuencia de cada uno de sus
elementos es 1, se trata de un conjunto amodal.
Mo=amodal
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 38
Medidas de Dispersión
Recorrido
Re=28.1-18.04
Re=10.06
Varianza
= (18.04-21.0845) ^2+(18.71-21.0845) ^2+(18.92-21.0845) ^2+(19.25-21.0845) ^2+
(19.29- 21.0845) ^2+ (19.44-21.0845) ^2+(19.77-21.0845) ^2+(20.17-21.0845) ^2+
(20.33-21.0845) ^2+(20.55-21.0845) ^2+(20.72-21.0845) ^2+(21.12-21.0845) ^2+
(21.41-21.0845) ^2+(21.77-21.0845) ^2+(22.11-21.0845) ^2+ (22.43-21.0845) ^2+
(22.85-21.0845) ^2+(23-21.0845) ^2+(23.71-21.0845) ^2+(28.1-21.0845) ^2
19
=(-3.0445) ^2+(-2.3745) ^2+(-2.1645) ^2+(-1.8345) ^2+(-1.7945) ^2+(-1.6445) ^2+
(-1.3145) ^2+(-0.9145) ^2+(-0.7545) ^2+(-0.5345) ^2+(-0.3645) ^2+(0.0355) ^2+
(0.3255) ^2+(0.6855) ^2+(1.0255) ^2+(1.3455) ^2+(1.7655) ^2+(1.9155) ^2+
(2.6255) ^2+(7.0155) ^2 .
19
=9.26898025+5.63825025+4.68506025+3.36539025+3.22023025+2.70438025+
1.72791025+0.83631025+0.56927025+0.28569025+0.13286025+0.00126025+
0.10595025+0.46991025+1.05165025+1.81037025+3.11699025+3.66914025+
6.89325025+49.21724025 .
19
=98.770095/19
=5.1984
Desviación Estándar
=sqrt(5.1984)
=2.28
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 39
2. Un ambientalista está haciendo una investigación sobre la cantidad de basura que se
genera en su colonia. Para ello registró cuántos kilos de basura recolectó el camión
durante veinte días consecutivos en su calle. Los resultados fueron:
227, 122, 172, 228, 217, 225, 182, 216, 229, 221, 192, 142, 152, 211, 192, 182, 203, 205,
187, 195.
Xn = 122
X1 = 229
R = 229-122
R = 107
K = 5
Amplitud = 107/5
Amplitud = 21.4 = 21
Medidas de Tendencia Central:
Media µ=(132.5*2)+(154.5*1)+(176.5*4)+(198.5*5)+(220.5*8)
20
µ=265+154.1+706+992.5+1764
20
µ=3881.6/20
µ=194.08
Intervalos Frecuencia Absoluta
Frecuencia Acumulada
Marca de Clase
122-143 2 2 132.5 7584.1928
144-165 1 3 154.5 1566.5764
166-187 4 7 176.5 1236.2256
188-209 5 12 198.5 97.682
210-231 8 20 220.5 5584.1312
20 20 16068.808
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 40
Mediana
N/2=20/2=10 el intervalo es el número 4 ya que este tiene frecuencia 12 que incluye el
número 10
Li = 188
Fi-1 = 22
fi = 5
ai = 21
Sustitución de valores:
Me=188+10-22(21)=188+(-12) (21)=188+(-2.4)(21)=188-50.4=137.6
5 5
Me=137.6
Moda
Intervalo con mayor frecuencia absoluta 5 con frecuencia 8
Li = 210
fi = 8
Fi-1 = 5
Fi+1 = 0
ai = 21
Sustitución de valores
Mo=210+ 8-5 (21)=210+ 3 (21)=210+5.72=215.72
(8-5)+(8-0) 11
Mo=215.72
Medidas de Tendencia Central
Recorrido
Re=229-121
Re=107
Varianza
µ=194.08
= 16068.808/20
= 803.44
Desviación Estándar
=sqrt(803.44)
=28.35
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 41
Evidencia de Aprendizaje 3: Medidas de Dispersión y Tendencia Central
Para elaborar la evidencia de esta unidad, realiza lo siguiente:
Retoma el trabajo que entregaste como evidencia en la Unidad 2. Para la variable
edad y la variable carrera, obtén las medidas de tendencia central y dispersión.
Para la variable carrera, debes obtener las medidas por carrera, del mismo modo
como elaboraste las tablas de frecuencias.
Describe brevemente qué significa cada una de las medidas.
Al final de tu trabajo incluye, a manera de conclusión, una reflexión sobre lo siguiente:
¿Qué tipo de información obtuviste con el análisis de los datos?
Si fueras director del campus virtual ¿para qué podrías utilizar esta información?
Describe, de manera breve, algunos ejemplos.
¿Cuál es la utilidad de la estadística en tu formación académica, tus actividades
profesionales y tu vida personal?
Entrega tu trabajo organizado del mismo modo que lo entregaste en la Unidad 2, es decir:
Incluye una presentación donde describas de dónde se obtuvieron los datos y la
finalidad del análisis de los mismos.
El procedimiento que seguiste para obtener la muestra.
Las tablas, las gráficas, las medidas de tendencia central y dispersión con una
descripción.
Agrega tu conclusión.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 42
Edades FA FR MC Carreras
17-26 94 94 21.5 Administración de empresas turísticas 63
27-36 152 246 31.5 Desarrollo comunitario 27
37-46 86 332 41.5 Gestión y administración de PYME 147
47-56 23 355 51.5 Mercadotecnia internacional 59
57-66 3 358 61.5 Seguridad pública 62
358 358
358
Debido a que se tiene que manejar por intervalos, en las edades, el último de ellos de
57 o más se le agrego el número 66 para poder obtener una marca de clase
Archivo de la presentación
EB_U3_EA_JOSA.pptx
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 43
Cálculo de Datos por Edades
Edades FA FR MC
17-26 94 94 21.5
27-36 152 246 31.5
37-46 86 332 41.5
47-56 23 355 51.5
57-66 3 358 61.5
358 358
Medidas de Tendencia Central
Media
µ=((21.5*94)+(31.5*152)+(41.5*86)+(51.5*23)+(61.5*3))/358 µ=(2021+4788+3569+1184.5+184.5)/358 µ=11747/358 µ=32.81 años
Mediana
N/2=358/2=179 el intervalo es el número 2 Li = 27 Fi-1 = 84 fi = 152 ai = 10 Sustitución de valores: Me=27+179-94(10) = 27+(85)(10) = 27+(0.56)*10 = 27+5.6=32.6 152 152 Me=32.6
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 44
Moda
El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 152 repeticiones. Li = 27 fi = 152 Fi-1 = 94 Fi+1 = 86 ai = 10 Sustitución de valores Mo=27+ 152-94 (10)= 27+ 58 (10)=27+(0.464*10)=27+4.64=31.64 (152-94)+(152-86) 58+66 Mo=31.64 años
Edades
Medidas de Dispersión
Recorrido
Re=66-18 Re=48
Varianza
= (32.8-21.5)^2+(32.8-31.5)^2+(32.8-41.5)^2+(32.8-51.5)^2+(32.8-61.5)^2 358
= (127.69)+(1.69)+(75.69)+(349.69)+(823.69) 358
= 1378.45 358
= 3.85
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 45
Desviación Estándar
=sqrt(3.85)
=1.96
Cálculos por Carreras
Carreras FA
Administración de empresas turísticas 63
Desarrollo comunitario 27
Gestión y administración de PYME 147
Mercadotecnia internacional 59
Seguridad pública 62
358
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 46
Resultados por carrera
Administración de Empresas Turísticas
17-26 29 29 21.5
27-36 26 55 31.5
37-46 7 62 41.5
47-56 1 63 51.5
57-66 0 63 61.5
63
Medidas de Tendencia Central
Media
µ=((21.5*29)+(31.5*26)+(41.5*7)+(51.5*1)+(61.5*0))/63 µ=(623.5+819+290.5+51.5+0)/63 µ=1784.5/63 µ=28.3 años
Mediana
N/2=63/2=31.5 el intervalo es el número 2 ya que 31.5 se encuentra dentro de 55 Li = 27 Fi-1 = 29 fi = 26 ai = 10 Sustitución de valores: Me=27+31.5-29(10) = 27+(2.5)(10) = 27+(0.096)*10 = 27+0.96=27.96 26 26 Me=27.96 años
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 47
Moda
El intervalo con mayor frecuencia absoluta es el 1 (17-26) con 29 repeticiones. Li = 17 fi = 29 Fi-1 = 0 Fi+1 = 55 ai = 10 Sustitución de valores Mo=17+ 29-0 (10)= 17+ 29 (10)=17+(9.6*10)=17+96.6=113.6 (29-0)+(29-55) 29-26 Mo=113.6 años
Recorrido
Re=66-18 Re=48
Varianza
= (28.3-21.5)^2+(28.3-31.5)^2+(28.3-41.5)^2+(28.3-51.5)^2+(28.3-61.5)^2
63
= (46.24)+(10.24)+(174.24)+(538.24)+(1102.24) 63
= 1861.2 63
= 29.54
Desviación Estándar
=sqrt(29.54)
=5.44
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 48
Desarrollo Comunitario
17-26 4 4 21.5
27-36 10 14 31.5
37-46 9 23 41.5
47-56 2 25 51.5
57-66 2 27 61.5
27
Medidas de Tendencia Central
Media
µ=((21.5*4)+(31.5*10)+(41.5*9)+(51.5*2)+(61.5*2))/27 µ=(86+315+373.5+103+123)/27 µ=1000.5/27 µ=37.05 años
Mediana
N/2=27/2=13.5 el intervalo es el número 2 Li = 27 Fi-1 = 4 fi = 10 ai = 10 Sustitución de valores: Me=27+13.5-4(10) = 27+(9.5)(10) = 27+(0.95)*10 = 27+9.5=36.5 10 10 Me=36.5 años
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 49
Moda
El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 10 repeticiones. Li = 27 fi = 10 Fi-1 = 4 Fi+1 = 23 ai = 10 Sustitución de valores Mo=27+ 10-4 (10)= 27+ 6 (10)=27+(-0.86*10)=27-8.6=18.4 (10-4)+(10-23) 6-13 Mo=18.4 años
Medidas de dispersión
Recorrido
Re=66-18 Re=48
Varianza
= (37.05-21.5)^2+(37.05-31.5)^2+(37.05-41.5)^2+(37.05-51.5)^2+(37.05-61.5)^2 27
= (241.8)+(30.8)+(19.8)+(208.8)+(597.8) 27
= 1099 27
= 40.7
Desviación Estándar
=sqrt(40.7)
=6.4
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 50
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 51
Administración y Gestión de PyME
17-26 30 30 21.5
27-36 57 87 31.5
37-46 46 133 41.5
47-56 13 146 51.5
57-66 1 147 61.5
147
Medidas de Tendencia Central
Media
µ=((21.5*30)+(31.5*57)+(41.5*46)+(51.5*13)+(61.5*1))/147 µ=(645+1795.5+1909+669.5+61.5)/147 µ=5080.5/147 µ=34.6 años
Mediana
N/2=147/2=73.5 el intervalo es el número 2 Li = 27 Fi-1 = 30 fi = 57 ai = 10 Sustitución de valores: Me=27+73.5-30(10) = 27+(43.5)(10) = 27+(0.76)*10 = 27+7.6=34.6 57 57 Me=34.6 años
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 52
Moda
El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 57 repeticiones. Li = 27 fi = 57 Fi-1 = 30 Fi+1 = 133 ai = 10 Sustitución de valores Mo=27+ 57-30 (10)= 27+ 27 (10)=27+(-0.55*10)=27-5.5=21.5 (57-30)+(57-133) 27-76 Mo=21.5 años
Medidas de dispersión
Recorrido
Re=66-18 Re=48
Varianza
= (34.6-21.5)^2+(34.6-31.5)^2+(34.6-41.5)^2+(34.6-51.5)^2+(34.6-61.5)^2
147
= (171.61)+(9.61)+(47.61)+(285.61)+(723.61) 147
= 1241.05 147
= 8.4
Desviación Estándar
=sqrt(8.4)
=2.9
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 53
Mercadotecnia Internacional
17-26 21 21 21.5
27-36 25 46 31.5
37-46 10 56 41.5
47-56 3 59 51.5
57-66 0 59 61.5
59
Medidas de Tendencia Central
Media
µ=((21.5*21)+(31.5*25)+(41.5*10)+(51.5*3)+(61.5*1))/59 µ=(451.5+787.5+415+154.5+0)/59 µ=1393.5/59 µ=23.62 años
Mediana
N/2=59/2=29.5 el intervalo es el número 2 Li = 27 Fi-1 = 21 fi = 25 ai = 10 Sustitución de valores: Me=27+29.5-21(10) = 27+(8.5)(10) = 27+(0.34)*10 = 27+3.4=30.4 25 25 Me=30.4 años
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 54
Moda
El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 25 repeticiones. Li = 27 fi = 25 Fi-1 = 21 Fi+1 = 56 ai = 10 Sustitución de valores Mo=27+ 25-21 (10)= 27+ 4 (10)=27+(-0.15*10)=27-1.5=25.5 (25-21)+(25-56) 4-31 Mo=25.5 años Medidas de dispersión
Recorrido
Re=66-18 Re=48
Varianza
= (23.62-21.5)^2+(23.62-31.5)^2+(23.62-41.5)^2+(23.62-51.5)^2+(23.62-61.5)^2
59
= (4.49+62.09+319.69+777.29+1434.89) 59
= 2598.45 59
= 44.04
Desviación Estándar
=sqrt(44.04)
=6.6
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 55
Seguridad Pública
17-26 10 10 21.5
27-36 34 44 31.5
37-46 14 58 41.5
47-56 4 62 51.5
57-66 0 62 61.5
62
Medidas de Tendencia Central
Media
µ=((21.5*10)+(31.5*34)+(41.5*14)+(51.5*4)+(61.5*0))/62 µ=(215+1071+581+206+0)/62 µ=2073/62 µ=33.44 años
Mediana
N/2=62/2=31 el intervalo es el número 2 Li = 27 Fi-1 = 10 fi = 34 ai = 10 Sustitución de valores: Me=27+31-10(10) = 27+(21)(10) = 27+(0.62)*10 = 27+36.2=33.2 34 34 Me=33.2 años
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 56
Moda
El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 34 repeticiones. Li = 27 fi = 34 Fi-1 = 10 Fi+1 = 58 ai = 10 Sustitución de valores Mo=27+ 34-10 (10)= 27+ 24 (10)=27+(0*10)=27+0=27 (34-10)+(34-58) 24-24 Mo=27 años Medidas de dispersión
Recorrido
Re=66-18 Re=48
Varianza
= (33.44-21.5)^2+(33.44-31.5)^2+(33.44-41.5)^2+(33.44-51.5)^2+(33.44-61.5)^2
62
= (4142.56+3.76+64.96+326.16+787.36) 62
= 5324.8 62
= 85.88
Desviación Estándar
=sqrt(85.88)
=9.3
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 57
Conclusiones
En la mayoría de los casos el intervalo 1 y el intervalo 2 son los que tienen mayor cantidad
de alumnos, es decir la población está compuesta principalmente por personas jóvenes de
entre 17 y 36 años de edad, siendo los intervalos de 37 a 66 años los que presentan
menor cantidad de frecuencias relativas. Esto me indica que el comportamiento de la
población de estudiantes de ESAD es muy parecido al de una universidad tradicional con
clases presenciales, en donde la población es principalmente joven, pero con la ventaja
que en ESAD se está captando personas de edad considerada maduros-jóvenes (los que se
encuentran en sus 30’s) los cuales por lo general representan una frecuencia muy baja en
las escuelas tradicionales y en ESAD tienen gran impacto poblacional.
Puedo agregar también a esta conclusión, que las carreras administrativas siguen siendo
las que mayor demanda presentan en nuestro país, ya que en la muestra que resultó de
mis cálculos, la mayoría de los individuos están inscritos en alguna carrera administrativa y
ninguno de ellos estuvo dentro de una ingeniería, aunque en la población total a estudiar
si había personas inscritas en ingenierías.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 58
Autorreflexiones: Unidad 3
1.- ¿Qué es la media aritmética?
La media aritmética es el valor que resulta de la suma de todos los valores de una muestra
o población y se divide entre el número de individuos. Este valor nos indica cual es el
promedio de valores de dicha población y es un dato de suma importancia al momento de
tomar una decisión en base a los datos arrojados por una muestra.
2.- ¿En qué consiste la moda aritmética?
La moda representa aquel valor que más veces se presento dentro de una población o
muestra, al igual que la media es un valor muy importante ya que permite tener una idea
general del comportamiento de una determinada población.
3.- ¿Qué es la mediana y como se determina en datos no agrupados?
La mediana es el elemento de la población o muestra que se ubica justo al centro de la
misma, es decir deja el 50% de los elementos tanto a la izquierda como a la derecha de la
recta que forman los valores de la muestra o población. Se representa con Me y la forma
de calcularla en datos no agrupados es la siguiente:
a) Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos
han sido ordenados (en orden creciente o decreciente), porque éste es el valor central.
b) Si n es par, la mediana es la media aritmética de las dos observaciones centrales.
Cuando n es par, los dos datos que están en el centro de la muestra ocupan las
posiciones n/2 y (n/2)+1. Es decir: Me = (Xn/2+(Xn/2+1))/2.
4.- ¿En qué consiste la varianza?
La varianza es la diferencia que hay entre el promedio o media aritmética y cada
elemento de la población o muestra, es decir que tanto se alejan estos elementos de la
media, la varianza se expresa en al cuadrado de la unidad original de la muestra, es decir,
si la muestra está en kilómetros la varianza es kilómetros al cuadrado y así con cada tipo
de medida.
(continua sig. hoja)
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 59
5.- ¿En qué consiste la desviación estándar?
La desviación estándar representa un promedio de alejamiento de los elementos de la
muestra respecto a su media, cuando la desviación estándar es un valor muy grande
quiere decir que los elementos tienen valores muy alejados de la media
6.- De los temas vistos en el curso, ¿Cuál fue el que más se te complicó y por qué?
El más complicado para mí fue la mediana, ya que en un principio no me quedó claro que
es y para que se utiliza, aunque después de repasarlo me di cuenta que en realidad es una
de las medidas más sencillas de calcular y representar.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 60
Comenzado el
viernes, 26 de agosto de 2011, 13:00
Completado el
viernes, 26 de agosto de 2011, 13:07
Tiempo empleado
6 minutos 54 segundos
Calificación 10 de un máximo de 10 (100%)
Comentario - Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te sugerimos prestar especial atención a la retroalimentación que recibiste, ya que ofrece información que orienta tu proceso de aprendizaje. Continúa esforzándote.
En una colonia de la Ciudad de México se obtuvo una muestra aleatoria del monto del consumo mensual de energía eléctrica. Los datos obtenidos en pesos son los siguientes:
20, 30, 39, 45, 55, 21, 31, 40, 46, 65, 74, 68, 82, 108, 123, 154, 167, 193, 181, 95, 81, 64,
25, 32, 141, 152, 167, 173, 194, 204, 208, 73, 97, 94, 87, 120, 151, 140, 21, 64, 52, 39, 52, 165, 172, 94, 83, 24, 193, 119
Question 1
Puntos: 2 Media Respuesta:
98.3
Retroalimentación
La media o el promedio de los datos es el resultado de la suma de todos los valores entre el número total de datos.
La fórmula para calcularla en datos agrupados por intervalos: , porque se está calculando en una muestra. Correcto Puntos para este envío: 2/2.
Question 2 Puntos: 2 Mediana Respuesta:
75.25
Retroalimentación
La mediana es el valor que divide a la mitad los datos. La fórmula para calcularla en datos
agrupados por intervalos es: Correcto
Puntos para este envío: 2/2.
Question 3 Puntos: 1 Moda
Respuesta:
41
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 61
Retroalimentación
La moda es el valor del dato que se repite más veces. En este caso se ocupa la siguiente fórmula:
Correcto Puntos para este envío: 1/1.
Question 4 Puntos: 1 Recorrido Respuesta:
188
Retroalimentación
El rango o recorrido es el resultado de restar el primero y el último valor de la variable. Se calcula con la fórmula: Re = máx xi - min xi
Correcto Puntos para este envío: 1/1.
Question 5 Puntos: 2 Varianza Respuesta:
3391.0109
Retroalimentación
La varianza siempre es mayor o igual a cero y está dada por la media de los cuadrados de las diferencias del valor de los datos, menos la media aritmética de éstos.La fórmula para calcularla es, porque se calcula en una muestra.
Correcto Puntos para este envío: 2/2.
Question 6 Puntos: 2 Desviación típica Respuesta:
58.2323
Retroalimentación
La desviación típica o estándar muestra qué tan alejado está un dato de la media.
La fórmula para calcularla es, porque se está calculando en una muestra.
Correcto Puntos para este envío: 2/2.
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 62
Examen Final
Intento Completado Calificación / 100
1 viernes, 9 de septiembre de 2011, 16:21 80
Su calificación final en este cuestionario es 80 / 100
Ingeniería en Tecnología Ambiental Educación Superior Abierta y a Distancia 63
Literatura Consultada
Estadística, Datos Agrupados. Guillermo Corbacho. Chile. 2009. Ebook.
http://upload.wikimedia.org/wikipedia/commons/4/4c/Estad%C3%ADstica_D
atos_Agrupados.pdf
Estadística, Datos no Agrupados. Guillermo Corbacho. Chile. 2009. Ebook.
http://upload.wikimedia.org/wikipedia/commons/d/df/Estad%C3%ADstica_Da
tos_no_agrupados.pdf
Curso Estadística Básica. Luis Salvaterry. Uruguay. 2000. Ebook.
http://guajiros.udea.edu.co/descriptiva/articulos/Curso%20de%20EstadIstica
%20Basica.pdf
Recommended