Upload
others
View
20
Download
0
Embed Size (px)
Citation preview
MEDIDAS DE DISPERSIÓN
Nivel: Tercero medio
Asignatura: Matemática
1http://portal.cepech.cl/
Apoyar con paginas del libro (11 – 14) y
realizar actividad de las paginas 4 y 5 del
cuadernillo de ejercicio
MOTIVACIÓN
Si nos limitáramos solamente a fijarnos en las
medidas de tendencia central, no tendríamos una
idea acabada de cómo se distribuyen los datos.
Comparemos la cantidad de llamadas recibidas
en un call center por trimestre en 2011 y 2012:
La media y la mediana son las mismas en 2011 y
2012, ¿se puede decir que los dos grupos son
parecidos.
http://portal.cepech.cl/ 2
ACTIVACIÓN DE CONOCIMIENTOS PREVIOS
http://portal.cepech.cl/ 3
Ambas familias tienen la misma media, pero son claramente distintas. La familia García tiene miembros
de distintas alturas, mientras que en la familia González todos miden lo mismo. Aun así la media sale la
misma para ambas familias.
¿Cómo podemos reflejar que las alturas varían mucho en la familia García, mientras que en la
familia González no varían nada?
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión reflejan la mayor o menor concentración con que se
encuentran distribuidos los valores de la serie alrededor de un valor central.
Principales medidas:
• Rango
• Varianza
• Desviación típica
• Coeficiente de variación
http://portal.cepech.cl/ 4
RANGO
El rango corresponde a la diferencia entre el valor máximo y el valor mínimo de
un conjunto.
En datos agrupados, el rango corresponde a la diferencia entre el límite superior
del último intervalo y el límite inferior del primer intervalo.
Propiedades del rango
• Es fácil de calcular y sus unidades son las mismas que las de la variable.
• No utiliza todas las observaciones (solo dos de ellas);
• Se puede ver muy afectada por alguna observación extrema;
• El rango aumenta con el n ́umero de observaciones, o bien se queda igual. En
cualquier caso nunca disminuye 5http://portal.cepech.cl/
VARIANZA 𝜎 2
Es la media aritmética de las diferencias al cuadrado de cada dato respecto a la
media aritmética de ellos.
Donde 𝑥 corresponde al promedio de la muestra y 𝑛 corresponde al número
total de datos.
7http://portal.cepech.cl/
Para calcular el rango es necesario ordenar los datos. Para la famil ia
García el rango es:
10
MEDIDAS DE DISPERSIÓN –FAMILIA GARCÍA
En este caso el valor máximo es 195 y el mínimo, 65; de modo que el rango de los
datos es:
R = valor máximo – valor mínimo = 195 – 65 = 130 cm
Calculamos la varianza para la familia García. Primero calculamos el numerador
Y con el numerador ya calculado, hacemos la división y obtenemos la varianza
para las estaturas de la familia García. Esta familia tiene 7 miembros, así que n =
7. Por lo tanto:
Cuanto mayor sea la varianza, mayor será la dispersión de los datos. Y cuanto
mayor sea la dispersión de los datos, menor será la representatividad de la
media como resumen de la información de la muestra.
𝜎2 =13593
7= 1941,85 𝑐𝑚2
Y con el numerador ya calculado, hacemos la división y obtenemos la varianza
para las estaturas de la familia González. Esta familia tiene 4 miembros, así que
𝑛 = 4. Por lo tanto:
Cuando las medidas de dispersión de una muestra son muy pequeñas se dice
que la muestra es muy homogénea. Como puede verse, las alturas de la familia
García varían mucho, y las de la familia González nada, y eso se refleja en los
rangos (130 frente a 0) y en las varianzas (1941,85 frente a 0).
Para calcular el rango es necesario ordenar los datos. Para la famil ia
García el rango es:
MEDIDAS DE DISPERSIÓN –FAMILIA GONZÁLEZ
En este caso el valor máximo coincide con el mínimo porque todos los valores
son iguales.
R = valor máximo – valor mínimo = 133 – 133 = 0 cm
Calculamos la varianza para la familia González. Primero calculamos el
numerador
𝜎2 =0
4= 0 𝑐𝑚2
11
¿QUÉ CONCLUSIÓN SACAMOS ENTONCES?
Que las medidas de centralización son muy cómodas y útiles, pero deben venir siempre acompañadas de una medida de dispersión, que nos indica si realmente la medida de
centralización resume bien la muestra (cuando la medida de dispersión es pequeña) o si por el contrario no recoge bien toda la información (medida de dispersión alta).
http://portal.cepech.cl/ 12
DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA 𝜎
Es la raíz cuadrada de la varianza.
13
Para datos agrupados:
La desviación estándar de un conjunto es cero solo si todos los elementos del
conjunto tienen el mismo valor, y va aumentando en la medida que aumenta la
diferencia entre los valores de los datos.
La desviación estándar o desviación típica (σ) es una medida de la
homogeneidad de un conjunto, es decir, permite determinar qué tan dispersos
se encuentran los elementos de un conjunto con respecto al promedio del
mismo y compararlo con otros conjuntos.
http://portal.cepech.cl/
EJEMPLO DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA 𝜎
Por ejemplo, la varianza del conjunto {2, 5, 8, 9} es
7,5 (calculada previamente), luego la desviación
estándar de dicho conjunto es 7,5 ≈ 2,74.
Para apreciar la utilidad de la desviación estándar en
comparación con el rango y el promedio, es posible
observar estos tres conjuntos:
◆ El conjunto {2, 5, 8, 9} tiene rango 7, promedio 6y desviación estándar 2,74 (aprox.)
◆ El conjunto {2, 4, 9, 9} tiene rango 7, promedio 6y desviación estándar 3,08 (aprox.)
◆ El conjunto {2, 6, 7, 9} tiene rango 7, promedio 6y desviación estándar 2,55 (aprox.)
Si bien los tres conjuntos tienen igual rango y promedio,
el segundo conjunto tiene los datos más alejados del
promedio con respecto al primer conjunto, por lo cual
tiene mayor desviación estándar que él, es decir, es más
heterogéneo. Por otro lado, el tercer conjunto tiene
sus datos más cercanos al promedio con respecto al
primer conjunto, por lo cual tiene menor desviación
estándar que él, es decir, es más homogéneo. Así, la
desviación estándar es la medida de la dispersión de los
datos de un conjunto con respecto a su promedio.
14http://portal.cepech.cl/
PREGUNTA PSU
http://portal.cepech.cl/ 15
RESOLUCIÓN
http://portal.cepech.cl/ 16
EJERCICIO RESUELTO
En Nicaragua, el 27% de partos
corresponde a adolescentes entre 14 y 18
años de edad. En el municipio de Diriá, hay
jóvenes que salen embarazadas, como se ve
en la tabla abajo:
Edad Casos 2012
10 - 14 4
15 - 19 61
20 o más 119
TOTAL 184
17
Entre las 4 embarazadas de 10 a 14 años, la distribución de las edades es así: 12, 12, 13, 14.
Calcula la variación de estos datos,
http://portal.cepech.cl/
Como miembro del equipo de la unidad materno-infantil del MINSA,
tienes que usar tu conocimiento sobre estadísticas para medir la
dispersión, desviación y varianza.
Obtener la media aritmética de 12, 12, 13, 14
PASO 1:
𝑥 =12 + 12 + 13 + 14
4=51
4= 12,75
PASO 2:
𝑥 𝒙 − 𝒙 (𝒙 − 𝒙)^2
12 12 − 12,75 = −0,75 −0,75 2
= 0,5625
12 12 − 12,75 = −0,75 −0,75 2
= 0,5625
13 13 − 12,75 = 0,25 0,252 = 0,0625
14 14 − 12,75 = 1,25 1,252 = 1,5625
18
PASO 3: Sumar todos los resultados del PASO 2. 2,75
PASO 4: Dividir el valor del PASO 3 por la cantidad de N datos.
2,75
4= 0,6875
PASO 5: Obtener la raíz cuadrada del valor del PASO 4.
0,6875 = 0,83
Entonces, 0,83 es la desviación estándar de jóvenes embarazadas entre 10
a 14 años, según los datos de sus edades.
http://portal.cepech.cl/
¿QUÉ S IGNIF IC A QUE 0,83 ES LA DESV IACIÓN ESTÁNDAR DE JÓVENES
EMB ARAZADAS ENTRE 10 A 14 AÑOS , SEGÚN LOS DATOS DE SUS EDADES ?
19http://portal.cepech.cl/
EJERCICIO PROPUESTO 1
Los resultados de un test de aptitud tomado a un grupo de 100 personas se
volcaron en la siguiente tabla:
¿Cuál es el intervalo modal? ¿En qué intervalo se encuentra la mediana? Calcule
la media, la varianza y la desviación estándar
20
INTERVALO FRECUENCIA
20,5 – 25,5 28
15,5 – 20,5 32
10,5 – 15,5 21
5,5 – 10,5 12
0,5 – 5,5 7
http://portal.cepech.cl/