Materia: Estadística I
Maestro: Dr. Francisco Javier Tapia Moreno
Semestre: 2015-2
Universidad de SonoraDepartamento de Matemáticas
Área Económico Administrativa
Hermosillo, Sonora, a 15 de septiembre de 2015.
En la clase anterior calculamos las medidas de
dispersión para datos a granel o no agrupados. En
esta clase se calculan también las medidas de
dispersión pero para datos resumidos y para datos
agrupados en intervalos de clase.
Usaremos dos ejemplos prácticos, primero uno de
datos resumidos y después uno de datos agrupados en
intervalos, los cálculos en ambos casos son muy
similares. Utilizaremos las técnicas más sencillas para
llevar a cabo los cálculos.
Introducción
Ejemplo 1. Se ha tomado una muestra de 48 personas y se les ha
preguntado el número de revistas que leen al mes. Los resultados
son los siguientes:
Número de
revistas
Número de
personas
1 1
2 20
3 12
4 10
5 3
6 2
Total 48
Calcular las medidas de
dispersión siguientes:
a) Rango
b) Rango intercuartílico
c) Varianza
d) Desviación estándar
e) Coeficiente de variación.
Ejemplo con datos resumidos.
a) Para calcular el rango, se resta el dato menor del dato mayor. Esto es,
Rango = Dato mayor – dato menor = 6 – 1 = 5 revistas.
b) Para calcular el rango intercuartílico, se calculan los cuartiles 1 y 3, y se restan. Es decir,
Rango Intercuertílico = Cuartil 3 – cuartil 1
La ubicación del cuartil 1 se encuentra entre el dato 12 y 13. El dato 12 es igual a 2 y el dato 13 también es igual a 2, así que el cuartil 1 es igual a 2.
La ubicación del cuartil 3 se encuentra entre el dato 36 y 37. El dato 36 es igual a 4 y el dato 37 también es igual a 4, así que el cuartil 3 es igual a 4.
Concluimos que el Rango intercuartilítico = 4 – 2 = 2 revistas.
Resolución.
c) La relación para calcular la varianza de una muestra en datos
resumidos o agrupados en intervalos es:
Si se trata de una población la relación es:
Como se trata de una muestra de 64 personas, usamos la primera
relación para elaborar la tabla para calcular la varianza.
n
i
ii
n
XXfS
1
22
1
)(*
n
i
ii
N
Xf
1
22 )(*
c) Para calcular la varianza construimos la tabla siguiente:
La media aritmética es 144
48 = 3 revistas.
La Varianza es 64
48−1 = 1.36170213 revistas al cuadrado.
Número de
Revistas
𝑿𝒊
Número de
Personas.
𝒇𝒊
𝒇𝒊 ∗ 𝑿𝒊
𝒇𝒊*(𝑿𝒊 − 𝑿 )
𝒇𝒊* 𝑿𝒊 − 𝑿 𝟐
1 1 1 1*(1-3)= -2 𝟏 ∗ (𝟏 − 𝟑)𝟐 =4
2 20 40 20*(2-3)= -20 20∗ 𝟐 − 𝟑 𝟐 = 𝟐𝟎
3 12 36 12*(3-3)= 0 𝟏𝟐 ∗ (𝟑 − 𝟑)𝟐= 0
4 10 40 10*(4-3)= 10 𝟏𝟎 ∗ (𝟒 − 𝟑)𝟐=10
5 3 15 3*(5-3)= 6 𝟑 ∗ (𝟓 − 𝟑)𝟐=12
6 2 12 2*(6-3)= 6 𝟐 ∗ (𝟔 − 𝟑)𝟐=18
Totales 48 144 0 64
d) La desviación estándar para una distribución de datos
resumidos o agrupados en intervalos de una muestra se calcula
mediante la relación,
La desviación estándar para una distribución de datos no
agrupados de una población se calcula mediante la relación,
1
)(*1
2
2
n
XXf
SS
n
i
ii
N
Xfn
i
ii
1
2
2
)(*
La desviación estándar es la raíz cuadrada de la varianza. Por
lo tanto,
Revistas.
e) El coeficiente de variación se calcula mediante la relación
𝑉𝑚 =𝑆
𝑋 * 100%
Así que 𝑉𝑚 = 1.167
3* 100% =38.897%
Concluimos que los datos recabados en la encuesta son muy
heterogéneos. Es decir, están muy separados unos de otros.
167.116691993.136170213.12
SS
Ejemplo 2. La utilidad anual de 38 empresas hermosillenses es
mostrada en la tabla siguiente:
Utilidad
(millones de pesos)
Número de
empresas
45 − 50 5
50 − 65 7
65 − 80 14
80 − 95 9
95 − 110 3
Total 38
Calcular las medidas de
dispersión siguientes:
a) Rango
b) Rango intercuartílico
c) Varianza
d) Desviación estándar
e) Coeficiente de variación.
Ejemplo con datos agrupados en intervalos.
a) Para calcular el rango, se resta el dato menor del dato mayor. Esto es,
Rango = Dato mayor – dato menor = 110 – 50 = 60 mdp.
b) Para calcular el rango intercuartílico, se calculan los cuartiles 1 y 3, y se restan. Es decir,
Rango Intercuertílico = Cuartil 3 – cuartil 1
El cuartil 1 se ubica en la tercera clase ya que 1∗(38+1)
4 =19.5.
Por lo tanto, 𝑄1 = 65 + 15 ∗19.5−(7+5)
14 = 73.0357 mdp.
El cuartil 3 se ubica en la cuarta clase ya que 3∗(38+1)
4 =29.25 .
Por lo tanto, 𝑄3 = 80 + 15 ∗29.25−(14+7+5)
14 = 82.08333 mdp.
Concluimos que el Rango intercuartilítico = 82.08333 – 73.0357 = 9.04763 mdp.
Resolución.
c) La relación para calcular la varianza de una muestra en datos
resumidos o agrupados en intervalos es:
Si se trata de una población la relación es:
Como se trata de una muestra de 64 personas, usamos la primera
relación para elaborar la tabla para calcular la varianza.
n
i
ii
n
XXfS
1
22
1
)(*
n
i
ii
N
Xf
1
22 )(*
c) Para calcular la varianza construimos la tabla siguiente:
La media aritmética es 2750
38 = 72.3684211 mdp.
La Varianza es 9424.34211
38−1 = 254.711949 mpd al cuadrado.
Marcas de
clase
𝑿𝒊
Número de
empresas.
𝒇𝒊
𝒇𝒊 ∗ 𝑿𝒊
𝒇𝒊*(𝑿𝒊 − 𝑿 )
𝒇𝒊* 𝑿𝒊 − 𝑿 𝟐
47.5 5 273.5 -124.342105 3092.19183
57.5 7 402.5 -104.078947 1547.48961
72.5 14 1015 1.84210526 0.24238227
87.5 9 787.5 136.184211 2060.68213
102.5 3 307.5 90.3947368 2723.73615
Totales 38 2750 0 9424.34211
d) La desviación estándar para una distribución de datos
resumidos o agrupados en intervalos de una muestra se calcula
mediante la relación,
La desviación estándar para una distribución de datos no
agrupados de una población se calcula mediante la relación,
1
)(*1
2
2
n
XXf
SS
n
i
ii
N
Xfn
i
ii
1
2
2
)(*
La desviación estándar es la raíz cuadrada de la varianza. Por lo tanto,
mdp.
d) El coeficiente de variación se calcula mediante la relación
𝑉𝑚 =𝑆
𝑋 * 100%
Así que 𝑉𝑚 = 15.711949
72.3684211* 100% =22.053%
Concluimos que los datos recabados en la encuesta son heterogéneos. Es decir, están separados unos montos de otros.
96.159596977.15711949.2542
SS