Estadística
MEDIDAS DE TENDENCIA CENTRAL
Y POSICIÓN
SEMANA 5
Al finalizar la sesión, el estudiante estará en la
capacidad de calcular e interpretar medidas de
tendencia central y posición de un conjunto de
datos sin agrupar y agrupados en tablas de
frecuencias.
LOGRO DE APRENDIZAJE:
Medidas Estadísticas
Frequency
12.09.67.24.82.40.0
18
16
14
12
10
8
6
4
2
0
Frequency
86420
16
14
12
10
8
6
4
2
0
Frequency
161284
20
15
10
5
0
Medidas de Posición o deTendencia Central: son medidasestadísticas que representan elcentro de la distribución o laposición de un conjunto de datos.
Medidas de Variabilidad: sonmedidas estadísticas que muestranque tan concentrados o dispersosestán los datos.
Medidas de Asimetría: son medidasestadísticas que muestran ladirección de la dispersión de losdatos respecto a su centro.
3
Medidas de Resumen más usadas
Media Aritmética:
Mediana:
Moda:
Percentiles (o cuántiles): Pk
Me
Mo
__
x)( xM
NOTACIÓN
Media Aritmética Es la suma de todas las observaciones de una población o muestra dividida entre el tamaño de la población o muestra.
Media poblacional:
Media Muestral:
Media de datos
no agrupadosMedia de datos agrupados
nX
n
iiX
1
nX
k
iii fX
1
Medidas de Tendencia Central
N
N
iiX
1
Desventaja de la Media Aritmética:
Se ve afectada por valores extremos.
Para calcular la
media aritmética
muestral veamos
primero si los datos
están agrupados (en
una tabla de
distribución de
frecuencias) o si son
datos no agrupados.
k
1i
ii
__
hxx
EJEMPLO 1: DATOS NO AGRUPADOS
Los siguientes datos muestran el ingreso mensual (en soles) de 7 técnicos en
enfermería entrevistados de la empresa Omega:
1,540 1,450 1,320 1,280, 1,300, 1,480, 1,500
Calcular la media aritmética del ingreso mensual o el promedio del ingreso
mensual en este grupo de trabajadores de la empresa Omega.
= 1,540 + 1,450 + 1,320 + 1,280 +1,300+1,480 +1,500 =1,410
Interpretación.- El ingreso promedio de los técnicos en enfermeríade la empresa Omega seleccionados en la muestra, es: 1,410 soles.
Media Aritmética
nX
n
iiX
1
7
EJEMPLO 2: VARIABLE DISCRETA
La siguiente tabla muestra la información correspondiente al
número de hijos por familia para una muestra de 50 familias.
Calcular la media aritmética.
1
1 (0)(4) (1)(8) (6)(2)2.54 hijos.
50
k
i i
i
X X fn
Número de hijos (Xi)
0 1 2 3 4 5 6
Número de familias (fi)
4 8 13 15 4 4 2n= 50
Xi.fi 0 8 26 45 16 20 12 Total=127
54.250
1271
nX
k
iii fX
La siguiente tabla presenta información correspondiente al saldo en una
muestra de 50 libretas de ahorro. Calcular la media aritmética.
EJEMPLO 3: DATOS AGRUPADOS (VARIABLE CONTINUA)
n
fx
x
k
1i
ii__(1.55)(5) + (3.85)(8) +…...+(15.35)(2) = 7.254 miles de Soles
50 8
Saldo en libretas (en
miles de Soles)Xi
Número de libretas (fi )
Fi hi Hi Xi.fi
[0.4 – 2.7) 1.55 5 5 0.1 0.1 7.75[2.7 – 5.0) 3.85 8 13 0.16 0.26 30.8[5.0 – 7.3) 6.15 14 27 0.28 0.54 86.1[7.3 – 9.6) 8.45 11 38 0.22 0.76 92.95
[9.6 – 11.9) 10.75 7 45 0.14 0.9 75.25[11.9 – 14.2) 13.05 3 48 0.06 0.96 39.15[14.2 – 16.5] 15.35 2 50 0.04 1 30.7
TOTAL 50 1 362.7
254.750
362.71
nX
k
iii fX
Ingreso familiar
mensual (Soles)Xi Número de
familias (fi)Xifi
[4,000 – 6,000 > 5,000 10 50,000[6,000 – 8,000 > 7,000 5 35,000[8,000 – 10,000 > 9,000 15 135,000[10,000 – 12,000 > 11,000 20
220,000[12,000 – 14,000> 13,000 28
364,000[14,000 – 16,000 > 15,000 17 255,000[16,000 – 18,000> 17,000 5 85,000
n = 1001´144,00
0
n
fx
x
k
1i
ii__
EJEMPLO 4: DATOS AGRUPADOS (VARIABLE CONTINUA)
El ingreso de 100familias residentesen el distrito de laMolina, elegidasaleatoriamente, hasido organizado enla siguiente tabla dedistribución defrecuencias:
a) Calcule elingreso familiarpromedio.
1´144,000 = 11,440 Soles
100
La Mediana, es aquel valor que divide a lasobservaciones ordenadas o tabuladas en dos partesaproximadamente de igual tamaño de modo que el50% de valores son iguales o menores que el, y elotro 50% son mayores o superiores a el.
x1 x2 x3 … … …… … xn
50% 50%
( Datos ordenados)Me
Mediana
Propiedades
• La mediana es única y siempre existe.
• No es afectada por los valores extremos. Esta propiedad es
conocida como robustez, significa que la mediana debe ser
utilizada en lugar de la media cuando se tenga datos con
valores extremos que afectan a la media.
• La mediana puede asumir cualquier valor real.
Mediana
Datos no agrupados y datos discretos
Suponga que se tienen los siguientes datos:
ordenados del siguiente modo:
entonces:
paresnsi
imparesnsi
2
XX
X
Me1)
2
n()
2
n(
)2
1n(
nXXX 21
nXXX ,,, 21
Calcular la mediana para los siguientes conjuntos de datos
5 6 7 9 11 12 16 9 12 16 16 17 18 19 21
49X
4 52 16.5X X
En el primer conjunto, la mediana es y en el segundo conjunto
EJEMPLO: MEDIANA – DATOS NO AGRUPADOS
EJEMPLO: MEDIANA – DATOS DISCRETOS
La siguiente tabla muestra la información correspondiente al númerode hijos por familia para una muestra (n) de 50 familias. Calcular lamediana.
Número de hijos (Xi) 0 1 2 3 4 5 6
Número de familias (fi) 4 8 13 15 4 4 2
Frecuencia acumulada (Fi) 4 12 25 40 44 48 50
50 50
125 262 2 2 3
2.5 hijos.2 2 2
e
X XX X
m
2
122
nn
e
XX
mComo n es par, la fórmula a utilizar
es:
Interpretación.- Las familias con frecuencia tienen 3 hijos aproximadamente
Si los datos están agrupados en una tabla de frecuencias de k categorías, el cálculo de la mediana será el siguiente:
TICh
HLITIC
f
Fn
LImi
i
i
i
i
ie
)1(
)1( 5.02
donde i es el número del intervalo que contiene a la mediana.
Mediana
Datos continuos agrupados
¿Cómo ubicar el Intervalo que contiene a la Mediana?
• Es el primer intervalo cuya frecuencia absoluta acumulada es igual o mayor
a la mitad de observaciones; o también es el primer intervalo cuya
frecuencia relativa acumulada se igual o mayor al valor 0.5 (50% de los
datos)
• Es decir, ubicar el primer intervalo donde: 5.0
2 ii Hó
nF
15
La mediana pertenece a la
tercera categoría ya que esta
contiene una frecuencia
relativa acumulada de 0.54
( a la frecuencia relativa
acumulada de 0.5).
(3 1)
3
3
5025 132 5 2.3 6.97 miles de soles.
14e
F
m LI TICf
EJEMPLO: MEDIANA – DATOSCONTINUOS AGRUPADOS
La siguiente tabla presenta información correspondiente al saldo en una muestra
de 50 libretas de ahorro. Calcular la mediana.
Saldo en
libretas (en
miles de
Soles)
Xi
Númer
o de
libretas
(fi )
Fi hi Hi
[0.4 – 2.7) 1.55 5 5 0.10 0.10
[2.7 – 5.0) 3.85 8 13 0.16 0.26
[5.0 – 7.3)6.15 14 27 0.28 0.54
[7.3 – 9.6) 8.45 11 38 0.22 0.76
[9.6 – 11.9) 10.75 7 45 0.14 0.90
[11.9 – 14.2) 13.05 3 48 0.06 0.96
[14.2 – 16.5] 15.35 2 50 0.04 1.00
5.0iH
16
Moda
• Es el valor ó categoría que ocurre con mayor frecuencia
en un conjunto de datos o en una serie de mediciones.
• A diferencia de la media y de la mediana, la moda se
puede hallar también de datos cualitativos.
• Un conjunto de datos puede ser: unimodal, bimodal,
multimodal o no tener moda.
• No se ve afectada por valores extremos.
Se tiene el Ingreso familiar de un grupo de familias
• 1000 2000 1300 1300 1500 1600
Mo =1300 (Unimodal)
El ingreso modal es 1300 Soles.
• 1100 1200 1200 1300 1400 1400 1700
Mo = 1200 y Mo = 1400 (Bimodal)
• 1200 1300 1500 1600 1900 (No hay moda)
EJEMPLO: MODA – DATOS NOAGRUPADOS
Estado civil de un grupo alumnos de la Escuela de Negocios
S, C, S, C, S, C, S,C, S, S, S, S, S
(S : soltero C : Casado)
Mo = Soltero
La mayoría de alumnos entrevistados son solteros.
EJEMPLO: MODA – DATOS CUALITATIVOS
EJEMPLO: MODA – DATOS CUALITATIVOS
El número de productos vendidos en una cadena deempresas de artefactos eléctricos durante el mes dediciembre del 2010, es como sigue:
Producto Cantidad
Televisores 50
Planchas 35
Licuadoras 45
Microondas 12
La moda es:
Mo= Televisores
Interpretación.- La cadena de artefacto eléctricos con frecuenciavende televisores.
Calcular la moda para la variable número de hijos por familia,considerando una muestra de 50 familias.
EJEMPLO : MODA – DATOS DISCRETOS
Para la variable número de hijos, la moda es 3 hijos (es la
categoría con mayor frecuencia, en este caso, una frecuencia de
15).
Número de hijos (Xi) 0 1 2 3 4 5 6
Número de familias (fi) 4 8 13 15 4 4 2
Moda – Datos agrupados continuos
Si los datos están agrupados en una tabla de frecuencia con k
categorías, la moda de la distribución puede aproximarse con la
siguiente expresión:
TICdd
dLIm io
21
1
donde i es el número del intervalo que contiene a la moda (intervalo
con mayor frecuencia), d1= fi – fi-1 y d2 = fi – fi+1
Alternativamente, d1 y d2 pueden definirse por d1 = hi – hi-1
y d2 = hi – hi+1
Calcular la moda para la variable saldo en una muestra de 50 libretas de ahorro.
EJEMPLO: MODA – DATOS CONTINUOS AGRUPADOS
d 1= 14− 8= 6 d 2= 14− 11= 3
13
1 2
65 2.3 6.53 miles de soles.
6 3o
dm LI TIC
d d
Para la variable saldo en
libretas de ahorro, la
moda se encuentra en la
categoría 3, pues es la
categoría con mayor
frecuencia absoluta.
Entonces se tiene que:
Saldo en
libretas (en
miles de Soles)
Xi
Número de
libretas (fi )Fi hi Hi
[0.4 – 2.7) 1.55 5 5 0.10 0.10
[2.7 – 5.0) 3.85 8 13 0.16 0.26
[5.0 – 7.3) 6.15 14 27 0.28 0.54
[7.3 – 9.6) 8.45 11 38 0.22 0.76
[9.6 – 11.9) 10.75 7 45 0.14 0.90
[11.9 – 14.2) 13.05 3 48 0.06 0.96
[14.2 – 16.5] 15.35 2 50 0.04 1.00
d1= fi – fi-1d2 = fi – fi+1
Relación entre media, mediana y moda
Un distribución es simétrica si:
MoMeX
MoMeX
Relación entre media, mediana y moda
XMeMo
Una distribución tiene asimetría positiva o es
asimétrica de cola a la derecha si:
MoMeX
Relación entre media, mediana y moda
MoMeX
Una distribución tiene asimetría negativa o es
asimétrica de cola a la inquierda si:
Los cuantiles son utilizados para dividir a un conjunto de datos
ordenados en q subconjuntos de igual tamaño; los cuantiles son
los valores que determinan los límites entre estos subconjuntos
consecutivos.Algunos cuantiles reciben nombres especiales:
Observación: la mediana es un cuantil, y corresponde al
cuartil 2, al decil 5 y al percentil 50.
Medidas de Posición no Central
Cuantil
Cuantiles 4 son llamados cuartiles.
Cuantiles 10 son llamados deciles.
Cuantiles 100 son llamados percentiles.
Son valores que resultan ser casos particulares de loscuantiles y que dividen al conjunto de observaciones en 4partes que contienen el mismo porcentaje de observaciones.
Tenemos en total tres cuartiles : Cuartil 1 (Q1), cuartil 2 (Q2) ycuartil 3 (Q3).
Q1 Q2 Q3
También Q1= P25 Q2=P50=Me Q3 =P75 .
Donde: Q3 - Q1 = Rango intercuartílico
(aquí se encuentra el 50% de la muestra)
25% 25% 25% 25%
Cuartiles
Percentil
El percentil Pq es el valor de la variable que divide a un conjunto
ordenado de observaciones en un q % menores que Pq y un (100 –
q) % mayores que Pq
Los Percentiles Pq, permiten dividir a los datos en cien partesaproximadamente iguales, cada uno de los cuales
contiene el 1% de los datos. En total tenemos 99
percentiles.
P1: Percentil 1
P2: Percentil 2
…
P99: Percentil 99
29
1. Se ordenan los datos en forma ascendente.
Posición Percentil q:
3. Luego ubicar el Percentil en la posición indicada si esta es un
número entero y si no lo es calcularla en forma proporcional de
la siguiente manera:
2. Hallar la posición del “percentil” buscado; esto es:
1
100
q nq
P X
10.q E E E
P X d X X
Donde:
E es la parte entera de y
d es la parte decimal.
MINITAB: Cal / Calculator / percentile (number, probability)
variableValor de q%
El percentil Pq se calcula de la siguiente manera:
PARA DATOS NO AGRUPADOS
PARA DATOS AGRUPADOS:
Medidas de Posición no Central
Percentil
TICf
Fnq
LIPi
i
iq
)1(
100
Considere los siguientes datos para la variable volumen de venta en
miles de soles registrada en una muestra (n) de 36 establecimientos.
1.5 2.1 3.2 3.7 4.2 4.5 4.6 4.6 4.7 5.3 5.4 5.7
6.1 6.46.6
6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.5 8.8
9.1 9.6 10.1 10.5 10.9 11.2 11.5 11.7 12.7 13.8 13.9 14.8
Calcule lo siguiente:
a) Percentil 62.
62 36 1 22.94 22 23 2262
100
0.94
8.4 0.94 8.5 8.4 8.494 miles de soles.
P X X X X X
EJEMPLO: PERCENTIL – DATOS NO AGRUPADOS
10.q E E E
P X d X X
Como 22.94 no es un no.
entero, entonces usar:
b) Percentil 30
c) Cuartil 3
30 36 1 11.1 11 12 1130
100
0.1
5.4 0.1 5.7 5.4 5.43 miles de soles.
P X X X X X
75 36 1 27.75 27 28 2775
100
0.75
10.1 0.75 10.5 10.1 10.4 miles de soles.
P X X X X X
d) Cuartil 1
Q3 =
Q1 = P25 = )(25.0 910925.925
100
136XXXXX
= 4.7 + 0.25 ( 5.3 - 4.7) = 4.85
A continuación de muestra los tiempos de alquiler (en minutos) de
computadoras que un grupo de personas realizaron en la avenida
Wilson durante el último fin de semana.
EJEMPLO: PERCENTIL – DATOS CONTINUOS AGRUPADOS
Tiempos de alquiler de computadoras (en minutos)
XiNúmero de usuarios (fi )
Fi hi Hi
[0 – 20> 10 5 5 0.0833 0.0833[20 – 40> 30 12 17 0.2000 0.2833[40 – 60> 50 20 37 0.3333 0.6167[60 – 80> 70 16 53 0.2667 0.8833
[80 – 100> 90 7 60 0.1167 1.0000Total 60 1.0000
Fuente: Estadística descriptiva y probabilidades (2012). Autores: Chue J., Barreno E., Castillo C., Millones R,
Vásquez F. Universidad de Lima, Fondo de desarrollo Editorial.
Se Pide Calcular:
a)El valor mínimo del tiempo correspondiente al 25% de las
personas que más tiempo alquilan computadoras.
b)El valor máximo del tiempo correspondiente al 25% de las
personas que menos tiempo alquilan computadoras.
c)El valor máximo del tiempo del 60% de las personas que
menos tiempo alquilan computadoras.
d)El tiempo tal que por encima se encuentra el 45% de las
observaciones.
a)
TICf
Fnq
LIPi
i
iq
)1(
100= 7020
16
37100
7560
60375
x
QP
La cuarta clase es la que tiene el 75% de observaciones o
más acumuladas, porque Hi = 0.8833 0.75
Interpretación:
El 75% de las personas que alquilan computadoras se demoran
menos de 70 minutos y el 25% se demora más de 70 minutos.
70375 QPEl valor de
b)
=
La segunda clase es la que tiene el 25% de observaciones o
más acumuladas, porque Fi = 0.2833 0.25
66.362012
5100
2560
20125
x
QP
Interpretación:
El 25% de las personas que alquilan computadoras se
demoran menos de 36.66 minutos y el 75% se demora más de
36-66 minutos.
66.36125 QP
TICf
Fnq
LIPi
i
iq
)1(
100
El valor de
c)
TICf
Fnq
LIPi
i
iq
)1(
100= 5920
20
17100
6060
4060
x
P
La tercera clase es la que tiene el 60% de observaciones o
más acumuladas, porque Fi = 0.6166 0.60
Interpretación:
El 60% de las personas que alquilan computadoras se
demoran menos de 59 minutos y el 40% se demora más de 59
minutos.
5960 PEl valor de:
d)
TICf
Fnq
LIPi
i
iq
)1(
100=
562020
17100
5560
4055
x
P
Interpretación:
El 55% de las personas que alquilan computadoras se
demoran menos de 56 minutos y el 45% se demora más de
56 minutos.
5655 P
La tercera clase es la que tiene el 55% de observaciones o
más acumuladas, porque Fi = 0.6166 0.55
El valor de: