Instrumentos y matriz de datos
Curso: Estadística
Profesor: Gonzalo Fernández
Fecha: 19/09/2017
Estadística Descriptiva
Medidas descriptivas de
Tendencia Central y Posición
LOGRO DE LA SESIÓN
Al finalizar la sesión, elestudiante estará en lacapacidad de calcular einterpretar medidas detendencia central yposición de un conjuntode datos sin agrupar yagrupados en tablas defrecuencias con precisión yexactitud de cálculo.
Sesión 5: Medidas de tendencia central y posición
CONTENIDO SABERES PREVIOS
1. Medidas descriptivas de tendencia central:
1.1 Media aritmética.1.2 Mediana.1.3 Moda.2. Medidas descriptivas de
posición:2.1 Cuartiles.2.2 Percentiles.
Conceptos fundamentales de estadística.
Manejo de funciones básicas de Excel o MegaStat.
INTRODUCCIÓN
Las medidas de tendencia central son medidas estadísticas que se usan para resumir la distribución de datos con un solo valor, dicho valor se dice que es representativo de los datos.
Las medidas de tendencia central son medidas estadísticas quese usan para resumir la distribución de datos con un solo valor,dicho valor se dice que es representativo de los datos.
ESTADÍSTICA DESCRIPTIVA
RECOLECCIÓN CLASIFICACIÓN
PRESENTACIÓN DESCRIPCIÓN
DATOS
PRESENTACIÓN
TABLAS DE FRECUENCIA
SIN INTERVALOS
CON INTERVALOS
GRÁFICOS
BARRAS CIRCULARES
HISTOGRAMAS
DESCRIPCIÓN
MEDIDAS TENDENCIA CENTRAL, DISPERSIÓN Y FORMA
POSICIÓN
CUARTILES
DECILES
PERCENTILES
CENTRALIZACIÓN
MEDIA MEDIANA
MODA
DISPERCIÓN
RANGO
VARIANZA DESVIACION ESTANDAR
C.V.
FORMA
ASIMETRÍA CURTOSIS
Medidas Resumen
Media Aritmética
Mediana
Moda
Descripción Numerica de Datos
Varianza
Desviación Estándar
Coeficiente de Variación
Rango
Rango Intercuartílico
Asimetría
Tendencia Central Variación Forma
Cuartiles
Percentiles
CLASIFICACIÓN DE MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central mas utilizadas son:
Media Aritmética
Mediana
Moda
Cuartiles
Deciles
Percentiles
La Media Aritmética es una de las medidas de resumen más importante
de la Estadística, es un valor que tiende a ubicarse en el centro de la
distribución de un conjunto de datos.
Se obtiene al dividir la suma de todos los valores de un conjunto de
datos entre el número total de datos.
1. MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS
Donde: xi: valores de la data
n: número total de datos n
x
X
n
i
i 1
Ejemplo 1: La Media de 2,2,3,7 es (2+2+3+7)/4=3,5
- Conveniente cuando los datos se concentran simétricamente
con respecto a ese valor.
- Muy sensible a valores extremos.
- Centro de gravedad de los datos.
2. MEDIANA PARA DATOS NO AGRUPADOS
Si el número de datos es impar, la mediana es el valor central.
Ejemplo 2: Mediana de 1, 2, 4, 5, 6, 6, 8 es Me=5
Si el número de datos es par, se elige el punto medio de los dos datos centrales.
Ejemplo 3: Mediana de 1, 2, 4, 5, 6, 6, 8, 9 es Me=(5+6)/2=5,5
• Es el valor que ocupa la posición central de un conjunto deobservaciones, una vez que han sido ordenados en formaascendente o descendente.
• Divide al conjunto de datos en dos partes iguales.
- Es conveniente cuando los datos son asimétricos.
- No es sensible a valores extremos.
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
Mediana: Posición y Valor• Si los datos están ordenados, la mediana es el valor
“medio” (50% inferiores, 50% superiores)
• La localización (posición) de la mediana (n impar):
• El valor de la mediana NO es afectado porvalores extremos.
1
2
nPosición Mediana posición en los datos ordenados
50% 50%
Me
Datos ordenados
3. MODA PARA DATOS NO AGRUPADOS
•Observación o clase que tiene la mayor frecuencia en un conjunto
de observaciones.
•Un conjunto de datos puede ser unimodal, bimodal o multimodal.
• Es la única medida de tendencia central que se puede determinarpara datos de tipo cualitativo y cuantitativo.
Ejemplo 4: Se tiene el Ingreso familiar de un grupo de familias
1000 2000 1300 1300 1500 1600
Mo =1300 (Unimodal)
El ingreso más frecuente es 1300 Soles.
1100 1200 1200 1300 1400 1400 1700
Mo = 1200 y Mo = 1400 (Bimodal)
Ejemplo 3:
El gerente del hotel Buen Samaritano de Ica brinda que brinda
hospedaje a turistas que visitan la laguna de Huacachina, tiene el
propósito de conocer el promedio de días que permanecen los turistas.
Para el estudio se ha tomado el registro de 20 días, y los días de
estancia de los turistas son:
1 1 2 2 5 4 1 2 3 5 4 1 2 3 1 4 2 1 4 1
Calcule e interpreta la media, mediana y moda
Interpretaciones:
MEDIDAS DE CENTRALIZACIÓN
MEDIA O PROMEDIO MEDIANA MODA
( )X ( )Me ( )Mo
Se utilizará cuando los datos están distribuidos en una tabla de
frecuencias. Luego se calcula la media aritmética aplicando la
fórmula:
Donde:
fi = frecuencia absoluta
xi = Marca de clase
n = número de observaciones
Observaciones:
La media se puede hallar sólo para variables cuantitativas.
La media es independiente de las amplitudes de los intervalos.
La media es muy sensible a las puntuaciones extremas.
4. MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
n
i
ii
n
fxX
1
Ejemplo 5: La siguiente tabla muestra el número de autos vendidos
mensualmente por los empleados de una tienda de automóviles:
Interpretación: El promedio mensual de autos
vendidos por los empleados fue de 37.
N° de Autosxi fi fixi
Li Ls
10 20 15 9 135
20 30 25 15 375
30 40 35 26 910
40 50 45 16 720
50 60 55 10 550
60 70 65 4 260
TOTAL n =80 2950
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
88.3680
2950
1
n
i
ii
n
fxX
Cuando se trabajan con tablas de frecuencias de intervalos, la
fórmula para calcular la mediana es:
5. MEDIANA PARA DATOS AGRUPADOS
12 i
i i
i
n
Me L cf
F
Donde:
Li : Límite inferior de la clase mediana.
Fi-1 : Frecuencia acumulada anterior a la clase mediana.
fi : Frecuencia absoluta de la clase mediana.
ci : Amplitud de la clase mediana.
Ejemplo 6: En el ejemplo 5 calcular la mediana del número de autos
vendidos.
Interpretación: El 50% de los empleados vendieron una
cantidad menor o igual a 36 autos.
40 24 1630 10 30 10 36 15 36
26 26.Me
MEDIANA PARA DATOS AGRUPADOS
N° de AutosXi fi FiLi Ls
10 20 15 9 9
20 30 25 15 24
30 40 35 26 50
40 50 45 16 66
50 60 55 10 76
60 70 65 4 80
TOTAL n =80
n/2=80/2=40ci=10
Mediana
Cuando se trabajan con tablas de frecuencias de intervalos, la
fórmula para calcular la moda es:
Donde:
Li : Límite inferior de la clase modal
ci: Amplitud del intervalo de la clase modal
n : número total de observaciones o datos
Δ1= fj – fj-1 y Δ2= fj – fj+1
Δ1 : Diferencia entre la frecuencia modal y la frecuencia anterior.
Δ2: Diferencia entre la frecuencia modal y la frecuencia siguiente.
1
2 1
i ioM L c
6. MODA PARA DATOS AGRUPADOS
• La moda tiene la ventaja de no ser afectada por valores extremos.
Nota
Ejemplo 7: En el ejemplo 5 calcular la moda del número de autos
vendidos.
MODA PARA DATOS AGRUPADOS
N° de Autosxi fiLi Ls
10 20 15 9
20 30 25 15
30 40 35 26
40 50 45 16
50 60 55 10
60 70 65 4
TOTAL n =80
ci=10
Moda
1130 10 35 24 35
11 10.Mo
Mayor Frecuencia
fi= 26
Δ2= 10
Interpretación: El número de autos vendidos con mayor frecuencia fue de 35.
Δ1= 11
k
i i
i 1 1 1 2 2 k k
p
1 2 k
n xn x n x ... n x
xn n n ... n
7. MEDIA PONDERADA
La media ponderada de un conjunto de observaciones x1, x2,... xn,
con pesos o ponderaciones p1, p2,... pn se define como:
n
i i
i 1 1 1 2 2 n n
p
1 2 n
p xp x p x ... p x
xP p p ... p
n
i
i 1
P p
Donde:
En particular:
Donde :
ni : Número de elementos de cada grupo.
: Media aritmética (i=1,2, …., k).ix
A continuación se presentan las notas finales de un alumno, obtenidas al
concluir el semestre académico y los créditos que tiene cada uno de los
cursos que ha llevado:
CURSO Nª de créditos Nota
Matemáticas 4 15
Lenguaje 3 14
Inglés 2 16
¿Cuál es su PROMEDIO de notas ?
EJEMPLO 8: MEDIA PONDERADA
3
1 4 15 3 14 2 16 13414.89
4 3 2 9
i i
ip
n x
xn
Propiedades de la Media
Si , entonces
Luego, Resumiendo
0x
constante a ,xaax
constante a ,axax
0,0,0 11 nxxx
yxyx
constantes ba, ,ybxabyax
Medidas de Posición
• La mediana (poblacional o muestral) divide el conjunto (ordenado) de datos en dos partes iguales. Si se dividen los datos en más de dos partes se pueden obtener medidas de localización más finas.
Primer
cuartil
Segundo
cuartil
Tercer
cuartil
2° cuartil = mediana
Deciles = división
en diez partes
Cuartiles = división
en cuatro partes
Percentiles = división
en 100 partes
Estadísticos de posición
25% 25% 25% 25%
Q3Q2Q1
Cuartiles
Cuartiles
Medidas de posición que dividen a un conjunto de
datos ordenados en 4 partes iguales y cada una de ellas
representa el 25% de los datos.
Q1: 25% de los datos están debajo del primer cuartil
Q2: 50% de los datos están debajo del segundo cuartil
Q3: 75% de los datos están debajo del tercer cuartil.
25% 25% 25% 25%
Q3Q2Q1
Ejemplo: Calculando Cuartiles
•Datos ordenados: 106, 109, 114, 116, 121, 122, 125, 129
Q1:
Q2:
Q3:
i Q
25
1008 2
109 114
211151( ) .
i Q
50
1008 4
116 121
211852( ) .
i Q
75
1008 6
122 125
212353( ) .
n=8
Note que cuando i es un número entero el cuartil es el promedio de los
valores de los datos ubicados en los lugares i e (i+1), en la data ordenada.
Percentil (Pk): Llamado también centil k, donde el k-ésimopercentil es un valor tal que por lo menos k por ciento de lasobservaciones son menores o iguales a este valor y por lomenos (100-k) por ciento de las observaciones son mayoresa este valor.
Percentil de orden k, localización i=(k/100)n
El percentil de orden 15: Al menos 15% de lasobservaciones están en o por debajo de ese valor, ycuando menos 85% están en o sobre ese valor.
Primer cuartil = Percentil 25
Segundo cuartil = Percentil 50 = Mediana
Tercer cuartil = Percentil 75.
Percentiles
Procedimiento para el cálculo del k-ésimo percentil:
• Paso 1: Ordene los datos de forma ascendente.
• Paso 2: Calcule un índice i, para localizar el percentil.
Se presenta dos casos:
a) Si i no es entero, i se redondea al entero mayor, el k-ésimopercentil es el dato que ocupa la posición i.
b) Si i es entero, el k-ésimo percentil es el promedio de los valores delos datos ubicados en los lugares i e i+1.
• Paso 3: El percentil es el dato que ocupa la posición i.
( )100
ki n
Donde:
k = percentil
i = localización percentil
n = número de datos
• Data: 14, 12, 19, 23, 5, 13, 28, 17
• Ordenando la data: 5, 12, 13, 14, 17, 19, 23, 28
• Problema: Halle el percentil 30• Número de observaciones n = 8
• Localización del Percentil 30:
• El índice de localización, i, no es un número entero.
• Por tanto, aproximando i al entero mayor, tenemos i = 3.
• El percentil 30 está en la tercera posición de la data ordenada : Percentil 30 = 13
Ejemplo: Calculando Percentiles
Asimétrica
Negativa
Moda
Mediana
Media
Simétrica
(No Asimétrica)
Media
Mediana
Moda
Asimétrica
Positiva
Moda
Mediana
Media
• Si media=mediana=moda, la distribución es simétrica.• Si media<mediana, la distribución es asimétrica negativa.• Si media>mediana, la distribución es asimétrica positiva.
Relación entre la media, mediana y moda
Relación entre la media, mediana y moda
Sensitividad a los Valores Extremos
• Un conjunto de datos contiene 19 familias, con 8
familias que ganan US$30,000 por año, 10 ganan
US$35,000 por año, y que 1 gana $1 millones por
año.
684,83$19
000,590,1
19
)000,000,1(1)000,35(10)000,30(8
X
$35,000Me
Si la distribución es altamente asimétrica, la
mediana es la mejor elección.
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN
“Las estadísticas no sustituyen el juicio.”Henry Clay