8
FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR Gilma Sabina Lizama 1 MEDIDAS DE TENDENCIA CENTRAL La estadística descriptiva en su función básica de reducir datos, propone una serie de indicadores que permiten tener una percepción rápida de lo que ocurre en un fenómeno. La primera gama de indicadores corresponde a las “Medidas de Tendencia Central”. Existen varios procedimientos para expresar matemáticamente las medidas de tendencia central, de los cuales, los más conocidos son: la media aritmética, la moda y la mediana. Esta primera parte la dedicaremos a analizar tres medidas de tendencia central: La media aritmética La moda La mediana La Media Aritmética Equivale al cálculo del promedio simple de un conjunto de datos. Para diferenciar datos muestrales de datos poblacionales, la media aritmética se representa con un símbolo para cada uno de ellos: si trabajamos con la población, este indicador será Nj; en el caso de que estemos trabajando con una muestra, el símbolo será ) ( X . Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como muestrales: sin agruparlos o agrupándolos en tablas de frecuencias. Esta apreciación nos sugiere dos formas de representar la media aritmética. Media aritmética para datos no agrupados Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muestrales:

Apuntes Sobre Medidas de Tendencia Central

Embed Size (px)

Citation preview

Page 1: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 1

MEDIDAS DE TENDENCIA CENTRAL

La estadística descriptiva en su función básica de reducir datos, propone una serie deindicadores que permiten tener una percepción rápida de lo que ocurre en un fenómeno.La primera gama de indicadores corresponde a las “Medidas de Tendencia Central”. Existenvarios procedimientos para expresar matemáticamente las medidas de tendencia central, de loscuales, los más conocidos son: la media aritmética, la moda y la mediana.

Esta primera parte la dedicaremos a analizar tres medidas de tendencia central:Ø La media aritméticaØ La modaØ La mediana

La Media Aritmética

Equivale al cálculo del promedio simple de un conjunto de datos. Para diferenciar datosmuestrales de datos poblacionales, la media aritmética se representa con un símbolo para cadauno de ellos: si trabajamos con la población, este indicador será ; en el caso de que estemostrabajando con una muestra, el símbolo será )(X .

Hay que entender que existen dos formas distintas de trabajar con los datos tantopoblacionales como muestrales: sin agruparlos o agrupándolos en tablas de frecuencias. Estaapreciación nos sugiere dos formas de representar la media aritmética.

Media aritmética para datos no agrupados

Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muestrales:

Page 2: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 2

Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica eltamaño de la población, mientras que n el de la muestra).

Ejemplo: Media aritmética para datos no agrupadosEl profesor de la materia de estadística desea conocer el promedio de las notas finales de los10 alumnos de la clase. Las notas de los alumnos son:3,2 3,1 2,4 4,0 3,53,0 3,5 3,8 4,2 4,0

¿Cuál es el promedio de notas de los alumnos de la clase?

SOLUCIÓN

Aplicando la fórmula para datos no agrupados tenemos:

Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos losalumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47.Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmética.

En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que la mediaaritmética es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es unanota atípica comparada con las demás, que están ubicadas entre 3,0 y 4,2.

Media aritmética para datos agrupadosSi los datos se presentan en una tabla de distribución de frecuencias, no es posible conocer losvalores individuales de cada una de las observaciones, pero si las categorías en las cuales sehallan. Para poder calcular la media, se supondrá que dentro de cada categoría, lasobservaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase, porlo tanto puede considerarse que todas las observaciones dentro de la clase ocurren en el puntomedio, por lo expuesto la media aritmética para datos agrupados puede definirse de la siguientemanera:

Npmf

X ∑ ∗=

f = frecuencia de cada clasepm = punto medio de cada clase

N = número de observaciones

Page 3: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 3

La media para una distribución de frecuencias, es igual a la suma de los productos de lasfrecuencias por los puntos medios de cada clase, dividido entre el total de datos.

Ejemplo: Calcular la media aritmética de la edad de los alumnos de Estadística I grupos 04,08,14.Distribución de Frecuencias de la variable edad en años

cumplidos.Edad Frecuencia p.m f*pm18-21 79 19.5 1540.522-25 57 23.5 1339.526-29 13 27.5 357.530-33 3 31.5 94.534-37 3 35.5 106.5Total 155 3438.5

Npmf

X ∑ ∗= = 18.22

1555.438,3

= La media es de 22 años cumplidos.

Ventajas

Ø Es la medida de tendencia central más usada.Ø El promedio es estable en el muestreo.Ø Es sensible a cualquier cambio en los datos (puede ser usado como un detector de

variaciones en los datos).Ø Se emplea a menudo en cálculos estadísticos posteriores.Ø Presenta rigor matemático.Ø En la gráfica de frecuencia representa el centro de gravedad.

DesventajasØ Es sensible a los valores extremos.Ø No es recomendable emplearla en distribuciones muy asimétricas.Ø Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no

pertenecer al conjunto de valores de la variable.

La Mediana (Me)

La definición de geométrica se refiere al punto que divide en dos partes a unsegmento. Por ejemplo, la mediana del segmento AB es el punto C.

Page 4: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 4

Existen dos segmento iguales:

Ejemplo de medidana para datos no agrupados:

Encontrar la mediana para los siguientes datos:

4 1 2 3 4 2 2 1 5 5 3

SOLUCIÓNPASO 1: Ordenar los datos.1 1 2 2 2 3 3 4 4 5 5PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.

La mediana es 3, dejando 5 datos a cada lado.

Ejemplo 2:

Modifiquemos el ejemplo anterior, eliminando el último dato. Encontrar la mediana:4 1 2 3 4 2 2 1 5 5

SOLUCIÓNPASO 1: Ordenar los datos.1 1 2 2 2 3 4 4 5 5PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.

El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la

mediana será 2,5. )5.22

32( =+

=Me

Mediana para datos agrupadosPara calcular la mediana de una distribución de clases y frecuencias, lo primero que tenemosque hacer es calcular la columna de frecuencias acumuladas, para que al dividir la serie en dospartes iguales N/2, podamos ubicar la clase que contiene la mediana.

Fórmula: icfm

faaN

liMd *2−

+=

Page 5: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 5

Md= MedianaLi = límite real inferior de la clase de la medianaFaa = frecuencia acumulada anterior a la frecuencia de la clase de la medianaFm = frecuencia absoluta de la clase de la medianaic = tamaño del intervalo de clase.

Ejemplo: Calcular la mediana de la edad de los alumnos de Estadística I grupos 04,08,14.

Distribución de Frecuencias de la variableedad en años cumplidos.

Edad Frecuencia Fa18-21 79 7922-25 57 13626-29 13 14930-33 3 15234-37 3 155Total 155

Aplicando la fórmula tenemos: 9.203*79

02

155

18 =−

+=Md La mediana de la edad es 21 años.

El 50% de los alumnos tienen edad superior de 21 años y el 50% tienen edad inferior a 21 años.

La Moda:

En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjuntode datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.

Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca degaseosa que más consume a la semana:

Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

SOLUCIÓNPASO 1: Determinar las frecuencias de cada valor de la variable.La marca 1 se repite 15 veces

Page 6: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 6

La marca 2 se repite 6 vecesLa marca 3 se repite 9 vecesPASO 2: la moda representa el valor que más se repite. En este caso es la Marca 1.

La Moda para datos Agrupados

Para encontrar la moda en una distribución de clases y frecuencias, primero hay que ubicar laclase modal, que será la clase que tenga la mayor frecuencia. Después debemos estimardonde se encuentra el valor de la moda, dentro de la clase modal.

Fórmula:

icliMo *21

1

∆+∆∆

+=

Mo = ModaLi = límite real inferior de la clase modal

1 = diferencia entre la frecuencia de la clase modal y al frecuencia de la clase anterior a lamodal

2 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior a lamodalic = tamaño del intervalo de clase.

Ejemplo: Calcular la moda de la edad de los alumnos de Estadística I grupos 04,08,14.Distribución de Frecuenciasde la variable edad en años

cumplidos.Edad Frecuencia18-21 7922-25 5726-29 1330-33 334-37 3Total 155

Aplicando la fórmula: 3.203*2279

7918 =+

+=Mo

La edad que más se repite es la de 20 años.

Page 7: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 7

Ejercicios:

1. Para que un producto sea aceptado por su cliente principal, debe cumplir con ciertasespecificaciones de calidad. Una de ellas, radica en que el promedio de longitud de los 20primeros productos este entre 20,0 y 20,9 centímetros. Si las medidas son:22,3 20,4 19,8 19,9 20,1 20,8 21,6 19,8 20,5 23,419,6 21,5 18,5 18,7 20,9 21,1 20,1 21,5 22,3 17,9¿Cumple en el proveedor con las especificaciones del cliente?

2. Calcular la media, mediana y moda para los siguientes datos (agrúpelos en una tabla defrecuencia)22,1 44,4 32,156,0 29,4 37,732,3 29,0 30,545,3 20,7 15,641,1 41,2 39,520,8 34,1 31,821,9 47,0 25,6

3. Los ingresos en dólares de 30 hombres elegidos al azar (entre un total de 1000) semuestran a continuación:

a. Calcule la media aritmética para todos los datos sin agruparlos.b. Calcule la media aritmética empleando la tabla de frecuencias.c. ¿Cuál cree usted son las razones de las diferencias entre ambas medias?d. ¿Explique mediante este ejemplo, la diferencia entre media, mediana y moda?e. ¿Qué representa para usted la moda y mediana (en termino de pesos)?f. ¿Se puede considera que la población de 1000 personas tendrán la misma media que lamuestra de 30 personas?

4. El histograma siguiente muestra el porcentaje de analfabetismo de las ciudades objeto delestudio.

Page 8: Apuntes Sobre Medidas de Tendencia Central

FACULTAD DE CIENCIAS ECONÓMICAS UNIVERSIDAD DE EL SALVADOR

Gilma Sabina Lizama 8

i) El total de ciudades consideradas en el estudio es de:a) 3 b) 5 c) 10 d) 30

ii) Que significado tiene la moda para el estudio del analfabetismoa) Cuatro de las ciudades no presentan analfabetismob) La mayoría de las ciudades no presentan analfabetismoc) Seis ciudades presentan problemas de analfabetismod) Ninguna de las anteriores

iii) El porcentaje promedio de analfabetismo que arroja el estudio es de:a) 0,4% b) 1,0% c) 1,4% d) 2,0%

iv) El estudio arrojado al número de habitante por ciudad indica que:a) El promedio de habitantes por ciudad es de 0,5 millones.b) El promedio de habitantes por ciudad es de 1,0 millón.c) El promedio de habitantes por ciudad es de 1,45 millones.d. El promedio de habitantes por ciudad es de 2,0 millones.