25
Medidas de tendencia central

Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

  • Upload
    vannhi

  • View
    235

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Medidas de tendencia central

Page 2: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Medidas de Posición: son aquellos valores numéricos que nos permiten

o bien dar alguna medida de tendencia central, dividiendo el

recorrido de la variable en dos, o bien fragmentar la cantidad de

datos en partes iguales. Las más usuales son la media, la mediana, la

moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de

dos tipos: de tendencia central o de tipismo.

Medidas de Dispersión: se llaman medidas de dispersión aquellas que

permiten retratar la distancia de los valores de la variable a un cierto

valor central, o que permiten identificar la concentración de los

datos en un cierto sector del recorrido de la variable. Se trata de

coeficientes para variables cuantitativas. Las más usuales son el

desvío estándar y la varianza.

Medidas de tendencia central

Page 3: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

medias de los diferentes conjuntos. 3) Es posible hallar la media de La idea de media o promedio (también llamada media aritmética) formaliza el concepto intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto medio del recorrido de la variable según la cantidad de valores obtenidos.

Ese valor tiene varias propiedades importantes. 1) Si se suma ladistancia de todos los valores respecto de la media, esa suma dacero. 2) Si se toman una cantidad cualesquiera de conjuntos de valores, cada uno con su respectiva media, la media del conjuntogeneral es igual a la suma de cada una de las un conjunto de valores de una variable a partir de tomar la distancia de las observaciones a un valor cualquiera (pertenezca o no al recorrido de la variable) 4) si a un conjunto de observaciones de una variable se le realiza una operación matemática usando un valor constante, entonces la media del nuevo grupo de valores asíobtenidos es igual a la aplicación de la misma operación matemática usando ese valor constante sobre la media original.

La Media

Page 4: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

El cálculo de la Media

Dado un conjunto de observaciones

la media se representa mediante y se obtiene dividiendo la suma de todos los datos por el número de ellos, es decir:

La interpretación de la media como centro (o punto de equilibrio) de los datos se apoya en una propiedad que afirma que la suma de las desviaciones

de un conjunto de observaciones a su media es igual a cero; es decir, puede probarse que

Page 5: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

La media aritmética de un conjunto de datos es el cociente entre la suma

de todos los datos y el número de estos.

Ejemplo: las notas de Juan el año pasado fueron:

5, 6, 4, 7, 8, 4, 6

La nota media de Juan es:

Nota media = 7,57

40

7

6487465 ==++++++

que suman 40

Hay 7 datos

Media aritmética (I)

Page 6: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Cálculo de la media aritmética cuando los datos se repiten.

Ejemplo. Las notas de un grupo de alumnos fueron:

Notas Frecuencia

absoluta

Notas x

F. absoluta

3 5 15

5 8 40

6 10 60

7 2 14

Total 25 129

1,525

129 Media ==

Datos por frecuencias

Total de datos

1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y

se suman.

2º. El resultado se divide por el total de datos.

Media aritmética (II)

Page 7: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Mediana

La mediana, a diferencia de la media no busca el valor central del recorrido de la variable según la cantidad de observaciones, sino que busca determinar el valor que tiene aquella observación que divide la cantidad de observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenación de los datos, y debido a ello, este cálculo depende de la posición relativa de los valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa).

en caso que N sea impar

Page 8: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

La mediana de un conjunto de datos es un valor del mismo tal que el número de

datos menores que él es igual al número de datos mayores que él.

Los pesos, en kilogramos, de 7 jugadores de un

equipo de fútbol son:Ejemplo:

72, 65, 71, 56, 59, 63, 72

1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72

2º. El dato que queda en el centro es

65.

La mediana vale 65.

Si el número de datos fuese par, la mediana es la

media aritmética de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es:64

2

6563 =+

Caso:

La mediana

Page 9: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Moda

La moda, es aquel dato, aquel valor de la

variable que más se repite; es decir, aquel

valor de la variable (que puede no ser un

único valor) con una frecuencia mayor.

Page 10: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

La moda de un conjunto de datos es el dato que más se repite.

Una zapatería ha vendido en una semana los zapatos

que se reflejan en la tabla:

Ejemplo.

La moda es 41.

Nº de calzado 38 39 40 41 42 43 44 45

Nº de personas 16 21 30 35 29 18 10 7

El número de zapato más

vendido, el dato con mayor

frecuencia absoluta, es el 41.Lo compran 35 personas

La moda

Page 11: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Cuartil, Quintiles, Deciles, Percentiles

La mediana, como vimos, separa en dos mitades el conjunto ordenado de observaciones. Podemos a su vez subdividir cada mitad en dos,de tal manera que resulten cuatro partes iguales. Cada una de esas divisiones se conoce como Cuartil y lo simbolizaremos mediante la letra Q agregando un subíndice según a cual de los cuatro cuartilesnos estemos refiriendo. Se llama primer cuartil (Q1) a la mediana de la mitad que contiene los datos más pequeños. Este cuartil, corresponde al menor valor que supera – o que deja por debajo de él – a la cuarta parte de los datos. Se llama tercer cuartil (Q3) a la mediana de la mitad formada por las observaciones más grandes. El tercer cuartil es el menor valor que supera – o que deja por debajo de él – a las tres cuartas partes de las observaciones. Con esta terminología, la mediana es el segundo cuartil (Q2) y el cuarto cuartil (Q4) coincide con el valor que toma el último dato, luego de ordenados.

Page 12: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Medidas de Dispersión

El desvío estándar

Es posible identificar conjuntos de datos que a pesar de ser muy

distintos en términos de valores absolutos, poseen la misma media.

Una medida diferencial para identificar esos conjuntos de datos es

la concentración o dispersión alrededor de la media.

Una manera de evitar que los distintos signos se compensen es

elevarlas al cuadrado, de manera que todas las desviaciones sean

positivas. La raíz cuadrada del promedio de estas cantidades recibe

el nombre de desvío estándar, o desviación típica y es representada

por la siguiente fórmula:

Page 13: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a

su media. Es un valor que representa los promedios de todas las diferencias individuales de las

observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende

entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la

media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más

“homogéneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor

dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.

La Varianza

El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La

suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media

aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de

cualquier otro valor que no sea la media aritmética.

Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado.

Precisamente la manera de simbolizarla es.

Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza

Page 14: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

8 cms.

Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos

tienen la misma base).

¿Existe alguna variación respecto de su altura entre estos rectángulos?

¿Cuál es el promedio de la altura de estos rectángulos?

8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8

9=72

9= 8

Page 15: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

El quinto rectángulo y el octavo rectángulo en un acto de rebeldía

cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10

centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros?

¿Cuál es el nuevo promedio de estos 9 rectángulos?

8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8

9=72

9= 8

... ¡el mismo promedio! Pero... ¿ha habido variación?

8 cms.

10 cms

6 cms

Page 16: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

El rectángulo rojo tiene +2 centímetros sobre el promedio, y el

rectángulo azul tiene –2 centímetros bajo el promedio. Los otros

rectángulos tienen cero diferencia respecto del promedio.

8 cms.

10 cms

6 cms

Si sumamos estas diferencias de la altura respecto del promedio,

tenemos

0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0

Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin

embargo, ante nuestros ojos, sabemos que hay variación.

Page 17: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

8 cms.

10 cms

6 cms

Una forma de eliminar los signos menos de aquellas diferencias que

sean negativas, esto es de aquellos mediciones que estén bajo el

promedio, es elevar al cuadrado todas las diferencias, y luego sumar...

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8

Y este resultado repartirlo entre todos los rectángulos, es decir lo

dividimos por el número de rectángulos que es 9

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =

9 9

8= 0,89

Page 18: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

8 cms.

10 cms

6 cms

Se dice entonces que la varianza fue de 0,89

Observemos que las unidades involucradas en el cálculo de la varianza

están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados.

De manera que se define

0,89 0,943=

La raíz cuadrada de la varianza se llama desviación estándar

Page 19: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

8 cms.

10 cms

6 cms

Que la desviación estándar haya sido de 0,943 significa que en promedio la

altura de los rectángulos variaron (ya sea aumentando, ya sea

disminuyendo) en 0,943 centímetros.

Es claro que esta situación es “en promedio”, puesto que sabemos que

los causantes de la variación fueron los rectángulos quinto y octavo.

Esta variación hace repartir la “culpa” a todos los demás rectángulos

que se “portaron bien”.

La desviación estándar mide la dispersión de los datos respecto del

promedio

Page 20: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

8 cms.

10 cms

6 cms4 cms

8 cms.8 cms. 8 cms.7 cms.

8 cms.

¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?

En primer lugar debemos calcular el promedio

8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8

9= 7,44

Luego debemos calcular la varianza

Page 21: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

8 cms.

10 cms

6 cms4 cms

8 cms. 8 cms. 8 cms.7 cms.

8 cms.

Promedio

7,44

0,56-3,44

0,56 0,56 2,56 0,56 -0,44 -1,44

0,56

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562

9

22,2224

9=

= 2,469Este es el valor de la varianza

Page 22: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

10 cms

8 cms.

6 cms4 cms

8 cms. 8 cms. 8 cms.7 cms.

8 cms.

Promedio

7,44

Si la varianza fue de 2,469, entonces la desviación estándar es de...

2,469 1,57=Lo que significa que, en promedio, los rectángulos se desviaron más o

menos (más arriba o más abajo) en 1,57 centímetros.

Page 23: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

Para entender la varianza necesariamente debe saber:

•Sumar

•Restar

•Multiplicar

•Dividir

•Potencia de orden 2

•Raíz cuadrada

Y es claro que esto no es suficiente (salvo que queramos que aprenda de

memoria los cálculos). Necesitamos estimular su imaginación para que

“vea” la variabilidad existente en la naturaleza.

Entregue una lista de fenómenos en que un mismo atributo tenga

variabilidad si se mide este atributo a un número de individuos u objetos.

Page 24: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la
Page 25: Medidas de tendencia central · Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la

ERROR: syntaxerror

OFFENDING COMMAND: --nostringval--

STACK:

/Title

()

/Subject

(D:20100414133312-03’00’)

/ModDate

()

/Keywords

(PDFCreator Version 0.9.5)

/Creator

(D:20100414133312-03’00’)

/CreationDate

(acabezas)

/Author

-mark-