40
Estadística PLH 406 Medidas de tendencia central Francisco Henríquez [email protected] www.freewebs.com/fcohenriquez/ estadistica.htm

Estadística PLH 406 Medidas de tendencia central Francisco Henríquez [email protected]

Embed Size (px)

Citation preview

Page 1: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

EstadísticaPLH 406

Medidas de tendencia central

Francisco Henríquez

[email protected]

www.freewebs.com/fcohenriquez/estadistica.htm

Page 2: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Notación de Sumatoria

El símbolo del lado indica la suma de todos los Xi desde i=1 hasta i=N.

N

iiX

1

Page 3: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Notación de Sumatoria

Es decir:

Propiedades:

N

iNi XXXX

121 ...

N

innii YXYXYXYX

12211 ...

N

ii

N

ini XaaXaXaXaX

1121 ...

Page 4: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Notación de Sumatoria

Propiedades:

n

ii

n

ii

n

ii

n

iiii ZcYbXacZbYaX

1111

Page 5: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Media

La Media Aritmética: la media de un conjunto N de números X1, X2,X3,…,XN se denota X (o “X barra”) y se define por:

N

X

N

X

NXXXX

X

N

ii

N 1321 ...

Page 6: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Media

Ejemplo: Tenemos los siguientes números: 19, 80, 21, 74, 66 La media se calcula:

525

2605

6674218019 x

Page 7: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Media

Calcular la media para los siguientes números: 70, 98, 54, 97, 26 El resultado es

695

3455

2697549870 x

Page 8: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Media La Media Aritmética Ponderada: A veces se asocia a

los números X1, X2,…, XN ciertos factores de peso (o pesos) w1, w2,…, wN, dependiendo de la influencia asignada a cada número. En tal caso,

N

ii

N

iii

N

NN

w

Xw

www

XwXwXwX

1

1

21

2211

...

...

Page 9: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Media

Ejemplo: Calcule el promedio de las siguientes notas: 5,6 coef. 2; 3,5 coef. 1; 6,4 coef. 1 y 5,2 coef.2

Otra manera de resolver este problema es calculando un ponderador, que se define:

25.56

5.312112

2*2.51*4.61*5.32*6.5

x

N

ii

ii

w

wponderador

1

Page 10: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Media

En este caso, los ponderadores son: 2/6=0.333 1/6=0.167 entonces, se calcula

25.5333.0*2.5167.*4.6167.0*5.3333.0*6.5

*1

x

Xponderadorxn

iii

Page 11: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: Proporciones Cuando se trabaja con datos de carácter

cualitativo, no se puede obtener media, sino que proporciones, lo cual indica la frecuencia relativa que posee un atributo en un conjunto de datos. Se obtiene así:

individuos de totalCantidad N

atributo elpresentan que individuos de Cantidad

proporción

i

i

fNf

p

Page 12: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: Proporciones El valor p está entre 0 y 1. Para una

interpretación más sencilla se suele multiplicar por 100 y se obtiene el porcentaje de ocurrencia del fenómeno.

Page 13: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: Proporciones Por ejemplo, se puede calcular la proporción de

respuestas buenas que los alumnos tienen en un ítem. De hecho, esta es una medida de dificultad del ítem. Mientras más cercano a 1, más fácil es el item.

Se calcula: Total de alumnos : 560 Alumnos que respondieron bien el ítem: 375

67.0560375 p

Page 14: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: Proporciones Ejercicio: Calcular el porcentaje que

representa cada uno de estos grupos:

¿Con cuál de las tendencias políticas Ud. se identifica o simpatiza más?...

(Encuesta CEP dic. 2006)

Sector frecuencia

Alianza 278

Concertación de partidos por la democracia 468

Pacto juntos podemos (Partidos Comunista, Humanista y otros) 110

Otros 7

Ninguna de ellas 594

No sabe 24

No contesta 24

Page 15: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: ProporcionesSector frecuencia %

Alianza 278 18.5%

Concertación de partidos por la democracia 468 31.1%

Pacto juntos podemos (Partidos Comunista, Humanista y otros) 110 7.3%

Otros 7 0.5%

Ninguna de ellas 594 39.5%

No sabe 24 1.6%

No contesta 24 1.6%

Total 1505  

Page 16: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana La Mediana: la mediana de un conjunto de números

ordenados en magnitud es el valor central o la media de los dos valores centrales.

Cuando hay un número impar de observaciones, es la observación (N+1)/2:

2

1: NXMediana

Page 17: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana

Ejemplo: Si tenemos el siguiente conjunto de datos: 344, 190, 399, 473, 170, 363, 43, 671, 75, 421, 702,

846, 74, 652, 216, 304, 390, 457, 652, 700, 636, 934, 77, 444, 238, 78, 429,65, 927

para obtener la mediana, primero debemos ordenarlos:

43, 65, 74, 75, 77, 78, 170, 190, 216, 238, 304, 344, 363, 390, 399, 421, 429, 444, 457, 473, 636, 652, 652, 671, 700, 702, 846, 927, 934.

Page 18: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana

una vez ordenados, se deben contar: 43, 65, 74, 75, 77, 78, 170, 190, 216, 238,

304, 344, 363, 390, 399, 421, 429, 444, 457, 473, 636, 652, 652, 671, 700, 702, 846, 927, 934.

Son 29 observaciones. Entonces, la observación del medio es la

número 15 (ya que (29+1)/2=15). Y esa observación es 399.

Page 19: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana

Obtener la mediana para los siguientes datos:

0, 7, 15, 18, 24, 44, 45, 49, 50, 68, 70, 75, 86, 88, 93, 97, 99.

el número de observaciones es 17, por lo que el valor mediano va a ser el noveno, es decir:

Me=50.

Page 20: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana Cuando N es impar se calcula el promedio entre los

dos valores del medio:

2

122

NN XX

Mediana

Page 21: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana

Ejemplo: 2, 4, 9, 16, 29, 45, 60, 65, 67, 68 Aquí hay 10 observaciones, luego, se debe

obtener el promedio de las que están “en el medio”.

Es decir las obs. 5 y la 6.

372

742

4529 Me

Page 22: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Mediana

Ejercicio: Obtener la mediana de: 3, 19, 33, 38, 40, 40, 45, 50, 55, 58, 74, 98 hay 12 obs., por lo que a mediana está entre los

datos 6 y 7, es decir

5.422

852

4540 Me

Page 23: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Moda

La Moda: la moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda puede no existir e incluso no ser única.

La distribución con una sola moda se llama unimodal y con dos es bimodal.

Page 24: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Moda

Ejemplo: determinar la moda de los siguientes datos:

10, 19, 21, 21, 32, 47, 47, 47, 71, 71, 73, 84, 89, 98

Dado que el valor que más se repite es el 47, Moda = 47

Page 25: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos no agrupados: La Moda

Ejercicio, determinar la moda de los siguientes datos:

15, 23, 25, 30, 30, 41, 67, 78, 78, 79, 81, 84, 87, 89, 99.

Moda = 30 y 78. 11, 14, 21, 36, 38, 39, 41, 42, 43, 48, 51, 65,

72, 95 En este caso, la moda no existe.

Page 26: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

Media aritmética para datos agrupados: Cuando se cuenta con datos agrupados en una distribución de frecuencia, todos los valores que caen dentro de un intervalo de clase dado se consideran igual a la marca de clase, o punto medio del intervalo.

Page 27: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

Con Xj como marca de la clase j y fj como frecuencia de la misma, se tiene que:

Nótese que se asume que hay M clases

N

Xf

X

M

jjj

1

Page 28: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

Ejemplo: A partir de la

siguiente tabla de distribución de frecuencia, encuentre la media.

LI LS Marca fi fr

0 150 75 285 0.012

150 300 225 5850 0.244

300 450 375 4655 0.194

450 600 525 7382 0.308

600 750 675 856 0.036

750 900 825 4948 0.206

N 23976

Page 29: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

Se puede hacer de dos maneras. Ambas provienen de la definición de promedio ponderado.

La primera suma las frecuencias multiplicadas por su marca y se divide por N.

La segunda simplemente suma la multiplicación de las marcas por las frecuencias relativas.

Page 30: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

LI LS Marca fi fr M*fi

0 150 75 285 0.012 21375

150 300 225 5850 0.244 1316250

300 450 375 4655 0.194 1745625

450 600 525 7382 0.308 3875550

600 750 675 856 0.036 577800

750 900 825 4948 0.206 4082100

N 23976 11618700

Page 31: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

60.48423976

11618700 x

Page 32: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Media

LI LS Marca fi fr marca*fr

0 150 75 285 0.012 0.892

150 300 225 5850 0.244 54.899

300 450 375 4655 0.194 72.807

450 600 525 7382 0.308 161.643

600 750 675 856 0.036 24.099

750 900 825 4948 0.206 170.258

N 23976 484.60

Page 33: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana

La mediana se obtiene por interpolación y está dada por:

mediana clase la de Ancho A

mediana clase la de Frecuencia

mediana la a inferiores clases las de sfrecuencia las de Suma

total)a(frecuenci datos de Número

mediana) la a contiene que (la mediana clase la deinferior Frontera

2

1

1

1

1

mediana

mediana

f

fa

N

L

Af

afN

LMediana

Page 34: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana

Es una interpolación debido a que en esta fórmula está implícito el supuesto de que los datos se distribuyen de manera lineal en el intervalo.

Page 35: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana Ejemplo

LI LS Marca fi fa

0 150 75 285 285

150 300 225 5850 6135

300 450 375 4655 10790

450 600 525 7382 18172

600 750 675 856 19028

750 900 825 4948 23976

N 23976

Page 36: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana

Lo primero que se debe hacer es determinar la clase donde está la mediana.

Lo anterior se realiza dividiendo N por 2, es decir:

23976/2=11988 A continuación se debe encontrar la clase

mediana, la cual es la que tiene la frecuencia acumulada mayor a la observación mediana.

En este caso:

Page 37: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana Ejemplo

LI LS Marca fi fa

0 150 75 285 285

150 300 225 5850 6135

300 450 375 4655 10790

450 600 525 7382 18172

600 750 675 856 19028

750 900 825 4948 23976

N 23976

Page 38: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana

Luego se debe aplicar la fórmula:

150*

7382

107902

23976

450Mediana

Límite Inferior de la frecuencia mediana

N

Frecuencia acumulada anterior a la frec. mediana

Ancho del Intervalo

Frecuencia Mediana

Page 39: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Mediana

323.474

323.24450

150*162.0450

150*73821198

450

150*7382

1079011988450

150*7382

107902

23976

450

Mediana

Mediana

Mediana

Mediana

Mediana

Mediana

Page 40: Estadística PLH 406 Medidas de tendencia central Francisco Henríquez Henriquez.fco@gmail.com

Medidas de tendencia central para datos agrupados: La Moda

La moda, para datos agrupados es simplemente la marca de la clase con mayor frecuencia.

LI LS Marca fi

0 150 75 285

150 300 225 5850

300 450 375 4655

450 600 525 7382

600 750 675 856

750 900 825 4948

En este caso, la moda es:Moda = 525