48
ESTADISTICA APLICADA Medidas de Tendencia Central, de Posición y Dispersión

Guia estudio 03.pptxestadistica

Embed Size (px)

Citation preview

Page 1: Guia estudio 03.pptxestadistica

ESTADISTICA APLICADAMedidas de Tendencia Central, de

Posición y Dispersión

Page 2: Guia estudio 03.pptxestadistica

Introducción

• En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptivas que representan las propiedades de tendencia central, dispersión y forma para extraer y resumir las principales características de los datos. Si se calculan a partir de una muestra de datos, se les denomina estadísticos; si se les calcula a partir de una población se les denomina parámetros.

Page 3: Guia estudio 03.pptxestadistica

Medidas de Tendencia Central

La mayor parte de las muestras de datos muestran una tendencia a agruparse alrededor de un punto "central" y por lo general es posible elegir algún valor que describa todo un conjunto de datos. Un valor típico descriptivo como ese es una medida de tendencia central o "posición centralizada". Las medidas de tendencia central a estudiar son: media aritmética, mediana y moda.

Page 4: Guia estudio 03.pptxestadistica

El problema

• El profesor de Estadística llevó a clase un bote de cristal lleno de canicas, dijo que había entre 20 y 30, y preguntó cómo podíamos averiguar cuántas canicas había sin sacarlos del bote.

A los alumnos se nos ocurrió que entre todos averiguásemos cuántos boliches podía haber. Así que preguntamos uno por uno a todos los compañeros para que dijesen cuántos boliches estimaban que había en el bote.

Page 5: Guia estudio 03.pptxestadistica

La muestra

• Todas las respuestas las recogimos en una lista numérica, obteniendo con ello una muestra estadística:21,25,24,29,26,24,23,25,28,29,26,22,25,21,22,24,24,26,23,21Esta lista corresponde a las 20 respuestas obtenidas de todos los compañeros de clase

Page 6: Guia estudio 03.pptxestadistica

Una medida de centralización

• Razonamos que el número exacto de canicas debería de ser un valor central en la muestra, algunos tendrían que haberse pasado y otros deberían de haberse quedado cortos

Page 7: Guia estudio 03.pptxestadistica

Una medida de centralización

El alumno X propuso que ese “valor central” se podía obtener sumando todas las respuestas y dividiendo por el número de respuestas. A esta medida obtenida de esa forma se le llama MEDIA.Media=Media=24.4

n

xxxx xx n2 ...431

Page 8: Guia estudio 03.pptxestadistica

La Media Aritmética

• La media aritmética ( también denominada media ) es la medida de tendencia central que se utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos, dividiendo después ese total entre el número total de elementos involucrados.

• La media aritmética de un conjunto de valores se calcula como el cociente de la suma de los valores entre el número de ellos. Su símbolo es si la media aritmética es de una muestra y si la media aritmética es de una población.

Page 9: Guia estudio 03.pptxestadistica

La Media Aritmética

• Para datos no agrupados.Media muestral: Media poblacional:

• Para datos agrupados.Media muestral: Media poblacional:

Page 10: Guia estudio 03.pptxestadistica

La Media Aritmética

• Donde:xi: marca de clase del intervalo i-ésimo

fi: frecuencia absoluta del intervalo i-ésimo

k: numero de intervalosEjemplo: Calcular la media aritmética para el peso de 40 trabajadores, según tabla adjunta.

Page 11: Guia estudio 03.pptxestadistica

La Media Aritmética

Ejm 01: Calcular la media de una distribución estadística que viene dada por la siguiente tabla:

xi fi xi  fi61 564 1867 4271 2773 8

Ejm 02: Hallar la media de la distribución estadística que viene dada por la siguiente tabla:

xi fi xi fi[10, 15) 3[15, 20) 5[20, 25) 7[25, 30) 4[30, 35) 2

Page 12: Guia estudio 03.pptxestadistica

La Media Aritmética

• Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla:

• Determinar a y b sabiendo que la puntuación media es 3.6.

1 2 3 4 5 6fi a 32 35 33 b 35

xi fi xi fi1 a2 323 354 335 b6 35

Page 13: Guia estudio 03.pptxestadistica

La Moda

Cuando hablamos de moda, por ejemplo en vestuario, se relaciona con aquella prenda que se usa masivamente.Entonces, se podría inferir que la moda tiene que ver con la frecuencia con que se usa cierta prenda de vestir• En estadística ocurre algo semejante.• La moda es aquel dato que más se repite.• Es decir, aquel dato que tiene mayor frecuencia.• Puede haber más de una moda cuando dos o más

números se repiten la misma cantidad de veces y además este es el máximo número de veces del conjunto.

• No hay moda si ningún número se repite más de una vez.

Page 14: Guia estudio 03.pptxestadistica

La Moda

1. Definición  de moda: La moda es el valor o dato que tiene mayor frecuencia absoluta, es decir, más repeticiones. Para datos no agrupados• Se representa por Mo.• Se puede hallar la moda para variables cualitativas y cuantitativas.• Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 • Si en un grupo hay dos o varias puntuaciones con la misma

frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

• Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9

Page 15: Guia estudio 03.pptxestadistica

La Moda

Para datos agrupados en intervalos• Caso A:

• Caso B:

El caso B no es muy usado.Ejm: Calcular la moda de una distribución estadística que viene dada por las siguiente tablas:

Page 16: Guia estudio 03.pptxestadistica

La Moda

fi

[60, 63) 5[63, 66) 18[66, 69) 42[69, 72) 27[72, 75) 8

Total 10

fi

[0 - 50) 78[50 - 100) 123

[100 - 150) 187[150 - 200) 82[200 - 250) 51[250 - 300) 47[300 - 350) 13[350 - 400) 9[400 - 450) 6[450 - 500) 4

600

a) b)

Page 17: Guia estudio 03.pptxestadistica

La Mediana

1. Definición de mediana: Es el valor que ocupa el lugar central de todos los datos de la muestra cuando éstos están ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas.Para datos no agrupadosSe deben ordenar los datos de forma creciente, para muestras con un número impar de observaciones, la mediana es el dato que queda en el centro de dicha ordenación y para muestras con número par de observaciones, la mediana es el promedio de los dos datos centrales de la muestra.a) Si la serie tiene un número  impar  de medidas la mediana es la puntuación central de la misma.2, 3, 4, 4, 5, 5, 5, 6, 6b) Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.7, 8, 9, 10, 11, 12

Page 18: Guia estudio 03.pptxestadistica

La Mediana

Para datos agrupadosPara la ubicación de la clase donde se ubica la mediana, utilizaremos el siguiente criterio.

Este criterio bastará para determinar la mediana para datos puntuales agrupados. Y la siguiente fórmula se utiliza para hallar la mediana para datos agrupados en intervalos.

Page 19: Guia estudio 03.pptxestadistica

La Mediana

1. Ejm: Calcular la mediana de una distribución estadística que viene dada por la siguientes tablas:

fi Fi

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100

xi fi Fi

2 2

3 2

4 5

5 6

6 2

8 3

20

Page 20: Guia estudio 03.pptxestadistica

La Mediana

Ejercicio 1: Calcular la mediana de las alturas de los jugadores de un equipo de baloncesto, que vienen dadas por la tabla:

¿Qué representa la mediana?

fi Fi

[1.70, 1.75) 1 1

[1.75, 1.80) 3 4

[1.80, 1.85) 4 8

[1.85, 1.90) 8 16

[1.90, 1.95) 5 21

[1.95, 2.00) 2 23

23

Page 21: Guia estudio 03.pptxestadistica

Ejercicio de Repaso

Ejercicio  de  repaso:  Se hace una encuesta entre 100 personas acerca del número de horas diarias que se dedican a ver televisión, obteniéndose la siguiente información:

Calcular la media, la mediana y la moda. Que representa cada una de ellas.

Page 22: Guia estudio 03.pptxestadistica

Medidas de Posición o Cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores. Los más usados son los cuartiles, los deciles y los percentiles.

Page 23: Guia estudio 03.pptxestadistica

Cuartiles

CuartilesLos cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.

Explicación:Número impar de datos2, 5, 3, 6, 7, 4, 9, 11, 14Número par de datos2, 5, 3, 4, 6, 7, 1, 9, 11, 13

25% 25% 25% 25%Q1 Q2 Q3

)4

)1(3(

)4

)1(2(

)4

1(

3

2

1

niónValorPosicQ

niónValorPosicQ

niónValorPosicQ

Page 24: Guia estudio 03.pptxestadistica

Cuartiles

• Cálculo de los cuartiles para datos agrupadosUtilizaremos la siguiente fórmula para calcular los cuartiles:

Criterio para determinar la clase cuartilica.

Donde: Li: es el límite inferior de la clase donde se encuentra el cuartil.n: es la suma de las frecuencias absolutas.Fi-1: es la frecuencia acumulada anterior a la clase del cuartil.ci: es la amplitud de la clase.

Page 25: Guia estudio 03.pptxestadistica

Cuartiles

Ejm: Calcular los cuartiles de la distribución de la tabla:

Explicación:

Solución:fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Page 26: Guia estudio 03.pptxestadistica

Cuartiles

Ejm: Dada la distribución estadística, Calcular los Cuartiles 1, 2 y 3.

Explicación:

Solución:xi fi Fi

[0, 5) 2.5 3

[5, 10) 7.5 5

[10, 15) 12.5 7

[15, 20) 17.5 8

[20, 25) 22.5 2

[25, ∞) 6

31

Page 27: Guia estudio 03.pptxestadistica

Deciles

• Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.

• El cálculo de los deciles en datos no agrupados es igual a los cuartiles.Para datos Agrupados

Criterio para determinar la clase decilica.

Donde: ,…,9Li: es el límite inferior de la clase donde se encuentra el cuartil.n: es la suma de las frecuencias absolutas.Fi-1: es la frecuencia acumulada anterior a la clase del cuartil.ci: es la amplitud de la clase.

D1 D2 D3 D4 D5 D6 D7 D8 D9

Page 28: Guia estudio 03.pptxestadistica

Deciles

Ejm: Calcular los deciles de la distribución de la tabla:fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Solución:

Page 29: Guia estudio 03.pptxestadistica

Percentiles

• Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.P50 coincide con la mediana.

Criterio para determinar la clase percentilica.

Donde: ,…,99Li: es el límite inferior de la clase donde se encuentra el cuartil.n: es la suma de las frecuencias absolutas.Fi-1: es la frecuencia acumulada anterior a la clase del cuartil.ci: es la amplitud de la clase.

Page 30: Guia estudio 03.pptxestadistica

Percentiles

Ejm: Calcular los pertentiles 35 y 60 de la distribución de la tabla:

fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Solución:

Page 31: Guia estudio 03.pptxestadistica

Medidas de dispersión

• Una segunda propiedad que describe a un conjunto de datos es la dispersión. Dispersión es el grado de variación o diseminación de los datos. Dos conjuntos de datos pueden diferir tanto en tendencia central como en dispersión o dos conjuntos de datos pueden tener las mismas medidas de tendencia central, pero diferir mucho en términos de dispersión..

Page 32: Guia estudio 03.pptxestadistica

Que significa?

Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos tienen la misma base).

¿Existe alguna variación respecto de su altura entre estos rectángulos?

¿Cuál es el promedio de la altura de estos rectángulos?

8 cms.

8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8

9=

72

9= 8

Page 33: Guia estudio 03.pptxestadistica

Que significa?

Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos tienen la misma base).

El quinto rectángulo y el octavo rectángulo cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el octavo rectángulo, de color cafe, mide 6 centímetros?

¿Cuál es el nuevo promedio de estos 9 rectángulos?

8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8

9=

72

9= 8

8 cms.

10 cms

6 cms

... ¡el mismo promedio! Pero... ¿ha habido variación?

Page 34: Guia estudio 03.pptxestadistica

Ilustración

Se tiene las medidas de alturas de 5 perros en milímetros.

Las alturas a sus lomos son: 600mm, 470mm, 170mm, 430mm y 300mm.

Explicación:

Page 35: Guia estudio 03.pptxestadistica

Ilustración

Tenemos media = 394

Page 36: Guia estudio 03.pptxestadistica

Rango

• Indica el número de valores que toma la variable. El rango es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos.

• Si los datos están agrupados en una tabla de frecuencias, el recorrido es la diferencia entre el límite real superior del último intervalo y el límite real inferior del primer intervalo.

fi Fi

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

El rango mide "la dispersión total“ del conjunto de datos. Aunque el rango es una medida de dispersión simple y que se calcula con facilidad, su debilidad preponderante es que no toma en consideración la forma en que se distribuyen los datos entre los valores más pequeños y los más grandes.

Page 37: Guia estudio 03.pptxestadistica

Desviación Media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por:

Ejm: Calcular la desviación media de la edad de 8 niños:9, 5, 8, 8, 9, 8, 9, 7

Solución:

Page 38: Guia estudio 03.pptxestadistica

Desviación Media

Desviación media para datos agrupados:

Ejm: Determine la desviación media de los siguientes datos agrupados:

Solución:xi fi xi fi || |fi[10, 15) 3

[15, 20) 5

[20, 25) 7

[25, 30) 4

[30, 35) 2

21

Page 39: Guia estudio 03.pptxestadistica

Varianza

• La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de un conjunto de datos. Se encuentra en unidades cuadradas1. Para datos puntualesVarianza Poblacional:Varianza muestral:2. Para datos agrupadosVarianza Poblacional:Varianza muestral:Algunas propiedades:1. ≥0; 02. =0; =0 Cuando todos los datos son iguales

Donde:

Page 40: Guia estudio 03.pptxestadistica

Desviación Estándar• La desviación estándar nos permite determinar, con un buen grado de

precisión, dónde están localizados los valores de una distribución de frecuencias con relación a la media. La desviación estándar puede ser interpretada como una medida de incertidumbreDesviación Estándar Poblacional:Desviación Estándar muestral:

• La desviación estándar representa la variabilidad de los datos, es decir la media alcanzará a representar a todos los datos de una muestra que se encuentren entre: . Pudiendo ser aplicable también para la población

Obs: esta regla es aplicable a muestras o poblaciones simétricas, es decir que representan una campana de Gauss.

Page 41: Guia estudio 03.pptxestadistica

Desviación Estándar

Regla empírica, para distribuciones simétricas o muestras o poblaciones normales.• Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación

estándar a partir de la media.• Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a

partir de la media.• Aproximadamente 99% de los valores estará en el intervalo que va desde 3

desviaciones estándar a la izquierda de la media hasta 3 desviaciones estándar a la derecha de la media

Page 42: Guia estudio 03.pptxestadistica

Ejemplo ilustrativo

En un intento de estimar la demanda potencial futura, la National Motor Company realizó un estudio, en el 2011, en el que preguntaba a parejas casadas cuántos automóviles debe tener la familia promedio actual. Para cada pareja, promediaron las repuestas del hombre y la mujer, a fin de obtener la respuesta global de la pareja. Las respuestas se colocaron en una tabla:

a) Calcule la varianza y la desviación estándar.b) Dado que la distribución tiene, casi, forma de campana, en teoría, ¿cuántas

observaciones deben caer entre 0.5 y 1.5? ¿Entre 0 y 2? ¿Cuántas caen de hecho en esos intervalos?. Verifique si el 68% de los datos esta entre ±1 desviación estándar.

Nro. de autos Frecuencia

0 2 0.5 14 1 23

1.5 1.7 2 1.4

2.5 1.2 TOTAL

Solución:

Page 43: Guia estudio 03.pptxestadistica

Otro ejercicio demostrativo

• Se tiene los tiempo en minutos, que un estudiante demora en resolver un ejercicio de matemática.

• ¿Cuál es la varianza y la desviación estándar de los tiempos que se demora en resolver un ejercicio?

• ¿Existe algún dato que no son representados por la media con un intervalo ?

8 min.10 min.

6 min.4 min.

8 min. 8 min. 8 min.7 min.

8 min.

Page 44: Guia estudio 03.pptxestadistica

8 min.

10 min.

6 min.4 min.

8 min. 8 min. 8 min.7 min.

8 min.

Media

7,44

0,56-3,44

0,56 0,56 2,56 0,56 -0,44 -1,44

0,56

Cálculo de la media y desviación8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8

9= 7,44

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562

9

22,22249

=

Lo que significa que, en promedio, los tiempos se desviaron más o menos (más arriba o más abajo) en 1,57 centímetros.

Page 45: Guia estudio 03.pptxestadistica

Coeficiente de Variación

• Coeficiente de variación mide la dispersión en términos de porcentaje, señala qué tan grande es la magnitud de la desviación estándar respecto al promedio del conjunto de datos que se examina.Coeficiente de variación: (100%)

Donde: : desviación estándar: media

Page 46: Guia estudio 03.pptxestadistica

Ejemplo

• Para utilizar la fórmula anterior en un ejemplo, podemos suponer que cada día el técnico A del laboratorio realiza un promedio de 40 análisis con una desviación estándar de 5. El técnico B efectúa un promedio de 160 análisis diarios con una desviación estándar de 15. ¿Cuál de los dos técnicos muestra menos variabilidad?

Page 47: Guia estudio 03.pptxestadistica

Ejercicio propuesto• Talent, Ltd., una compañía en Hollywood de selección de

elenco, está en proceso de elegir un grupo de extras para una película. Las edades de los 20 hombres que se entrevistaron primero son:50 56 55 49 52 57 56 57 56 5954 55 61 60 51 59 62 52 54 49

• Calcular los estadísticos de dispersión vistos anteriormente• El director de la película con sus conocimientos de estadística,

decide aceptar a los hombres cuyas edades estén entre los límites de variación estándar. ¿Cuántos hombre califican como extras?

Page 48: Guia estudio 03.pptxestadistica

Ejercicios con ExcelA continuación damos el peso en libras de una población completa de 100 jugadores de fútbol americano de la NFL.

226 198 210 233 222 175 215 191 201 175264 204 193 244 180 185 190 216 178 190174 183 201 238 232 257 236 222 213 207233 205 180 267 236 186 192 245 218 193189 180 175 184 234 234 180 252 201 187155 175 196 172 248 198 226 185 180 175217 190 212 198 212 228 184 219 196 212220 213 191 170 258 192 194 180 243 230180 135 243 180 209 202 242 259 238 227207 218 230 224 228 188 210 205 197 169

Realizar el cálculo de todos los temas tratados hasta el momento.