20
1 DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA INTRODUCCIÓN A LA ESTADÍSTICA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA DESCRIPTIVA Lazarte Víctor Fabio y Naidicz Paula Lorena Lazarte Víctor Fabio y Naidicz Paula Lorena

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

  • Upload
    kaz

  • View
    34

  • Download
    0

Embed Size (px)

DESCRIPTION

DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA Lazarte Víctor Fabio y Naidicz Paula Lorena. MEDIDAS DE POSICIÓN Y DISPERSIÓN. MEDIDAS DE POSICIÓN: - PowerPoint PPT Presentation

Citation preview

Page 1: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

11

DIRECCIÓN DE ESTADÍSTICAS DE LA DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIAPROVINCIA

INTRODUCCIÓN A LA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Lazarte Víctor Fabio y Naidicz Paula LorenaLazarte Víctor Fabio y Naidicz Paula Lorena

Page 2: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

22

MEDIDAS DE POSICIÓN Y DISPERSIÓNMEDIDAS DE POSICIÓN Y DISPERSIÓN

MEDIDAS DE POSICIÓN:MEDIDAS DE POSICIÓN:

Resumen la información referida de la posición de la muestra. Las Resumen la información referida de la posición de la muestra. Las

medidas de posición más utilizadas son: medidas de posición más utilizadas son: MediaMedia, , MedianaMediana, , ModaModa

y y CuartilesCuartiles, las tres primeras, media, mediana y moda son , las tres primeras, media, mediana y moda son

medidas de tendencia central.medidas de tendencia central.

Supongamos que los datos observados son: xSupongamos que los datos observados son: x11, x, x22, …, x, …, xnn..

MediaMedia:: es el promedio de los datos es el promedio de los datos

Page 3: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

33

Ejemplo 1:Ejemplo 1: Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6. Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6.

Nota promedioNota promedio

En este caso la media es un buen representante del rendimiento En este caso la media es un buen representante del rendimiento

académico del alumno.académico del alumno.

La media tiene la propiedad de equilibrar los desvíos.La media tiene la propiedad de equilibrar los desvíos.

Page 4: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

44

Ejemplo 2:Ejemplo 2: En el ejemplo de la cantidad de miembros de una En el ejemplo de la cantidad de miembros de una

familia de cierta ciudad.familia de cierta ciudad.

La cantidad promedio de miembros de una familia esLa cantidad promedio de miembros de una familia es

xxx xx xx xx xx xx xx xx xx xx x xx x x

x x x xx x x xx x x xx x x x x

x x x x x xx x x x x xx x x x x x x

x x x x x x x x xx x x x x x x x x

1 2 3 4 5 6 7 8 9 10

Page 5: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

55

Existen casos en donde la media no es un buen representante del Existen casos en donde la media no es un buen representante del

conjunto de datos.conjunto de datos.

Ejemplo 3: Ejemplo 3: Una empresa tiene 5 empleados, sus sueldos en Una empresa tiene 5 empleados, sus sueldos en

pesos son: 1000, 1000, 1000, 1000, 10000. pesos son: 1000, 1000, 1000, 1000, 10000.

Entonces la media es Entonces la media es ::

El dueño de la empresa diría orgulloso El dueño de la empresa diría orgulloso ¡El sueldo promedio de los ¡El sueldo promedio de los

empleados mi empresa es de $ 2800 al mes!!empleados mi empresa es de $ 2800 al mes!!

Pero claramente, la media no es un buen representante de este Pero claramente, la media no es un buen representante de este

conjunto de datos, dado que hay 4 empleados que ganan sólo conjunto de datos, dado que hay 4 empleados que ganan sólo

1000 y sólo uno que gana 10000.1000 y sólo uno que gana 10000.

Page 6: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

66

En general cuando la muestra tenga valores alejados o presente En general cuando la muestra tenga valores alejados o presente

asimetría, la media no será un buen representante del conjunto asimetría, la media no será un buen representante del conjunto

de datos.de datos.

Una medida de posición alternativa a la media sería la Una medida de posición alternativa a la media sería la MedianaMediana..

La Mediana:La Mediana: Es el valor central de la muestra ordenada.Es el valor central de la muestra ordenada.

Si la cantidad de datos es impar, la mediana es el valor Si la cantidad de datos es impar, la mediana es el valor

central de la muestra ordenada.central de la muestra ordenada.

Si la cantidad de datos es par, la mediana es el promedio de Si la cantidad de datos es par, la mediana es el promedio de

los dos datos centrales de la muestra ordenada.los dos datos centrales de la muestra ordenada.

Page 7: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

77

Ejemplos Ejemplos

Para n impar.Para n impar.

Notas de un alumno A: 10, 8, 7, 9, 10, 7, 6.Notas de un alumno A: 10, 8, 7, 9, 10, 7, 6.

Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, 9, 10, 10. , 9, 10, 10.

La mediana de las notas es 8. Notación: La mediana de las notas es 8. Notación:

Para n parPara n par

Notas de un alumno B: 10, 8, 7, 9, 10, 7, 6, 9.Notas de un alumno B: 10, 8, 7, 9, 10, 7, 6, 9.

Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, , 99, 9, 10, 10. , 9, 10, 10.

La mediana de las notas es: La mediana de las notas es:

Page 8: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

88

En el ejemplo de la empresa con 5 empleados la mediana sería En el ejemplo de la empresa con 5 empleados la mediana sería

igual a igual a $ 1000$ 1000, por lo tanto sería un mejor representante del , por lo tanto sería un mejor representante del

conjunto de datos.conjunto de datos.

La mediana no es afectada por valores alejados ni es afectada La mediana no es afectada por valores alejados ni es afectada

por asimetría.por asimetría.

Cuartiles:Cuartiles: En cierta forma, dividen el lote de datos ordenado en En cierta forma, dividen el lote de datos ordenado en

cuatro partes iguales.cuatro partes iguales.

Para calcular los cuartiles, se toma la primera mitad de la Para calcular los cuartiles, se toma la primera mitad de la

muestra ordenada y se calcula la mediana de este conjunto que muestra ordenada y se calcula la mediana de este conjunto que

será el primer cuartil, para el tercer cuartil se trabaja igual con será el primer cuartil, para el tercer cuartil se trabaja igual con

los datos de la segunda mitad. los datos de la segunda mitad.

Page 9: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

99

Ejemplos Ejemplos

Para n imparPara n impar

Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, 9, 10, 10. , 9, 10, 10.

Primer cuartil: Primer cuartil: QQ1 1 = 7= 7 Tercer cuartil: Tercer cuartil: QQ3 3 = 9,5= 9,5

Para n parPara n par

Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, , 99, 9, 10, 10. , 9, 10, 10.

Primer cuartil: Primer cuartil: QQ1 1 = 7= 7 Tercer cuartil: Tercer cuartil: QQ3 3 = 9,5= 9,5

Page 10: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1010

En el ejemplo de la empresa con 5 empleados los datos son:En el ejemplo de la empresa con 5 empleados los datos son:

1000, 1000, 1000, 1000, 100001000, 1000, 1000, 1000, 10000

Así la moda es igual a Así la moda es igual a $ 1000$ 1000, por lo tanto sería un buen , por lo tanto sería un buen

representante del conjunto de datos.representante del conjunto de datos.

Moda:Moda: Es el dato más frecuente (si es que este existe) Es el dato más frecuente (si es que este existe)

En los ejemplos de las notas del alumno no existe la moda En los ejemplos de las notas del alumno no existe la moda

por que hay varios datos que se repiten dos veces.por que hay varios datos que se repiten dos veces.

6, 7, 7, 6, 7, 7, 88, 9, 10, 10, 9, 10, 10

Page 11: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1111

En el ejemplo de la En el ejemplo de la cantidad de miembros de una familiacantidad de miembros de una familia

¿Cuál sería la moda?¿Cuál sería la moda?

Cantidad de miembros

Cantidad de familias

Porcentajes % acumulado

1 2 2,5 % 2,5 %

2 5 6,3 % 8,8 %

3 9 11,3 % 20,0 %

4 22 27,5 % 47,5 %

5 20 25,0 % 72,5 %

6 11 13,8 % 86,3 %

7 6 7,5 % 93,8 %

8 3 3,8 % 97,5 %

10 2 2,5 % 100,0 %

Total 80 100,0 %

Moda Moda

Mediana Mediana

Page 12: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1212

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN

Ejemplo :Ejemplo :

Notas del alumno Juan: 6, 6, 8, 10, 10.Notas del alumno Juan: 6, 6, 8, 10, 10.

Notas del alumno Pedro: 8, 8, 8, 8, 8.Notas del alumno Pedro: 8, 8, 8, 8, 8.

La nota promedio de los dos alumnos es 8, sin embargo La nota promedio de los dos alumnos es 8, sin embargo

claramente su desempeño no es igual.claramente su desempeño no es igual.

¿Cómo los comparo? ¿Cuál es la diferencia?¿Cómo los comparo? ¿Cuál es la diferencia?

Una medida de dispersión es una medida de cuan alejados están Una medida de dispersión es una medida de cuan alejados están

los datos del centro de la distribución, ya sea que se tome como los datos del centro de la distribución, ya sea que se tome como

centro a la media o a la mediana de los datoscentro a la media o a la mediana de los datos

Page 13: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1313

Varianza muestral:Varianza muestral:

La varianza es el promedio de los desvíos al cuadrado, es decir, La varianza es el promedio de los desvíos al cuadrado, es decir,

se mide la distancia de cada dato a la media, se la eleva al se mide la distancia de cada dato a la media, se la eleva al

cuadrado y se las promedia.cuadrado y se las promedia.

Desviación Estándar:Desviación Estándar: es la raíz cuadrada positiva de la varianza. es la raíz cuadrada positiva de la varianza.

Page 14: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1414

Ejemplo:Ejemplo:

Notas del alumno Juan: 6, 6, 8, 10, 10.Notas del alumno Juan: 6, 6, 8, 10, 10.

La media es 8 por lo tanto los desvíos son: -2, -2, 0, 2, 2, los La media es 8 por lo tanto los desvíos son: -2, -2, 0, 2, 2, los

desvíos al cuadrado son: 4, 4, 0, 4, 4.desvíos al cuadrado son: 4, 4, 0, 4, 4.

La varianza será:La varianza será:

Desviación Estándar: Desviación Estándar:

Para el alumno Pedro naturalmente la varianza y la desviación Para el alumno Pedro naturalmente la varianza y la desviación

estándar serán iguales a cero.estándar serán iguales a cero.

Page 15: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1515

Coeficiente de variaciónCoeficiente de variación

El coeficiente de variación es una medida de la magnitud de la El coeficiente de variación es una medida de la magnitud de la

dispersión en relación a la media.dispersión en relación a la media.

Estas tres medidas toman como centro a la media, por lo tanto Estas tres medidas toman como centro a la media, por lo tanto

están asociadas a ella.están asociadas a ella.

Si el lote de datos es simétrico y no tiene valores alejados, Si el lote de datos es simétrico y no tiene valores alejados,

utilizaremos a la media y la desviación estándar para describir utilizaremos a la media y la desviación estándar para describir

el conjunto de datos.el conjunto de datos.

Page 16: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1616

Una medida de dispersión asociada a la mediana es el Una medida de dispersión asociada a la mediana es el Rango Rango

IntercuartilIntercuartil. .

El El Rango intercuartilRango intercuartil es simplemente la diferencia entre el primer es simplemente la diferencia entre el primer

y el tercer cuartil: y el tercer cuartil: RI = Q3 – Q1RI = Q3 – Q1

Si el conjunto de datos es simétrico y no tiene valores alejados Si el conjunto de datos es simétrico y no tiene valores alejados

se recomienda utilizar a la media como medida de posición con se recomienda utilizar a la media como medida de posición con

la desviación estándar como medida de dispersión.la desviación estándar como medida de dispersión.

Si el conjunto de datos es asimétrico o tiene valores alejados se Si el conjunto de datos es asimétrico o tiene valores alejados se

recomienda utilizar a la mediana como medida de posición con recomienda utilizar a la mediana como medida de posición con

el rango intercuartil como medida de dispersión.el rango intercuartil como medida de dispersión.

Page 17: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1717

¿Cómo analizo simetría?¿Cómo analizo simetría?

GráficamenteGráficamente

Coeficiente de asimetría:Coeficiente de asimetría:

Figura 5: Figura 5: Ejemplo de una distribución asimétrica positivaEjemplo de una distribución asimétrica positiva

0

10

20

30

40

50

60

70

80

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

1000

0

1100

0

1200

0

Fre

cuen

cias

Page 18: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1818

Valores alejados:Valores alejados: Estos son valores observados que se apartan Estos son valores observados que se apartan

demasiado del resto de la muestra. Para detectarlos se puede demasiado del resto de la muestra. Para detectarlos se puede

utilizar la siguiente regla: utilizar la siguiente regla:

Si un valor Si un valor xxii de la muestra es menor que de la muestra es menor que QQ11 – 1.5 (Q – 1.5 (Q33 – Q – Q11)) , ,

entonces entonces xxii es alejado por defecto. es alejado por defecto.

Si un valorSi un valor x xii de la muestra es mayor que de la muestra es mayor que QQ33 + 1.5 (Q + 1.5 (Q33 – Q – Q11)) , ,

entoncesentonces x xii es alejado por exceso. es alejado por exceso.

No significa que haya que descartar ese dato, significa que hay No significa que haya que descartar ese dato, significa que hay

que estudiar ese caso y usar medidas que no se vean que estudiar ese caso y usar medidas que no se vean

afectadasafectadas por valores alejados. por valores alejados.

Page 19: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

1919

Diagrama de tipo caja:Diagrama de tipo caja:

Se deben calcular mínimo y máximo, mediana, Q1 , Q3 y Detectar Se deben calcular mínimo y máximo, mediana, Q1 , Q3 y Detectar

valores alejadosvalores alejados

Figura 5:Figura 5: Peso en gramos de los recién nacidos en un cierto periodo de Peso en gramos de los recién nacidos en un cierto periodo de

una cierta ciudad.una cierta ciudad.

4500

3500

2500

1500

Pe

so e

n g

r.

Page 20: DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA

2020

Diagrama de tipo caja:Diagrama de tipo caja:

Figura 5:Figura 5: Cantidad de miembros de una familia. Cantidad de miembros de una familia.

02

46

81

0C

antid

ad

de m

iem

bro

s