ESTADÍSTICA DESCRPTIVA Tablas de Frecuencia para Variables Continuas, Representación Gráfica y...

Preview:

Citation preview

ESTADÍSTICA DESCRPTIVAESTADÍSTICA DESCRPTIVA

Tablas de Frecuencia para Variables Continuas, Representación Gráfica y

Tabla de Contingencia

Tabla de frecuencia Variable Continua Si la variable que se esta midiendo es de tipo

continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento.

Recorrido: Es el campo de variación de la variable.

Recorrido = X máx – X mín2

Tabla de frecuencia Variable Continua El número y tamaño de los intervalos, dependen de la cantidad

de datos de la muestra y de su recorrido.

El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra.

Los intervalos puede ser cerrado- cerrado,

cerrado- abierto

3

Tabla de frecuencia Variable Continua Definiciones:

1. Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K

2. Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ].

3. Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C.

4

Tabla de frecuencia Variable Continua4. Marca de clase: Es el punto medio de las clases, es

decir, la semisuma del Ls y Li.

Las clases deben tener el misma Amplitud.

Amplitud = C = (Máx. - VMín) / K

Donde K es el número de clases

En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturgen.

K = (1 + 3,322 Log n)

5

Ejemplo Los siguientes datos indican el número de minutos que

ocuparon sus asientos 20 clientes de una cafetería.

Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n]

¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más?

¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos?

6

Solución

1. 45%

2. 60%7

Representación Gráfica

1. Histograma Consiste en un conjunto de rectángulos con:

bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases.

Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.

8

Representación Gráfica

9

Ejemplo Dada la siguiente tabla de distribución, graficar

histograma.

10

Representación Gráfica

2. Polígono de Frecuencia Es un gráfico de trazos de la frecuencia de

clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.

Ejemplo: Realizar el polígono de frecuencia de la tabla anterior.

11

Representación Gráfica

12

Representación Gráfica

3. Ojiva: Al igual que el histograma y el polígono de

frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.

En el eje horizontal se considera los limites de clase. Limites inferiores Ojiva mayor

Limites superiores Ojiva menor

13

Representación Gráfica

Ojiva Mayor

14

Ojiva Menor

Representaciones Gráficas

15

Tabla de Contingencia 2 x 2 Sirve para analizar la relación de dependencia o

independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia.

1. Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores.

2. A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio.

16

Tabla de Contingencia 2 x 2 Para identificar relaciones de dependencia entre

variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.

17

Tabla de Contingencia 2 x 2 Considerando un grado de confianza del 95%, esto

implica un = 0,05.

Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes.

H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes.

Obtención del grado de libertad para X2 (Chi-cuadrado):

Grados de libertad: (r-1)*(c-1), r: filas; c: columnas Grados de libertad: (2-1)*(2-1)=1

Valor tabla = 3,84

18

Tabla de Contingencia 2 x 2

Si el resultado es menor a 3,84 no se rechaza Ho

Si el resultado es mayor a 3,84 se rechaza Ho

19

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos Básicos: Moda, Mediana, Media en Datos no Agrupados

Estadígrafos Básicos

Estadígrafo o estadístico: Es un valor que, calculado sobre la base de los datos observados, sirve para caracterizar la muestra que originó los datos.

Ejemplos: El promedio común y corriente, un tanto por ciento, el rango, el IPC, etc. Todos ellos responden a la idea general de estadígrafo.

1. Es un número real

2. Se calculan con los datos observados

3. Caracterizan la muestra en estudio

Permiten condensar ,el volumen de información, a unos pocos valores que sean indicativos de todo el conjunto.

Tipos de Estadígrafos

Tipos de Estadígrafos

1. Estadígrafos de posición: Son aquellos que describen la posición que ocupa la distribución de frecuencias respecto a un valor de variable.

Indican alrededor de cuál valor se agrupan los datos obtenidos.

2. Estadígrafos de dispersión: Cuantifican la variabilidad o dispersión de los datos.

Indican qué tan esparcidos están los datos obtenidos

Moda en datos no agrupados La moda es el valor que

tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Ejemplo: Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5

R: Mo = 4

En caso de:1. Si en un grupo hay dos o

varias variables con la misma frecuencia y

2. Esa frecuencia es la máxima

Entonces la distribución es bimodal o multimodal, es decir, tiene varias modas.

Moda en datos no agrupados Ejemplo: Hallar la moda de

la distribución: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

R: Mo = 1, 5, 9

Cuando todos los valores de un grupo tienen la misma frecuencia, no hay moda

Ejemplo: Hallar la moda de la distribución: 2, 2, 3, 3, 6, 6, 9, 9

R: Mo = No hay moda

Ejercicios

1. Calcule la moda para n° de personas ocupantes por automóvil en un control policial fronterizo:

4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3

2. Calcule la moda para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)

25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5

3. Calcule la moda para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):

3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140

Ejercicios

4. Calcule la moda de la siguiente serie de números:

5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4

Respuestas:

1. M0 = 4 personas

2. M0 = 25 minutos

3. M0 = La moda no existe

4. M0 = 4 y 5

Media aritmética en datos no agrupados La media aritmética o el

promedio es igual a la suma de todos los valores observados, dividida por el número de datos.

Desventaja de la media aritmética:

o Es altamente influenciable por valores extremos, por lo que la media es recomendable cuando la variable tiene una distribución de valores homogéneos.

Media aritmética en datos no agrupados Ejemplo: Calcular la media

aritmética de la edad de 5 personas: 23 – 21 – 11 – 8 – 34

R: = (23 + 21 + 11 + 8 + 34) / 5 = 19,4 años.

Ejemplo: Una persona que trabaja en forma independiente gana un mes $100.000, otro mes $300.000 y otro $200.000. ¿Cuanto gana en promedio mensual? Interprete el resultado.

R: = (100.000 + 300.000 + 200.000) / 3

= $200.000

Interpretación: La persona debe esperar ganar cada mes $200.000, por supuesto que abra meses que ganará más y otros menos.

Ejercicios

1. Calcule la media aritmética para n° de personas ocupantes por automóvil en un control policial fronterizo:

4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3

2. Calcule la media aritmética para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)

25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5

3. Calcule la media aritmética para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):

3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140

Ejercicios

4. Calcule la media aritmética de la siguiente serie de números:

5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4

Respuestas:

= 3,3 personas

= 22,67 minutos

= 3,359 Kg

= 4,375

Mediana en datos no agrupados

La Mediana de una serie de datos, es el valor de la variable que, una vez ordenadas las observaciones de menor a mayor, divide la distribución en dos segmentos tales que:

1. A lo menos, el 50% de las observaciones son iguales o menores que la mediana

2. A lo menos, el 50% de las observaciones son iguales o mayores que la mediana.

Mediana en datos no agrupados

1. Ordenar los datos de menor a mayor (recomendado) o de mayor a menor

2. Encontrar la ubicación de la mediana

3. Determinar el valor que se encuentra en el lugar señalado.

Caso en que “n” es impar. Ejemplo: Los siguientes

son el número de menores de edad por familia:

3, 2, 0, 0, 1, 2, 0.

Calcular la mediana.

1. Ordenados:

0, 0, 0, 1, 2, 2, 3

En este caso n = 7

Mediana en datos no agrupados

2. Ubicación: = (7+1)/2

Es la 4º observación o valor.

3. La 4º observación es el valor .

La Me = 1

Caso en que “n” es par. Ejemplo: Los siguientes

son el número de menores de edad por familia:

3, 2, 0, 0, 1, 2, 0, 4

Calcular la mediana.

1. Ordenados:

0, 0, 0, 1, 2, 2, 3, 4

En este caso n = 8

Mediana en datos no agrupados

2. Ubicación: = (8+1)/2

resultado 4,5

La mediana esta entre el 4º y 5º valor.

Es decir entre: 1 y 2

3. La mediana es ( 1 + 2) / 2

Me = 1,5

Ejercicios

1. Calcule la mediana para n° de personas ocupantes por automóvil en un control policial fronterizo:

4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3

2. Calcule la mediana para el tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos)

25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5

3. Calcule la mediana para el peso de una muestra de 10 recién nacidos en un hospital público (Kg.):

3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140

Ejercicios

4. Calcule la mediana de la siguiente serie de números:

5 – 4 – 6 – 5 – 4 – 5 - 6 – 5 – 4 – 5 – 4 – 2 – 4 – 2 – 5 - 4

Respuestas:

Me = 3,5 personas

Me = 25 minutos

Me = 3,325 Kg

Me= 4,5

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos Básicos: Moda, Mediana, Media en Datos Agrupados

Moda en datos agrupados La moda se obtiene por

interpolación, mediante la siguiente formula:

Ejemplo: Calcular la moda para los siguientes datos:

Li: limite inferior de la clase.

C: amplitud del intervaloNk-1: Frecuencia absoluta

del intervalo anterior al modal.

Nk+1: Frecuencia absoluta del intervalo posterior al modal.

Tiempo (horas) Marca de clase Fr. Absoluta[0 - 2) 1 6[2 - 4) 3 11[4 - 6) 5 5[6 - 8) 7 2[8 - 10] 9 3

Moda en datos agrupados Intervalo modal: [2 – 4), posee la

mayor frecuencia absoluta. Li: Limite inferior del intervalo =

2 C: amplitud del intervalo modal

=2 Nk-1: Frecuencia absoluta del

intervalo anterior = 6 Nk+1: Frecuencia absoluta del

intervalo posterior = 5

Formula:

M0 = 2,9 Horas

Ejercicios

1. Calcule la moda para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos.

2. Interprete la moda obtenida en el ejercicio anterior

Ejercicios Intervalo modal: [6 – 8), posee la mayor frecuencia absoluta.

Li: Limite inferior del intervalo = 6 C: amplitud del intervalo modal =2 Nk-1: Frecuencia absoluta del

intervalo anterior = 17 Nk+1: Frecuencia absoluta del

intervalo posterior = 14

Formula: M0= 6 + 2 ( 14 / (14 + 17))

M0 = 6,9 $ Miles

Interpretación: Lo más frecuente es que haya un gasto de $6.900 pesos mensualmente en combustible para la calefacción.

Media aritmética en datos agrupados La media aritmética

se obtiene de la siguiente formula:

Ejemplo: Calcular la media aritmética de:

Xmi: El valor de la variable o la marca de clase.

Fi: Frecuencia de absoluta.

Xi

Media aritmética en datos agrupados

Luego la media aritmética es:

= ( 1.068 / 30) = 35,6

Xi Xi

Ejercicios

1. Calcule la media aritmética de los datos que representan las horas que transcurren hasta que un trabajador sufre un accidente.

2. Interprete la media aritmética obtenida en el ejercicio anterior

Ejercicios

Interpretación: En promedio cada 3,9 horas un trabajador sufre un accidente.

Mediana en datos agrupados La mediana se obtiene por

interpolación, mediante la siguiente formula:

Ejemplo: Calcular la mediana para los siguientes datos:

Li: limite inferior de la clase medial.

C: amplitud del intervalo medial

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al medial.

nk: Frecuencia absoluta del intervalo medial

Tiempo (horas) Marca de clase Fr. Absoluta[0 - 2) 1 6[2 - 4) 3 11[4 - 6) 5 5[6 - 8) 7 2[8 - 10] 9 3

Mediana en datos agrupados Condición a considera :

El intervalo medial es [2 – 4)

Ejercicios

1. Calcule la mediana para los siguientes datos, los cuales reflejan el gasto mensual, de combustible para calefacción, expresado en miles de pesos.

2. Interprete la moda obtenida en el ejercicio anterior

Ejercicios

Interpretación: El 50% de los casos de consumo mensual destinado a calefacción se encuentra antes de 7,65 $miles y el 50% restante de los consumos mensuales esta sobre los 7,65 $miles.

Nk > n/2 Nk-1 n/2 Nk > 77/2 = 38,5 Nk-1

77/2= 38,5

El intervalo medial es: [6 – 8)

Me = 6 + 2 x (38,5 – 17) / 26 Me = 7,65

Media aritmética ponderada en datos agrupados La media aritmética

ponderada, se obtiene de la siguiente formula:

Ejemplo: Calcular la media aritmética ponderada de:

Wi: La ponderación de la variable xi

:

ii

iii

nw

nwxwX

Media aritmética ponderada en datos agrupados

Luego la media aritmética PONDERADA es:

= ( 42 / 6) = 7

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos de Localización: Cuartil, Decir y Percentil

Cuartiles Los cuartiles son puntos o

medidas que dividen a la muestra ordenada en cuatro grupos de igual tamaño.

Se denota Qi el cuartil i- ésimo con 3,2,1=i

Ejemplo: Calcular el cuartil 1, 2 y 3 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo

Cuartiles Calculo del 1º cuartil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a Q1 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de n/4

Con n= 27 n/4 = 27/4 = 6,75

La frecuencia absoluta acumulada que supera a 6,75 pertenece al 2º intervalo [2-4)

Cuartiles Calculo del 1º cuartil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del cuartil

C: amplitud del intervalo del cuartil

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil

nk: Frecuencia absoluta del intervalo del cuartil.

Cuartiles Interpretación: El 25% de los accidentes ocurren antes

que el trabajador cumpla 2,14 horas de trabajo y el 75% restante de los accidentes ocurren sobre las 2,14 horas de trabajo.

Calculo del 2º cuartil. El 2º cuartil el cual comprende el

50% de los datos es equivalente a la mediana.

Q2 = Me

Cuartiles Calculo del 3º cuartil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a Q3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de 3n/4

Con n= 27 3n/4 = (3 x 27)/4 = 20,25

La frecuencia absoluta acumulada que supera a 20,25 pertenece al 3º intervalo [4-6)

Cuartiles Calculo del 3º cuartil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del cuartil.

C: amplitud del intervalo del cuartil.

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del cuartil.

nk: Frecuencia absoluta del intervalo del cuartil.

Cuartiles

Interpretación:

El 75% de los accidentes ocurren antes que el trabajador cumpla 5,3 horas de trabajo y el 25% restante de los accidentes ocurren sobre las 5,3 horas de trabajo.

Ejercicio Propuesto La siguiente información corresponde al consumo mensual

en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:

Calcule cada uno de los cuartiles e interprete su significado, en relación a la tabla de distribución

Diagrama de Caja Es una representación

semigráfica de una distribución constante.

Se utiliza cuando la muestra no es muy grande.

Construcción de una diagrama de caja:

1. Se ordenan los datos de la muestra, identificando el valor mínimo y el máximo, luego se obtiene el recorrido y los tres cuartiles.

2. Se dibuja un rectángulo cuyos extremos son Q1 y Q3 e indicar la posición de la mediana, mediante un segmento de recta vertical.

Así, dentro de la caja queda representado el 50% central de la información contenida en los datos.

Diagrama de Caja La tabla de distribución de

frecuencias adjunta indica el número de años de experiencia de una muestra de expertos en el área de administración de empresas.

Con esta información construya un diagrama de cajas

Diagrama de Caja SOLUCIÓN:

Xmin = 0 años.

Xmáx = 15 años.

Q1 = 3,7 años

Q2 = Me = 5,4 años

Q3 = 7,9 años.

Ejercicio Observe el siguiente diagrama de caja, el cual

representa la Deuda morosa de 5.400 clientes de la empresa CONAFE residentes en la comuna de Viña del Mar (Miles de $)

Realice 5 afirmaciones

Ejercicio1. El 25% de los deudores, deben

entre 10 y 20 mil pesos.

2. De los deudores, el 50% adeuda, cuando más, $35.000.

3. El 75% de los deudores, deben más de 20 mil pesos.

4. El 25% de los deudores, deben a lo menos $40 mil a CONAFE.

5. El 50% de los deudores, deben entre 20 y 40 mil pesos.

Deciles Los deciles son puntos o

medidas que dividen a la muestra ordenada en diez grupos de igual tamaño.

Se denota Di el decil i- ésimo con i = 1,2,3,...,9

Ejemplo: Calcular el decil 3 y 7 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo

Deciles Calculo del 3º decil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a D3 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de

(3n)/10

Con n= 27 3n/10 = 3x27/10 = 8,1

La frecuencia absoluta acumulada que supera a 8,1 pertenece al 2º intervalo [2-4)

Deciles Calculo del 3º decil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del decil

C: amplitud del intervalo del decil.

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del decil.

nk: Frecuencia absoluta del intervalo del decil.

Di: Número del decil.

Deciles

Interpretación:

El 30% de los accidentes ocurren antes que el trabajador cumpla 2,38 horas de trabajo y el 70% restante de los accidentes ocurren sobre las 2,38 horas de trabajo.

Deciles Calculo del 7º decil.

Con n= 27 7n/10 = 7x27/10 = 18,9

El intervalo del 7º decil es [4 – 6)

Reemplazando:

D7 = 4 + 2 x [ (18,9 – 17)/5 ]

D7 = 4,76 Horas

Interpretación: El 70% de los accidentes ocurren antes que el trabajador cumpla 4,76 horas de trabajo y el 30% restante de los accidentes ocurren sobre las 4,76 horas de trabajo.

Ejercicio Propuesto La siguiente información corresponde al consumo mensual

en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:

Calcule el 4º decil e interprete

Percentiles Los percentiles son

puntos o medidas que dividen a la muestra ordenada en cien grupos de igual tamaño.

Se denota Pi el perceptili- ésimo con i = 1,2,3,...,99

Ejemplo: Calcular el percentil 10 y 95 de la siguiente tabla de horas asociadas hasta que ocurre un trabajo

Percentiles Calculo del 10º percentil.

1. Se construye la tabla de distribución de frecuencias acumuladas.

2. Se identifica la clase que contiene a P10 determinando la menor de las frecuencias absolutas acumuladas Nk que supere el valor de

(10n)/100

Con n= 27 10n/100 = 10x27/100 = 2,7

La frecuencia absoluta acumulada que supera a 2,7 pertenece al 1º intervalo [0-2)

Percentiles Calculo del 10º percentil.

3. Se utiliza la siguiente formula de interpolación:

Li: limite inferior de la clase del percentil.

C: amplitud del intervalo del percentil.

Nk-1: Frecuencia absoluta acumulada del intervalo anterior al del percentil.

nk: Frecuencia absoluta del intervalo del percentil.

Pi: Número del percentil.

Percentiles

Interpretación:

El 10% de los accidentes ocurren antes que el trabajador cumpla 0,9 horas de trabajo y el 90% restante de los accidentes ocurren sobre las 0,9 horas de trabajo.

Percentiles Calculo del percentil 95

Con n= 27 95n/100 = 95x27/100 = 25,65

El intervalo del percentil 95 es [8 – 10]

Reemplazando: P95 = 8 + 3 x [ (25,65 – 24)/3 ] P95 = 9,65 Horas

Interpretación: El 95% de los accidentes ocurren antes que el trabajador cumpla 9,65 horas de trabajo y el 5% restante de los accidentes ocurren sobre las 9,65 horas de trabajo.

Ejercicio Propuesto La siguiente información corresponde al consumo mensual

en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno:

Calcule el percentil 75 e interprete

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA

Estadígrafos de Dispersión: Varianza, desviación Estándar

y Coeficiente de Variación

Estadígrafos de dispersión

Por si solas las Medidas de Posición no permiten caracterizar de cómo es una distribución.

Las Medidas de Dispersión, indican como se distribuyen las observaciones, generalmente con respecto a la media.

La dispersión se relaciona con la mayor o menor concentración de datos en torno a un valor central generalmente el promedio o media.

Varianza y Desviación Estándar Ambos estadígrafos están

relacionados.

La varianza se define, en datos no agrupados, como:

También se le define como:

La varianza se define, en datos agrupados, como:

n: Números de elementos de lamuestra.

: Media aritmética o promedio.

Xi: Valor de la variable.

ni: Frecuencia absoluta de la variable.

Varianza y Desviación Estándar

La Desviación Estándar o Desviación Típica es la raíz cuadrada de la varianza.

Para los datos no agrupados.

Para los datos agrupados.

Ejercicio Se dispone de la siguiente información sobre el consumo de

un producto envasado en latas.

Se encuestó a un grupo de 20 familias y se interrogó: ¿cuántas unidades de este producto, mensualmente consume su grupo familiar?

Calcule: Media Aritmética, Varianza y Desviación Estándar

Ejercicio RESULTADO: Media Aritmética: 2,3 unidades. Varianza: 2,61 unidades Desviación Estándar: 1,62 unidades.

Se clasifican los ingresos mensuales de los trabajadores, de una empresa (en miles de pesos), obteniéndose los siguientes resultados.

Calcule: Varianza y Desviación Estándar

Ejercicio

RESULTADO:

Media Aritmética: 675,93 pesos.

Varianza: 7150,62 pesos

Desviación Estándar: 84,30 pesos

Coeficiente de Variación

El coeficiente de variación permite comparar la dispersión entre dos poblaciones distintas e incluso, comparar la variación producto de dos variables diferentes (que pueden provenir de una misma población).

Formula:

Ejercicio La siguiente tabla muestra las horas de trabajo

transcurridas hasta que un trabajador sufre un accidente de trabajo, investigación realizada a una muestra de 27 accidentes de trabajo.

Calcule el coeficiente de variación e interprete.

Ejercicio

La media aritmética y la desviación estándar es:

El cálculo de coeficiente de variación:

Esto significa que existe una dispersión de un 62,98% en relación a la media.

Ejercicio

Se conoce la información respecto de los ingresos de los trabajadores de dos secciones de una empresa, A y B.

El ingreso promedio de los trabajadores de la sección A es de $950.000 con una desviación típica de $98.000.

Los trabajadores de la sección B tienen un ingreso promedio de $1.2000.000 con una desviación típica de $180.000

¿En cual de las dos secciones existe una dispersión relativa mayor? Justifique su respuesta.

Ejercicio

Dispersión relativa mayor en la sección B.

Asimetría Esta medida nos permite identificar si los datos se

distribuyen de forma uniforme alrededor del punto central (Media aritmética).

La asimetría presenta tres estados diferentes Se dice que la asimetría es positiva cuando la

mayoría de los datos se encuentran por encima del valor de la media aritmética,

La curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la curva.

Asimetría

La asimetría negativa es cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Asimetría

(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).

(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.

Asimetría

(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.

Entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.

Curtosis Esta medida determina el grado de concentración que

presentan los valores en la región central de la distribución.

Por medio del Coeficiente de Curtosis, se puede identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).

Curtosis (g2 = 0): la distribución es Mesocúrtica: Al igual

que en la asimetría es bastante difícil  encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.).

(g2 > 0): la distribución es Leptocúrtica

(g2 < 0): la distribución es Platicúrtica

ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA