27
Medidas de dispersión • Dispersión: indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Rango, Desviación típica, coeficiente de variación, varianza

Dispersion

Embed Size (px)

DESCRIPTION

Dispersion

Citation preview

  • Medidas de dispersin

    Dispersin: indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin. Rango, Desviacin tpica, coeficiente de variacin, varianza

  • Para datos no agrupados, la amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos.AMPLITUD = valor mayor - valor menor

    EJEMPLO 4: una muestra de cinco graduados de contadura indic los siguientes salarios iniciales: $22 000, $28 000, $31 000, 23 000, $24 000. La amplitud es $31 000 - $22 000 = $9 000.4-12

  • Desviacin mediaDesviacin media: es el promedio aritmtico de los valores absolutos de las desviaciones con respecto a la media aritmtica.4-3

  • EJEMPLO Los pesos de una muestra de cajas con libros en una librera son (en lb) 103, 97, 101, 106 y 103.

    X = 510/5 = 102 lb = 1 + 5 + 1 + 4 + 1 = 12MD = 12/5 = 2.4Por lo comn los pesos de las cajas estn a 2.4 lb del peso medio de 102 lb. 4-4

  • Variancia de la poblacin La varianza de la poblacin para datos no agrupados es la media aritmtica de las desviaciones cuadrticas respecto a la media de la poblacin.

    4-5

  • EJEMPLO 2Las edades de la familia Dunn son 2, 18, 34, y 42 aos. Cul es la variancia de la poblacin? 4-6

  • Variancia poblacionalUna frmula alternativa para la variancia poblacional es: 4-7

  • Desviacin estndar poblacionalLa desviacin estndar poblacional () es la raz cuadrada de la variancia de la poblacin.

    Para el EJEMPLO 2, la desviacin estndar poblacional es 15.19 (raz cuadrada de 230.81).4-8

  • Variancia muestralLa variancia muestral estima la variancia de la poblacin. 4-9Nota: el n -1 se trabaja para estadstica inferencial.

  • EJEMPLO 3Una muestra de cinco salarios por hora para varios trabajos en el rea es: $7, $5, $11, $8, $6. Encuentre la variancia. X = 37/5 = 7.40 = 21.2/(5-1) = 5.34-10

  • Desviacin estndar muestralLa desviacin estndar muestral es la raz cuadrada de la variancia muestral.

    En el EJEMPLO 3, la desviacin estndar de la muestra es = 2.30 4-11

  • Variancia muestral para datos agrupadosLa frmula de la variancia para datos agrupados usada como estimador de la variancia poblacional es:

    donde f es la frecuencia de clase y X es el punto medio de la clase.4-13

  • Interpretacin y usos de la desviacin estndarTeorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1.4-14

  • Interpretacin y usos de la deviacin estndarRegla emprica: para una distribucin de frecuencias simtrica de campana, cerca de 68% de las observaciones estar dentro de 1 de la media (); cerca de 95% de las observaciones estar dentro de 2 de la media (); alrededor de 99.7% estar dentro de 3 de la media ().4-15

  • 3m 2001 Alfaomega Grupo EditorCurva en forma de campana que muestra la relacin entre y 21+1+2+3

  • Dispersin relativaEl coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica, expresada como porcentaje:4-17

  • AsimetraAsimetra (sesgo) es la medida de la falta de simetra en una distribucin.El coeficiente de asimetra se calcula mediante la siguiente frmula:

    3(media - mediana) desviacin estndar4-18Sk =

  • Amplitud intercuartlicaLa amplitud intercuartlica es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.Amplitud intercuartlica = tercer cuartil - primer cuartil = Q3 - Q1 4-19

  • Primer cuartilEl primer cuartil es el valor correspondiente al punto debajo del cual se encuentra el 25% de las observaciones en un conjunto ordenado de datos.

    donde L = lmite de las clases que contienen Q1, CF = frecuencia acumulda que precede a la clase que contiene a Q1, f = frecuencia de la clase que contiene Q1, i= tamao de la clase que contiene Q1.4-20

  • Tercer cuartilEl tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75% de las observaciones en un conjunto ordenado de datos:

    donde L = lmite inferior de la clase que contiene a Q3, CF = frecuencia acumulada precedente a la clase que contiene a Q3, f = frequencia de la clase que contiene a Q3, i = tamao de la clase que contiene a Q3.4-21

  • Desviacin cuartlicaLa desviacin cuartlica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero, Q1.QD = [Q3 - Q1]/24-22

  • EJEMPLO 5Si el tercer cuartil = 24 y el primer cuartil = 10, cul es la desviacin cuartlica? La amplitud intercuartlica es 24 - 10 = 14; por lo tanto, la desviacin cuartlica es 14/2 = 7. 4-23

  • Amplitud cuartlicaCada conjunto de datos tiene 99 porcentiles, que dividen el conjunto en 100 partes iguales.La amplitud cuartlica es la distancia entre dos porcentiles establecidos. La amplitud cuartlica 10 a 90 es la distancia entre el 10 y 90 porcentiles.4-24

  • Frmula para porcentiles4-25

  • Diagramas de cajaUn diagrama de caja es una ilustracin grfica, basada en cuartiles, que ayuda a visualizar un conjunto de datos.Se requieren cinco tipos de datos para construir un diagrama de caja: el valor mnimo, el primer cuartil, la mediana, el tercer cuartil, y el valor mximo.4-26

  • EJEMPLO 6Con base en una muestra de 20 entregas, Marcos Pizza determin la siguiente informacin: valor mnimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos, valor mximo = 30 minutos. Desarrolle un diagrama de caja para los tiempos de entrega.4-27

  • EJEMPLO 6 continuacin

    mediana mn Q1 Q3 mx

    12 14 16 18 20 22 24 26 28 30 32 4-28