Tema 2 presentación

Preview:

Citation preview

Tema 2: Parámetros estadísticos

1.Parámetros estadísticos tipos

1.1. Medidas de centralizaciónMedia aritmética:La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresión:

xi representa el valor de la variable o en su caso la marca de clase.

La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G.

Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.

Media geométrica:

Media armónica

La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H

Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente.

Moda

La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima.

1.2. Medidas de posición

Mediana

La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra.Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.

Cálculo de la mediana en el caso discreto:Tendremos en cuenta el tamaño de la muestra.

Si N es Impar, hay un término central, el término que será el valor de la mediana.

Si N es Par, hay dos términos centrales, la mediana será la media de esos dos valores.

Cuartiles

Medida de localización que divide la población o muestra en cuatro partes iguales.-Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.

-Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = mediana.

-Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.

Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de variable.

Percentiles

Medida de localización que divide la población o muestra en 100 partes igualesNo tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las variables continuas.

1.3. Medidas de dispersión

Rango

Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular.Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media.

Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .

No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.

Rango intercuartílico

El rango intercuartílico es una medida de variabilidad adecuada cuando la medida de posición central empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil (Q3) y el

primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil se le conoce como

desviación cuartil (DQ): DQ = RQ/2= (Q3 – Q1)/2.

Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.

Desviación

Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.

Varianza

Es la media de los cuadrados de las desviaciones, y la denotaremos por o también por

Desviación Típica

Es la raíz cuadrada de la varianza, se denota por Sx o s x.

Medidas de forma

Evalúa la forma que adopta la distribución de frecuencias respecto al grado de distorsión (inclinación) que registra respecto a valor promedio tomado como centro de gravedad, el grado de apuntamiento (elevamiento) de la distribución de frecuencias. A mayor elevamiento de la distribución de frecuencia significará mayor concentración de los datos en torno al promedio,por tanto, una menor dispersión de los datos. Estas medidas son:

Asimetría o Sesgo

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética)

Curtosis

Esta medida determina el grado de concentración que presentan los valores en la región central de la distribucióPara calcular el coeficiente de Curtosis se utiliza la ecuación:

2.Interpretación de la media y la desviación típica

Desigualdad de Tchebycheff

La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estándar de la media es al menos 1- (1/k2)

Este matemático descubrió que la fracción del área entre 2 valores simétricos cualesquiera alrededor de la media está relacionada con la desviación estándar.

Coeficiente de variación

En estadística el coeficiente de variación (a distintas escalas pero que están correlacionadas estadísticamente y sustantivamente con un factor en común. Es decir, ambas variables tienen una relación causal con ese factor. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar.

Exigimos que: media>0

Se calcula:

Cv= desviación típica/media aritmética

Donde σ es la desviación típica. Se puede dar en tanto por ciento calculando:

Cv= (desviación típica/ media aritmética) x 100

Transformaciones de variables (suma y producto)

si tenemos una variables como por ejemplo estas:

y realizamos la media de dicha variable:

6+12+12+4/4=8,58,5 es la media aritmética de estas variables, si ahora queremos realizar una transformación en los datos estadísticos (sumando o multiplicando los datos estadísticos) para no volver a tener que realizar de nuevo la media aritmética y las demás medidas, sencillamente se le suma al resultado anterior de la media aritmética la transformación a realizar en xi, por ejemplo si ahora queremos sumar a cada dato estadístico 3, sabríamos de antemano que el resultado de la media aritmética es 11,5. y con el producto seria lo mismo pero no se sumaria sino se multiplicaría.

xi 1 2 3 4ni 6 12 12 4

Recommended