12
Un parámetro estadístico es un número que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población. Existen principalmente tres tipos de parámetros estadísticos: de posición, dispersión y forma: 1. PARÁMETROS DE POSICIÓN Permiten identificar el valor en torno al cual se agrupan mayoritariamente los datos, es decir, cuyo valor es representativo de todos ellos. Pueden ser de dos tipos: MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA Y MODA. Media Aritmética Es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos ¯ x= i =1 N x i N Ejemplo: Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Clase de Parametros

Embed Size (px)

DESCRIPTION

estadistitica

Citation preview

Un parmetro estadstico es un nmero que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadstica. El clculo de este nmero est bien definido, usualmente mediante una frmula aritmtica obtenida a partir de datos de la poblacin.Existen principalmente tres tipos de parmetros estadsticos: de posicin, dispersin y forma:

1. PARMETROS DE POSICINPermiten identificar el valor en torno al cual se agrupan mayoritariamente los datos, es decir, cuyo valor es representativo de todos ellos. Pueden ser de dos tipos:MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA Y MODA. Media AritmticaEs elvalorobtenido alsumartodos losdatosy dividirel resultado entre elnmerototal dedatos

Ejemplo:Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

En general, la media no ser un buen parmetro de posicin cuando la distribucin de los datos sea asimtrica, al ser muy sensible a los valores extremos de la variable.

Mediana Es elvalorque ocupa ellugar centralde todos losdatoscuando stos estnordenados de menor a mayor. Lamedianase representa porMe. Lamedianase puedehallarslo paravariables cuantitativas. Ejemplo Hallar lamedianade las siguientes series de nmeros: 3, 5, 2, 6, 5, 9, 5, 2, 8. 2, 2, 3, 5, 5, 5, 6, 8, 9Me =5 3, 5, 2, 6, 5, 9, 5, 2, 8, 6, 2, 2, 3, 5, 5, 5, 6, 6, 8, 9.10/2 = 5

Moda Es elvalorque tienemayor frecuencia absoluta.Se representa porMo.Se puede hallar lamodaparavariables cualitativasycuantitativas.

Ejemplo: Hallarlamodade la distribucin:2, 3, 3, 4, 4, 4, 5, 5Mo= 4

MEDIDAS DE POSICIN NO CENTRALSe trata de valores de la variable estadstica que dejan por debajo de s determinada cantidad de los datos. Mientras que la mediana deja por debajo de s al 50% de la distribucin, los cuantiles pueden hacerlo con cualquier otro porcentaje. Los ms frecuentemente utilizados son cuartiles, si se divide la cantidad de datos en cuatro partes. A estos cuartiles se les denomina y representa de la siguiente manera: Primer cuartil, C1. Valor que deja por debajo el 25% de los datos y por encima el 75% de los datos. Segundo cuartil, C2. Coincide con la mediana. Deja el 50% de los valores por debajo y por encima. Tercer cuartil, C3. Valor que deja por debajo el 75% de los datos y por encima el 25% de los datos.Para calcular C1 y C3, ordenados los datos de menor a mayor, se procede de la siguiente forma: Si N es un nmero par, entonces C1 es la mediana de los N/2 primeros datos y C3 la mediana de los N/2 ltimos datos. Si N es un nmero impar, entonces tenemos dos posibilidades:

es impar. C1 es la mediana de los primeros datos. C3 es la mediana de los ltimos datos.

es par. C1 es la mediana de los primeros +C2 datos y C3 la mediana de los ltimos +C2 datosPor ejemplo Los siguientes datos muestran el nmero de despedidos que se han producido en 15 empresas del sector del automvil durante el ao 2010:

33569164556024232266340253484

Hallar los cuartiles.Lo primero que debemos hacer es ordenar los datos de menor a mayor:

123456789101112131415

22526323334404255566063648491

Se trata de un nmero impar de datos, luego la mediana es el valor central que ocupa la posicin (N+1)/2 o en nuestro caso (15+1)/2=8, es decir, el dato 42.Para el primer y el tercer cuartil, tenemos que N es impar (15) y que (N-1)/2=7 es impar. Por tanto, el primer cuartil C1 es la media de los primeros (N-1)/2 datos, como son 7 datos, ser entonces el dato central de los primeros (N-1)/2 datos, o el dato 4. Luego C1=32Para C3 seguimos el mismo procedimiento, con lo que C3=63.

2. PARMETROS DE DISPERSIN Las medidas de posicin resumen la distribucin de datos, pero resultan insuficientes y simplifican excesivamente la informacin. Estas medidas adquieren verdadero significado cuando van acompaadas de otras que informen sobre la heterogeneidad de los datos. Estas medidas se conocen como parmetros de dispersin y miden en qu medida los datos se agrupan entorno a un valor central.Hay medidas de dispersin absolutas, entre las cuales se encuentran la varianza, la desviacin tpica o el recorrido y medidas de dispersin relativas, como el coeficiente de variacin. Las medidas absolutas tienen que ir acompaadas de un parmetro de posicin, normalmente la media, y no permiten comparaciones entre distintas muestras. Las medidas relativas suelen ser adimensionales por lo que permiten la comparacin entre distintas muestras. Los estadsticos de dispersin ms relevantes son:1. Recorrido o RangoEs la medida de dispersin ms sencilla de calcular. Es la diferencia entre el mayor y el menor valor que toma la variable. Es una medida poco precisa ya que slo toma en consideracin un par de observaciones y puede verse afectada por valores extremos.

Por ejemplo: Hallar el rango de los datos 2, 9, 8, 9, 15, 21, 5, 20.El Rango quedara 21-2=19.

2. Intervalo Intercuartlico: Se define como la diferencia entre el tercer y primer cuartil. En ese rango estn, por la propia definicin de los cuartiles, el 50% de las observaciones. Este tipo de medidas tambin se usa para determinar valores atpicos.

Por ejemplo:Hallar el Intervalo Intercuartlico de los datos 2, 9, 8, 15, 21, 5, 20.

Para el clculo de los cuartiles debemos ordenar los datos de menor a mayor: 2, 5, 8, 9, 15, 20, 21. El C1 ser igual a 5 y el C3 igual a 20, con lo que el Intervalo Intercuartlico tendr un valor de 15.

3. Varianza y Desviacin TpicaLa varianza se define como:

Donde es el valor de la media aritmtica y xi el valor de cada dato. Para evitar el inconveniente de que est expresado en las mismas unidades que la media pero elevadas al cuadrado, suele utilizarse la desviacin tpica (S), que no es ms que la raz cuadrada de la varianza:

La varianza cumple tres propiedades bsicas: La varianza y la desviacin tpica no varan si a cada valor de la variable se le suma una constante. Es decir, si Y=a+X entonces, Si una variable Z es la suma de dos variables X e Y, la varianza de Z es la suma de las varianzas de X e Y, es decir, si Z=X+Y entonces, Siguiendo lo anterior, si una variable Y es una transformada lineal de otra variable X, es decir, Y=a+bX, la varianza de Y es tambin la transformada lineal de la varianza de X, esto es .Por ejemplo: La varianza y desviacin tpica de los datos 2, 9, 8, 15, 21, 5, 20, seran respectivamente 49,18 y 6,82.

4. Coeficiente de Variacin de PearsonSe define como cociente entre la desviacin tpica y la media:

Se interpreta como el nmero de veces que la media est contenida en la desviacin tpica. Suele darse su valor en tanto por ciento, multiplicando el resultado anterior por 100. De este modo se obtiene un porcentaje de la variabilidad.

3. PARMETROS DE FORMALas variables aleatorias continuas presentan frecuentemente una pauta de variabilidad que se caracteriza por el hecho de que los datos tienden a acumularse en torno a un valor central, que coincide con la media, decreciendo su frecuencia de forma aproximadamente simtrica a medida que se alejan por ambos lados de dicho valor. Los histogramas de estas variables continuas tienen forma de campana de Gauss, que es el modelo matemtico de la distribucin normal, siendo la distribucin que con ms frecuencia aparece en multitud fenmenos reales.

Los parmetros de forma son indicativos de la forma tpica que presenta la grfica o histograma de los datos, es decir de cmo se distribuyen. Entre ellas destacan el coeficiente de asimetra y curtosis.

1. Coeficiente de AsimetraLas medidas de asimetra permiten conocer si los datos estn dispuestos de forma simtrica en torno a un valor central de posicin, que generalmente es la media aritmtica.Para saber qu grado de asimetra presentan los datos es necesario el llamado Coeficiente de Asimetra (C.A), que se define como:

Si unos datos son simtricos, lo son respecto a su media y la suma de los cubos de las desviaciones de los datos respecto a su media ser nula.Por el contrario, tendremos una asimetra positiva (C.A > 0), cuando la media est a la derecha de la mediana y grficamente se obtiene un histograma en forma de L con una cola hacia la derecha, como se muestra en la figura 2. As mismo, existe asimetra negativa (C.A