13

Click here to load reader

Estadistica Descriptiva

Embed Size (px)

Citation preview

Page 1: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 1 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

GUÍA DE REPASO N°2

DESCRIPCIONES ESTADÍSTICAS

Hasta ahora hemos visto que, según la pertinencia y la necesidad del caso, podemos agregar valor al análisis de datos (en una variable) cuando realizamos algunas de las siguientes acciones: • Ordenando los datos de forma ascendente o descendente. • Presentando los datos sin agrupar en una Tabla de Distribución de Frecuencias. • Agrupando los datos en clases y presentando dichas clases en una Tabla de Distribución de Frecuencias. • Graficando los resultados de las Tablas de Distribución de Frecuencias. Sin embargo, podemos resumir aún más la información utilizando las Descripciones Estadísticas, las cuales, son medidas que resumen, en un valor, características del conjunto de datos. De estas características, hay dos que son muy importantes:

DESCRIPCIONES ESTADÍSTICAS

DE POSICIÓN

MEDIDAS DETENDENCIA CENTRAL

FRACTILES

MEDIANA

MEDIA ARITMÉTICA

MODA

MEDIA PONDERADA

MEDIA GEOMÉTRICA

MEDIAARMÓNICA

DECILES

CUARTILES

PERCENTILES

DE DISPERSIÓN

RECORRIDO(ALCANCE Ó RANGO)

DESVIACIÓNMEDIA

RANGOSMODIFICADOS

ALCANCE INTERCUARTIL

ALCANCEINTERDECIL

ALCANCEINTERPERCENTIL

VARIANZA

DESVIACIÓNESTANDAR

Existen otras dos características que proporcionan información útil:

• Sesgo vs Simetría • Curtosis (grado de agudeza). Además de comprender el significado de cada una de estas medidas, vamos a aprender a calcularlas: manualmente, con la calculadora y con la computadora, utilizando Excel y/o los programas estadísticos (por ejemplo: SPSS, MINITAB, otros) Es importante saber que los cálculos de una medida estadística son diferentes si los datos están o no agrupados

DATOS NO AGRUPADOS

DATOS AGRUPADOS

Page 2: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 2 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10 MEDIDAS DE POSICIÓN Describen la forma como se amontonan los datos en su conjunto. El objetivo de estas medidas es describir de alguna manera el centro o mitad de un conjunto de datos, buscar un valor que sea representativo de todos los valores incluidos en el conjunto de datos. Entre ellas están:

LA MEDIA ARITMÉTICA Es la más conocida y la más usada de las medidas de tendencia central. También se le llama promedio, pero en Estadística existen otros tipos de promedio, por lo cual se considera conveniente denominarla “media aritmética” Se define como la suma de los valores dividida entre el número de valores.

Media Aritmética de una MUESTRA )(x

La media aritmética de un conjunto de datos que corresponden a una muestra se calcula por la siguiente ecuación:

n

xx i∑

= Donde: muestra la de tamañon

observados valoreslos todosde

=

=∑ sumaxi

Media Aritmética de una POBLACIÓN: La media aritmética se calcula de igual forma, solo que N= número de elementos de la población, y se designa de la siguiente forma:

x∑=µ Donde:

población la de tamañoN

población la de valoreslos todosde

=

=∑ sumaxi

CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS: Cuando se tiene una distribución de frecuencias cuyos datos están agrupados en clases, no se sabe el valor de cada observación, solo se sabe que la misma se encuentra en una clase determinada. Entonces, solo se puede calcular una aproximación de la media, asumiendo que el punto medio de cada clase (o marca de clase) representará a todos los valores contenidos en cada una de las clases. Los pasos a seguir para calcular la media son: • Se determina el punto medio de cada clase. Se redondean las cantidades, en caso de que no resulten cifras cerradas. • Se multiplica el punto medio de cada clase por la frecuencia correspondiente a dicha clase. • Se suman todos los resultados de las multiplicaciones. • Se divide el total de la suma entre el número total de observaciones (“n” o “N”, según el caso) La media de una Muestra, para datos agrupados, se calcula:

n

xfx

m∑ ∗=

).( Donde:

clase cada de Marca

muestra la de Tamaño n

=

=

=

imx

clasecadadefrecuenciaif

La media de una Población, para datos agrupados, se calcula:

xf m∑=

)*(µ

Page 3: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 3 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10 PROPIEDADES DE LA MEDIA ARITMÉTICA: • Es un concepto muy conocido y muy aplicado. • Siempre existe y es única: A cualquier conjunto de datos numéricos se le puede calcular la media aritmética y este valor resultante

será único. • Es útil para comparar medias de varios conjuntos de datos. • Es relativamente confiable: Si tomamos varias muestras de una misma población y a cada una le calculamos su media aritmética,

por lo general, éstas no varían significativamente. • Toma en cuenta todos y cada uno de los elementos de los datos. DESVENTAJAS DE LA MEDIA ARITMÉTICA: • A veces las muestras pueden contener valores aberrantes (que se apartan de los demás datos por ser muy grandes o muy

pequeños). Al promediar estos valores con los demás, se afecta el valor de la media hasta tal punto que no se pueda tomar como una medida que represente el centro de los datos.

• Cuando se trata de muchas observaciones o datos, el cálculo de la Media es tedioso, a menos que busquemos una aproximación de la misma, agrupando los datos en clases.

• Cuando los datos están agrupados en clases, la media no se puede calcular para un conjunto de clases de extremo abierto.

LA MEDIANA ( x~ ó Me )

Es el valor que divide los datos en dos partes iguales. El 50% de los datos son menores a la mediana, y el otro 50% son mayores que ella. Si ordenamos los datos en forma ascendente o descendente, la mediana se define como: • El valor que se encuentra en el centro del conjunto de datos cuando el total de elementos es un número impar. Ejemplo: Si el

tamaño de la muestra es 75, la mediana será el valor que ocupe la posición Nº 38 en los datos ordenados. • El promedio de los dos valores centrales cuando el total de elementos es par. Ejemplo: si n= 600 la mediana será el promedio de

los dos datos que ocupan la posición 300 y 301. CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS: Cuando no se tiene acceso al conjunto de datos, sino que se presentan ya agrupados, no se podrá indicar exactamente cuál será el valor que divide los datos en dos partes. Lo que sí se puede hacer se explicará con un ejemplo: Hallar la mediana para los siguientes datos agrupados Saldos mensuales promedio en miles de Bs

Clases (miles de Bs)

Frecuencia Frecuencia Acumulada

0,00 - 50,00 78 78 50.00 - 100,00 123 201 100,00 - 150,00 187 388 150,00 - 200,00 82 470 200.00 - 250,00 51 521 250,00 - 300,00 47 568 300,00 - 350,00 13 581 350,00 - 400,00 9 590 400.00 - 450,00 6 596 450,00 - 500,00 4 600 Total 600

Fuente: Levin/Rubin , 6ªEd. P.99

• Se toma la mediana como n/2 , es decir 600 / 2=300. • Sumando las frecuencias 78+123=201 se observa que

el dato que ocupa la posición 300 se encuentra en la tercera clase.

• Se hace la suposición que en esta tercera clase, cuya amplitud es de 50$ (150$ menos100$) se distribuyen uniformemente sus 187 datos. Se aplica una regla de tres:

50$ ------------- 187 x $ ------------- (300 - 201)

126,47$ 50*187

)201300( $ 100 $ =

−+=x

Este resultado se interpreta como sigue”Se estima que la mitad de los 600 clientes observados tienen un saldo menor o igual a 126,47$.

En forma general se puede calcular la mediana para Datos agrupados utilizando la siguiente fórmula

:

Page 4: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 4 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

A* 2 L ~ i

+==me

antes

f

Fn

xMe

medianal clase la de Amplitud A

medianal clase absoluta frecuenciamef

medianal clase la aanterior Acum. Absoluta FrecuenciaantesF

muestra la de tamañon

medianal clase la deInferior Límite i

L

~

=

=

=

=

=

== MedianaxMe

VENTAJAS DE LA MEDIANA: • Los valores extremos no afectan a la Mediana como afectan a la Media. • Es fácil de entender y se puede calcular tanto en datos no agrupados como agrupados. • Podemos usar la mediana cuando los datos son expresiones cualitativas y los podemos expresar en escala ordinal (rangos)

Ejemplo: Deficiente, Regular, Bueno, Eficiente, Excelente. Cuál será la Mediana? • Cuando el rango es muy grande (es decir, existen grandes variaciones en los datos) la mediana puede ser mucho más significativa

que la media aritmética. DESVENTAJAS DE LA MEDIANA: • Se deben ordenar los datos antes de calcular la Mediana. • Algunos procedimientos estadísticos que utilizan la Mediana son más complejos que aquellos que usan la Media • No se puede calcular cuando los datos están agrupados y la clase medianal cae en un intervalo abierto.

LA MODA (Mo)

Es el valor que más se repite en un conjunto de datos. Es decir aquel valor que posee la máxima frecuencia. Puede existir más de una moda. Cuando hay dos modas se habla de Distribución Bimodal.

VENTAJAS DE LA MODA: • Se puede usar para datos cualitativos y cuantitativos • No se ve afectada por los valores extremos • Se puede usar cuando existen clases de extremo abierto.

DESVENTAJAS DE LA MODA: • No siempre existe. Nos podemos encontrar conjuntos de datos que no repiten valores, por lo que no existe valor modal. • Si existe, no siempre es única, por lo que resulta difícil de interpretar y comparar. • Puede darse el caso de que un solo elemento no representativo se repita y sea el valor con mayor frecuencia. Es por ello que la

moda rara vez se usa. Se recomienda que cuando se vaya a usar la Moda como medida de tendencia central se calcule la Moda para Datos Agrupados.

CÁLCULO DE LA MODA PARA DATOS AGRUPADOS:

A* )()(

)( iL

−+−

−+=

despfmofantesfmof

antesfmofMo

Donde

modal clase la de Amplitud A

modal clase absol. frec.mo

f

modal clase aposterior absol frec.desp

f

modal clase la aanterior absol. rec.antes

f

muestra la de tamañon

modal clase la deInferior Límite i

L

=

=

=

=

=

=

=

f

ModaMo

Page 5: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 5 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

FRACTILES (CUARTILES, DECILES, PERCENTILES)

Señalan la ubicación de los datos (no necesariamente de los datos centrales). Ejemplo: el tercer cuartil, el sexto decil, el 85º percentil. En forma general se calcula la posición del fractil:

nc

i *4

=

nd

i *10

=

np

i *100

=

i= la ubicación del dato requerido n= tamaño de la muestra c= cuartil. (Ej: c=1 si buscamos el 1º cuartil) d= decil. (Ej: d=2 si buscamos el 2º decil) p= percentil (Ej: p=34 si buscamos el 34º percentil) � Si “i” resulta número entero el fractil será el valor promedio entre xi y x i+1 . � Si “i” resulta número no entero el fractil será el valor que ocupe la posición “i+1”. Es decir: xi+1

Recurrimos a ejemplos para calcular cualquier fractil: Hallar el 3º cuartil , el 6º decil y el 85º percentil del siguiente conjunto de datos:

Sueldos mensuales iniciales para una muestra de 12 egresados de una escuela de Administracion:

2210 2380 2420 2550 2255 2380 2440 2630 2350 2390 2450 2825

Fuente: Anderson,7ºEd. P.69

Tercer Cuartil -> 912*4

3*

4

3=== ni

Como “i” resultó ser un número entero (9) entonces el tercer cuartil será el promedio entre la novena y la décima (10º) posición: Tercer Cuartil = (2450+2550)/2 = 2500

Sexto Decil -> 2,712*10

6*

10

6=== ni

Como “i” resultó no ser un número entero (7,2) entonces el sexto decil será el dato que ocupe la octava (8º) posición: Sexto Decil=2440

85º Percentil -> 2,1012*100

85*

100

85=== ni

Como “i” resultó no ser un número entero (10,2) entonces el 85ºpercentil será el dato que ocupe la décimo primera (11º) posición. 85º percentil = 2630

UBICACIÓN DE LOS FRACTILES EN DATOS AGRUPADOS De la misma manera que se calcula la mediana para datos agrupados se ubican los fractiles: Primer Cuartil Tercer Cuartil

A*

1

4

1

inferior

exactoL 1

+=

Qf

antesFn

Q

A* 4

3

L 3

inferiorexacto3

+=Q

antes

f

Fn

Q

Page 6: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 6 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10 Octavo Decil Segundo Decil

A*

10

8

L 8

inferiorexacto8

+=D

antes

f

Fn

D

A* 10

2

L 2

inferiorexacto2

+=D

antes

f

Fn

D

90º Percentil Décimo Percentil

A*

100

90

L 90

inferiorexacto90

+=P

antes

f

Fn

P

A* 100

10

L 10

inferiorexacto10

+=P

antes

f

Fn

P

MEDIA PONDERADA (MEDIA PESADA O PROMEDIO PONDERADO): Es la media aritmética que toma en cuenta la importancia que tiene cada valor en relación con el total. Por lo tanto para calcular esta medida, es preciso asignarle un “peso” (importancia relativa) que se le llamará factor de ponderación “p”. Entonces se multiplica cada valor por el factor de ponderación asignado, se suman estos resultados y se divide por la suma de todos los factores de ponderación. Las fórmulas para la media ponderada muestral y poblacional son idénticas, como sigue:

∑=

p

xipx p

).(

∑∑

=p

xp i

p

).(µ

MEDIA GEOMÉTRICA Se utiliza para medir la tasa promedio de cambio o de crecimiento de alguna variable

nxxxxG ⋅⋅⋅⋅∗∗∗= 321

MEDIA ARMÓNICA )( Hx Es la recíproca de la media aritmética de los recíprocos de los datos. Se utiliza frecuentemente para promediar velocidades, donde las distancias para cada velocidad son las mismas

∑∑==

x

n

n

x

xH 11

1

Page 7: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 7 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

EJERCICIOS

1. Calcule la media, la mediana y la moda para todos los conjuntos de datos (sin agrupar) que hemos visto como ejemplo. Seleccione la medida, que Usted considera, que mejor refleja la tendencia central de los datos. Además de los siguientes ejercicios:

Edad Estudiantes de Ingeniería Industrial

19 21 21 25 21 21 18 18 20 20 20 22 24 23 20 21 21 19 22 22 23 20 22 19 19 21 20 18 20 24 21 22 21 22 21 21 21 20

Peso Estudiantes de Ingeniería Industrial

56.5 51,0 55,0 50,0 70,0 56,0 52,0 50,0 65,0 78,0 86,0 54,0 56,0 51,0 64.5 50,0 65,0 52,0 78,0 41,0 56,0 53,0 52,0 52,0 52,0 55,0 50,0 75,0 75,0 80,0 85,0 86,0 65,0 112 76,0 77,0 78,0 75,0

2. Hallar la media aritmética, mediana moda, primer cuartil, tercer cuartil, para los siguientes datos agrupados: Saldos mensuales promedio Banco Guayana, agencia Villa Asia, año 2005

Clase en $ Frecuencia 0,00 - 50,00 78 50.00 - 100,00 123 100,00 - 150,00 187 150,00 - 200,00 82 200.00 - 250,00 51 250,00 - 300,00 47 300,00 - 350,00 13 350,00 - 400,00 9 400.00 - 450,00 6 450,00 - 500,00 4

Total 600 Fuente: adaptado de Levin/Rubin , 6ªEd. P.99

Diámetro (cm) de 250 Remaches Fabricados en Extrametal ( lote:0345) Clases (en días) Frecuencia 0.7247 - 0.7249 2 0.7250 - 0.7252 6 0.7253 - 0.7255 8 0.7256 - 0.7258 15 0.7259 - 0.7261 42 0.7262 - 0.7264 68 0.7265 - 0.7267 49 0.7268 - 0.7270 25 0.7271 - 0.7273 18 0.7274 - 0.7276 12 0.7277 - 0.7279 4 0.7280 - 0.7282 1

Fuente: adaptación. Murray Spiegel 2ºEd. Pg.87 2. Calcule el valor estimado para la media, la mediana y la moda, para todos los conjuntos de datos (agrupados) que hemos visto

como ejemplo. Seleccione la medida, que Usted considera, que mejor refleja la tendencia central de los datos. 3. Las notas de un estudiante en seis exámenes han sido 68, 84, 91, 72, 87, 78. Hallar a media y la mediana de estas notas. 4. Hallar la media, la mediana y la moda para los siguientes conjuntos de datos:

• 3,5,2,6,5,9,5,2,8,6 • 51,6 48,7 50,3 49,5 48,9 • 119,125,126,128,132,135,135,135,136,138,138,140,140,142,142,144,144,145,146,146,147,147,148,149,150,150,152,153

,154,156,157,158,161,163,164,165,168,173,176. Rentas Mensuales de 200 Apartamentos Pto. Ordaz, 1999, (en miles de Bolívares)

Clases (en días) Frecuencia 320 - 350 1 350 - 380 3 380 - 410 8 410 - 440 10 440 - 470 13 470 - 500 33 500 - 530 40 530 - 560 35 560 - 590 30 590 - 620 16 620 - 650 11

Page 8: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 8 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

MEDIDAS DE DISPERSIÓN

¿Por qué es necesario analizar medidas de dispersión?

Un valor pequeño en una medida de dispersión indica que los datos están amontonados alrededor de la media. En este caso la media se considera representativa de los datos. Si pasa lo contrario, un valor grande en la medida de dispersión indica que los datos están más alejados de la media y no sería ésta tan representativa como en el primer caso.

Podría darse el caso de que dos o más conjuntos de datos tengan el mismo valor de la media, sin embargo, la distribución de los mismos puede ser distinta en cada uno de los casos. Las razones más importantes son:

� Las medidas de dispersión proporcionan información adicional que permite juzgar la confiabilidad de la

medida de tendencia central. � Cuando los datos están muy dispersos existen problemas característicos, por lo que se debe saber

distinguir estos casos observando la dispersión. � Es útil cuando se desea comparar las dispersiones de diferentes muestras con promedios similares.

1. ALCANCE o RECORRIDO: Es la diferencia entre el mayor valor y el menor valor de los datos:

mínmáxxxR −=

� Esta medida es fácil de entender y de encontrar, pero su utilidad es limitada. � Se ve influida por los valores extremos. � Tiene muchas posibilidades de cambiar de una muestra a otra, para una población dada. � Las distribuciones de extremo abierto no tienen alcance.

2. ALCANCE INTERFRACTIL: Es la diferencia entre los valores de dos fractiles. Ejemplo:

• Alcance interfractil entre los percentiles vigésimo (20º) y octogésimo (80º).

2080

PPilInterfractAlcance −=

• Alcance interfractil entre los deciles Cuarto y sexto.

46 DDilInterfractAlcance −=

• Alcance Intercuartil

Diferencia entre el tercer cuartil y el primer cuartil

13 QQilIntercuartAlcance −=

Page 9: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 9 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

MEDIDAS DE DISPERSIÓN REFERIDAS A UNA MEDIDA DE TENDENCIA CENTRAL

Las siguientes son medidas de dispersión cuyo propósito es dar información acerca de "qué tan desviados están los datos respecto a una medida de tendencia central" (la media o la mediana).

1. Desviación Media 2. Varianza 3. Desviación Estándar

Antes de comenzar a ver cada una de estas medidas, necesitamos definir lo que vamos a entender por lo que llamaremos:

DESVIACIÓN: Es la diferencia entre el valor de un dato y la media aritmética. µ−= ixe

___________________ __________________

1. DESVIACIÓN MEDIA: Se define como el promedio de las desviaciones. Se utiliza en raras ocasiones. Para una población:

xMD

i∑ −=

||.

µ

Para una Muestra:

n

xxMD

i∑ −=

||.

Ventaja: Se usan todos los datos para calcularla. Es fácil de interpretar. Desventaja: La desviación media no se presta a transformaciones algebraicas debido a que los signos son ajustados en su definición.

2. VARIANZA: Se define como el promedio de las desviaciones al cuadrado. Al elevar al cuadrado cada una de las desviaciones se logra que todas ellas sean positivas y a su vez, que las desviaciones más grandes tengan más peso.

Para una población:

2

222 )(

µµ

σ −=−

=∑∑�

x

x ii

Para una Muestra:

1

)( 2

2

−=∑

n

xxs

i

Observa que para una muestra ya no sería “n” sino “n-1” porque en la práctica se ha encontrado que el valor resultante dá una mejor estimación de la varianza de la población total . Para grandes valores de “N” no existe mucha diferencia entre una u otra .

La varianza se puede usar para comparar dos o más conjuntos de datos.

DESVENTAJA: Para un solo conjunto de datos las unidades de la Varianza no son manejables o fáciles de interpretar, ya que son unidades elevadas al cuadrado (dolares2,por ejemplo). Por esa razón debemos recurrir a la raíz cuadrada de la varianza que se define como DESVIACIÓN ESTANDAR o DESVIACIÓN TÍPICA.

Page 10: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 10 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

3. DESVIACIÓN ESTANDAR O DESVIACIÓN TÍPICA: Se define como la raíz cuadrada de la Varianza.

Para una población:

2

22)(µ

µσ −=

−=

∑∑�

x

x ii

Para una Muestra:

=−

−=∑

1

)( 2

n

xxs

i

La Desviación estándar nos permite calcular con un buen grado de precisión dónde están localizados los

valores de una distribución de frecuencias con respecto a la media.

TEOREMA DE CHEVYSHEV: Para cualquier Distribución de Frecuencias:

• Al menos el 75% de los datos caen dentro de σ2± (más o menos dos desviaciones estándar) a partir de la media

• Al menos el 89% de los datos caen dentro σ3± a partir de la media

REGLA PRÁCTICA

Cuando la curva de frecuencias es simétrica, con forma de campana y “n” es grande, se puede decir que:

• Aproximadamente el 68% de los valores de la población cae dentro de σ1± a partir de la media.

• Aproximadamente el 95% de los datos caen dentro de σ2± (más o menos dos desviaciones estandar) a partir de la media

• Aproximadamente el 99% de los datos caen dentro σ3± a partir de la media

EJEMPLO

A una muestra de 15 frascos se realizó un estudio de impurezas (% de impurezas) 0.04 0.06 0.12 0.14 0.14 0.15 0.17 0.17 0.18 0.19 0.21 0.21 0.22 0.24 0.25 Los resultados los podemos expresar por medio de los siguientes estadísticos: Media = 0,166% ;Desviación Estándar= 0,058 Al menos el 75% de los datos (15 * 0,75= 11 frascos) están entre:

• 0,166 - (2 * 0,058) = 0,050 % • 0,166 + (2 * 0,058) = 0,282 % Comprobemos si se cumple: ¿Cuántos de los datos caen dentro del intervalo 0.050–0.282? Catorce de los quince. Es decir el 93% de las observaciones están realmente dentro de este intervalo. Entonces sí se cumple el Teorema de Chebyschev. Es más, observamos que 93% se acerca mucho al valor de 95% (regla práctica). Por ello podemos concluir que esta distribución se aproxima a una distribución simétrica.

Page 11: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 11 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

RESULTADO ESTANDAR DE LA POBLACIÓN Da el número de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media.

σ

µ−= ixstándarsultado E Re

Ejemplo: Queremos saber a cuantas desviaciones se encuentra de la media el dato xi = 0,12

79,0058,0

166,012,0Re 12,0 −=

−=

Este dato está a menos de una desviación estándar por debajo de la media.

COEFICIENTE DE VARIACIÓN

: Sirve para comparar la media con la Desviación Estandar. Es una medida relativa muy útil para comparar el grado de variación en conjuntos de datos que posean diferentes medias.

100*Estandar

Media

DesviaciónVariacióndeeCoeficient =

VARIANZA CUANDO LOS DATOS YA ESTÁN AGRUPADOS

Para una población:

22

*2

2)(*

µµ

σ −∑

=−

=∑

ixf

xf mi

Para una Muestra:

1

)(* 22

−=∑

n

xxfs

mi

DESVIACIÓN ESTÁNDAR CUANDO LOS DATOS YA ESTÁN AGRUPADOS

Para una población: 2

22 *)(*µ

µσ −=

−=

∑∑�

xf

xf mimi

Para una Muestra: =−

−=∑

1

)(* 2

n

xxfs

mi

Page 12: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 12 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

Una Tabla nos facilita el cálculo. Ejemplo:

Ventas Semanales de 100 establecimientos de comida rápida (en miles de bolívares)

Clase Marca de Clase (M)

Frecuencia (f)

F*M

Media

(Xi - µ)

(Xi - µ)2

.f * (Xi - µ)2

700-800 4 800-900 7 900-1000 8 1000-1100 10 1100-1200 12 1200-1300 17 1300-1400 13 1400-1500 10 1500-1600 9 1600-1700 7 1700-1800 2 1800-1900 1

Fuente: Adaptado del original Levin/Rubin 6º Ed. P.124

SESGO Es el grado de asimetría de una Distribución.

s

Mox

estándarDesviación

amediaSesgo

−=

−=

mod

CURTOSIS : Mide cuán puntiaguda es una distribución, en general, por referencia a la distribución normal. • Leptocúrtica: Si tiene un pico alto. • Platicúrtica: Si es aplastada. • Mesocúrtica: Forma intermedia (como la distribución Normal) Coeficiente Percentil de Curtosis: Es una medida de curtosis que se basa en cuartiles y percentiles:

1090

)Q-(Q 2

1

13

PP −=κ

Page 13: Estadistica Descriptiva

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA Prof. Zoraida Pérez S. ESTADISTICA I GuiaContenido2. Página 13 UNIDAD II: Medidas de Posición y de Dispersión Revisión:02/12/10

EJERCICIOS

1. El Gerente de Finanzas de una compañía está interesado en invertir en la bolsa de valores. Se le presentan dos opciones: Invertir en CANTV ó en LA ELECTRICIDAD DE CARACAS (LAC) Durante los últimos cinco años cada compañía ofreció los siguientes rendimientos:

EMPRESA Tasas de Rendimiento (%) CANTV 12 10 13 9 y 11 LEC 13 12 14 10 y 6

Tome Usted la decisión por ese gerente, apoyándose en bases estadísticas.

2. Calcular el alcance intercuartil para los siguientes datos: 99,72,75,91,84,74,61,93,33,54,45,76,66,52,97,91,69,77,55,68. 3. Se tomó una muestra de 40 choferes a fin de determinar el nº de Km que cada uno de ellos conduce durante un año:

3600 4200 4700 4900 5300 5700 6700 7300 7700 8100 8300 8400 8700 8700 8900 9300 9500 9500 9700 10000 10300 10500 10700 10800 11000 11300 11300 11800 12100 12700 12900 13100 13500 13800 14600 14900 16300 17200 18500 20300

Calcule: • Alcance • Alcance Intercuartil • Alcance Interfractil entre los deciles primero y noveno

• Alcance interfractil entre los percentiles 70º y 30º • Varianza y Desviación Estandar

4. Para el siguiente conjunto de datos agrupados

determine: • Rango, Media, Mediana, Moda • Alcance intercuartil, Alcance percentil 90-10 • Varianza, Desviación Estándar, Coeficiente de

variación • Límites dentro de los cuales debería estar, al menos

el 75% de los datos • Límites dentro de los cuales debería estar, al menos

el 89% de los datos • ¿Podría decirse, que ésta es una distribución

simétrica?

Rentas Mensuales de 200 Apartamentos Pto. Ordaz, 1999 (en miles de Bolívares)

Clases (en días) Frecuencia 320 - 350 1 350 - 380 3 380 - 410 8 410 - 440 10 440 - 470 13 470 - 500 33 500 - 530 40 530 - 560 35 560 - 590 30 590 - 620 16 620 - 650 11