Capitulo 2. descripción de datos

Preview:

DESCRIPTION

Esta es parte del modulo de estadisticas básica.

Citation preview

2- 1

Capitulo

Dos

2- 2

Capitulo Dos Descripción de datos: Distribuciones de Descripción de datos: Distribuciones de

Frecuencia y su presentación gráficaFrecuencia y su presentación gráficaMETASAl terminar este capítulo usted podrá:

UNOOrganizar la información en una distribución de frecuencia. DOS Representar una distribución de frecuencia en un histograma, un polígono de frecuencia y un polígono de frecuencia acumulada.TRESPresentar la información utilizando técnicas de gráficas de líneas, gráficas de barras y gráficas de pastel.

Metas

2- 3

Distribución de Frecuencia

Una Distribución de FrecuenciaDistribución de Frecuencia es una agrupación de los datos en clases mutuamente excluyentes mostrando el número de observaciones en cada una.

2- 4

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Construyendo una distr. de frecuencia

2- 5

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Construyendo una distr. de frecuencia

2- 6

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Organizar la data (distribución de frecuencia)

Construyendo una distr. de frecuencia

2- 7

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Organizar la data (distribución de frecuencia)

Presentación de la data (gráfica)

Construyendo una distr. de frecuencia

2- 8

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Organizar la data (distribución de frecuencia)

Presentación de la data (gráfica)

Conclusiones

Construyendo una distr. de frecuencia

2- 9

Collecting raw data

Organizing data (frequency distribution)

Presenting data (graph)

Drawing conclusions

1.5 3.5 5.5 7.5 9.5 11.5 13.5

5

10

15

20

Construyendo una distr. de frecuencia

2- 10

Clase de Punto medioClase de Punto medio:: Punto que divide la clase en dos partes iguales. Este es el promedio de las clases de limites superiores e inferiores.

Clase de Clase de FrecuenciaFrecuencia: El número de observaciones en cada clase.

Clase de IntervaloClase de Intervalo: El intervalo de clase es obtenido restando el limite más bajo de una clase del limite más bajo de la clase siguiente. Los intervalos de clase deben ser iguales.

Definiciones

2- 11

EJEMPLO 1

15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.

Organice la data en una distribución de frecuencia.

Dr. Tillman es el Decano de la escuela de negocios del Socastee University. El desea preparar un reporte que muestre el número de horas por semana que dedican los estudiantes a estudiar. El selecciono una muestra al azar de 30 estudiantes y determino el número de horas que cada estudiante estudio la semana pasada.

2- 12

Ejemplo 1 continua

Paso unoPaso uno:: Decidir el número de clase usando la formula

22kk > n > ndonde k=numero de clases n=numero de observaciones

o Hay 30 observaciones por tal n=30.

o Dos elevado a la quinta es 32.

o Por tal, tenemos por lo menos 5 clases, i.e., k=5.

2- 13

donde H=valor más alto, L=valor más bajo

33.8 – 10.3 5

= 4.7

Paso DosPaso Dos: Determine el intervalo de clases

H – LH – L kk

i > =

Redondear a un intervalo de 5 horas.

Fijar el limite menor de la primera clase a 7.5 horas, dando un total de 6 clases.

Ejemplo 1 continua

2- 14

EJEMPLO 1 continua

Horas de estudio Frecuencia, f

7.5 up to 12.5 1

12.5 up to 17.5 12

17.5 up to 22.5 10

22.5 up to 27.5 5

27.5 up to 32.5 1

32.5 up to 37.5 1

Paso TresPaso Tres: Fije los limites individuales de la clase yPaso Cuatro y Cinco:Paso Cuatro y Cinco: Marque y cuente en número de artículos en cada clase.

2- 15

Clase de Punto MedioClase de Punto Medio: encuentre el punto medio para cada intervalo, usando la siguiente formula: Limite superior + limite inferior

2Horas de

estudio Punto medio f

7.5 up to 12.5 (12.5+7.5)/2 =10.0 1

12.5 up to 17.5 (17.5+12.5)/2=15.0 12

17.5 up to 22.5 (22.5+17.5)/2=20.0 10

22.5 up to 27.5 (27.5+22.5)/2=25.0 5

27.5 up to 32.5 (32.5+27.5)/2=30.0 1

32.5 up to 37.5 (37.5+32.5)/2=35.0 1

Ejemplo 1 continua

2- 16

Horas f Frecuencia Relativa

7.5 up to 12.5 1 1/30=.0333

12.5 up to 17.5 12 12/30=.400

17.5 up to 22.5 10 10/30=.333

22.5 up to 27.5 5 5/30=.1667

27.5 up to 32.5 1 1/30=.0333

32.5 up to 37.5 1 1/30=.0333 TOTAL 30 30/30=1

Ejemplo 1 continua

Una Distribución de Frecuencia RelativaDistribución de Frecuencia Relativa muestra el porcentaje de observaciones en cada clase.

2- 17

Presentación Gráfica de una Distribución de Frecuencia

Un Histograma es una gráfica en la que las clases se marcan en el eje horizontal y las frecuencias de clases en el eje vertical. Las frecuencias de clases se representan mediante la altura de las barras y estás últimas se dibujan una junto a otra.

Las tres formas de gráfico comunmente utilizados son Histogramas, Poligonos de Histogramas, Poligonos de FrecuenciaFrecuencia, y Frecuencia AcumuladaFrecuencia Acumulada.

2- 18

Histograma de horas dedicadas a estudiar

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Horas dedicadas a estudio

Fre

cuen

cia

Punto medio

2- 19

Presentación Gráfica de una Distribución de Presentación Gráfica de una Distribución de FrecuenciaFrecuencia

Presentación Gráfica de una Distribución de Frecuencia

Un Poligono de FrecuenciaPoligono de Frecuencia consiste en segmentos de linea que conectan los puntos formados por las intersecciones de los puntos medios de clase y la frecuencia de clases.

2- 20

Poligono de FrecuenciaPoligono de Frecuencia de de horas dedicadas a estudiarhoras dedicadas a estudiar

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Hours spent studying

Fre

qu

en

cy

Poligono de Frecuencia de horas dedicadas a estudiar

2- 21

Una Distribución de Distribución de Frecuencia Frecuencia AcumuladaAcumulada se utiliza para determinar cuantos o que proporción de los valores de la data se encuentran por debajo o por encima de ciertos valores.

Distribución de Frecuencia AcumuladaDistribución de Frecuencia Acumulada

Para crear un poligono de frecuencia acumulada, escale el limite superior de cada clase a lo largo del X-axis y la correspondiente frecuencia relativa a lo largo del Y-axis.

Distribución de Frecuencia Acumulada

2- 22

Tabla de Frecuencia Acumulada de horas Tabla de Frecuencia Acumulada de horas dedicadas a estudiardedicadas a estudiar

Horas de Estudio

Limite Superior

f FrecuenciaAcumulada

7.5 up to 12.5 12.5 1 1

12.5 up to 17.5 17.5 12 13 (1+12)

17.5 up to 22.5 22.5 10 23 (13+10)

22.5 up to 27.5 27.5 5 28 (23+5)

27.5 up to 32.5 32.5 1 29 (28+1)

32.5 up to 37.5 37.5 1 30 (29+1)

Tabla de frecuencia acumulada

2- 23

Distribución de Frecuencia Acumulada Distribución de Frecuencia Acumulada de Horas de Estudiosde Horas de Estudios

0

5

10

15

20

25

30

35

10 15 20 25 30 35

Horas dedicadas a estudio

Frecuencia

Distribución de frecuencia acumulada

2- 24

Gráfico de linea tipicamente es usado para presentar cambios o tendencia de una variable a través del tiempo.

AÑOS HOMBRE MUJER1992 30.5 32.91993 30.8 33.21994 31.1 33.51995 31.4 33.81996 31.6 34.01997 31.9 34.31998 32.2 34.61999 32.5 34.92000 32.8 35.22001 33.2 35.52002 33.5 35.8 Gráfico lineal

2- 25

Edad media de USA por genero

25

30

35

40

Eda

d m

edia

Males

Females

Ejemplo 3 continua

2- 26

Construir un gráfico de barra del número de desempleados por 100,000 habitantes en el 2001

Ciudad Número de desempleados por 100,000 habitantes

Atlanta, GA 7300 Boston, MA 5400 Chicago, IL 6700

Los Angeles, CA 8900 New York, NY 8200

Washington, D.C. 8900

Una Gráfica de Barras Gráfica de Barras se puede utilizar para representar cualquiera de los niveles de medición (nominal, ordinal, de intervalo, o de razón).

Gráfico de Barras

2- 27

Gráfico de barras para datos de desempleo

7300

5400

6700

89008200

8900

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 2 3 4 5 6

Ciudades

# d

esem

ple

ado

s/10

0,00

0Atlanta

Boston

Chicago

Los Angeles

New York

Washington

2- 28

Gráfico P.

A una muestra de 200 corredores se les pregunto sobre sus preferencias de uso de zapatillas para correr. Dibujar un gráfico de pastel en base a la siguiente información.

Tipo de zapatillas

# de corredores

% del total

Nike 92 46.0

Adidas 49 24.5

Reebok 37 18.5

Asics 13 6.5

Other 9 4.5

Una Gráfica de PastelGráfica de Pastel es útil para ilustrar distribuciones de frecuencia relativa. Un circulo se divide proporcinalmente a su frecuencia relativa y partes del circulo distribuidos para diferentes grupos.

2- 29

46%

24.50%

18.50%6.50%

4.50%

Nike

Adidas

ReebokAsics

Other

Gráfico de pastel para zapatilla de correr

Recommended