29
2- 1 Capitulo Dos

Capitulo 2. descripción de datos

Embed Size (px)

DESCRIPTION

Esta es parte del modulo de estadisticas básica.

Citation preview

Page 1: Capitulo 2.  descripción de datos

2- 1

Capitulo

Dos

Page 2: Capitulo 2.  descripción de datos

2- 2

Capitulo Dos Descripción de datos: Distribuciones de Descripción de datos: Distribuciones de

Frecuencia y su presentación gráficaFrecuencia y su presentación gráficaMETASAl terminar este capítulo usted podrá:

UNOOrganizar la información en una distribución de frecuencia. DOS Representar una distribución de frecuencia en un histograma, un polígono de frecuencia y un polígono de frecuencia acumulada.TRESPresentar la información utilizando técnicas de gráficas de líneas, gráficas de barras y gráficas de pastel.

Metas

Page 3: Capitulo 2.  descripción de datos

2- 3

Distribución de Frecuencia

Una Distribución de FrecuenciaDistribución de Frecuencia es una agrupación de los datos en clases mutuamente excluyentes mostrando el número de observaciones en cada una.

Page 4: Capitulo 2.  descripción de datos

2- 4

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Construyendo una distr. de frecuencia

Page 5: Capitulo 2.  descripción de datos

2- 5

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Construyendo una distr. de frecuencia

Page 6: Capitulo 2.  descripción de datos

2- 6

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Organizar la data (distribución de frecuencia)

Construyendo una distr. de frecuencia

Page 7: Capitulo 2.  descripción de datos

2- 7

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Organizar la data (distribución de frecuencia)

Presentación de la data (gráfica)

Construyendo una distr. de frecuencia

Page 8: Capitulo 2.  descripción de datos

2- 8

Determinar la pregunta que se tratará

Construir una distribución de frecuencia requiere:

Recolección de información en bruto

Organizar la data (distribución de frecuencia)

Presentación de la data (gráfica)

Conclusiones

Construyendo una distr. de frecuencia

Page 9: Capitulo 2.  descripción de datos

2- 9

Collecting raw data

Organizing data (frequency distribution)

Presenting data (graph)

Drawing conclusions

1.5 3.5 5.5 7.5 9.5 11.5 13.5

5

10

15

20

Construyendo una distr. de frecuencia

Page 10: Capitulo 2.  descripción de datos

2- 10

Clase de Punto medioClase de Punto medio:: Punto que divide la clase en dos partes iguales. Este es el promedio de las clases de limites superiores e inferiores.

Clase de Clase de FrecuenciaFrecuencia: El número de observaciones en cada clase.

Clase de IntervaloClase de Intervalo: El intervalo de clase es obtenido restando el limite más bajo de una clase del limite más bajo de la clase siguiente. Los intervalos de clase deben ser iguales.

Definiciones

Page 11: Capitulo 2.  descripción de datos

2- 11

EJEMPLO 1

15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.

Organice la data en una distribución de frecuencia.

Dr. Tillman es el Decano de la escuela de negocios del Socastee University. El desea preparar un reporte que muestre el número de horas por semana que dedican los estudiantes a estudiar. El selecciono una muestra al azar de 30 estudiantes y determino el número de horas que cada estudiante estudio la semana pasada.

Page 12: Capitulo 2.  descripción de datos

2- 12

Ejemplo 1 continua

Paso unoPaso uno:: Decidir el número de clase usando la formula

22kk > n > ndonde k=numero de clases n=numero de observaciones

o Hay 30 observaciones por tal n=30.

o Dos elevado a la quinta es 32.

o Por tal, tenemos por lo menos 5 clases, i.e., k=5.

Page 13: Capitulo 2.  descripción de datos

2- 13

donde H=valor más alto, L=valor más bajo

33.8 – 10.3 5

= 4.7

Paso DosPaso Dos: Determine el intervalo de clases

H – LH – L kk

i > =

Redondear a un intervalo de 5 horas.

Fijar el limite menor de la primera clase a 7.5 horas, dando un total de 6 clases.

Ejemplo 1 continua

Page 14: Capitulo 2.  descripción de datos

2- 14

EJEMPLO 1 continua

Horas de estudio Frecuencia, f

7.5 up to 12.5 1

12.5 up to 17.5 12

17.5 up to 22.5 10

22.5 up to 27.5 5

27.5 up to 32.5 1

32.5 up to 37.5 1

Paso TresPaso Tres: Fije los limites individuales de la clase yPaso Cuatro y Cinco:Paso Cuatro y Cinco: Marque y cuente en número de artículos en cada clase.

Page 15: Capitulo 2.  descripción de datos

2- 15

Clase de Punto MedioClase de Punto Medio: encuentre el punto medio para cada intervalo, usando la siguiente formula: Limite superior + limite inferior

2Horas de

estudio Punto medio f

7.5 up to 12.5 (12.5+7.5)/2 =10.0 1

12.5 up to 17.5 (17.5+12.5)/2=15.0 12

17.5 up to 22.5 (22.5+17.5)/2=20.0 10

22.5 up to 27.5 (27.5+22.5)/2=25.0 5

27.5 up to 32.5 (32.5+27.5)/2=30.0 1

32.5 up to 37.5 (37.5+32.5)/2=35.0 1

Ejemplo 1 continua

Page 16: Capitulo 2.  descripción de datos

2- 16

Horas f Frecuencia Relativa

7.5 up to 12.5 1 1/30=.0333

12.5 up to 17.5 12 12/30=.400

17.5 up to 22.5 10 10/30=.333

22.5 up to 27.5 5 5/30=.1667

27.5 up to 32.5 1 1/30=.0333

32.5 up to 37.5 1 1/30=.0333 TOTAL 30 30/30=1

Ejemplo 1 continua

Una Distribución de Frecuencia RelativaDistribución de Frecuencia Relativa muestra el porcentaje de observaciones en cada clase.

Page 17: Capitulo 2.  descripción de datos

2- 17

Presentación Gráfica de una Distribución de Frecuencia

Un Histograma es una gráfica en la que las clases se marcan en el eje horizontal y las frecuencias de clases en el eje vertical. Las frecuencias de clases se representan mediante la altura de las barras y estás últimas se dibujan una junto a otra.

Las tres formas de gráfico comunmente utilizados son Histogramas, Poligonos de Histogramas, Poligonos de FrecuenciaFrecuencia, y Frecuencia AcumuladaFrecuencia Acumulada.

Page 18: Capitulo 2.  descripción de datos

2- 18

Histograma de horas dedicadas a estudiar

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Horas dedicadas a estudio

Fre

cuen

cia

Punto medio

Page 19: Capitulo 2.  descripción de datos

2- 19

Presentación Gráfica de una Distribución de Presentación Gráfica de una Distribución de FrecuenciaFrecuencia

Presentación Gráfica de una Distribución de Frecuencia

Un Poligono de FrecuenciaPoligono de Frecuencia consiste en segmentos de linea que conectan los puntos formados por las intersecciones de los puntos medios de clase y la frecuencia de clases.

Page 20: Capitulo 2.  descripción de datos

2- 20

Poligono de FrecuenciaPoligono de Frecuencia de de horas dedicadas a estudiarhoras dedicadas a estudiar

0

2

4

6

8

10

12

14

10 15 20 25 30 35

Hours spent studying

Fre

qu

en

cy

Poligono de Frecuencia de horas dedicadas a estudiar

Page 21: Capitulo 2.  descripción de datos

2- 21

Una Distribución de Distribución de Frecuencia Frecuencia AcumuladaAcumulada se utiliza para determinar cuantos o que proporción de los valores de la data se encuentran por debajo o por encima de ciertos valores.

Distribución de Frecuencia AcumuladaDistribución de Frecuencia Acumulada

Para crear un poligono de frecuencia acumulada, escale el limite superior de cada clase a lo largo del X-axis y la correspondiente frecuencia relativa a lo largo del Y-axis.

Distribución de Frecuencia Acumulada

Page 22: Capitulo 2.  descripción de datos

2- 22

Tabla de Frecuencia Acumulada de horas Tabla de Frecuencia Acumulada de horas dedicadas a estudiardedicadas a estudiar

Horas de Estudio

Limite Superior

f FrecuenciaAcumulada

7.5 up to 12.5 12.5 1 1

12.5 up to 17.5 17.5 12 13 (1+12)

17.5 up to 22.5 22.5 10 23 (13+10)

22.5 up to 27.5 27.5 5 28 (23+5)

27.5 up to 32.5 32.5 1 29 (28+1)

32.5 up to 37.5 37.5 1 30 (29+1)

Tabla de frecuencia acumulada

Page 23: Capitulo 2.  descripción de datos

2- 23

Distribución de Frecuencia Acumulada Distribución de Frecuencia Acumulada de Horas de Estudiosde Horas de Estudios

0

5

10

15

20

25

30

35

10 15 20 25 30 35

Horas dedicadas a estudio

Frecuencia

Distribución de frecuencia acumulada

Page 24: Capitulo 2.  descripción de datos

2- 24

Gráfico de linea tipicamente es usado para presentar cambios o tendencia de una variable a través del tiempo.

AÑOS HOMBRE MUJER1992 30.5 32.91993 30.8 33.21994 31.1 33.51995 31.4 33.81996 31.6 34.01997 31.9 34.31998 32.2 34.61999 32.5 34.92000 32.8 35.22001 33.2 35.52002 33.5 35.8 Gráfico lineal

Page 25: Capitulo 2.  descripción de datos

2- 25

Edad media de USA por genero

25

30

35

40

Eda

d m

edia

Males

Females

Ejemplo 3 continua

Page 26: Capitulo 2.  descripción de datos

2- 26

Construir un gráfico de barra del número de desempleados por 100,000 habitantes en el 2001

Ciudad Número de desempleados por 100,000 habitantes

Atlanta, GA 7300 Boston, MA 5400 Chicago, IL 6700

Los Angeles, CA 8900 New York, NY 8200

Washington, D.C. 8900

Una Gráfica de Barras Gráfica de Barras se puede utilizar para representar cualquiera de los niveles de medición (nominal, ordinal, de intervalo, o de razón).

Gráfico de Barras

Page 27: Capitulo 2.  descripción de datos

2- 27

Gráfico de barras para datos de desempleo

7300

5400

6700

89008200

8900

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

1 2 3 4 5 6

Ciudades

# d

esem

ple

ado

s/10

0,00

0Atlanta

Boston

Chicago

Los Angeles

New York

Washington

Page 28: Capitulo 2.  descripción de datos

2- 28

Gráfico P.

A una muestra de 200 corredores se les pregunto sobre sus preferencias de uso de zapatillas para correr. Dibujar un gráfico de pastel en base a la siguiente información.

Tipo de zapatillas

# de corredores

% del total

Nike 92 46.0

Adidas 49 24.5

Reebok 37 18.5

Asics 13 6.5

Other 9 4.5

Una Gráfica de PastelGráfica de Pastel es útil para ilustrar distribuciones de frecuencia relativa. Un circulo se divide proporcinalmente a su frecuencia relativa y partes del circulo distribuidos para diferentes grupos.

Page 29: Capitulo 2.  descripción de datos

2- 29

46%

24.50%

18.50%6.50%

4.50%

Nike

Adidas

ReebokAsics

Other

Gráfico de pastel para zapatilla de correr