EstadÃstica A - ORGANIZACIÓN Y PRESENTACION DE DATOS.pdf

Preview:

Citation preview

M. Sc. Eder C. Vicuña Galindo 1

ORGANIZACIÓN Y PRESENTACIÓN

GRÁFICA DE DATOS

Objetivos:

• Confeccionar tablas de frecuencias para la organización de datos cualitativos y cuantitativos.

• Representar los datos bajo estudio en gráficos adecuados.

Organización y Representación de

Datos Cualitativos o Categóricos

• Ejemplo

A: Problemas de inestabilidad (no arranca, se cuelga,

etc,)

B: Problemas de incompatibilidad (tanto del hardware

como software)

C: Problemas de intermitencia (baja rendimiento, se

hace lento, etc,)

D: Problemas por falta de requerimientos (inadecuado

sistema operativo, reducida memoria RAM, etc,)

Continuación

A, A, C, D , B , A, C, A, B, D, C, A, A, B, B,

C, C, A, A, A, B, C, C, D, A, A, D, A, C, B,

Para un valor xi, i = 1 … n, donde n es el

número de datos, definimos las siguientes

frecuencias:

Frecuencia, fi,

Frecuencia relativa, fri

Frecuencia acumulada, Fi

Frecuencia acumulada relativa, Fri

Continuación …

Categoría de tipos de

fallas Frecuencia, f i

A 12

B 6

C 8

D 4

Total 30

Continuación …Gráfico de barras o

rectángulos

0 2 4 6 8 10 12 14

A

B

C

D

Tip

os d

e f

all

a

frecuencia

Continuación …Gráfico de barras o

rectángulos

Categoría de

tipos de fallas

T123 SV41

Frecuencia, f i Frecuencia, f i

A 12 9

B 6 5

C 8 9

D 4 7

Total 30 30

0 2 4 6 8 10 12 14

A

B

C

D

Tip

os d

e f

all

a

frecuencia

Marca T123 Marca SV41

Continuación …Gráfico de barras o

rectángulos

Continuación …Gráfico de barras o

rectángulos

Categoría

de tipos

de fallas

T123 SV41 C1Q2

f i fri f i fri f i fr i

A 12 0,40 9 0,30 7 0,39

B 6 0,20 5 0,17 3 0,17

C 8 0,27 9 0,30 6 0,33

D 4 0,13 7 0,23 2 0,11

Total 30 1 30 1 18 1

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

A B C D

tipos de falla

Fre

cu

en

cia

rela

tiva

Marca T123

Marca SV41

Marca C1Q2

Continuación …Gráfico de barras o

rectángulos

Gráficos Circulares

Categoría de

tipos de fallas

Frecuencia,

f i

Frecuencia

relativa, fri:

Ángulo del

sector, i

A 12 0.40 144°

B 6 0.20 72°

C 8 0.27 96°

D 4 0.13 48°

Total 30 1 360°

Gráficos Circulares …

12

6

8

4

A

B

C

D

Organización y Representación de Datos

Cuantitativos Discretos

• Los resultados obtenidos, como parte de una evaluación que

tenía un máximo de 5 en valores enteros, fueron: 2, 5, 1, 2, 0,

2, 1, 5, 1, 4, 3, 0, 5, 4, 4, 3, 3, 2, 4, 5.

Puntaje Frecuencia, f i Frecuencia relativa, fri

0 2 0,10

1 3 0,15

2 4 0,20

3 3 0,15

4 4 0,20

5 4 0,20

Total 20 1

Gráfico de Bastones

Otro ejemplo

• La demanda diaria, en unidades de un

producto, durante 30 días de trabajo es:

38 35 72 58 48 59

67 63 33 69 53 51

28 25 36 32 61 57

33 61 48 42 72 72

47 66 58 44 44 56

Otro ejemplo …

Demanda diaria,

unidades/día Frecuencia, f i

Demanda diaria,

unidades/día Frecuencia, f i

25 1 53 1

28 1 56 1

32 1 57 1

33 2 58 2

35 1 59 1

36 1 61 2

38 1 63 1

42 1 66 1

44 2 67 1

47 1 69 3

48 2 72 1

51 1

Otro ejemplo …

0

1

2

3

4

20 25 30 35 40 45 50 55 60 65 70 75

número de pedidos por día

fre

cu

en

cia

Clases o Intervalos

Clase: es la subdivisión de la escala de mediciones, de modo que cada observación esté contenida en exactamente una clase o intervalo de clase, A. Número de clases se representa por la letra m.

nm )log(3,31 nm

minmax, xxRm

aRA

Continuando ejemplo …

= 5,477225575

Decidimos que m = 6

= 5,874500141

xmin = 25

R = xmax - xmin = 72 – 25 = 47

xmax = 72

a A

0 7,83

1 8

30m

)30log(3,31m

xmin, nuevo = xmin – a/2 = 28 – 1/2 = 27,5 28

xmax, nuevo = xmax + a/2 = 72 + 1/2 = 73,5 73

Continuando ejemplo …

Clase xj xj+1 xi f i

1 25 32 29 5

2 33 40 37 3

3 41 48 45 6

4 49 56 53 4

5 57 64 61 6

6 65 73 69 6

30

Continuando ejemplo …

0

1

2

3

4

5

6

7

20 25 30 35 40 45 50 55 60 65 70 75

frec

uen

cia

Número representativo de los pedidos por día

Organización y Representación de Datos

Cuantitativos Continuos

Ejemplo: Los siguientes datos son mediciones de la

resistencia a la ruptura (en onzas) de hilos de cáñamo:

n = 60

32,5 15,2 35,4 21,3 28,4 26,9 34,6 29,3 24,5 31,0 21,2 29,4

27,1 25,0 32,7 29,5 30,2 23,9 23,0 26,4 27,3 33,7 33,5 31,3

29,3 17,3 29,0 36,8 29,2 23,5 20,6 29,5 21,8 37,5 38,4 28,3

26,8 28,7 34,8 18,6 25,4 34,1 27,5 29,6 22,2 22,7 21,9 29,6

37,0 28,3 36,9 24,6 28,9 24,8 28,1 25,4 34,5 23,6 33,2 24,0

Organización y Representación de Datos

Cuantitativos Continuos

= 7,745966692 m = 7

= 6,867899126 m = 8

30m

)30log(3,31m

xmin = 15,2

R = xmax - xmin = 38,4 – 15,2 = 23,2

xmax = 38,4

m 7 8

a = 0,6 0,8

A = 3,4 3

xmin, nuevo = 14,9 14,8

xmax, nuevo = 38,7 38,8

Organización de Datos Cuantitativos

Continuos

m = 7

clase LIi LSi xi fi Fi 1 [14,8 18,3> 16,6 2 2

2 [18,3 21,7> 20,0 4 6

3 [21,7 25,1> 23,4 13 19

4 [25,1 28,5> 26,8 12 31

5 [28,5 31,9> 30,2 14 45

6 [31,9 35,3> 33,6 9 54

7 [35,3 38,7] 37,0 6 60

Organización de Datos Cuantitativos

Continuos

m = 8

clase LIi LSi xi fi Fi Fri 1 [14,8 17,8> 16,3 2 2 3,33

2 [17,8 20,8> 19,3 2 4 6,67

3 [20,8 23,8> 22,3 9 13 21,67

4 [23,8 26,8> 25,3 9 22 36,67

5 [26,8 29,8> 28,3 20 42 70,00

6 [29,8 32,8> 31,3 5 47 78,33

7 [32,8 35,8> 34,3 8 55 91,67

8 [35,8 38,8] 37,3 5 60 100,00

Histograma m = 7

0

2

4

6

8

10

12

14

16

14 18 22 26 30 34 38 42

resistencia a la ruptura, onzas

Fre

cu

en

cia

Histograma …

m = 8

0

5

10

15

20

14 18 22 26 30 34 38 42

resistencia a la ruptura, onzas

Fre

cu

en

cia

Polígono de Frecuencias

0

5

10

15

20

14 18 22 26 30 34 38 42

resistencia a la ruptura, onzas

Fre

cu

en

cia

Ojiva

Opcional: plotear con frecuencia 0

clase LIi LSi xi fi Fi 1 [14,8 17,8> 16,3 2 2

2 [17,8 20,8> 19,3 2 4

3 [20,8 23,8> 22,3 9 13

4 [23,8 26,8> 25,3 9 22

5 [26,8 29,8> 28,3 20 42

6 [29,8 32,8> 31,3 5 47

7 [32,8 35,8> 34,3 8 55

8 [35,8 38,8] 37,3 5 60

Ojiva …

0

10

20

30

40

50

60

12 17 22 27 32 37 42

resistencia a la ruptura, onzas

Fre

cu

en

cia

ac

um

ula

da

Ojiva …

clase LIi LSi xi fi Fri 1 [14,8 17,8> 16,3 2 3,33

2 [17,8 20,8> 19,3 2 6,67

3 [20,8 23,8> 22,3 9 21,67

4 [23,8 26,8> 25,3 9 36,67

5 [26,8 29,8> 28,3 20 70,00

6 [29,8 32,8> 31,3 5 78,33

7 [32,8 35,8> 34,3 8 91,67

8 [35,8 38,8] 37,3 5 100,00

Ojiva …

0

20

40

60

80

100

12 17 22 27 32 37 42

resistencia a la ruptura, onzas

Fre

cu

en

cia

ac

um

ula

da

, %

Ejemplo: En una fábrica la producción de “A” y “B” se comportó durante el

primer semestre del año como muestra la tabla:

Estadística Descriptiva

Representaciones gráficas de resultados :

a) Gráfico de líneas:

El correspondiente gráfico de líneas sería:

Mes “A”, ton “B”, ton

Enero 185 105

Febrero 195 95

Marzo 205 90

Abril 200 100

Mayo 210 95

Junio 195 105

0

50

100

150

200

250

“A”, ton

“B”, ton

A continuación se muestran dos opciones de gráficos de barras para la misma data:

Estadística Descriptiva

0

50

100

150

200

250

Enero Febrero Marzo Abril Mayo Junio

“A”, ton

“B”, ton

Representaciones gráficas de resultados :

b) Gráfico de barras:

La opción de la derecha es menos aconsejable, ya que no permite visualizar

fácilmente las variaciones que experimenta “B” ni sus variaciones relativas

respecto a “A”, lo que sí hace la primera opción.

0

50

100

150

200

250

300

350

Enero Febrero Marzo Abril Mayo Junio

“B”, ton

“A”, ton

Los gráficos de barras también pueden ser horizontales, como se muestra a

continuación para la misma data:

Estadística Descriptiva

Representaciones gráficas de resultados :

b) Gráfico de barras:

0 50 100 150 200 250

Enero

Febrero

Marzo

Abril

Mayo

Junio

“B”, ton

“A”, ton

Diagrama de Puntos

• Un investigador sintetiza un reactivo creyendo que es

completamente nuevo. Lo estudia utilizando un

método espectrométrico y obtiene un valor promedio

de 104 (en unidades adecuadas). En los libros de

referencia encuentra que todos los compuestos

estudiados con el "mismo" método tienen un valor

inferior a 100. ? Descubrió el investigador un nuevo

compuesto? La respuesta depende del grado de

confianza que se pueda asignar al valor promedio

104. Si los valores obtenidos (valores muestrales)

fueron 98,100, 102, 104, 107, 108 y 109.

Diagrama de Puntos

el 100 es un valor tan razonable como el 104; se

deberían realizar más mediciones. Si en cambio fueron

103,3 103,5 103,9 104,1 104,3 104,5 104,7.

Diagrama de Puntos pensamos que el químico puede haber descubierto un nuevo

compuesto ... o que ha cometido alguna equivocación que lo

conduce a medir de más.

¿Qué significan precisión y exactitud? El valor verdadero

(desconocido) es 101, los puntos representan los datos

obtenidos. Los datos representados en (a) son precisos e

inexactos, en (b) imprecisos e inexactos, en (c) precisos y

exactos y en (d) imprecisos y exactos.

Diagrama de Puntos

Diagrama de Tallo y Hojas

En un diagrama tallo-hoja podemos ver:

• Cuán aproximadamente simétricos son los datos.

• Cuán dispersos están los valores.

• La aparición de valores inesperadamente más

frecuentes.

• Si algunos valores están alejados del resto.

• Si hay concentraciones de valores.

• Si hay grupos separados.

• La distribución de los datos dentro de cada intervalo

como patrones dentro de los datos.

Diagrama de Tallo y Hojas

En un diagrama tallo-hoja podemos ver:

• Cuán aproximadamente simétricos son los datos.

• Cuán dispersos están los valores.

• La aparición de valores inesperadamente más

frecuentes.

• Si algunos valores están alejados del resto.

• Si hay concentraciones de valores.

• Si hay grupos separados.

• La distribución de los datos dentro de cada intervalo

como patrones dentro de los datos.

Diagrama de Tallo y Hojas Ejemplo. Los siguientes datos representan la evaluación

de los latidos cardíacos de un grupo de 30 personas

después de cierta actividad física

82 95 92 62 85 92

82 95 70 85 84 95

91 82 94 76 88 91

87 80 68 58 76 85

110 60 75 88 64 74

Diagrama de Tallo y Hojas Es muy poca la información que arroja este conjunto de

datos cuando se encuentran sin un tratamiento. A

continuación estos datos son presentados como una

combinación ordenada en forma ascendente (de menor a

mayor):

58 70 80 85 88 94

60 74 82 85 91 95

62 75 82 85 91 95

64 76 82 87 92 95

68 76 84 88 92 110

Diagrama de Tallo y Hojas

A partir de esta lista ordenada se pueden concluir varias

cosas:

• La más alta evaluación de latidos es 110.

• La más baja evaluación de latidos es 58

• La mitad de la combinación se encuentra entre 82 y 85

• Hay una predominancia en los latidos entre 80 y 95

• Hay un "vacío" entre el valor 95 y el valor 110.

• Hay una evaluación atípica dentro del grupo de 30 personas, el

que registra el valor 110. ES posible que esta persona tenga

perturbaciones cardíacas. Sin embargo, es necesario ampliar la

información antes de lanzar un juicio apresurado.

Se puede observar que éstos tienen un rango desde los

cincuentas hasta los ciento diez. Ellos se pueden

presentar como un arreglo de tallo y hojas en una

columna de números del 5 al 11 y trazando una línea

vertical a su derecha. Estos números representarán el

tallo. En la columna de las hojas, se enlistan las

unidades (de manera ordenada) de cada uno de los datos

registrados y correspondientes con su respectiva decena.

Diagrama de Tallo y Hojas

Diagrama de Tallo y Hojas

Tallo Hojas

5 8

6 0 2 4 8

7 0 4 5 6 6

8 0 2 2 2 4 5 5 5 7 8 8

9 1 1 2 2 4 5 5 5

10

11 0