43
Tema 1: Conceptos básicos y presentación de datos MSc. Víctor Sánchez Cáceres

01 presentacion de datos u ap

Embed Size (px)

Citation preview

Page 1: 01 presentacion de datos u ap

Tema 1: Conceptos básicos y presentación de datos

MSc. Víctor Sánchez Cáceres

Page 2: 01 presentacion de datos u ap

INTRODUCCIÓN

CONCEPTOS BASICOS

ORGANIZACIÓN DE DATOS

Page 3: 01 presentacion de datos u ap

OBJETIVOS: Comprender qué es y porqué se estudia la

estadística.

Comprender los conceptos básicos de la estadística.

Explicar lo que significan estadística descriptiva y estadística inferencial.

Diferenciar entre una variable cualitativa y cuantitativa.

Page 4: 01 presentacion de datos u ap

¿Qué es estadística?Recolecta

Organiza

Presenta

Analiza

interpreta

Page 5: 01 presentacion de datos u ap

¿Para que sirve la estadística?

La Estadística se utiliza como tecnología al servicio de las ciencias.......

Page 6: 01 presentacion de datos u ap

OBJETIVOS DE LA ESTADISTICA LA DESCRIPCION: Conjunto de datos presentados a

través de Cuadros y Gráficos para describir el comportamiento u composición de las variables.

EL ANALISIS: Generalización de resultados basándose en una muestra.

LA PREDICCION: Proyección de resultados, basándose en datos del pasado.

Page 7: 01 presentacion de datos u ap

Tipos de estadísticaEstadística Descriptiva: Se ocupa de la

colección y clasificación de información, de suresumen en cuadros y gráficos adecuados queresuman en forma apropiada la información captada.

Estadística Inferencial: se ocupa de losprocesos de estimación, análisis y prueba de hipótesis,con el propósito de llegar a conclusiones que brindenuna adecuada base científica para la toma dedecisiones tomando como base la información

captada por la muestra.

Page 8: 01 presentacion de datos u ap

CONCEPTOS BÁSICOS Población Muestra Unidad de Estudio Variable, Tipos y escala de medición Dato Observación Información Censo Parámetro Estadígrafo

Page 9: 01 presentacion de datos u ap

Ejemplo: Se desea hacer un estudio sobre elingreso familiar de Cajamarca

Identifique: Población, una posible muestra,la característica en estudio y la unidad elemental.

Solución:

1. Población: Familias de Cajamarca

2. Muestra: 400 familias de Cajamarca

3. Variable: Ingreso familiar

4. Unidad elemental: Familia de Cajamarca

Page 10: 01 presentacion de datos u ap

EJEMPLO

Se ha hecho un estudio para determinar la preferencia de una marca especial de aditivos por parte de los ingenieros metalúrgicos. Entre 50 ingenieros entrevistados, 30 dijeron que preferían marca Bayer.

a. ¿Qué constituye la muestra?.

Rpta:

b. ¿Qué constituye la población?.

Rpta:

c. ¿Cuál es la proporción, dentro de la muestra?

Rpta: p=30/50=0,60 (60% …prefieren la marca…)

Page 11: 01 presentacion de datos u ap

VariablesSon las características que se desea apreciar de los elementos de la población.

CUALITATIVAS CUANTITATIVAS

DISCRETANOMINAL ORDINAL CONTINUA

ATRIBUTO NUMERICO

Page 12: 01 presentacion de datos u ap

TIPOS DE VARIABLES

Cualitativas Nominales: Si sus categorías no se pueden ordenar

Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

Ordinales: Si sus categorías se pueden ordenarGrado de satisfacción, Intensidad del color

Cuantitativas o Numéricas Discretas: Si toma valores enteros

Número de hijos, Número de desempleados

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, ingreso mensual,

Page 13: 01 presentacion de datos u ap

EJEMPLOClasificar cada una de las siguientes variables:

Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. (Cuantitativa. Continua)

Tiempo que requiere un estudiante para responder a un examen(Cuantitativa. Continua)

Llamadas que llegan a la central telefónica de la UPN en un día. (Cuantitativa. Discreta)

Page 14: 01 presentacion de datos u ap

Preferencia de consumidores por cierta marca de refresco. (Cualitativa -Nominal)

Sexo de los estudiantes que toman el curso de estadística en el semestre. (Cualitativa -Nominal)

Número de acciones vendidas en un día en la Bolsa de Valores. (Cuantitativa. Discreta)

Nivel educativo de pobladores de cierta comunidad. (Cualitativa -Ordinal)

Page 15: 01 presentacion de datos u ap
Page 16: 01 presentacion de datos u ap

Pasos en un estudio estadístico

Plantear hipótesis sobre una población

Decidir qué datos recoger (diseño de experimentos)

• Qué individuos pertenecerán al estudio (muestras)

• Qué datos recoger de los mismos (variables)

Recoger los datos (muestreo)

• ¿Simple? ¿Estratificado? ¿Sistemático? ¿Agrupado?

Describir (resumir) los datos obtenidos

Realizar una inferencia sobre la población

Cuantificar la confianza en la inferencia

• Nivel de confianza

• Margen de error:

Page 17: 01 presentacion de datos u ap
Page 18: 01 presentacion de datos u ap

ORGANIZACIÓN DE DATOS

OBJETIVOS:

ƒOrganizar los datos en un cuadro de distribución de frecuencias

ƒPresentar los datos en gráficos de distribución de frecuencias.

Page 19: 01 presentacion de datos u ap

ORGANIZACIÓN DE DATOSCUADRO DE VARIABLE CUALITATIVA

Variable frecuencia Porcentaje %

C1 f1 (f1/n)x100

C2 f2 (f2/n)x100

… … …

Ck fk (fk/n)x100

Total n 1

Page 20: 01 presentacion de datos u ap

ORGANIZACIÓN DE DATOS

VARIABLE CUALITATIVA

Para representar gráficamente la distribución de

frecuencias de una variable cualitativa se utilizan las

barras y los sectores circulares.

Nota

Si trabajamos con variables nominales las categorías pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categorías deberán ser colocadas en orden(Grafico de barras)

Page 21: 01 presentacion de datos u ap

Gráficos para v. cualitativas

Diagramas de barras Alturas proporcionales a las frecuencias

(abs. o rel.) Se pueden aplicar también a variables

discretas

Diagramas de sectores (tartas, polares) No usarlo con variables ordinales. El área de cada sector es proporcional a su

frecuencia (abs. o rel.)

Pictogramas Fáciles de entender. El área de cada modalidad debe ser

proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.

21

Page 22: 01 presentacion de datos u ap

EJEMPLO:

En una planta embotelladora seregistraron 54 accidentes y de acuerdocon la parte del cuerpo lesionada,dedos (D), ojos (O), brazo (B), ypiernas (P); se registraron los datos(cuadro 1). Se pide organizar losdatos.

Page 23: 01 presentacion de datos u ap

Datos:

D

D

B

P

B

B

D

D

D

P

D

O

D P D O D P

O

B

B

O

B

D

D

B

B

D

O

B

P

B

P

D

D

P

D

P

D

D

P

B

D

D

D

B

O

P

B

P

B

O

D

D

Page 24: 01 presentacion de datos u ap

CUADRO 1:

PARTE LESIONADA DEL CUERPO EN

ACCIDENTES DEEMBOTELLADORA

FUENTE: Registros de accidentes en embotelladora

ELABORACION: Departamento de Personal

PARTE

LESIONADA

NÚMERO DE

ACCIDENTES

%

BRAZOS 14 25,93

DEDOS 22 40,74

OJO 7 12,96

PIERNA 11 20,37

Total 54 100

Page 25: 01 presentacion de datos u ap

Grafico de Barras:

Grafico N° 1

FUENTE: Registros de accidentes en embotelladora

ELABORACION: Departamento de Personal

26

41

13

20

0

5

10

15

20

25

30

35

40

45

BRAZOS DEDOS OJO PIERNA

%

Parte lesionada

PARTE LESIONADA DEL CUERPO EN ACCIDENTES EN EMBOTELLADORA

Page 26: 01 presentacion de datos u ap

Grafico de Sectores Circulares:

Grafico N° 2

FUENTE: Registros de accidentes en embotelladora

ELABORACION: Departamento de Personal

26%

41%

13%

20%

PARTE LESIONADA DEL CUERPO EN ACCIDENTES EN EMBOTELLADORA

BRAZOS

DEDOS

OJO

PIERNA

Page 27: 01 presentacion de datos u ap

ORGANIZACIÓN DE DATOS

VARIABLE CUANTITATIVA DISCRETA

Xi fi hi Fi Hi

X1 f1 h1 F1 H1

X2 f2 h2 F2 H2

… … … … …

Xk fk hk Fk Hk

TOTAL n 1

Page 28: 01 presentacion de datos u ap

Ejemplo

Construir la distribución de frecuencias del número de trabajadores que se ausentaron en 20 días laborales:

2 1 2 4 1

3 2 3 2 0

3 2 1 3 2

3 3 1 2 4

Page 29: 01 presentacion de datos u ap

Ausencias de

Trabajadores

N° de días Porcentajes

0 1 0.05x100=5%

1 4 0.20x100=20%

2 7 0.35x100=35%

3 6 0.30x100=30%

4 2 0.10x100=10%

20 100%

Page 30: 01 presentacion de datos u ap

CUADRO N 2

NUMERO DE AUSENCIAS DE TRABAJADORES

FUENTE: Registro de control de asistencia de trabajadores

ELABORACION: Departamento de Personal

Ausencias de

Trabajadores

N° de días (fi) hi% Fi Hi%

0 1 5 1 5

1 4 20 5 25

2 7 35 12 60

3 6 30 18 90

4 2 10 20 100

Total 20 100

Page 31: 01 presentacion de datos u ap

Grafico de Bastones:

GRAFICO N 3

FUENTE: Registro de control de asistencia de trabajadores

ELABORACION: Departamento de Personal

5

20

35

30

10

0

5

10

15

20

25

30

35

40

0 1 2 3 4

%

Ausencias

AUSENCIAS DE TRABAJADORES

Page 32: 01 presentacion de datos u ap

Grafico de Escalones:GRAFICO N 4

FUENTE: Registro de control de asistencia de trabajadores

ELABORACION: Departamento de Personal

5

25

60

90

100

0

20

40

60

80

100

120

0 1 2 3 4

%

Ausencias

AUSENCIAS DE TRABAJADORES

Page 33: 01 presentacion de datos u ap

Ejemplo ¿Cuántos individuos tienen

menos de 2 hijos? frec. indiv. sin hijos

+ frec. indiv. con 1 hijo = 419 + 255= 674 individuos

¿Qué porcentaje de individuos tiene 6 hijos o menos? 97,3%

¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual? 2 hijos

Número de hijos

419 27,8 27,8

255 16,9 44,7

375 24,9 69,5

215 14,2 83,8

127 8,4 92,2

54 3,6 95,8

24 1,6 97,3

23 1,5 98,9

17 1,1 100,0

1509 100,0

0

1

2

3

4

5

6

7

Ocho+

Total

Frec.

Porcent.

(válido)

Porcent.

acum.

33

≥50%

Page 34: 01 presentacion de datos u ap

ORGANIZACIÓN DE DATOS

VARIABLE CUANTITATIVA CONTINUA

Intervalo [Li ; Ls>

Marca de Clase (Xi)

fi hi Fi Hi

I1 X1 f1 h1 F1 H1

I2 X2 f2 h2 F2 H2

… … … … … …

Ik Xk fk hk Fk Hk

Total n 1

Page 35: 01 presentacion de datos u ap

Ejemplo. En la oficina de un diario, el tiempo que setardan en imprimir la primera plana fue registradodurante 50 días. A continuación se transcriben losdatos, aproximados a décimas de minuto:

20,8

22,8

21,9

22,0

20,7

20,9

25,0

22,2

22,8

20,1

25,3 20,7 22,5 21,2 23,8 23.3 20,9 22,9 23,5 19,5

23,7

20,3

23,6

19,0

25,1

25,0

19,5

24,1

24,2

21,8

21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9

19,7

24,2

23,8

20,7

23,8

24,3

21,1

20,9

21,6

22,7

Page 36: 01 presentacion de datos u ap

Construya con los datos una tabla de distribución de frecuencia, usando la regla de sturges.

PROCEDIMIENTO

•Calcular el rango (R) o recorrido, el cual se define de la siguiente manera:

R = Obs. máxima – Obs. Mínima

R = 25.3 - 19.0 = 6.3

•Determine el número de intervalos (k)

K = 1 + 3.3 log (n) (Fórmula de Sturges) K = 1 + 3.3 log (50) = 6.607 = 7 (entero) (Redondeo simple)

•Determinar la amplitud del intervalo (a=R/K) (Redondeado por exceso) Se redondea según el número de decimales que se tiene en la muestra : a=6.3/7=0.9

Page 37: 01 presentacion de datos u ap

Cuadro N3Tiempo que se tardan en imprimir la primera plana

de un diario

FUENTE: observación de impresión de primera planaELABORACION: Departamento de Logística

Tiempo

(minutos)

Xi fi hi Fi Hi

[19.0-19.9> 19.45 5 0.10 5 0.10

[19.9-20.8> 20.35 6 0.12 11 0.22

[20.8-21.7> 21.25 9 0.18 20 0.40

[21.7-22.6> 22.15 5 0.10 25 0.50

[22.6-23.5> 23.05 7 0.14 32 0.64

[23.5-24.4> 23.95 14 0.28 46 0.92

[24.4-25.3] 24.85 4 0.08 50 1.00

Total 50 1

Page 38: 01 presentacion de datos u ap

Grafico de Histograma:GRAFICO N 5

FUENTE: observación de impresión de primera plana del Diario

ELABORACION: Departamento de Logística

10%

12%

18%

10%

14%

28%

8%

0%

5%

10%

15%

20%

25%

30%

18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75

%

Tiempo

TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO

Page 39: 01 presentacion de datos u ap

Grafico de Polígono:

GRAFICO N 6

FUENTE: observación de impresión de primera plana del Diario

ELABORACION: Departamento de Logística

10%

12%

18%

10%

14%

28%

8%

0%

5%

10%

15%

20%

25%

30%

18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75

%

Tiempo

TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO

Page 40: 01 presentacion de datos u ap

Grafico de Ojiva:GRAFICO N 7

FUENTE: observación de impresión de primera plana del Diario

ELABORACION: Departamento de Logística

10%

22%

40%

50%

64%

92%

100%

0%

20%

40%

60%

80%

100%

120%

19.0 19.9 20.8 21.7 22.6 23.5 24.4 25.3 26.2

%

Tiempo

TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO

Page 41: 01 presentacion de datos u ap

Organización de los Datos

Variable Numérica

Diagrama de Tallos y Hojas (Stem & Leaf)

Se ubican en una columna, en orden ascendente, todos los números queforman los datos una vez que se ha eliminado la última cifra (de lasunidades o de los décimos) . Estos valores son los “tallos”.

Se separa con una línea vertical estos números y a la derecha de cadauno de ellos se localizan en filas las cifras de las unidades (o de susdécimos) de cada dato (hojas) que comienza con ese número.

En cada fila, las hojas se ordena también de menor a mayor.

Page 42: 01 presentacion de datos u ap

Ejemplo

Variable Numérica

Gráfico de Tallos y Hojas de la variable “Edad del Jefe de Familia”

Page 43: 01 presentacion de datos u ap

¿Qué hemos visto?

Definición de estadística Población Muestra Variables

Cualitativas Numéricas

Presentación ordenada de datos Tablas de frecuencias

absolutas relativas acumuladas

Representaciones gráficas Cualitativas Numéricas

Diferenciales Integrales

Tallos y hojas43