01 presentacion de datos u ap

  • View
    238

  • Download
    0

  • Category

    Science

Preview:

Citation preview

Tema 1: Conceptos básicos y presentación de datos

MSc. Víctor Sánchez Cáceres

INTRODUCCIÓN

CONCEPTOS BASICOS

ORGANIZACIÓN DE DATOS

OBJETIVOS: Comprender qué es y porqué se estudia la

estadística.

Comprender los conceptos básicos de la estadística.

Explicar lo que significan estadística descriptiva y estadística inferencial.

Diferenciar entre una variable cualitativa y cuantitativa.

¿Qué es estadística?Recolecta

Organiza

Presenta

Analiza

interpreta

¿Para que sirve la estadística?

La Estadística se utiliza como tecnología al servicio de las ciencias.......

OBJETIVOS DE LA ESTADISTICA LA DESCRIPCION: Conjunto de datos presentados a

través de Cuadros y Gráficos para describir el comportamiento u composición de las variables.

EL ANALISIS: Generalización de resultados basándose en una muestra.

LA PREDICCION: Proyección de resultados, basándose en datos del pasado.

Tipos de estadísticaEstadística Descriptiva: Se ocupa de la

colección y clasificación de información, de suresumen en cuadros y gráficos adecuados queresuman en forma apropiada la información captada.

Estadística Inferencial: se ocupa de losprocesos de estimación, análisis y prueba de hipótesis,con el propósito de llegar a conclusiones que brindenuna adecuada base científica para la toma dedecisiones tomando como base la información

captada por la muestra.

CONCEPTOS BÁSICOS Población Muestra Unidad de Estudio Variable, Tipos y escala de medición Dato Observación Información Censo Parámetro Estadígrafo

Ejemplo: Se desea hacer un estudio sobre elingreso familiar de Cajamarca

Identifique: Población, una posible muestra,la característica en estudio y la unidad elemental.

Solución:

1. Población: Familias de Cajamarca

2. Muestra: 400 familias de Cajamarca

3. Variable: Ingreso familiar

4. Unidad elemental: Familia de Cajamarca

EJEMPLO

Se ha hecho un estudio para determinar la preferencia de una marca especial de aditivos por parte de los ingenieros metalúrgicos. Entre 50 ingenieros entrevistados, 30 dijeron que preferían marca Bayer.

a. ¿Qué constituye la muestra?.

Rpta:

b. ¿Qué constituye la población?.

Rpta:

c. ¿Cuál es la proporción, dentro de la muestra?

Rpta: p=30/50=0,60 (60% …prefieren la marca…)

VariablesSon las características que se desea apreciar de los elementos de la población.

CUALITATIVAS CUANTITATIVAS

DISCRETANOMINAL ORDINAL CONTINUA

ATRIBUTO NUMERICO

TIPOS DE VARIABLES

Cualitativas Nominales: Si sus categorías no se pueden ordenar

Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

Ordinales: Si sus categorías se pueden ordenarGrado de satisfacción, Intensidad del color

Cuantitativas o Numéricas Discretas: Si toma valores enteros

Número de hijos, Número de desempleados

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, ingreso mensual,

EJEMPLOClasificar cada una de las siguientes variables:

Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. (Cuantitativa. Continua)

Tiempo que requiere un estudiante para responder a un examen(Cuantitativa. Continua)

Llamadas que llegan a la central telefónica de la UPN en un día. (Cuantitativa. Discreta)

Preferencia de consumidores por cierta marca de refresco. (Cualitativa -Nominal)

Sexo de los estudiantes que toman el curso de estadística en el semestre. (Cualitativa -Nominal)

Número de acciones vendidas en un día en la Bolsa de Valores. (Cuantitativa. Discreta)

Nivel educativo de pobladores de cierta comunidad. (Cualitativa -Ordinal)

Pasos en un estudio estadístico

Plantear hipótesis sobre una población

Decidir qué datos recoger (diseño de experimentos)

• Qué individuos pertenecerán al estudio (muestras)

• Qué datos recoger de los mismos (variables)

Recoger los datos (muestreo)

• ¿Simple? ¿Estratificado? ¿Sistemático? ¿Agrupado?

Describir (resumir) los datos obtenidos

Realizar una inferencia sobre la población

Cuantificar la confianza en la inferencia

• Nivel de confianza

• Margen de error:

ORGANIZACIÓN DE DATOS

OBJETIVOS:

ƒOrganizar los datos en un cuadro de distribución de frecuencias

ƒPresentar los datos en gráficos de distribución de frecuencias.

ORGANIZACIÓN DE DATOSCUADRO DE VARIABLE CUALITATIVA

Variable frecuencia Porcentaje %

C1 f1 (f1/n)x100

C2 f2 (f2/n)x100

… … …

Ck fk (fk/n)x100

Total n 1

ORGANIZACIÓN DE DATOS

VARIABLE CUALITATIVA

Para representar gráficamente la distribución de

frecuencias de una variable cualitativa se utilizan las

barras y los sectores circulares.

Nota

Si trabajamos con variables nominales las categorías pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categorías deberán ser colocadas en orden(Grafico de barras)

Gráficos para v. cualitativas

Diagramas de barras Alturas proporcionales a las frecuencias

(abs. o rel.) Se pueden aplicar también a variables

discretas

Diagramas de sectores (tartas, polares) No usarlo con variables ordinales. El área de cada sector es proporcional a su

frecuencia (abs. o rel.)

Pictogramas Fáciles de entender. El área de cada modalidad debe ser

proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.

21

EJEMPLO:

En una planta embotelladora seregistraron 54 accidentes y de acuerdocon la parte del cuerpo lesionada,dedos (D), ojos (O), brazo (B), ypiernas (P); se registraron los datos(cuadro 1). Se pide organizar losdatos.

Datos:

D

D

B

P

B

B

D

D

D

P

D

O

D P D O D P

O

B

B

O

B

D

D

B

B

D

O

B

P

B

P

D

D

P

D

P

D

D

P

B

D

D

D

B

O

P

B

P

B

O

D

D

CUADRO 1:

PARTE LESIONADA DEL CUERPO EN

ACCIDENTES DEEMBOTELLADORA

FUENTE: Registros de accidentes en embotelladora

ELABORACION: Departamento de Personal

PARTE

LESIONADA

NÚMERO DE

ACCIDENTES

%

BRAZOS 14 25,93

DEDOS 22 40,74

OJO 7 12,96

PIERNA 11 20,37

Total 54 100

Grafico de Barras:

Grafico N° 1

FUENTE: Registros de accidentes en embotelladora

ELABORACION: Departamento de Personal

26

41

13

20

0

5

10

15

20

25

30

35

40

45

BRAZOS DEDOS OJO PIERNA

%

Parte lesionada

PARTE LESIONADA DEL CUERPO EN ACCIDENTES EN EMBOTELLADORA

Grafico de Sectores Circulares:

Grafico N° 2

FUENTE: Registros de accidentes en embotelladora

ELABORACION: Departamento de Personal

26%

41%

13%

20%

PARTE LESIONADA DEL CUERPO EN ACCIDENTES EN EMBOTELLADORA

BRAZOS

DEDOS

OJO

PIERNA

ORGANIZACIÓN DE DATOS

VARIABLE CUANTITATIVA DISCRETA

Xi fi hi Fi Hi

X1 f1 h1 F1 H1

X2 f2 h2 F2 H2

… … … … …

Xk fk hk Fk Hk

TOTAL n 1

Ejemplo

Construir la distribución de frecuencias del número de trabajadores que se ausentaron en 20 días laborales:

2 1 2 4 1

3 2 3 2 0

3 2 1 3 2

3 3 1 2 4

Ausencias de

Trabajadores

N° de días Porcentajes

0 1 0.05x100=5%

1 4 0.20x100=20%

2 7 0.35x100=35%

3 6 0.30x100=30%

4 2 0.10x100=10%

20 100%

CUADRO N 2

NUMERO DE AUSENCIAS DE TRABAJADORES

FUENTE: Registro de control de asistencia de trabajadores

ELABORACION: Departamento de Personal

Ausencias de

Trabajadores

N° de días (fi) hi% Fi Hi%

0 1 5 1 5

1 4 20 5 25

2 7 35 12 60

3 6 30 18 90

4 2 10 20 100

Total 20 100

Grafico de Bastones:

GRAFICO N 3

FUENTE: Registro de control de asistencia de trabajadores

ELABORACION: Departamento de Personal

5

20

35

30

10

0

5

10

15

20

25

30

35

40

0 1 2 3 4

%

Ausencias

AUSENCIAS DE TRABAJADORES

Grafico de Escalones:GRAFICO N 4

FUENTE: Registro de control de asistencia de trabajadores

ELABORACION: Departamento de Personal

5

25

60

90

100

0

20

40

60

80

100

120

0 1 2 3 4

%

Ausencias

AUSENCIAS DE TRABAJADORES

Ejemplo ¿Cuántos individuos tienen

menos de 2 hijos? frec. indiv. sin hijos

+ frec. indiv. con 1 hijo = 419 + 255= 674 individuos

¿Qué porcentaje de individuos tiene 6 hijos o menos? 97,3%

¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual? 2 hijos

Número de hijos

419 27,8 27,8

255 16,9 44,7

375 24,9 69,5

215 14,2 83,8

127 8,4 92,2

54 3,6 95,8

24 1,6 97,3

23 1,5 98,9

17 1,1 100,0

1509 100,0

0

1

2

3

4

5

6

7

Ocho+

Total

Frec.

Porcent.

(válido)

Porcent.

acum.

33

≥50%

ORGANIZACIÓN DE DATOS

VARIABLE CUANTITATIVA CONTINUA

Intervalo [Li ; Ls>

Marca de Clase (Xi)

fi hi Fi Hi

I1 X1 f1 h1 F1 H1

I2 X2 f2 h2 F2 H2

… … … … … …

Ik Xk fk hk Fk Hk

Total n 1

Ejemplo. En la oficina de un diario, el tiempo que setardan en imprimir la primera plana fue registradodurante 50 días. A continuación se transcriben losdatos, aproximados a décimas de minuto:

20,8

22,8

21,9

22,0

20,7

20,9

25,0

22,2

22,8

20,1

25,3 20,7 22,5 21,2 23,8 23.3 20,9 22,9 23,5 19,5

23,7

20,3

23,6

19,0

25,1

25,0

19,5

24,1

24,2

21,8

21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9

19,7

24,2

23,8

20,7

23,8

24,3

21,1

20,9

21,6

22,7

Construya con los datos una tabla de distribución de frecuencia, usando la regla de sturges.

PROCEDIMIENTO

•Calcular el rango (R) o recorrido, el cual se define de la siguiente manera:

R = Obs. máxima – Obs. Mínima

R = 25.3 - 19.0 = 6.3

•Determine el número de intervalos (k)

K = 1 + 3.3 log (n) (Fórmula de Sturges) K = 1 + 3.3 log (50) = 6.607 = 7 (entero) (Redondeo simple)

•Determinar la amplitud del intervalo (a=R/K) (Redondeado por exceso) Se redondea según el número de decimales que se tiene en la muestra : a=6.3/7=0.9

Cuadro N3Tiempo que se tardan en imprimir la primera plana

de un diario

FUENTE: observación de impresión de primera planaELABORACION: Departamento de Logística

Tiempo

(minutos)

Xi fi hi Fi Hi

[19.0-19.9> 19.45 5 0.10 5 0.10

[19.9-20.8> 20.35 6 0.12 11 0.22

[20.8-21.7> 21.25 9 0.18 20 0.40

[21.7-22.6> 22.15 5 0.10 25 0.50

[22.6-23.5> 23.05 7 0.14 32 0.64

[23.5-24.4> 23.95 14 0.28 46 0.92

[24.4-25.3] 24.85 4 0.08 50 1.00

Total 50 1

Grafico de Histograma:GRAFICO N 5

FUENTE: observación de impresión de primera plana del Diario

ELABORACION: Departamento de Logística

10%

12%

18%

10%

14%

28%

8%

0%

5%

10%

15%

20%

25%

30%

18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75

%

Tiempo

TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO

Grafico de Polígono:

GRAFICO N 6

FUENTE: observación de impresión de primera plana del Diario

ELABORACION: Departamento de Logística

10%

12%

18%

10%

14%

28%

8%

0%

5%

10%

15%

20%

25%

30%

18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75

%

Tiempo

TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO

Grafico de Ojiva:GRAFICO N 7

FUENTE: observación de impresión de primera plana del Diario

ELABORACION: Departamento de Logística

10%

22%

40%

50%

64%

92%

100%

0%

20%

40%

60%

80%

100%

120%

19.0 19.9 20.8 21.7 22.6 23.5 24.4 25.3 26.2

%

Tiempo

TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO

Organización de los Datos

Variable Numérica

Diagrama de Tallos y Hojas (Stem & Leaf)

Se ubican en una columna, en orden ascendente, todos los números queforman los datos una vez que se ha eliminado la última cifra (de lasunidades o de los décimos) . Estos valores son los “tallos”.

Se separa con una línea vertical estos números y a la derecha de cadauno de ellos se localizan en filas las cifras de las unidades (o de susdécimos) de cada dato (hojas) que comienza con ese número.

En cada fila, las hojas se ordena también de menor a mayor.

Ejemplo

Variable Numérica

Gráfico de Tallos y Hojas de la variable “Edad del Jefe de Familia”

¿Qué hemos visto?

Definición de estadística Población Muestra Variables

Cualitativas Numéricas

Presentación ordenada de datos Tablas de frecuencias

absolutas relativas acumuladas

Representaciones gráficas Cualitativas Numéricas

Diferenciales Integrales

Tallos y hojas43

Recommended