56
“Estadística” Prof. Juan Narro Lavi Diplomatura de Estudio en Gestión de Operaciones

Est Sesiones 1 y 2 Diplops Adobe

  • Upload
    rcampos

  • View
    221

  • Download
    0

Embed Size (px)

DESCRIPTION

Estadistica

Citation preview

Page 1: Est Sesiones 1 y 2 Diplops Adobe

“Estadística”Prof. Juan Narro Lavi

Diplomatura de Estudio en

Gestión de Operaciones

Page 2: Est Sesiones 1 y 2 Diplops Adobe

Sesiones 1 y 2:Descripción de Datos

Page 3: Est Sesiones 1 y 2 Diplops Adobe

“Antes del inicio de la guerra se prevé que se podrá conquistar la victoria, eso se debe a los repetidos y minuciosos cálculos, a las apreciaciones y planificaciones que se hacen en el templo…”

Sun Tzu

Page 4: Est Sesiones 1 y 2 Diplops Adobe

“Nosotros confiamos en Dios. Todos los demás deben usar datos”

W.E.Deming

Page 5: Est Sesiones 1 y 2 Diplops Adobe

RECOLECTAR

Es una ciencia queabarca técnicas que nos permiten:

ORGANIZAR

PRESENTAR

INTERPRETAR

Estadística – Definición

TOMA DE

DECISIONES

ANALIZAR

DEFINIR

Page 6: Est Sesiones 1 y 2 Diplops Adobe

Toma de Decisiones

1. Datos: Observaciones específicas a través de mediciones o conteos.

2. Información: Datos procesados y resumidos para producir hechos y generar ideas.

3. Conocimiento: Información seleccionada y organizada que proporciona entendimiento, recomendaciones y el sustento para las decisiones.

Page 7: Est Sesiones 1 y 2 Diplops Adobe

Estadística

Estadística

Descriptiva

Inferencial

Resumir

Presentar

Numéricas

Gráficas

HistogramasPolígonosCurvasBarrasPastel

Distribuc. FrecuenciasMed. Tend. CentralDispersión

Page 8: Est Sesiones 1 y 2 Diplops Adobe

8

Diagrama Circular

Resumir Datos: Media Aritmética Simple

Edad N°Trabajadores

30 - 3435 - 3940 - 4445 - 49

612

82

Tabla de Distribución

Estadística Descriptiva

Presentar Datos: Tablas y Gráficas

ii

N

ii

n

X x

Nx

n1 1;

Page 9: Est Sesiones 1 y 2 Diplops Adobe

Estadística

Estadística

Descriptiva

Inferencial

Resumir

Presentar

Numéricas

Gráficas

Plantear

Probar

Supuestos

HistogramasPolígonosCurvasBarrasPastel

ProbabilidadDist. NormalDist. Normal Std.T StudentPoissonChi Cuadrado

Distribuc. FrecuenciasMed. Tend. CentralDispersión

Page 10: Est Sesiones 1 y 2 Diplops Adobe

• Estimación– Ej. Estimar el peso

promedio de la población usando el peso promedio de la muestra.

• Prueba de Hipótesis– Ej. Probar que el peso

promedio de la población es 65 kg.

Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en

los resultados de una muestra.

Estadística Inferencial

Page 11: Est Sesiones 1 y 2 Diplops Adobe

MARCO POBLACIONAL(1200 Trabajadores de una Empresa)

Característica

Edad PesoExper.laboral (años)

Estado Civil

Registrode la

Caract.Población

P1

(1200 datos)...

PoblaciónP2

(1200 datos)

PoblaciónP3

(1200 datos)

PoblaciónPn

(1200 datos)

Page 12: Est Sesiones 1 y 2 Diplops Adobe

Característica

Registrode la

Caract.

Marco Poblacional

1200 trabajadores de la empresa

Técnicas

de muestreo

Marco Muestral

75 trabajadores de la empresa

POBLACIÓN

P1 P2 P3 Pn

Edad Peso Exper.Lab. Estado civil

...

POBLACIÓN POBLACIÓNPOBLACIÓN

Page 13: Est Sesiones 1 y 2 Diplops Adobe

Edad Peso Exper.Lab. Estado civil

MUESTRA

m1

75 datos

m2 m3 mn

Característica

Registrode la

Caract.

Marco Poblacional

1200 trabajadores de la empresa

Técnicas

de muestreo

Marco Muestral

75 trabajadores de la empresa

P1 P2

POBLACIÓN

P3 Pn

Edad Peso Exper.Lab. Estado civil

...

POBLACIÓN POBLACIÓNPOBLACIÓN

MUESTRA MUESTRA MUESTRA

Page 14: Est Sesiones 1 y 2 Diplops Adobe

Parámetro y Estimador

Parámetro:

Valor representativo de una población. Se simboliza por letras griegas.

Sólo hay un parámetro en cada población.

m Media poblacional

2 Varianza poblacional

Desviación estándar poblacional p Proporción poblacional

Page 15: Est Sesiones 1 y 2 Diplops Adobe

Estimador

Valor representativo de una muestra. Se simboliza por letras latinas.

Existen tantos estimadores como muestras se

extraigan de una población.

Media muestral.

Varianza muestra.

Desviación estándar muestral.

Proporción muestral.

x2ssp

Parámetro y Estimador

Page 16: Est Sesiones 1 y 2 Diplops Adobe

POBLACIÓN

MUESTRATécnicas de

Muestreo

Estadística Inferencial

Estimador : x

Parámetro : µ - = Error de muestreo

Parámetro y Estimador

Page 17: Est Sesiones 1 y 2 Diplops Adobe

Dato

Atributo Numérico

Discreto Continuo

Ejemplos:

Estado Civil Especialidad Color de Ojos (Define categorias o

grupos)

Ejemplos:

Número de Niños Defectos por hora (Items Contados)

Ejemplos:

Peso Voltaje (Características Medidas)

Estadística – Tipos de Datos

Page 18: Est Sesiones 1 y 2 Diplops Adobe

¿Qué podemos hacer con los datos?

Identificar característicasde interés para la gestión.

Recolección de datos

Organizarlos en tablas, gráficos y figuras

Calcular promedios ( media, mediana, moda y percentiles ) .

Calcular su dispersión (varianza, desviación estándar ).

Determinar una ecuación que represente larelación entre ellos (regresión)

Determinar el grado de asociación entreellos (correlación).

Analizarlos dentro de un horizontetemporal (series cronológicas)

Mejorar laCalidad Decisional

Page 19: Est Sesiones 1 y 2 Diplops Adobe

Fases del análisis estadístico

Definición ProblemaVariable / Atributo

Definición Población o Muestra

Recolección DatosPlan Censal / Muestral

Organización y Presentación de Datos

Medidas Estadísticas Parámetros/Estimador

Inferencia EstadísticaEstimación/P. Hipótesis

Conclusiones / Recomendaciones

Page 20: Est Sesiones 1 y 2 Diplops Adobe

Obtención de la Información

• Encuestas son el último recurso.• Principales fuentes:

– Publicaciones periódicas del gobierno– Firmas Financieras– Instituciones de Investigación– Grupos económicos– Periódicos y Revistas especializadas– Base de Datos Computarizadas, Redes.

Page 21: Est Sesiones 1 y 2 Diplops Adobe

Estadística descriptiva - Análisis de datos

• Distribución de Frecuencias– Agrupamiento de datos en categorías que

muestran el número de observaciones en cada categoría.

• Medidas de Tendencia Central (Posición)– Aquellas que indican el valor de un punto

medio o típico de un grupo de datos.• Medidas de Dispersión

– Aquellas que indican como se encuentran esparcidas las observaciones de un grupo de datos.

Page 22: Est Sesiones 1 y 2 Diplops Adobe

• Técnicas:

VariablesCualitativas

VariablesCuantitativas

• Distribución de Frecuencias• Tabla Cruzada • Barras• Circular• Pareto

• Lineal• Distribución de Frecuencias• Histograma y Ojiva• Tallo y Hoja • Dispersión

Tablas y los gráficos

Page 23: Est Sesiones 1 y 2 Diplops Adobe

Variable

Cualitativa

Gráfica de Datos

Circular ParetoBarrasDistribución de

Frecuencias

Tabulación de Datos

Tablas y los gráficos

Page 24: Est Sesiones 1 y 2 Diplops Adobe

(Variables son categoricas - atributos)

Ejemplo: Pacientes de Hospital por Unidad

Resumen de datos por categoria

Unidad Número de Pacientes PorcentajeCuidado Cardiaco 1,052.00 11.93%Emergencia 2,245.00 25.46%UCI 340.00 3.86%Maternidad 552.00 6.26%Cirugía 4,630.00 52.50%Total 8,819.00 100.00%

Distribución de Frecuencias

Page 25: Est Sesiones 1 y 2 Diplops Adobe

• Gráfico de Barras de pacientes por Unidad

Distribución de Frecuencias

Cuidado Cardiaco

Emergencia UCI Maternidad Cirugía Total -

1,000.00

2,000.00

3,000.00

4,000.00

5,000.00

6,000.00

7,000.00

8,000.00

9,000.00

10,000.00

1,052.00

2,245.00

340.00 552.00

4,630.00

8,819.00

Número de Pacientes

Page 26: Est Sesiones 1 y 2 Diplops Adobe

Tabla Cruzada

• Tabla Cruzada (o de Contingencia), es el listado del númewro de observaciones para cada combinación de valores de dos variables (cuantitativa o cualitativa).

• Si hay r categorias para la primera variables (filas) y c categorias para la segunda variable (columnas), la tabla es llamada “Tabla cruzada de r x c.

Page 27: Est Sesiones 1 y 2 Diplops Adobe

• Tabla Cruzada 3 x 3 para las Alternativas de Inversión de un Inversionista (en $1000’s)

Tabla Cruzada

InversiónInversionista

AInversionista

BInversionista

CTotal

Acciones 46 55 27 128

Bonos 32 44 19 95

Efectivo 15 20 33 68

Total 93 119 79 291

Page 28: Est Sesiones 1 y 2 Diplops Adobe

• Barras Horizontales lado a lado

Tabla Cruzada - Gráficos

Page 29: Est Sesiones 1 y 2 Diplops Adobe

• Barra Acumulada

Tabla Cruzada - Gráficos

Page 30: Est Sesiones 1 y 2 Diplops Adobe

• Ventas Trimestrales por Región:

Tabla Cruzada - Gráficos

  1er Trim 2do Trim 3er Trim 4to TrimNorte 20.4 27.4 59 20.4Centro 30.6 38.6 34.6 31.6Sur 45.9 46.9 45 43.9

Page 31: Est Sesiones 1 y 2 Diplops Adobe

• Los gráficos de Barras y Circulares son frecuentemente usados para presentar datos cualitativos.

• La altura de la Barra o el tamaño del Sector Circular muestran la frecuencia o porcentaje de cada categoría.

Gráficos de Barras y Circular

Page 32: Est Sesiones 1 y 2 Diplops Adobe

Unidad Número de PacientesCuidado Cardiaco 1,052.00 Emergencia 2,245.00 UCI 340.00 Maternidad 552.00 Cirugía 4,630.00 Total 8,819.00

Gráficos de Barras y Circular

Page 33: Est Sesiones 1 y 2 Diplops Adobe

(Porcentajes son

redondeados )

Gráficos de Barras y Circular

UnidadNúmero de Pacientes

Porcentaje

Cuidado Cardiaco 1,052.00 11.93%Emergencia 2,245.00 25.46%UCI 340.00 3.86%Maternidad 552.00 6.26%Cirugía 4,630.00 52.50%Total 8,819.00 100.00%

Page 34: Est Sesiones 1 y 2 Diplops Adobe

Diagrama de Pareto

1. Decidir que elementos se estudiarán y colectar datos.

2. Tabular datos y calcular los #s acumulados.

3. Dibujar los ejes X e Y.4. Muestre los datos como

barras.5. Dibuje una curva

acumulativa.6. Crear una escala % en eje

vertical adicional.7. Rotular el diagrama.8. Analizar el diagrama.

1. Enfocar el aspecto principal de un problema.

2. Decidir el objetivo y elementos de mejoras.

3. Predecir la efectividad de la mejora.

4. Confeccionar diagramas ordenados por causas.

5. Comprender la efectividad de la mejora.

6. Emplear pérdidas unitarias en lugar de casos o unid. físicas.

Pasos Empleo

Page 35: Est Sesiones 1 y 2 Diplops Adobe

• En la planta de una empresa metal-mecánica se levantó la siguiente información referida a las lesiones sufridas por el personal entre el 1ro. de Enero y 31 de Mayo. Analizar y Concluir

Lesiones Enero Febrero Marzo Abril MayoEsguince de espalda 6 10 10 7 5Quemadura con acido 1 1Cortadura de mano 1 4 1 3 2Esguince de tobillo 1 2 1Cuerpo extraño en el ojo 2 1 1Cortadura de pierna 1 1 2 1 1

Diagrama de Pareto

Page 36: Est Sesiones 1 y 2 Diplops Adobe

Esguince de espalda

Cortadura de mano

Cortadura de pierna

Esguince de tobillo

Cuerpo ex-traño en el

ojo

Quemadura con acido

Esguince de espalda

Cortadura de mano

Cortadura de pierna

Esguince de tobillo

Cuerpo ex-traño en el

ojo

Quemadura con acido

TOTAL

38 11 6 4 4 2

F.R. ACM.

0.584615384615385

0.753846153846154

0.846153846153847

0.907692307692308

0.969230769230769

1

5

15

25

35

45

55

65

0.050.150.250.350.450.550.650.750.850.95

Lesiones Enero – Mayo

Cant

. de L

esion

es

Diagrama de Pareto

Page 37: Est Sesiones 1 y 2 Diplops Adobe

Datos Numéricos

Gráfico Tallo y Hoja

Histograma Ogiva

Distribucion de Frecuencias yDistribuciones Acumulativas

Tablas y los gráficos

Page 38: Est Sesiones 1 y 2 Diplops Adobe

¿Qué es una Distribución de Frecuencias?

• Una distribución de frecuencias es una lista o una tabla …

• Conteniendo agrupaciones de clases (categorias o rangos dentro de los cuales se encuetran los datos) ...

• Y la correspondiente frecuencia con la cual los datos se encuentran en cada clase o categoria.

Distribución de frecuencias

Page 39: Est Sesiones 1 y 2 Diplops Adobe

Distribución de frecuencias - Definiciones• Intervalo de clase

– Número reducido de datos.• Frontera/Límite de clase

– Punto medio entre dos extremos de clase consecutivas.

• Amplitud de clase– Diferencia entre la frontera superior e

inferior de una clase.• Marca de clase

– Punto medio entre los extremos/fronteras de una clase.

• Frecuencia de clase– Número de variables incluidas en un

intervalo de clase.

Page 40: Est Sesiones 1 y 2 Diplops Adobe

Distribución de Frecuencias

• Pasos

1.Determinar el tipo y número de clases (intervalos).

Regla general : 5 - 20

Sturges : # clases = 1 + 3.3 log N

2.Determinar la amplitud de la clase (i)

i = (Val. Máx. - Val. Min.) / # clases

3.Establecer el extremo inferior.

4.Determinar las fronteras (limites)

5.Calcular la marca de clase (m)

6.Contar el número de observaciones en cada clase (f).

Page 41: Est Sesiones 1 y 2 Diplops Adobe

PETROLOBITOSProduccion de Petroleo

(en Miles de Barriles)

38 31 41 52 5933 34 92 74 6877 68 84 41 4054 49 60 62 5978 63 46 74 6960 37 43 51 6192 95 81 38 6070 42 88 94 8573 66 75 64 5676 95 69 50 5569 83 78 74 7783 49 34 78 4838 76 99 38 9468 51 87 53 6939 60 35 79 8071 58 83 94 6667 50 86 70 8051 57 54 46 4634 48 64 71 6561 65 64 98 55

Ejercicio

Page 42: Est Sesiones 1 y 2 Diplops Adobe

Distribución de Frecuencias

• Pasos

1.Determinar el tipo y número de clases (intervalos).

Sturges : # clases = 1 + 3.3 log N

# de clases= 1 + 3.3 log (100) = 1 + 3.3 * 2 = 7.6

# de clases= 7

2.Determinar la amplitud de la clase (i)

i = (Val. Máx. - Val. Min.) / # clases

i = (99-31) / 7 = 9.7

i = 10

3. Establecer el extremo inferior.

Puede ser 31 o menos.

Por facilidad 30

Page 43: Est Sesiones 1 y 2 Diplops Adobe

Distribución de Frecuencias

• Pasos

4. Determinar las fronteras (limites)

Fronteras se expresan con un decimal adicional

Frontera inferior de primera clase pto. Medio entre 29 y 30, es decir 29.5

Frontera superior = 29.5 + 10 = 39.5

Extremo superior de la primera clase sería 39.

5. Calcular la marca de clase (m)

Pto.medio entre extremos o fronteras

(30 + 39) / 2 = 34.5 ó (29.5 + 39.5) / 2 = 34.5

6.Contar el número de observaciones en cada clase (f).

Page 44: Est Sesiones 1 y 2 Diplops Adobe

Distribución de Frecuencias

Intervalo Clase

Amplitud (i)

Frontera Inferior

(li)

Frontera Superior

(ls)

Marca Clase(m)

Frecuencia Absoluta

(f)

30 -39 10 29.5 39.5 34.5 12

40 – 49 10 39.5 49.5 44.5 12

50 – 59 10 49.5 59.5 54.5 16

60 – 69 10 59.5 69.5 64.5 23

70 – 79 10 69.5 79.5 74.5 17

80 – 89 10 79.5 89.5 84.5 11

90 – 99 10 89.5 99.5 94.5 9

Page 45: Est Sesiones 1 y 2 Diplops Adobe

Distribución de Frecuencias

Intervalo Clase

Marca Clase

Frecuencia Absoluta

Frecuencia Acumulada

Frecuencia Relativa

Frecuencia Relativa Acumulada

30 -39 34.5 12 12 0.12 0.12

40 – 49 44.5 12 24 0.12 0.24

50 – 59 54.5 16 40 0.16 0.40

60 – 69 64.5 23 63 0.23 0.63

70 – 79 74.5 17 80 0.17 0.80

80 – 89 84.5 11 91 0.11 0.91

90 – 99 94.5 10 100 0.09 1.00

Tabla de Frecuencias de la distribución deCuentas por Cobrar Tienda BETA

Fuente: Dpto. Contabilidad Tienda BETA

Page 46: Est Sesiones 1 y 2 Diplops Adobe

• Un gráfico de los datos arreglados en una distribución de frecuencias es llamado histograma.

• Los criterios de valoración de intervalo se muestran en el eje horizontal

• en el eje vertical se presentan: frecuencia, frecuencia relativa, o porcentaje

• Barra de altrura apropiada son empleadas para representar el número de observaciones que hay dentro de cada clase.

Histograma

Page 47: Est Sesiones 1 y 2 Diplops Adobe

EjemploGráfico 4: Peso de 100 Personas (en Kg.)

Número de Personas

0

5

10

15

20

25

29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5Peso(Kgs)

Fuente: Encuesta, enero 1998

Histograma

Page 48: Est Sesiones 1 y 2 Diplops Adobe

Ejemplo Gráfico 5: Marca de bebida gaseosa preferida por

universitarios (en %)

0

5

10

15

20

CocaCola

PepsiCola

InkaCola

Fanta Otros

%

Fuente: Encuesta a Universitarios, enero 1998

Histograma

Page 49: Est Sesiones 1 y 2 Diplops Adobe

Empleo de histogramas

• Normales– Proceso estable, distrib.

simétrica.• Doble pico

– Mezcla de datos con diferentes medias.

• Islas– Mezcla accidental con

otra distribución.• “Cliff”

– Final abrupto en una columna alta (eliminar)

• Rueda dentada– Amplitudes múltiplos

enteros (escala)

• ¿Está el centro de la distribución exactamente en el medio de las especificaciones?

• ¿Es la dispersión demasiado grande o pequeña?

• ¿Aparece algún dato más allá de las especificaciones?

• ¿Hay un espacio amplio para la distribución dentro de las especificaciones?

Page 50: Est Sesiones 1 y 2 Diplops Adobe

Análisis Gráfico

• Histograma– Gráfica de barras de una distribución de frecuencias.

• Polígono de frecuencias– Gráfica lineal de una distribución de frecuencias (marca).

• Curvas– Polígono de frecuencias suavizado (asimetría, curtosis)

• Ojiva– Gráfica de una distribución de frecuencias acumulada.

• Barras– Gráfica de frecuencias para diferentes categorias de datos.

• Pastel– Para ilustrar divisiones de una cantidad total (%).

Page 51: Est Sesiones 1 y 2 Diplops Adobe

Intervalo Clase

Marca Clase

Frecuencia Absoluta

Frecuencia Acumulada

Frecuencia Relativa

Frecuencia Relativa Acumulada

30 -39 34.5 12 12 0.12 0.12

40 – 49 44.5 12 24 0.12 0.24

50 – 59 54.5 16 40 0.16 0.40

60 – 69 64.5 23 63 0.23 0.63

70 – 79 74.5 17 80 0.17 080

80 – 89 84.5 11 91 0.11 0.91

90 – 99 94.5 9 100 0.09 1.00

Tabla de Frecuencias de la distribución deCuentas por Cobrar Tienda BETA

Fuente: Dpto. Contabilidad Tienda BETA

Análisis Gráfico

Page 52: Est Sesiones 1 y 2 Diplops Adobe

0

5

10

15

20

25

30-39 40-49 50-59 60-69 70-79 80-89 90-99

Frecuencia

Clases

Tienda "BETA"Histograma

Frecuencia

Fuente: Dpto. Contabilidad Tienda BETA

Page 53: Est Sesiones 1 y 2 Diplops Adobe

0

5

10

15

20

25

34.5 44.5 54.5 64.5 74.5 84.5 94.5

Frecuencia

Clases

Tienda "BETAPoligono de frecuencias

Frecuencia

Frecuencia

Fuente: Dpto. Contabilidad Tienda BETA

Page 54: Est Sesiones 1 y 2 Diplops Adobe

0

20

40

60

80

100

120

30-39 40-49 50-59 60-69 70-79 80-89 90-99

Frecuencia

Clases

Tienda "BETA"Frecuencia Acumulada

Frec. Acum.

Fuente: Dpto. Contabilidad Tienda BETA

Page 55: Est Sesiones 1 y 2 Diplops Adobe

30-3912%

40-4912%

50-5916%

60-6923%

70-7917%

80-8911%

90-999%

Tienda "BETA"Frecuencia Relativa

Fuente: Dpto. Contabilidad Tienda BETA

Page 56: Est Sesiones 1 y 2 Diplops Adobe

“Estadística”Prof. Juan Narro Lavi

Diplomatura de Estudio en

Gestión de Operaciones