Est Sesiones 1 y 2 Diplops Adobe

Preview:

DESCRIPTION

Estadistica

Citation preview

“Estadística”Prof. Juan Narro Lavi

Diplomatura de Estudio en

Gestión de Operaciones

Sesiones 1 y 2:Descripción de Datos

“Antes del inicio de la guerra se prevé que se podrá conquistar la victoria, eso se debe a los repetidos y minuciosos cálculos, a las apreciaciones y planificaciones que se hacen en el templo…”

Sun Tzu

“Nosotros confiamos en Dios. Todos los demás deben usar datos”

W.E.Deming

RECOLECTAR

Es una ciencia queabarca técnicas que nos permiten:

ORGANIZAR

PRESENTAR

INTERPRETAR

Estadística – Definición

TOMA DE

DECISIONES

ANALIZAR

DEFINIR

Toma de Decisiones

1. Datos: Observaciones específicas a través de mediciones o conteos.

2. Información: Datos procesados y resumidos para producir hechos y generar ideas.

3. Conocimiento: Información seleccionada y organizada que proporciona entendimiento, recomendaciones y el sustento para las decisiones.

Estadística

Estadística

Descriptiva

Inferencial

Resumir

Presentar

Numéricas

Gráficas

HistogramasPolígonosCurvasBarrasPastel

Distribuc. FrecuenciasMed. Tend. CentralDispersión

8

Diagrama Circular

Resumir Datos: Media Aritmética Simple

Edad N°Trabajadores

30 - 3435 - 3940 - 4445 - 49

612

82

Tabla de Distribución

Estadística Descriptiva

Presentar Datos: Tablas y Gráficas

ii

N

ii

n

X x

Nx

n1 1;

Estadística

Estadística

Descriptiva

Inferencial

Resumir

Presentar

Numéricas

Gráficas

Plantear

Probar

Supuestos

HistogramasPolígonosCurvasBarrasPastel

ProbabilidadDist. NormalDist. Normal Std.T StudentPoissonChi Cuadrado

Distribuc. FrecuenciasMed. Tend. CentralDispersión

• Estimación– Ej. Estimar el peso

promedio de la población usando el peso promedio de la muestra.

• Prueba de Hipótesis– Ej. Probar que el peso

promedio de la población es 65 kg.

Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en

los resultados de una muestra.

Estadística Inferencial

MARCO POBLACIONAL(1200 Trabajadores de una Empresa)

Característica

Edad PesoExper.laboral (años)

Estado Civil

Registrode la

Caract.Población

P1

(1200 datos)...

PoblaciónP2

(1200 datos)

PoblaciónP3

(1200 datos)

PoblaciónPn

(1200 datos)

Característica

Registrode la

Caract.

Marco Poblacional

1200 trabajadores de la empresa

Técnicas

de muestreo

Marco Muestral

75 trabajadores de la empresa

POBLACIÓN

P1 P2 P3 Pn

Edad Peso Exper.Lab. Estado civil

...

POBLACIÓN POBLACIÓNPOBLACIÓN

Edad Peso Exper.Lab. Estado civil

MUESTRA

m1

75 datos

m2 m3 mn

Característica

Registrode la

Caract.

Marco Poblacional

1200 trabajadores de la empresa

Técnicas

de muestreo

Marco Muestral

75 trabajadores de la empresa

P1 P2

POBLACIÓN

P3 Pn

Edad Peso Exper.Lab. Estado civil

...

POBLACIÓN POBLACIÓNPOBLACIÓN

MUESTRA MUESTRA MUESTRA

Parámetro y Estimador

Parámetro:

Valor representativo de una población. Se simboliza por letras griegas.

Sólo hay un parámetro en cada población.

m Media poblacional

2 Varianza poblacional

Desviación estándar poblacional p Proporción poblacional

Estimador

Valor representativo de una muestra. Se simboliza por letras latinas.

Existen tantos estimadores como muestras se

extraigan de una población.

Media muestral.

Varianza muestra.

Desviación estándar muestral.

Proporción muestral.

x2ssp

Parámetro y Estimador

POBLACIÓN

MUESTRATécnicas de

Muestreo

Estadística Inferencial

Estimador : x

Parámetro : µ - = Error de muestreo

Parámetro y Estimador

Dato

Atributo Numérico

Discreto Continuo

Ejemplos:

Estado Civil Especialidad Color de Ojos (Define categorias o

grupos)

Ejemplos:

Número de Niños Defectos por hora (Items Contados)

Ejemplos:

Peso Voltaje (Características Medidas)

Estadística – Tipos de Datos

¿Qué podemos hacer con los datos?

Identificar característicasde interés para la gestión.

Recolección de datos

Organizarlos en tablas, gráficos y figuras

Calcular promedios ( media, mediana, moda y percentiles ) .

Calcular su dispersión (varianza, desviación estándar ).

Determinar una ecuación que represente larelación entre ellos (regresión)

Determinar el grado de asociación entreellos (correlación).

Analizarlos dentro de un horizontetemporal (series cronológicas)

Mejorar laCalidad Decisional

Fases del análisis estadístico

Definición ProblemaVariable / Atributo

Definición Población o Muestra

Recolección DatosPlan Censal / Muestral

Organización y Presentación de Datos

Medidas Estadísticas Parámetros/Estimador

Inferencia EstadísticaEstimación/P. Hipótesis

Conclusiones / Recomendaciones

Obtención de la Información

• Encuestas son el último recurso.• Principales fuentes:

– Publicaciones periódicas del gobierno– Firmas Financieras– Instituciones de Investigación– Grupos económicos– Periódicos y Revistas especializadas– Base de Datos Computarizadas, Redes.

Estadística descriptiva - Análisis de datos

• Distribución de Frecuencias– Agrupamiento de datos en categorías que

muestran el número de observaciones en cada categoría.

• Medidas de Tendencia Central (Posición)– Aquellas que indican el valor de un punto

medio o típico de un grupo de datos.• Medidas de Dispersión

– Aquellas que indican como se encuentran esparcidas las observaciones de un grupo de datos.

• Técnicas:

VariablesCualitativas

VariablesCuantitativas

• Distribución de Frecuencias• Tabla Cruzada • Barras• Circular• Pareto

• Lineal• Distribución de Frecuencias• Histograma y Ojiva• Tallo y Hoja • Dispersión

Tablas y los gráficos

Variable

Cualitativa

Gráfica de Datos

Circular ParetoBarrasDistribución de

Frecuencias

Tabulación de Datos

Tablas y los gráficos

(Variables son categoricas - atributos)

Ejemplo: Pacientes de Hospital por Unidad

Resumen de datos por categoria

Unidad Número de Pacientes PorcentajeCuidado Cardiaco 1,052.00 11.93%Emergencia 2,245.00 25.46%UCI 340.00 3.86%Maternidad 552.00 6.26%Cirugía 4,630.00 52.50%Total 8,819.00 100.00%

Distribución de Frecuencias

• Gráfico de Barras de pacientes por Unidad

Distribución de Frecuencias

Cuidado Cardiaco

Emergencia UCI Maternidad Cirugía Total -

1,000.00

2,000.00

3,000.00

4,000.00

5,000.00

6,000.00

7,000.00

8,000.00

9,000.00

10,000.00

1,052.00

2,245.00

340.00 552.00

4,630.00

8,819.00

Número de Pacientes

Tabla Cruzada

• Tabla Cruzada (o de Contingencia), es el listado del númewro de observaciones para cada combinación de valores de dos variables (cuantitativa o cualitativa).

• Si hay r categorias para la primera variables (filas) y c categorias para la segunda variable (columnas), la tabla es llamada “Tabla cruzada de r x c.

• Tabla Cruzada 3 x 3 para las Alternativas de Inversión de un Inversionista (en $1000’s)

Tabla Cruzada

InversiónInversionista

AInversionista

BInversionista

CTotal

Acciones 46 55 27 128

Bonos 32 44 19 95

Efectivo 15 20 33 68

Total 93 119 79 291

• Barras Horizontales lado a lado

Tabla Cruzada - Gráficos

• Barra Acumulada

Tabla Cruzada - Gráficos

• Ventas Trimestrales por Región:

Tabla Cruzada - Gráficos

  1er Trim 2do Trim 3er Trim 4to TrimNorte 20.4 27.4 59 20.4Centro 30.6 38.6 34.6 31.6Sur 45.9 46.9 45 43.9

• Los gráficos de Barras y Circulares son frecuentemente usados para presentar datos cualitativos.

• La altura de la Barra o el tamaño del Sector Circular muestran la frecuencia o porcentaje de cada categoría.

Gráficos de Barras y Circular

Unidad Número de PacientesCuidado Cardiaco 1,052.00 Emergencia 2,245.00 UCI 340.00 Maternidad 552.00 Cirugía 4,630.00 Total 8,819.00

Gráficos de Barras y Circular

(Porcentajes son

redondeados )

Gráficos de Barras y Circular

UnidadNúmero de Pacientes

Porcentaje

Cuidado Cardiaco 1,052.00 11.93%Emergencia 2,245.00 25.46%UCI 340.00 3.86%Maternidad 552.00 6.26%Cirugía 4,630.00 52.50%Total 8,819.00 100.00%

Diagrama de Pareto

1. Decidir que elementos se estudiarán y colectar datos.

2. Tabular datos y calcular los #s acumulados.

3. Dibujar los ejes X e Y.4. Muestre los datos como

barras.5. Dibuje una curva

acumulativa.6. Crear una escala % en eje

vertical adicional.7. Rotular el diagrama.8. Analizar el diagrama.

1. Enfocar el aspecto principal de un problema.

2. Decidir el objetivo y elementos de mejoras.

3. Predecir la efectividad de la mejora.

4. Confeccionar diagramas ordenados por causas.

5. Comprender la efectividad de la mejora.

6. Emplear pérdidas unitarias en lugar de casos o unid. físicas.

Pasos Empleo

• En la planta de una empresa metal-mecánica se levantó la siguiente información referida a las lesiones sufridas por el personal entre el 1ro. de Enero y 31 de Mayo. Analizar y Concluir

Lesiones Enero Febrero Marzo Abril MayoEsguince de espalda 6 10 10 7 5Quemadura con acido 1 1Cortadura de mano 1 4 1 3 2Esguince de tobillo 1 2 1Cuerpo extraño en el ojo 2 1 1Cortadura de pierna 1 1 2 1 1

Diagrama de Pareto

Esguince de espalda

Cortadura de mano

Cortadura de pierna

Esguince de tobillo

Cuerpo ex-traño en el

ojo

Quemadura con acido

Esguince de espalda

Cortadura de mano

Cortadura de pierna

Esguince de tobillo

Cuerpo ex-traño en el

ojo

Quemadura con acido

TOTAL

38 11 6 4 4 2

F.R. ACM.

0.584615384615385

0.753846153846154

0.846153846153847

0.907692307692308

0.969230769230769

1

5

15

25

35

45

55

65

0.050.150.250.350.450.550.650.750.850.95

Lesiones Enero – Mayo

Cant

. de L

esion

es

Diagrama de Pareto

Datos Numéricos

Gráfico Tallo y Hoja

Histograma Ogiva

Distribucion de Frecuencias yDistribuciones Acumulativas

Tablas y los gráficos

¿Qué es una Distribución de Frecuencias?

• Una distribución de frecuencias es una lista o una tabla …

• Conteniendo agrupaciones de clases (categorias o rangos dentro de los cuales se encuetran los datos) ...

• Y la correspondiente frecuencia con la cual los datos se encuentran en cada clase o categoria.

Distribución de frecuencias

Distribución de frecuencias - Definiciones• Intervalo de clase

– Número reducido de datos.• Frontera/Límite de clase

– Punto medio entre dos extremos de clase consecutivas.

• Amplitud de clase– Diferencia entre la frontera superior e

inferior de una clase.• Marca de clase

– Punto medio entre los extremos/fronteras de una clase.

• Frecuencia de clase– Número de variables incluidas en un

intervalo de clase.

Distribución de Frecuencias

• Pasos

1.Determinar el tipo y número de clases (intervalos).

Regla general : 5 - 20

Sturges : # clases = 1 + 3.3 log N

2.Determinar la amplitud de la clase (i)

i = (Val. Máx. - Val. Min.) / # clases

3.Establecer el extremo inferior.

4.Determinar las fronteras (limites)

5.Calcular la marca de clase (m)

6.Contar el número de observaciones en cada clase (f).

PETROLOBITOSProduccion de Petroleo

(en Miles de Barriles)

38 31 41 52 5933 34 92 74 6877 68 84 41 4054 49 60 62 5978 63 46 74 6960 37 43 51 6192 95 81 38 6070 42 88 94 8573 66 75 64 5676 95 69 50 5569 83 78 74 7783 49 34 78 4838 76 99 38 9468 51 87 53 6939 60 35 79 8071 58 83 94 6667 50 86 70 8051 57 54 46 4634 48 64 71 6561 65 64 98 55

Ejercicio

Distribución de Frecuencias

• Pasos

1.Determinar el tipo y número de clases (intervalos).

Sturges : # clases = 1 + 3.3 log N

# de clases= 1 + 3.3 log (100) = 1 + 3.3 * 2 = 7.6

# de clases= 7

2.Determinar la amplitud de la clase (i)

i = (Val. Máx. - Val. Min.) / # clases

i = (99-31) / 7 = 9.7

i = 10

3. Establecer el extremo inferior.

Puede ser 31 o menos.

Por facilidad 30

Distribución de Frecuencias

• Pasos

4. Determinar las fronteras (limites)

Fronteras se expresan con un decimal adicional

Frontera inferior de primera clase pto. Medio entre 29 y 30, es decir 29.5

Frontera superior = 29.5 + 10 = 39.5

Extremo superior de la primera clase sería 39.

5. Calcular la marca de clase (m)

Pto.medio entre extremos o fronteras

(30 + 39) / 2 = 34.5 ó (29.5 + 39.5) / 2 = 34.5

6.Contar el número de observaciones en cada clase (f).

Distribución de Frecuencias

Intervalo Clase

Amplitud (i)

Frontera Inferior

(li)

Frontera Superior

(ls)

Marca Clase(m)

Frecuencia Absoluta

(f)

30 -39 10 29.5 39.5 34.5 12

40 – 49 10 39.5 49.5 44.5 12

50 – 59 10 49.5 59.5 54.5 16

60 – 69 10 59.5 69.5 64.5 23

70 – 79 10 69.5 79.5 74.5 17

80 – 89 10 79.5 89.5 84.5 11

90 – 99 10 89.5 99.5 94.5 9

Distribución de Frecuencias

Intervalo Clase

Marca Clase

Frecuencia Absoluta

Frecuencia Acumulada

Frecuencia Relativa

Frecuencia Relativa Acumulada

30 -39 34.5 12 12 0.12 0.12

40 – 49 44.5 12 24 0.12 0.24

50 – 59 54.5 16 40 0.16 0.40

60 – 69 64.5 23 63 0.23 0.63

70 – 79 74.5 17 80 0.17 0.80

80 – 89 84.5 11 91 0.11 0.91

90 – 99 94.5 10 100 0.09 1.00

Tabla de Frecuencias de la distribución deCuentas por Cobrar Tienda BETA

Fuente: Dpto. Contabilidad Tienda BETA

• Un gráfico de los datos arreglados en una distribución de frecuencias es llamado histograma.

• Los criterios de valoración de intervalo se muestran en el eje horizontal

• en el eje vertical se presentan: frecuencia, frecuencia relativa, o porcentaje

• Barra de altrura apropiada son empleadas para representar el número de observaciones que hay dentro de cada clase.

Histograma

EjemploGráfico 4: Peso de 100 Personas (en Kg.)

Número de Personas

0

5

10

15

20

25

29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5Peso(Kgs)

Fuente: Encuesta, enero 1998

Histograma

Ejemplo Gráfico 5: Marca de bebida gaseosa preferida por

universitarios (en %)

0

5

10

15

20

CocaCola

PepsiCola

InkaCola

Fanta Otros

%

Fuente: Encuesta a Universitarios, enero 1998

Histograma

Empleo de histogramas

• Normales– Proceso estable, distrib.

simétrica.• Doble pico

– Mezcla de datos con diferentes medias.

• Islas– Mezcla accidental con

otra distribución.• “Cliff”

– Final abrupto en una columna alta (eliminar)

• Rueda dentada– Amplitudes múltiplos

enteros (escala)

• ¿Está el centro de la distribución exactamente en el medio de las especificaciones?

• ¿Es la dispersión demasiado grande o pequeña?

• ¿Aparece algún dato más allá de las especificaciones?

• ¿Hay un espacio amplio para la distribución dentro de las especificaciones?

Análisis Gráfico

• Histograma– Gráfica de barras de una distribución de frecuencias.

• Polígono de frecuencias– Gráfica lineal de una distribución de frecuencias (marca).

• Curvas– Polígono de frecuencias suavizado (asimetría, curtosis)

• Ojiva– Gráfica de una distribución de frecuencias acumulada.

• Barras– Gráfica de frecuencias para diferentes categorias de datos.

• Pastel– Para ilustrar divisiones de una cantidad total (%).

Intervalo Clase

Marca Clase

Frecuencia Absoluta

Frecuencia Acumulada

Frecuencia Relativa

Frecuencia Relativa Acumulada

30 -39 34.5 12 12 0.12 0.12

40 – 49 44.5 12 24 0.12 0.24

50 – 59 54.5 16 40 0.16 0.40

60 – 69 64.5 23 63 0.23 0.63

70 – 79 74.5 17 80 0.17 080

80 – 89 84.5 11 91 0.11 0.91

90 – 99 94.5 9 100 0.09 1.00

Tabla de Frecuencias de la distribución deCuentas por Cobrar Tienda BETA

Fuente: Dpto. Contabilidad Tienda BETA

Análisis Gráfico

0

5

10

15

20

25

30-39 40-49 50-59 60-69 70-79 80-89 90-99

Frecuencia

Clases

Tienda "BETA"Histograma

Frecuencia

Fuente: Dpto. Contabilidad Tienda BETA

0

5

10

15

20

25

34.5 44.5 54.5 64.5 74.5 84.5 94.5

Frecuencia

Clases

Tienda "BETAPoligono de frecuencias

Frecuencia

Frecuencia

Fuente: Dpto. Contabilidad Tienda BETA

0

20

40

60

80

100

120

30-39 40-49 50-59 60-69 70-79 80-89 90-99

Frecuencia

Clases

Tienda "BETA"Frecuencia Acumulada

Frec. Acum.

Fuente: Dpto. Contabilidad Tienda BETA

30-3912%

40-4912%

50-5916%

60-6923%

70-7917%

80-8911%

90-999%

Tienda "BETA"Frecuencia Relativa

Fuente: Dpto. Contabilidad Tienda BETA

“Estadística”Prof. Juan Narro Lavi

Diplomatura de Estudio en

Gestión de Operaciones

Recommended