Clase de introducción a la estadística

  • View
    1.924

  • Download
    3

  • Category

    Travel

Preview:

Citation preview

1 de 44

Fundamentos de Teoría Estadística

2 de 44

Temas a tratar

Indicadores.

Datos.

Variación y tipo de causas.

Distribuciones, y cálculo de parámetros y estadísticos.

Caracterización de los datos.

Sumando o restando distribuciones.

Relación entre estadísticos y parámetros.

Intervalos de Confianza.

Ejercicios.

Indicadores

4 de 44

Características de un indicador

Todo indicador, no importa de qué tipo sea, debe cumplir con las siguientes características:

Mesurable

Existe una manera de cuantificar el cumplimiento de la especificación.

Verificable

Múltiples observadores deberían coincidir cuando evalúan el resultado del indicador.

Eficiente

Deben ser elegidos considerando el costo.

DMAIC - Fase 1 Medir

Datos

6 de 44

Para qué recolectamos datos

Para separar lo que “pensamos que pasa” de lo que “realmente pasa”.

Confirmar o descartar ideas y preconceptos.

Establecer una línea de base para el desempeño.

Ver el desempeño del proceso o la historia de un problema a lo largo del tiempo.

Medir el impacto de los cambios introducidos.

Identificar y entender las relaciones que explican la variación.

Controlar un proceso.

Evitar soluciones que no corrigen realmente el problema.

7 de 44

Variables para las cuales recolectar datos

Los datos pueden pertenecer a:

Y: Resultado del proceso medido en el producto o servicio, que se entrega al cliente externo del proceso.

y: Resultado intermedio del proceso medido en el producto o servicio que un cliente interno recibe de un proveedor interno.

x: Variable de proceso que afecta al y o al Y.

X: Variable medida en el producto o servicio que es input del proceso.

11 de 44

Definiciones operacionales 1

Para que un dato pueda ser confiable debe, entre otros factores, tener una definición operacional.

Una Definición Operacional se refiere a: Una clara, compresible y no ambigua descripción de qué

debe ser medido u observado... De manera tal que todos puedan operar o medir

consistentemente en base a la definición.

¿Cómo describir mejor el factor / cosa que queremos observar y medir?

12 de 44

Definiciones operacionales 2

No hay una regla ni respuesta única para lograr una definición operacional de una medición.

Lo más específico posible, es mejor.

La mejor manera de mejorar una definición operacional es poniéndola a prueba con quienes la usarán en la práctica. El entrenamiento y uso monitoreado es indispensable.

DMAIC - Fase 1 Medir

Variación y tipo de causas

14 de 44

Variación 1

Los resultados y variables de un proceso están afectados por variación.

Medio ambiente

Personas

Máquinas

MaterialesMétodosMediciones

Los resultados del proceso tienen variación, lo que

afecta al cliente

Los resultados del proceso tienen variación, lo que

afecta al cliente

La variación está originada en la variación de las

variables

La variación está originada en la variación de las

variables

Una importante fuente de variación está en la omisión

de métodos estudiados y comunes a todos los

operadores.

Una importante fuente de variación está en la omisión

de métodos estudiados y comunes a todos los

operadores.

A mayor uniformidad de las variables, mayor

uniformidad del resultado

A mayor uniformidad de las variables, mayor

uniformidad del resultado

15 de 44

Variación 2

Máquinas

MaterialesMétodosMediciones

Medio ambiente

Personas

Tiempo

Med

ició

n

16 de 44

Variación 3

Verifiquemos la existencia y tipos de variación.

Si tiramos dos dados, y sumamos los resultados de ambos:

¿Cuáles serán los posibles resultados de nuestra suma?

¿Cuál es la probabilidad de cada valor?

6-66-56-46-36-26-1

5-65-55-45-35-25-1

4-64-54-44-34-24-1

3-63-53-43-33-23-1

2-62-52-42-32-22-1

1-61-51-41-31-21-1

6-66-56-46-36-26-1

5-65-55-45-35-25-1

4-64-54-44-34-24-1

3-63-53-43-33-23-1

2-62-52-42-32-22-1

1-61-51-41-31-21-1

17 de 44

Variación 4

2 3 4 5 6 7 8 9 10 11 12

Esta es la distribución teórica, -ver

tabla anterior-

Esta es la distribución teórica, -ver

tabla anterior-

18 de 44

Variación 5

2 3 4 5 6 7 8 9 10 11 12 151413

Esta es una distribución real.

Esta es una distribución real.

• Cualquier número dicho entre 2 y 12 no causará sorpresas. Son cosas “normales”.• Cualquier número dicho entre 2 y 12 no causará sorpresas. Son cosas “normales”.

19 de 44

Variación 6

2 3 4 5 6 7 8 9 10 11 12 151413

Esta es una distribución real.

Esta es una distribución real.

• Cualquier número fuera de ese rango, sí.Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

• Cualquier número fuera de ese rango, sí.Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

20 de 44

Variación 7

2 3 4 5 6 7 8 9 10 11 12

Esta es una distribución real.

Esta es una distribución real.

• Cualquier secuencia que no respete el patrón, por ejemplo un número repetido excesivamente sí. Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

• Cualquier secuencia que no respete el patrón, por ejemplo un número repetido excesivamente sí. Son cosas “especiales”. Algo diferente tiene que haber ocurrido.

22 de 44

Causas Comunes de variación 1

1. Causas Comunes

Atribuibles al proceso.

Normales en condiciones operativas especificadas.

Función sólo del azar.

Muchas. Cada una genera pequeña variación.

Se eliminan o disminuyen con el rediseño del proceso, cambiando las condiciones operativas especificadas.

Es un 6 o un 8 en el juego de los dados.

23 de 44

Causas Comunes de variación 2

Por ejemplo, para ir de nuestra casa al trabajo durante todos los días en auto, podríamos encontrar las siguientes causas Comunes:

Los semáforos. Mayor o menor cantidad de autos en la calle.

24 de 44

Causas Especiales de variación 1

2. Causas Especiales

No atribuibles al proceso.

Situación que no responde al diseño o funcionamiento original del proceso.

Deben eliminarse identificando y destruyendo las causas que la generan.

Es un 14 en el juego de los dados.

Las causas Especiales no son solamente aquellas que “empeoran” el resultado. Una serie de valores con los dados de 3, 5, 4, 5, 3, 4, 5, 5, 4, 5, 3, 4... aunque ha bajado la variabilidad del resultado también es especial: no responde al Patrón.

25 de 44

Causas Especiales de variación 2

Por ejemplo, para ir de nuestra casa al trabajo durante todos los días en auto, podríamos encontrar las siguientes causas Especiales:

La pinchadura de una cubierta. Quedarnos sin combustible.

27 de 44

Causas Comunes y Especiales 2

Qué acciones tomar frente a las diferentes causas, Comunes o Especiales:

Causa Situación Acción a tomar

Comunes

El proceso está entregando lo mejor según su diseño.

Si el resultado del proceso no es el necesario, rediseñar el proceso.

Especiales

El proceso está entregando una variación diferente al diseño dadas las causas especiales.

Eliminar las causas especiales u homologarlas en el caso que disminuyan la variabilidad.

DMAIC - Fase 1 Medir

Distribuciones, y cálculo de parámetros y estadísticos

30 de 44

Técnicas Estadísticas

Estadística Descriptiva Permite describir la información de la cual disponemos,

para entender los datos.

Estadística Inferencial Usa un conjunto de datos más pequeño, una muestra,

para sacar conclusiones o hacer inferencias de un grupo más grande, la Población.

31 de 44

Población

Es el grupo completo de objetos en el cual estamos interesados, al cual queremos describir o del cual queremos sacar conclusiones.

A los valores reales que representan los resultados de un proceso los llamamos Parámetros.

32 de 44

Muestra

Es un grupo de unidades seleccionadas de la población. Al estudiar la muestra, esperamos sacar conclusiones de la población.

Por eso, debe ser representativa de toda la población, y generalmente esto es logrado a partir de la selección aleatoria de la muestra.

A los valores reales que representan los resultados de una muestra los llamamos “Estadísticos”.

Las técnicas estadísticas nos son útiles para tomar decisiones sobre un proceso o población basado en un análisis de información contenida en una muestra de esa población.

33 de 44

Parámetros y Estadísticos 1

Tanto de una muestra como de la Población nos interesa:

Posición Dispersión FormaPosiciónPosición DispersiónDispersión FormaForma

34 de 44

Parámetros y Estadísticos 2

Nomenclatura

σ = desvío estándar de la población.

µ = media de la población

N = población total.

x = estimación de la media (muestra).

s = estimación del desvío estándar (muestra).

n = tamaño de la muestra.

35 de 44

Promedio = Mediana = Moda Moda Promedio

Mediana

Posición (localización) 1

Estadísticos de Posición

Promedio Promedio matemático.

Mediana Valor que deja el mismo 50 % de los datos por derecha

que por izquierda.

Moda Valor más repetido.

36 de 44

Posición (localización) 2

Cálculo del promedio

Población Muestra

Cálculo de la Mediana

Es el valor del dato central, cuando estamos hablando de cantidad de datos impares.

Toma el valor del promedio de los dos datos centrales, cuando la cantidad de datos es par.

n

n1 X

X∑

=N

XN1μ

∑=

37 de 44

Variación 1

Estadísticos de Dispersión

Rango Es un estadístico que muestra la máxima variabilidad de

un conjunto de observaciones. Rango = Mayor valor – Menor valor

Desvío estándar (σ o s) Es un estadístico que señala la dispersión de los valores

respecto al valor central (de posición).

Varianza (σ2 o s2) Es el cuadrado del desvío estándar (en realidad el desvío

estándar es la raíz cuadrada de la Varianza).

38 de 44

Variación 2

Cálculo del desvío estándar

Población

Muestra

N

2μ)N

(X...2μ)2

(X2μ)1

(Xσ

−−+−=

1-n

2)Xn

(X...2)X2

(X2)X1

(Xs

−−+−=

39 de 44

Cálculo de promedio y desvío estándar 1

1°1°

2°2°

3°3°

Ejercicios Medir.Columna 7Ejercicios Medir.Columna 7Cálculos de

estadísticos y graficación

Cálculos de estadísticos y graficación

Nivel de Confianza defaultNivel de Confianza default

40 de 44

Cálculo de promedio y desvío estándar 2

103,5102,0100,599,097,596,0

Median

Mean

100,3100,2100,1100,099,999,899,7

1st Quartile 98,759Median 99,9623rd Quartile 101,080Maximum 103,856

99,774 100,121

99,736 100,275

1,415 1,662

A-Squared 0,76P-Value 0,048

Mean 99,948StDev 1,528Variance 2,336Skewness 0,083005Kurtosis -0,598483N 300

Minimum 96,044

Anderson-Darling Normality Test

95% Confidence Interval for Mean

95% Confidence Interval for Median

95% Confidence Interval for StDev95% Confidence I nt erv als

Summary for Tiempos de reparación4°4°

5°5°

Histograma de los datosHistograma de los datos

Muestra los Intervalos de Confianza para Mediana y MediaMuestra los Intervalos de Confianza para Mediana y Media

Valores de promedio y desvío estándar para la serie de datos

Valores de promedio y desvío estándar para la serie de datos

Resultado en un Gráfico

Resultado en un Gráfico

41 de 44

Cálculo de promedio y desvío estándar 3

1°1°

2°2°

4°4°

5°5°3°3°

7°7°

6°6°

Permite calcular estadísticos.Permite calcular estadísticos.

Columna con los datosColumna con los datos

Permite elegir los estadísticos a calcularPermite elegir los estadísticos a calcular

Permite elegir los gráficos a hacer

Permite elegir los gráficos a hacer

42 de 44

Cálculo de promedio y desvío estándar 4

Results for: EJERCICIOS MEDIR.MTW

Summary for Tiempos de reparación

Descriptive Statistics: Tiempos de reparación

Total

Variable Count N N* Mean SE Mean StDev Sum Minimum

Tiempos de repar 300 300 0 99,948 0,0882 1,528 29984,343 96,044

Variable Q1 Median Q3 Maximum Range Skewness

Tiempos de repar 98,759 99,962 101,080 103,856 7,812 0,08

Resultado en la Hoja de Sesión

Resultado en la Hoja de Sesión

8°8°

43 de 44

Distribución 1

Para comprender mejor a la variación del indicador, usamos una serie de distribuciones para caracterizarla.

La más conocida es la Distribución Normal (Gauss). Pero, se necesita ubicar aquella que mejor represente a los datos que se tienen.

3σ3σ

99,73%

2σ2σ

95,44%

99,999997%

6σ6σ

σ

Tiempo de viaje

Can

tidad

ed

días

3σ3σ

99,73%

2σ2σ

95,44%

99,999997%

6σ6σ

σ

Tiempo de viaje

Can

tidad

ed

días

f z ez

( ) =−1

2

2

2

π

44 de 44

Distribución Normal 1

Es la distribución de probabilidad que más frecuentemente se encuentra en la naturaleza.

La media, mediana y modo, todos ocurren en el centro de la distribución con ambas mitades simétricas alrededor del centro.

El área bajo la curva es igual a 1 y una vez que la media y el desvío estándar son conocidos, la curva queda definida.