Red de aprendizaje Modelado
y
Simulacin
Proyectos
Simulacin
Generacin
Valores de
Variables
Aleatorias
Simulacin
por
Eventos
Sistema de Colas con
Servidores en Serie
Sistema de Colas con
Un servidor
Sistemas de Colas con
Servidores en Paralelo
Sistemas de
Inventarios
Revisin Peridica
Sistemas de
Inventarios Punto
de Repedido
Sistema
Combinado de:
Cadena de
Almacenes
Sistema
Combinado de:
Sistema de Colas e
Inventario
Modelacin
Montecarlo
Anlisis y Tratamiento de Datos para la
Simulacin de Sistemas
En esta parte del curso analizaremos los inputs
del sistema y que tratamiento debemos darles.
Trabajarlos como datos reales o debemos ajustarlos a una distribucin?
Introduccin
Modelar en la computadora un sistema del mundo real significa crear una especie de analoga digital del sistema en estudio.
Adems, el modelo posee la capacidad de comportarse de manera semejante al sistema original de tal forma que, al interactuar con el usuario le permita la realizacin de experimentos.
Con la intencin de obtener un mayor conocimiento y compresin del sistema real por medio de la inferencia estadstica.
Introduccin
Para que un modelo pueda crear una historia artificial del sistema real, es fundamental que este traiga consigo a posibilidad de representar por si mismo un comportamiento estocstico, a semejanza de la gran mayora de los sistemas.
En los modelos de simulacin de sistemas, este objetivo es alcanzado por la utilizacin de distribuciones de probabilidades como forma de representar la multiplicidad de ocurrencias de eventos aleatorios.
Introduccin
Cuando se hace uso de distribuciones de probabilidades para representar el comportamiento de las variables aleatorias presentes en los sistemas a ser modelados, es preciso considerar los siguientes puntos:
1. Los posibles valores que una variable puede asumir estarn dentro de la amplitud cubierta por la distribucin.
2. La probabilidad de ocurrencia de cualquier valor en el intervalo, esta determinada por el perfil de la distribucin probabilidad de la variable en estudio.
El Proceso de Muestreo y Recoleccin de Datos
Es el procedimiento inicial para identificar la distribucin de probabilidades ms adecuada
que representar la muestra de datos.
Tambin acostumbra ser el marco inicial de los problemas que se enfrenta en la modelacin de
sistemas.
Los datos estn disponibles?
De que manera estn disponibles?
Como recolectarlos?
Como analizarlos?
Datos Determinsticos vs. Aleatorios
Determinsticos: valores fijos
Ejemplos:
Numero de unidades de un recurso.
Tiempo de transferencia de una unidad.
Tiempos de llegadas y tiempos de procesamiento.
Datos que no presentan variaciones.
Datos Determinsticos vs. Aleatorios
Aleatorios: modelacin con base en distribuciones
de probabilidades, en donde los valores son
obtenidos directamente del sistema en estudio.
Ejemplos:
Transferencias, llegadas, procesos, tiempos, temperatura, eventos.
Qu distribucin se utiliza?
Que parmetros se ingresan?
Esto implica necesariamente resultados aleatorios
Uso de los Datos: Alternativas y discusiones
Usando los datos reales directamente en la simulacin:
Los datos son ledos de archivos y usados directamente en el modelo (llegadas, servicios, tipos de entidades, tiempos, temperaturas, etc.);
Todos los valores sern reales
No se tendrn elementos diferentes de los ya observados
En consecuencia se tendr que:
Los datos sern insuficientes para muchas o largas simulaciones;
Perder de desempeo computacional (lectura de archivos).
Uso de los Datos: Alternativas y discusiones
Uso de las distribuciones de probabilidades:
Los datos sern generados de acuerdo con una distribucin propuesta.
Los posibles valores que la variable podr asumir estarn dentro de la amplitud cubierta por la distribucin.
Otros valores: adems de los observados podrn ser usados los valores generados por la distribucin de probabilidad. (bien o mal?).
La probabilidad de ocurrencia de cualquier valor en el intervalo esta determinada por el perfil de la distribucin.
El proceso de ajuste puede no ser perfecto o adecuado (problema de validacin).
Recoleccin de Datos
Generalmente es difcil, cara y rutinaria.
El sistema puede no existir (es el proyecto de un sistema).Donde los obtenemos los datos?
Los datos disponibles pueden no ser los deseados.(Tiempo en cola)
Puede haber cambios en el modelo en funcin de los datos disponibles.
Pueden ser incompletos (cantidad menor a la deseada)
Muchos datos innecesarios.
Recoleccin de Datos
La sensibilidad de los resultados es afectado por la incertidumbre en la recoleccin de datos.
Modelos tendrn un nivel de detalle de acuerdo con la calidad de los datos.
Capturar la variabilidad en los datos Validacin.
Datos incoherentes entran y resultados incoherentes salen (Garbage In, Garbage out).
Los costos de obtencin de datos deben ser incluidos en el proyecto.
Fuentes de Datos
En la mayora de los casos y, dependiendo de las circunstancias, las fuentes de datos pueden ser:
Archivos histricos (mostrando el comportamiento, resultados, etc.) del sistema; provenientes de observaciones del sistema en estudio.
Originarios de sistemas similares;
Determinados con base en las estimaciones de los operadores;
Determinados con base en afirmaciones de vendedores de mquinas, equipamientos, etc.;
Estimaciones de proyectistas de sistemas;
Consideraciones tericas sobre el sistema. .
Muestreo
Planeamiento y Observacin Preliminar.
1. Planeamiento.
Pre - observacin de la situacin. Recolectar datos de cuanto se observa.
Como recolectar en Circunstancias no usuales?
2. Utilidad de los Datos Recolectados. Son adecuados para las distribuciones? Son tiles?
No existe la necesidad de recolectar dados superfluos.
3. Conjuntos Homogneos de Datos. Combinar datos en conjuntos homogneos.
4. Relaciones entre Variables Diagrama de dispersin.
Independencia de las Observaciones.
Considerar la posibilidad de autocorrelacin.
Puntos importantes en la bsqueda de los datos
Identificacin de las entidades (tipos de clientes); Identificacin de sus procesos (actividades con los
recursos del banco);
Identificacin de los recursos utilizados (las cajas)
A partir de estos elementos, buscar e identificar:
Los parmetros de la VA involucradas. Tiempos de ocurrencias de los eventos. Evento llegada del cliente. Evento fin del proceso (depende de la duracin de las
actividades)
Verificar si los datos recolectados son homogneos. Verificar cual es tamao de muestra adecuada.
Muestra -Homogeneidad de los Datos
Por ejemplo en una agencia bancaria tendramos que tener en lo siguiente:
Considerar los clientes que se dirigen a las cajas.
Periodos crticos en da (ms congestionados).
Das considerados normales.
Las distribuciones de las llegadas de los clientes durante el Horario comercial son diferentes.
Muestra -Homogeneidad de los Datos
Puede ser que algunos das de la semana el comportamiento de las llegadas sean semejantes.
Las informaciones pasadas por la gerencia facilitan sobremanera, el proceso de recoleccin de datos.
No siempre existe la posibilidad, que se realicen recoleccin de muestras sobre los innumerables perodos de diversidad de la demanda.
Tamao de Muestra
Definidos los periodos en que la recoleccin ser realizada, el prximo paso en el planeamiento es la determinacin del tamao de muestras.
La palabra clave en el muestreo (Tamao de muestra) es la Representatividad.
Cul debe ser el tamao de las muestras a ser recolectadas durante los periodos ya definidos?
El concepto de representatividad de la muestra puede ser reseada a travs del ejemplo de lanzar un dado.
Tamao de Muestra
Cuntas veces tendremos que lanzar un dado para que podamos afirmar que los posibles resultados {1, 2, 3, 4, 5, 6}, tienen una misma posibilidad de ocurrencia?
Relacin entre el Tamao de Muestra y la
Variable Aleatoria a Generar.
Vamos a imaginar, que el verdadero valor de la variable TELL en el periodo de las 10:00 y las 11:00 horas ser perfectamente descrito por una distribucin exponencial con media 2 min.
Veamos lo que ocurre cuando recolectamos las muestras con tamaos que varan de 10 a 100 elementos.
Valores obtenidos con
el Input
Analyzer
Experimento Tamao. de muestra Valor del Parmetro
1 10 EXPO(2,45)
2 20 EXPO(2,78)
3 30 EXPO(2,26)
4 40 EXPO(2,13)
5 50 EXPO(1,98)
6 100 EXPO(2,01)
Importancia de un Buen Ajuste
Vea el ejemplo del empleo de una distribucin Exponencial.
Muestra con 500 valores
Experimento
Parmetro
Utilizado
Parmetro
Calculado
Valor Mx.
en la muestra
1 2,0 2,03 10,5
2 2,2 1,97 14,4
3 2,4 2,44 14,8
4 2,6 2,56 23,9
5 2,8 2,81 24,6
Conceptos bsicos del muestreo
Si la varianza de la poblacin es desconocida, que es lo que mas frecuente se ve en la prctica el tratamiento ser diferente, no es posible encontrar una frmula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimiento:
Se toma una pequea muestra, que se le llama muestra piloto, con ella se estima la varianza poblacional (2) y con este valor se evala en la formula siguiente:
2
12
d
Zsn 1dxP
Donde se sustituye (2) por su estimacin (s2). Donde el valor de d por lo general es un valor es menor o igual a 0.1
El valor de d = 0.1 es tomado en forma estndar.
Conceptos bsicos del muestreo
Tomar una muestra piloto de tamao n
valores (100 valores mnimo)
Calcular la varianza muestral (s) de los n valores
n* n
Calcular el nmero (n*) nuevo tamao de muestra
adicionales
NO
SI
Tomar una nueva muestra de tamao n=n* valores
Fin del procedimiento
2
12
*
d
Zsn
Identificacin de la Distribucin Terica de
Probabilidades
El siguiente paso en el proceso de anlisis de los datos recolectados es la identificacin de una distribucin terica
de probabilidades.
La utilizacin de grficos, tales como un histograma, son muy tiles para la identificacin o delineamiento de la
distribucin terica de probabilidades.
La construccin de un histograma permite dar inicio al proceso de inferencia sobre una distribucin terica de
probabilidades.
Las hiptesis sobre cual distribucin adoptar deben estar basadas en el contexto del sistema en estudio y en el perfil
del histograma obtenido.
Principales Distribuciones Continuas y sus
aplicaciones
Uniforme: Se aplica en procesos en los cuales las probabilidades de ocurrencia de los eventos son o se
asumen iguales.
Normal: Es una de las distribuciones ms importantes y utilizadas en amplia gama de situaciones. Esta gran
utilizacin se debe fundamentalmente al Teorema del
Lmite Central.
Exponencial: Todo lo referido a duracin tiempo entre eventos, por ejemplo tiempo de llegadas en un sistema de
colas.
Principales Distribuciones Continuas y sus
aplicaciones
Triangular: Se emplea la tcnica de administracin de
proyectos PERT y fenmenos para los cuales se produzcan
eventos que tengan marcas MINIMA, NORMAL o ms
COMUN y MAXIMA.
Lognormal:
Para describir la vida til de sistemas mecnicos y electrnicos.
Abundancia de especies de animales.
Concentracin de elementos qumicos en materiales geolgicos.
Periodos de incubacin de enfermedades infecciosas.
En econometra para caracterizar econmicos asimtricos.
Principales Distribuciones Continuas y sus
aplicaciones
Erlang:
Duracin de K procesos secuenciales, c/u de ellos con la misma duracin promedio 1/ y distribucin exponencial.
Para el ajuste de datos empricos en teora de colas, confiabilidad, reemplazos e inventarios, (en este caso K no
tiene interpretacin fsica).
Weibull: Fue establecida por el fsico suizo Weibull quien
demostr que el esfuerzo al que se someten los materiales
puede modelarse de manera adecuada mediante el empleo
de esta distribucin.
Tambin. se ha usado para modelar situaciones del tipo tiempo- falla, bien puede indicar la vida til de cierto
artculo, planta o animal, confiabilidad de un componente.
Principales Distribuciones Continuas y sus
aplicaciones
Gamma: se ha utilizado frecuentemente en variables tales como:
El tiempo ( espacio) requerido para observar ocurrencias del evento A en el intervalo t ( regin del espacio ), sucesos del tipo Poisson.
Problemas de trfico en lneas telefnicas, ERLANG, 1900.
Flujos mximos, MARKOVIC, 1965.
Resistencia de componentes del concreto reforzado, TICHY VARLIETK, 1965.
Altura de la precipitacin mensual, WHITCOMB, 1940.
Tiempo de falla de un sistema de componentes, cada uno falla con frecuencia.
Ingresos familiares.
Edad del hombre al contraer matrimonio por primera vez.
Tiempo total para completar una operacin, s sta se lleva a cabo en subestaciones a una frecuencia.
Principales Distribuciones Continuas y sus
aplicaciones
Beta: Sea un fenmeno aleatorio y X una variable aleatoria que puede
representar una caracterstica fsica cuyos valores se encuentran
restringidos a un intervalo de longitud finita. Tales como:
Proporcin de impurezas en un producto qumico.
La fraccin de tiempo que una mquina est en reparacin.
La proporcin vendida de un lote durante un tiempo t.
La humedad relativa medida en cierto lugar.
Porcentaje del costo total destinado a reparacin de maquinaria.
Porcentaje de costo adicional destinado a reparacin de maquinaria.
La distribucin del tiempo necesario para completar una fase del proyecto PERT.
Evaluacin de programas y tcnicas de revisin.
Principales Distribuciones Discretas y sus
aplicaciones
Poisson: La variable aleatoria representa el nmero de eventos que ocurren durante un intervalo de tiempo.
Uniforme discreta: Esta variable presenta una probabilidad constante para diferentes valores discretos que toma la variable aleatoria.
Caso de aplicacin
Un sistema de tramite documentario tiene la siguiente descripcin:
Los clientes llegan al sistema con un tiempo entre llegadas que esta descrito por la muestra de datos ubicados en el archivo TELL.txt. Si la cola es muy larga
(mximo de 7 personas) proceden a abandonar el sistema.
Luego pasan a la estacin de recepcin cuyo tiempo de servicio se encuentra definido por la data TS1.txt. En esta parte cliente puede abandonar el sistema
por falta de algn requisito.
Luego son atendidos por dos servidores en paralelo cuyos tiempos de servicio se pueden calcular segn la data que se encuentra en los archivos TS2.txt y
TS3.txt. Donde se llenaran los formularios que sern presentados al ultimo
empleado
Este ultimo empleado da conformidad o no de que el tramite se concluyo satisfactoriamente. Si no se concluyo satisfactoriamente, el cliente tendr que
volver al servidor anterior para subsanar los errores cometidos en el proceso,
este rechazo sucede con una incidencia del 7% de las veces, si termina
satisfactoriamente el cliente sale del sistema.
El tiempo de servicio de este empleado esta dado por la muestra que se encuentra contenida en el archivo TS4.txt
Caso de aplicacin Representacin del sistema
Caso de aplicacin
Inputs del sistema no controlables:
TELL ~ TELL.txt
TS1 ~ TS1.txt
TS2 ~ TS2.txt
TS3 ~ TS3.txt
TS4 ~ TS4.txt
Cola mxima 1
% de falta de requisito
% de inconformidad en el proceso de atencin.
Inputs del sistema controlables:
Horario de trabajo
# Operarios
Inicio del tiempo de descanso
Duracin del tiempo de descanso
Salario, etc.
Ajuste de Distribuciones con el Arena Input Analyzer
Objetivos y necesidades:
Seleccionar una distribucin de probabilidades para ser usada en la generacin de datos para el modelo de simulacin.
Obtener una muestra de datos (IID Independiente e idnticamente distribuida) recolectado del sistema real.
Arena Input Analyzer
Aplicacin independiente
Tambin accesible va el men Tools;
Realiza un proceso de ajuste.
Calcula una expresin vlida en el Arena pasando esta expresin directamente al modelo va un Copy/Paste.
Ajuste de Distribuciones con el Arena Input Analyzer
Ajuste = decidir sobre el tipo de distribucin (exponencial, normal, emprica, etc.) y estimar sus parmetros;
Diferentes mtodos (Mxima semejanza, mnimos cuadrados, ...)
Realizando de pruebas de Hiptesis para hallar la mejor distribucin
H0: la distribucin escogida representa adecuadamente los datos
Probar el valor de p (mayor > mejor)
Verificar ajuste entre distribucin terica X emprica;
Trabaja con datos de distribuciones continuas y discretas;
Realiza Best fit entre varias distribuciones
Archivos de Datos para el Input Analyzer
Crear un archivo de datos (editores, platillas, etc...)
Debe ser del tipo ASCII (guardado o exportado);
Los Datos deben estar separados por blancos (espacios, tab., nuevas lneas)
Acepta tambin formato libre Abrir archivo a partir del Input Analyzer
menu File/New o menu File/Data File/Use Existing Get histogram, basic summary of data Para ver los datos: menu Window/Input Data
El Menu Fit
Verifica distribuciones (pruebas de ajuste); Verifica a forma de distribuciones especficas Disea la funcin de densidad sobre un histograma
(visual); Calcula la expresin exacta (parmetros) para Copy y Paste al modelo de simulacin;
Puede incluir limites (offset), dependiendo de la distribucin;
Calcula los resultados de la prueba de ajuste. Pruebas de Chi-cuadrado y Kolmogorov - Smirnov
Lo ms importante: valor de p, siempre entre 0 y 1; Si p pequeo (< 0.05): ajuste pobre; El uso de la distribucin ajustada puede presentar un
conjunto de datos ms inconsistentes de lo que el conjunto de datos de la muestra, en funcin de la probabilidad de puntos extremos.
El Menu Fit
Verifica distribuciones (pruebas de ajuste); Verifica a forma de distribuciones especficas Disea la funcin de densidad sobre un histograma
(visual); Calcula la expresin exacta (parmetros) para Copy y Paste al modelo de simulacin;
Puede incluir limites (offset), dependiendo de la distribucin.
Calcula los resultados de la prueba de ajuste. Pruebas de Chi-cuadrado y Kolmogorov - Smirnov
Lo ms importante: el valor de p, siempre entre 0 y 1; Si p pequeo (< 0.05): ajuste pobre; El uso de la distribucin ajustada puede presentar un
conjunto de datos ms inconsistentes de lo que el conjunto de datos de la muestra, en funcin de la probabilidad de puntos extremos.
Caso de aplicacin
Inputs del sistema:
TELL~NORM(4.07, 1.49)
TS1~TRIA(9, 11.9, 14)
TS2~NORM(12, 1.28)
TS3~5 + EXPO(7.97)
TS4~8 + GAMM(6.13, 1.95)
Cola mxima 1
% de falta de requisito
% de inconformidad en el proceso de atencin.