Upload
doanduong
View
221
Download
1
Embed Size (px)
Citation preview
INSTITUTO TECNOLÓGICO DE VILLAHERMOSA
UNIDAD 2.
GENERACIÓN DE NÚMEROS ALEATORIOS
INTEGRANTES:
JOSÉ MANUEL TORRES CARRASCO
ISMAEL ADRIÁN GARCIA CANCINO
MATERIA: SIMULACIÓN
HORA: 8:00 A 9:00 AM
6TO SEMESTRE
CATEDRÁTICA: M.C. ZINATH JAVIER GERÓNIMO
VILLAHERMOSA, TABASCO, MARZO DEL 2017
Índice
2. Generación de Números Aleatorios.....................................................................3
2.1 Números aleatorios: definición, propiedades, generadores y tablas...............3
2.2 Propiedades de los números pseudoaleatorios..............................................5
2.3 Pruebas estadísticas de aleatoriedad para los números pseudoaleatorios: de
medias, de varianza, de independencia y de bondad de ajuste...........................8
2.3.1 De medias.................................................................................................8
2.3.2 De varianza...............................................................................................9
2.3.3. De independencia..................................................................................11
2.3.4 De bondad de ajuste...............................................................................12
2.4 Obtención de números pseudoaleatorios utilizando paquetes
computacionales.................................................................................................14
2.5 Método de Monte Carlo.................................................................................16
Bibliografía.............................................................................................................18
Mapa de la unidad…………………………………………………………………....………………..19
1
Introducción
Esta unidad comprende el jugar de alguna manera con los números, sean enteros,
con decimales, fraccionarios; todo va a depender del contexto en que el que se
manejen.
Hoy en día podemos clasificarlos según sea el caso, en discretos o continuos. De
igual manera se cuenta con los números aleatorios que se dan por caso de la
naturaleza y otros que pueden ser manipulables como lo son los pseudoaleatorios
que son sin duda con los que se estarán trabajando en la materia de “Simulación”.
Dentro de la variedad que se podrá encontrar en esta información serán los
componentes, propiedades, usos, aplicación. Por otro lado métodos que nos
permitan tener un conocimiento amplio de la Generación de Números Aleatorios
así como la conexión que se tiene con la probabilidad y estadística que tuvimos la
oportunidad de conocer en semestres anteriores.
Esperamos que lo aquí aportado sea de agrado y entendimiento sobre todo del
lector.
2
2. Generación de Números Aleatorios.
2.1 Números aleatorios: definición, propiedades, generadores y tablas.
Definición:
Un número aleatorio es aquél que es generado a partir de la distribución Uniforme
U (0,1)
Propiedades y Generadores:
Su generación se basa en el uso de mecanismos físicos. Entre las distintas
propuestas se incluyen el recuento de partículas emitidas por una explosión, el
lanzamiento de monedas, aparatos mecánicos basadas en ruedas de la fortuna,
etc.
Tienen el inconveniente de ser generados lentamente. Además, los números
aleatorios no pueden almacenarse de forma automática. Por tanto, se deben
buscar procedimientos algorítmicos computacionales que generen números
aleatorios de forma muy rápida y los puedan almacenar sin utilizar mucha
capacidad de memoria.
Una de las características más poderosas de la simulación es la habilidad de
imitar el comportamiento aleatorio que es característico de la mayoría de los
sistemas reales. Para poder imitar este comportamiento aleatorio la simulación
necesita utilizar un generador de números aleatorios, el cual es responsable de
producir un ciclo grandísimo e independiente de números aleatorios.
Hay que aclarar que los números U (0,1) producidos por un generador de números
aleatorios (algoritmo computacional) no son aleatorios en el verdadero sentido de
la palabra, ya que el generador puede reproducir la misma secuencia de números
3
una y otra vez, lo cual no indica un comportamiento aleatorio. Por esta razón, a los
números U (0,1) producidos por un generador (algoritmo) se les llama
pseudoaleatorios.
Tablas:
Es un conjunto de cifras entre 0 y 9 cuyo orden no obedece ninguna regla de
formación, ellas se pueden leer individualmente o en grupos y en cualquier orden,
en columnas hacia abajo, columnas hacia arriba, en fila, diagonalmente, si se
desea formar números aleatorios en un determinado rango, basta con calcular la
proporción, otra forma de usarlo es sumando dos números tomados de alguna
posición o multiplicarlos.
Para ser presentadas estas cifras se agrupan en números de 4 dígitos, formando
bloques de 5 filas y 10 columnas facilitando de esta forma su lectura que puede
iniciarse desde cualquier parte de la tabla.
Una tabla de números aleatorios es útil para seleccionar al azar los individuos de
una población conocida que deben formar parte de una muestra.
4
2.2 Propiedades de los números pseudoaleatorios.
Es deseable que los números pseudoaleatorios uniformes posean las siguientes
características:
1. Uniformemente distribuidos.
2. Estadísticamente independientes.
3. Reproducibles.
4. Periodo largo.
5. Generados mediante un método rápido.
Generados mediante un método que no requiera mucha capacidad de
almacenamiento de la computadora.
Generar un conjunto de números pseudoaleatorios es una tarea relativamente
sencilla, para ello, el lector sólo tiene que diseñar su propio algoritmo de
generación. Lo que resulta difícil es diseñar un algoritmo que genere un conjunto
de números pseudoaleatorios con periodo de vida suficientemente grande (N) y
además pase sin problema las pruebas de uniformidad e independencia, lo cual
implica evitar problemas como éstos:
Que los números del conjunto no estén uniformemente distribuidos, es
decir, que haya demasiados números en un subintervalo y otro muy pocos
o ninguno.
Que los números pseudoaleatorios sean discretos en lugar de continuos.
Que la media del conjunto sea muy alta o muy baja, es decir, que esté por
arriba o por debajo de ½.
Que la varianza del conjunto sea muy alta o muy baja, es decir, que se
localice por arriba o por debajo de 1/12.
5
En ocasiones se presentan también anomalías como números pseudoaleatorios
seguidos por arriba o por debajo de la media; secuencia de números por arriba de
la media, seguida por una secuencia por debajo de la media, y viceversa, o varios
números seguidos en forma ascendente o descendente.
Existen varios métodos para generar números pseudoaleatorios. A continuación
se presentan los más importantes:
El Método de Centros al Cuadrado (Método de los cuadrados medios)Este método es debido a von Neumann y tiene fundamentalmente sólo interés
histórico. El método de centros al cuadrado se apega a la siguiente metodología:
1. Inicie con un número entero positivo de 4 (2n) dígitos y llámele Z0 (X0),
llamado semilla.
2. Eleve Z0 (X0) al cuadrado para obtener un número de 8 (4n) dígitos. Si es
necesario, agregue ceros a la izquierda para hacerlo exactamente de 8
dígitos.
3. Tome los 4 (2n) dígitos centrales como el próximo número de 4 (2n) dígitos
y llámele Z1(X1).
4. Coloque el punto decimal a la izquierda de Z1(X1) para obtener el primer
número pseudoaleatorio U (0,1).
5. Continué generando de esta forma números pseudoaleatorios U(0,1)
Desventaja del método de centros al cuadrado: Tiene una fuerte tendencia a
degenerar rápidamente hacia cero, donde permanecerá por siempre.
La gran mayoría de los generadores de números pseudoaleatorios que se usan en
la actualidad son generadores congruenciales lineales, introducidos por Lehmer en
1951.
Los generadores congruenciales lineales generan una secuencia de números
pseudoaleatorios en la cual el próximo número pseudoaleatorio es determinado a
partir del último número generado. A continuación se presentan los dos más
importantes: el método congruencial mixto lineal y el método congruencial
multiplicativo lineal.
6
Método de LehmerEl método consiste en los siguientes pasos:
1. Se toma como semilla un número entero, X0, de n cifras.
2. Se elige otro entero, c, de k cifras. Suele tomarse k<n.
3. Se calcula X0 *c, número de a lo sumo, n + k cifras.
4. Se separan las k cifras de la izquierda de X0*c y al número formado por las
n cifras restantes se le resta el que se forma de esas k cifras de la
izquierda, dando lugar a X1.
5. Se repite este proceso tantas veces como sea necesario.
6. Se devuelven los valores
Método Congruencial Mixto Lineal
Los valores posibles de Xn+1 son 0, 1, 2,3,…, m-1, m representa el número
posible de valores que pueden ser generados.
Los generadores congruenciales lineales generan una secuencia de números
pseudoaleatorio en la cual el próximo número pseudoaleatorio es determinado a
partir del último número generado, es decir, el número pseudoaleatorio Xn+1 es
derivado a partir del número pseudoaleatorio Xn. La relación de recurrencia para
el generador congruencial mixto es Xn+1 =(a Xn+c) mod m, en donde:
X0 = es la semilla
a =el multiplicador
c = constante aditiva
m = el modulo (m > X0, a,c)
X0, a, c >0
Esta relación de recurrencia nos dice que Xn+1 es el residuo de dividir a Xn+c
entre el modulo. Lo anterior significa que los valores posibles de Xn+1 son
0,1,2,3 ....m-1, es decir, m representa el número posible de valores diferentes que
pueden ser generados.
7
2.3 Pruebas estadísticas de aleatoriedad para los números pseudoaleatorios: de medias, de varianza, de independencia y de bondad de ajuste.
2.3.1 De medias.
Una de las propiedades que deben cumplir los números del conjunto ri, es que el
valor esperado sea igual a 0.5. La prueba que busca determinar lo anterior es la
llamada prueba de medias, en la cual se plantean las siguientes hipótesis:
H 0 :μr i=0.5
H 1 :μri≠0.5
La prueba de medias consiste en determinar el promedio de los n números que
contiene el conjunto ri, mediante la ecuación siguiente:
ȓ=1n∑i=1
n
ri
Posteriormente se calculan los límites de aceptación inferior y superior.
Si el valor de ȓ se encuentra entre los límites de aceptación, concluimos que no se
puede rechazar que el conjunto r i tiene un valor esperado de 0.5 con un nivel de
aceptación de 1-α . En caso contrario se rechaza que el conjunto ri tiene un valor
esperado de 0.5.
Consiste en verificar que los números generados tengan una media
estadísticamente igual a |, de esta manera, se analizan las hipótesis.
8
2.3.2 De varianza.
La varianza o variancia de una variable aleatoria es una medida de dispersión
definida como la esperanza del cuadrado de la desviación de dicha variable
respecto a su media.
Está medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si la
variable mide una distancia en metros, la varianza se expresa en metros al
cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una
medida de dispersión alternativa expresada en las mismas unidades de los datos
del variable objeto de estudio. La varianza tiene como valor mínimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores
atípicos y no se aconseja su uso cuando las distribuciones de las variables
aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras
medidas de dispersión más robustas.
Otra de las propiedades que debe satisfacer el conjunto ri, es que sus números
tengan una varianza de 1/12. La prueba que busca determinar lo anterior es la
prueba de varianza, que establece las siguientes hipótesis:
H 0 :σ2ri=1/12H 0 : σ
2ri≠1/12
La prueba de varianza consiste en determinar la varianza de los n números que
contiene el conjunto ri, mediante la ecuación siguiente:
V (r )=∑i=1
n
(ri−ȓ )2
n−1
Después se calculan los límites de aceptación inferior y superior.
Si el valor de V® se encuentra entre los límites de aceptación, decimos que no se
puede rechazar el conjunto ri tiene una varianza de 1/12, con un nivel de
9
aceptación de 1- α ; de lo contrario, se rechaza que el conjunto de r i tiene una
varianza de 1/12.
Consiste en verificar si los números aleatorios generados tienen una variancia de
0.083. Los pasos son:
1) Calcular la varianza de los n números generados V(x)
2) Calcular los límites superior e inferior de aceptación
3) Si V(x) se encuentra entre los límites de aceptación, decimos que no se
puede rechazar el conjunto ri.
El análisis de Varianza contrasta la hipótesis de igualdad de las Medias de más de
dos grupos, y tiene su fundamento en la relación entre la variación explicada por
las diferencias entre grupos y la variación individual.
10
2.3.3. De independencia.
Recuerde que las dos propiedades más importantes que deben satisfacer los
números de un conjunto ri son uniformidad e independencia.
El objetivo es verificar si existe una dependencia entre las variables cualitativas
que definen filas y columnas, es decir, si para todo i = 1, ..., k y j = 1, .., m se
verifica que la probabilidad del resultado correspondiente a la combinación Ai ∩ Bj
es el producto de las probabilidades marginales correspondientes. P(Ai) es la
probabilidad del resultado i para la variable fila y P(Bj) la del resultado j para la
variable columna.
Para probar la independencia de los números del conjunto r iprimero es preciso
formular las siguientes hipótesis:
H 0 : losnúmeros deconjunto r i son independientes
H 1: los números deconjunto r i noson independientes
Las pruebas estadísticas que tratan de corroborar si los números en el intervalo
(0,1) son independientes o, en otras palabras, si parecen pseudoaleatorios son:
Prueba de corridas arriba y abajo
Prueba de corridas arriba y debajo de la media
Prueba póker
Prueba de series
Prueba de huecos
La prueba Ji Cuadrado de contraste de independencia entre variables cualitativas
se basa en el estadístico Ji Cuadrado, que ha sido introducido en el tema 5
apartado 5, cuya distribución es Ji Cuadrado con (f-1)(c-1) grados de libertad (f y
11
c: Número de filas y columnas de la tabla bivariada de contingencia) si la Hipótesis
Nula de independencia es verdadera.
2.3.4 De bondad de ajuste.
En la construcción del modelo de simulación es importante decidir si un conjunto
de datos se ajusta apropiadamente a una distribución específica de probabilidad.
Al probar la bondad del ajuste de un conjunto de datos, se comparan las
frecuencias observadas FO realmente en cada categoría o intervalo de clase con
las frecuencias esperadas teóricamente FE.
Prueba Ji cuadrada
La prueba Ji cuadrada hace uso de la distribución del mismo nombre para probar
la bondad del ajuste al comparar el estadístico de prueba Xo2 con el valor en
tablas de la mencionada distribución Ji cuadrada con v grados de libertad y un
nivel de significancia alfa. En la siguiente sección aplicaremos esta prueba para
probar la hipótesis nula de que los números aleatorios (provenientes de un
generador) se ajustan a la distribución teórica uniforme continua.
Sea x una variable aleatoria discreta con valores x1, x2,......., xn Se propone la
hipótesis nula H0, de que la distribución de donde proviene la muestra se
comporta según un modelo teórico específico tal como la uniforme, la exponencial,
la normal, etc. Entonces FOi, representa el número de veces que ocurre el valor xi
mientras que FEi, es la frecuencia esperada proporcionada por el modelo teórico
propuesto. A menudo ocurre que muchas de las frecuencias FEi, (y también
las FOi) son muy pequeñas, entonces, como regla práctica adoptamos el criterio
de agrupar los valores consecutivos de estas frecuencias esperadas hasta que su
suma sea de al menos cinco. La medida estadística de prueba para la hipótesis
nula es:
12
Para n grande este estadístico de prueba tiene una distribución X2 aproximada
con V grados de libertad dados por
V = (k –1) – (número de parámetros estimados)
así, si se estiman dos parámetros como la media y la varianza, la medida
estadística tendrá (k – 3) grados de libertad.
Se puede aplicar esta prueba a variables continuas agrupando adecuadamente los
valores en un número adecuado de subintervalos o clases k. Una regla empírica
para seleccionar el número de clases es:
13
2.4 Obtención de números pseudoaleatorios utilizando paquetes computacionales.
La herramienta principal de la simulación es la generación de números aleatorios o
al azar, los cuales representaran el valor que tomara una variable. En un principio
los números aleatorios se generaban por métodos rústicos como el girar una ruleta
o lanzar los dados.
El enfoque moderno es usar una computadora para generarlos mediante alguna
fórmula matemática con lo que nos encontramos generando por un método
determinístico una secuencia de número que dan la apariencia de ser aleatorios
cuando no lo son, dado que en algún momento no determinado esta lista
comenzara a repetirse, el objetivo en sí es generar una lista lo suficientemente
larga como para evitar llegar al comienzo del ciclo.
A esta serie de número que parecen ser aleatorios se les denomina
pseudoaleatorios, ahora veamos una fórmula para determinar esta serie de
números:
Excel es uno de los paquetes computacionales que permite la generación de números pseudoaleatorios.
Estos son los software más usados:
HYSYS
Es un programa interactivo enfocado a la ingeniería de procesos y la simulación,
que se puede utilizar para solucionar toda clase de problemas relacionados con
procesos químicos. Este simulador cuenta con una interfaz muy amigable para el
14
usuario, además de permitir el empleo de operadores lógicos y herramientas que
facilitan la simulación de diversos procesos. Es un simulador bidireccional, ya que
el flujo de información va en dos direcciones (hacia delante y hacia atrás). De esta
forma, puede calcular las condiciones de una corriente de entrada a una operación
a partir de las correspondientes a la corriente de salida sin necesidad de cálculos
iterativos. Posee un entorno de simulación modular tanto para estado estacionario
como para régimen dinámico. Es un software para la simulación de plantas
petroquímicas y afines.
AspenPlus
El Sistema Avanzado para Ingeniería de Procesos (ASPEN) es un mercado líder
en herramientas de modelado de proceso de diseño conceptual, optimización y
monitoreo de desempeño para la industria química, polímeros, especialidades
químicas, metales y minerales. Aspen Plus es un simulador estacionario,
secuencial modular (en las últimas versiones permite la estrategia orientada a
ecuaciones). Actualmente es posible que sea el más extendido en la industria. Se
ha utilizado para modelar procesos en industrias: química y petroquímica, refino
de petróleo, procesamientos de gas y aceites, generación de energía, metales y
minerales, industrias del papel y la pulpa y otros. Aspen Plus tiene la base de
datos más amplia entre los simuladores de procesos comerciales, e incluye
comportamiento de iones y de electrolitos. Además modela y simula cualquier tipo
de proceso para el cual hay un flujo continuo de materiales y energía de una
unidad de proceso a otra. Posee herramientas para cálculos de costes y
optimizaciones del proceso, generación de resultados en forma gráfica y en tablas
y otros.
15
2.5 Método de Monte Carlo.
El método de Montecarlo es un método no determinista o estadístico numérico,
usado para aproximar expresiones matemáticas complejas y costosas de evaluar
con exactitud. El método se llamó así en referencia al Casino de Montecarlo
(Mónaco) por ser “la capital del juego de azar”, al ser la ruleta un generador simple
de números aleatorios. El nombre y el desarrollo sistemático de los métodos de
Montecarlo datan aproximadamente de 1944 y se mejoraron enormemente con el
desarrollo de la computadora.
El uso de los métodos de Montecarlo como herramienta de investigación, proviene
del trabajo realizado en el desarrollo de la bomba atómica durante la Segunda
Guerra Mundial en el Laboratorio Nacional de Los Álamos en EE. UU. Este trabajo
conllevaba la simulación de problemas probabilísticos de hidrodinámica
concernientes a la difusión de neutrones en el material de fisión. Esta difusión
posee un comportamiento eminentemente aleatorio. En la actualidad es parte
fundamental de los algoritmos de raytracing para la generación de imágenes 3D.
El método de Monte Carlo proporciona soluciones aproximadas a una gran
variedad de problemas matemáticos posibilitando la realización de experimentos
con muestreos de números pseudoaleatorios en una computadora. El método es
aplicable a cualquier tipo de problema, ya sea estocástico o determinista. A
diferencia de los métodos numéricos que se basan en evaluaciones en N puntos
en un espacio M-dimensional para producir una solución aproximada, el método
de Monte Carlo tiene un error absoluto de la estimación que decrece como en
virtud del teorema del límite central.
16
Bajo el nombre de Método Monte Carlo o Simulación Monte Carlo se agrupan una
serie de procedimientos que analizan distribuciones de variables aleatorias usando
simulación de números aleatorios. El Método de Monte Carlo da solución a una
gran variedad de problemas matemáticos haciendo experimentos con muestreos
estadísticos en una computadora. El método es aplicable a cualquier tipo de
problema, ya sea estocástico o determinístico. Generalmente en estadística los
modelos aleatorios se usan para simular fenómenos que poseen algún
componente aleatorio. Pero en el método Monte Carlo, por otro lado, el objeto de
la investigación es el objeto en sí mismo, un suceso aleatorio o pseudoaleatorio se
usa para estudiar el modelo.
A veces la aplicación del método Monte Carlo se usa para analizar problemas que
no tienen un componente aleatorio explícito; en estos casos un parámetro
determinista del problema se expresa como una distribución aleatoria y se simula
dicha distribución.
17
Bibliografía
http://simulacion-itstb.blogspot.mx/p/unidad-dos-numeros-aleatorios-y.html
http://www.sites.upiicsa.ipn.mx/polilibros/portal/Polilibros/P_Terminados/
SimSist/doc/SIMULACI-N-128.htm
https://sistemasumma.com/2011/09/05/numeros-pseudoaleatorios/
18
Mapa de la unidad
19