14
CAMPUS TLALPAN DEPARTAMENTO DE POSGRADO MAESTRÍA EN GESTIÓN DE TECNOLIGÍAS DE LA INFORMACIÓN SOFTWARE DE ANÁLISIS DE DECISIONES MAESTRANTES: José Antonio Chávez Malagamba Carlos Adán Moctezuma Figueroa NOMBRE DOCENTE: Ricardo Alfonso Delgado Altamirano

Software para arboles de decisión y diagramas de influencia

Embed Size (px)

DESCRIPTION

Software

Citation preview

Page 1: Software para arboles de decisión y diagramas de influencia

CAMPUS TLALPAN

DEPARTAMENTO DE POSGRADO

MAESTRÍA EN GESTIÓN DE TECNOLIGÍAS DE LA INFORMACIÓN

MAESTRANTES:

José Antonio Chávez Malagamba

Carlos Adán Moctezuma Figueroa

NOMBRE DOCENTE: Ricardo Alfonso Delgado Altamirano

Page 2: Software para arboles de decisión y diagramas de influencia

Marco Teórico

Los árboles de decisión son una manera de representar una serie de reglas que culminan en una clase o valor. Son comúnmente usados en la minería de datos para examinar los datos e inducir las reglas para realizar predicciones.

Los árboles de decisión crecen a través de una división iterativa de grupos discretos, donde la meta es maximizar la “distancia” entre grupos por cada división. Una de las distinciones entre los diferentes métodos de “división” es como miden esta distancia. Se puede pensar que cada división de los datos en nuevos grupos debe ser diferente uno de otro tanto como sea posible. Esto también es llamado como “purificación” de grupos.

Los árboles de decisión usados para predecir variables categóricas son llamados árboles de clasificación, y los árboles usados para predecir variables continuas son llamados árboles de regresión. Los árboles de decisión manejan datos no numéricos muy bien. La habilidad para aceptar datos categóricos minimiza la cantidad de transformaciones en los datos y la explosión de variables de predicción inherentes en las redes neuronales.

Un diagrama de influencia es una presentación visual simple en forma de grado de un problema de decisión. Ofrece una manera intuitiva de identificar y representar los elementos esenciales de un problema de ese tipo, incluyendo decisiones, elementos de azar y objetivos; asi como relaciones entre ellos.

En el grado podemos diferenciar entre nodos y aristas. Representando las distintas relaciones entre ellos. Los nodos pueden representar:

- Decisiones- Variables al azar- Utilidades

AnálisisUn árbol de decisión se compone de:

- Un nodo raíz, que puede ser aleatorio o de decisión- Cada nodo (excepto el nodo de utilidad) tiene varios hijos, uno por cada valor de la

variable asociada al nodo- Gráficamente el nodo raíz se representa a la izquierda, y los hijos de cada nodo a la

derecha de su padre, siguiendo un orden temporal en las acciones; por tanto los nodos de utilidad aparecen en el extremo de la derecha.

- Los nodos aleatorios se representan por círculos, y los de decisión por cuadrados.- Los enlaces que parten de un nodo aleatorio X llevan asociada una probabilidad

condicional P(x|izq(x), donde izq(x) representa los valores que toman los nodos situados a la izquierda de X en el árbol.

Un diagrama de influencia viene dado por un grafo y unas tablas.

Page 3: Software para arboles de decisión y diagramas de influencia

En el grafo pueden aparecer tres tipos de nodos:

- Variables aleatorias, que se representan por círculos- Decisiones, que se representan por cuadrados o rectángulos- Utilidad, que se representan por rombos.

Cada nodo aleatorio lleva asociado una tabla de probabilidad condicional dados sus padres (que pueden ser tanto aleatorios como de decisión)

DesarrolloPara construir el árbol tomando en cuenta ambos conceptos, es necesario tener en cuenta la siguiente composición utilizando como herramienta “Precision Three”:

- A la derecha del todo debe aparecer el valor de la utilidad para cada rama.

- Si la Decisión Dec1 se toma antes que Dec2, el nodo Dec1 debe aparecer a la izquierda del nodo Dec2.

Page 4: Software para arboles de decisión y diagramas de influencia

- Las variables cuyo valor se conoce antes de tomar la decisión Dec, han de aparecer a la izquierda del nodo Dec en el desarrollo del árbol; las que no se conocen al decidir Dec, aparecerán a la derecha.

- De dos puntos anteriores se deduce que, si el valor de la variable X se conoce después de la Decisión Dec1 y antes de la Dec2, el nodo X debe aparecer entre Dec1 y Dec2.

Su evaluación de se realizara siempre de derecha a izquierda.

Para el desarrollo del modelo Precision Three recomienda seguir los siguientes pasos:

1.- Planificar el modelo de árbol de decisión

2.- Construir el esqueleto del árbol

3.- Introducir los valores y las probabilidades

4.- Examinar la estrategia óptima

5.- Realizar un análisis de sensibilidad

Page 5: Software para arboles de decisión y diagramas de influencia

Ejemplos de aplicaciónCon la finalidad de mostrar la aplicación de la herramienta, a continuación se muestran dos ejemplos y su descripción respectiva:

Terminología básica de árboles

El objetivo de este ejemplo es ayudarle a familiarizarse con la terminología básica que se utiliza en un árbol de decisión.

El árbol simple, llamado "Lotería" incluye numerosas anotaciones. Contiene un nodo de decisión con dos ramas que representan una decisión de compra de un boleto de lotería de $2. Si elige la opción "Sí", debe pagar $2. No hay ningún costo si se elige la rama "No". Si juega, hay dos posibles resultados. Hay una probabilidad del 1% de ganar un premio de $100, y un 99% de no ganar nada.

El valor esperado de la rama "Sí" (si se compra el boleto, celda D19) es -$1. Por tanto, si lo único que le preocupa es el valor esperado, la mejor decisión es no comprar el boleto. Los valores FALSO y VERDADERO de las celdas C18 y C24 indican que esta es también la decisión a la que ha llegado PrecisionTree. Siempre marca la rama de la mejor decisión con VERDADERO. No obstante, puede probar a cambiar los valores y las probabilidades del modelo para ver si cambian estos resultados y de qué manera.

Page 6: Software para arboles de decisión y diagramas de influencia
Page 7: Software para arboles de decisión y diagramas de influencia

Ejemplo II

Decisión de presentar oferta 1 - Modelo de PrecisionTree básico

En este modelo introductorio, una compañía de tecnología debe decidir si presentará una oferta para un contrato con el gobierno para desarrollar un equipo y, si la compañía opta por presentar la oferta, debe decidir el valor de la misma. El gobierno adjudicará el contrato a la compañía que presente la oferta más baja. No obstante, hay una probabilidad de 0.2 de que ninguna otra compañía presente una oferta. Si se presentan otras ofertas, la oferta más baja está determinada por la siguiente distribución de probabilidad: menos de $160K con una probabilidad de 0.2, entre $160K y $170K con una probabilidad de 0.4, entre $170K y $180K con una probabilidad de 0.3 y mayor que $180K con una probabilidad 0.1. La compañía estima que el costo de presentar una oferta es de $7.5K y el costo de desarrollar el equipo, en caso de que gane el contrato es de $150K. De esta manera, por ejemplo, si la compañía presenta una oferta de $170K y gana el contrato, si beneficio será igual a $20K menos lo que le costó presentar la oferta. Además, la probabilidad de ganar la oferta en este caso es de 0.2 (si no tiene que competir con ninguna otra oferta) más 0.8*0.4 (las ofertas con las que debe competir superan los $170K).

Se muestra el árbol para tomar estas decisiones. Observe que todas las probabilidades y los valores monetarios se han introducido directamente en las ramas del árbol. (Estas son las celdas con letra negra. Las celdas con letra azul, verde o roja se reservan para las fórmulas de PrecisionTree.) Siempre hay una posibilidad en un árbol y tiende a acelerar el proceso de desarrollo de un árbol. No obstante también es posible, y con frecuencia es una buena idea, utilizar fórmulas en las ramas del árbol que hagan referencia a las celdas de una sección "Entradas" de la hoja de cálculo. Esta posibilidad resulta particularmente útil para el análisis de sensibilidad y se ilustra en la siguiente versión de esta secuencia de ejemplos de decisión de presentar oferta.

Una vez que se ha creado el árbol y se ha etiquetado con las probabilidades y los valores monetarios, es fácil ver la estrategia de la mejor decisión siguiendo las ramas VERDADERO de los nodos de decisión. En este modelo, la compañía debe presentar una oferta y la cantidad de la oferta debe ser de $170K. El valor monetario esperado de esta estrategia es de $2900, el valor de la celda C35. Las últimas tres hojas muestran salidas opcionales de PrecisionTree del menú desplegable Análisis de decisión.

Page 8: Software para arboles de decisión y diagramas de influencia

Diagrama de influencia

Page 9: Software para arboles de decisión y diagramas de influencia

Grafica de probabilidad

Page 10: Software para arboles de decisión y diagramas de influencia

Grafica Acumulativa

Page 11: Software para arboles de decisión y diagramas de influencia

Conclusiones

Todas las actividades profesionales requieren de decisiones rápidas y acertadas para el éxito de situaciones, la técnica del Árbol de Decisiones nos facilitará la tarea de escoger las estrategias adecuadas a seguir dentro de la empresa, por lo que se hace de vital importancia el conocer y comprenderlo.

Entre las facilidades de utilizar un árbol de decisiones podemos encontrar que nos permite plantear claramente el problema de tal manera que todas las opciones sean analizadas, hacer un análisis rápido de todas las consecuencias de las posibles decisiones. Ya que utiliza un esquema que cuantifica el costo de los resultados y las probabilidades de que los diferentes resultados aparezcan, nos ayuda a tomar decisiones adecuadamente.

Dentro de la Gerencia y la Administración financiera serán de gran ayuda pues se logrará tener un mapa que pueda medir el riesgo y beneficios de las decisiones tomadas, claramente será de mayor precisión en cuanto se pueda contar con la mayor cantidad de información posible que nos permita elegir las opciones que minimicen el riesgo y maximicen los beneficios.

La técnica del Árbol de decisiones facilitará la representación y análisis de diferentes situaciones futuras de forma secuencial a través del tiempo, es de gran utilidad cuando se debe optimizar diferentes decisiones. La técnica del Árbol de Decisiones involucra varias alternativas, de tal manera que es necesaria la identificación de todas para optimizar los resultados a obtener.

Debemos tomar muy en cuenta las probabilidades de ocurrencia de cada una de las consecuencias de las decisiones, cuanta mayor información tengamos de las posibles consecuencias entonces serán más exactas las predicciones y mejores las decisiones a tomar; será de gran utilidad si se examinan decisiones de inversión o de financiamiento.