Upload
wlogia
View
30
Download
3
Embed Size (px)
Citation preview
1
SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS APOYADO CON REDES NEURONALES ARTIFICIALES
HOLMES ELIAS PINTO AVILA
ANDRES FELIPE GONZALEZ GALEANO
UNIVERSIDAD POPULAR DEL CESAR
FACULTAD DE INGENIERÍAS Y TECNOLOGÍAS
PROGRAMA DE INGENIERÍA DE SISTEMAS
VALLEDUPAR
2011-1
2
SISTEMA DE INFORMACIÓN DE GESTIÓN DE PROCESOS ACADÉMICOS
APOYADO CON REDES NEURONALES ARTIFICIALES
HOLMES ELIAS PINTO AVILA
ANDRES FELIPE GONZALEZ GALEANO
Director
Ing. Norberto Díaz
UNIVERSIDAD POPULAR DEL CESAR
FACULTAD DE INGENIERÍAS Y TECNOLOGÍAS
PROGRAMA DE INGENIERÍA DE SISTEMAS
VALLEDUPAR
2011-1
3
1. INTRODUCCIÓN
La utilización de las redes neuronales para el manejo y posterior estudio de los
procesos de información desarrollado en entorno web como una herramienta
interactiva de un Sistema de gestión de procesos académicos y financieros en
ambiente web para las instituciones de educación básica y media del municipio de
Valledupar, nace con la intención de innovar los métodos de almacenamiento de
registros utilizados de forma tradicional. Se pretende demostrar que la
implementación de estos modelos en las instituciones educativas ha de facilitar la
socialización de conocimientos.
Por otra parte, se ha producido un fuerte incremento en el conocimiento y la
aplicación de modernas técnicas econométricas y estadísticas que tiempo atrás
eran consideradas como sofisticadas y sólo al alcance de unos pocos. Nos
estamos refiriendo a las regresiones no lineales, el análisis estadístico
multivariante y en particular a las técnicas de minería de datos o data mining. La
aplicación de estas técnicas, utilizando las redes neuronales artificiales, está
contribuyendo a una significativa mejora de los trabajos y los resultados que se
desarrollan en el amplio campo de la investigación y, en muchos casos, han
supuesto nuevas formas de enfrentarse a problemas económicos tradicionales.
Sin embargo, cuando se trata de redes neuronales artificiales aplicado a la
educación se encuentran pocos trabajos realizados, por lo cual, este proyecto, se
convierten en un herramienta indispensables para promover un aporte científico a
la educación de hoy.
De igual forma, la creación de un software interactivo de administración de
información que permita la unificación de criterios de los docentes e incorporar en
4
el proyecto educativo institucional los procesos y procedimientos de evaluación;
estrategias para la superación de debilidades y promoción de los estudiantes,
definidos por estos y/o el consejo directivo, después del análisis de la información
como referente principal de los procesos académicos diseñados y aplicados por
los docentes, que son los primeros en tomar las medidas para realizar actividades
académicas en la institución.
Mediante este proyecto, se hará un seguimiento estratégico por parte de la
Institución, el Docente, Los Padres de Familia a la información completa
generada por los estudiantes para consolidar o reorientar los procesos educativos
relacionados con el desarrollo integral. Esta experiencia de desarrollo es una
alternativa positiva, pues, permitirá integrar tecnología y conocimiento, en
inteligencia artificial utilizando las redes neuronales como apoyo a los modelos de
conocimiento e inferencia lógica.
Así, en los objetivos sociales del mundo educativo comprenden una amplia gama,
que persigue la reducción del fracaso escolar; el aumento del rendimiento
académico; la mejora en la calidad de la enseñanza (entendida como el acceso a
las nuevas tecnologías; instalaciones educativas; educación más personalizada y
métodos pedagógicos exitosos) y la igualdad de oportunidades educativas para
todos los alumnos.
El objetivo fundamental de esta Tesis es el de aportar nueva luz en torno a la
función de producción y la medición de la eficiencia escolar a partir del análisis no
lineal de una realidad tan compleja como la educativa. Este análisis no lineal será
llevado a cabo mediante un modelo basado en redes neuronales artificiales
(RNAs).
El propósito de este proyecto va encaminado a facilitar el aprendizaje y la
5
captación total de la información con el fin de tener un mejor desempeño en la
práctica profesional, contribuyendo al mejoramiento del aprendizaje en los
procesos cognitivos que se realizan en la educación Básica y Media.
1.1. PLANTEAMIENTO DEL PROBLEMA
1.1.1 Descripción del problema
Los procesos de administración de la información en la educación han ido
evolucionando a lo largo del tiempo. Si bien, en la Universidad Popular del Cesar
se han presentado muchos proyectos con este perfil y ninguno de estos ha optado
por tomar las redes neuronales como aporte estructural y significativo que se
podría innovar al incorporarse un módulo dentro del sistema de gestión de
información académica apoyado por medio de redes neuronales artificiales que
permita conocer de primera mano los estados académicos, sociales y financieros
de los estudiantes, para resolver los problemas de deserción y bajo desempeño en
la institución educativa, como también un módulo de consulta psicológico que
permita el estudio de comportamiento del estudiante; además el estudio en línea
de los nuevos estudiantes con el fin de detectar sintomatologías de deserción
escolar, son inconvenientes que se pueden solucionar a la hora de desarrollar este
software.
En el pasado, los docentes, se apoyaban en informes periódicamente muy
limitados, y por otra parte el estudiante en obtener calificaciones cuantitativas; con
la llegada de las tecnologías digitales, la educación ha sufrido cambios en los
métodos y procesos de enseñanza dando paso a la masificación y uso de
recursos tecnológicos para el aprendizaje y el manejo de la información. En
consecuencia, el uso de la tecnología debe ser un factor fundamental en el
desarrollo del aprendizaje y una herramienta que ayude a construir e implementar
6
un modelo de enseñanza más flexible. Sin embargo, los modelos actuales de
calificación son muy rígidos y no permiten tomar decisiones “inteligentes”, hacer
proyecciones estadísticas de alto nivel académico institucional, donde prime la
investigación y la construcción del conocimiento mediante unos recursos
tecnológicos. Igualmente, las Instituciones no cuentan con herramientas
tecnológicas adecuadas acordes al contexto global de los sistemas educativos de
hoy día, esto impide integrar nuevos recursos de aplicación libre, disponibles en la
red de Internet, útiles para la implementación de nuevas estrategias pedagógicas.
Así mismo, la falta de proyectos de innovación tecnológica en las instituciones de
educación básica y media, no ha permitido la transformación de nuevos ambientes
de aprendizaje, conservando el viejo modelo tradicional de clase en el aula.
De igual manera, el incremento en la población estudiantil en estas instituciones
dificulta el control y acompañamiento por parte del personal encargado de hacer
seguimiento al comportamiento de manera individual de cada estudiante, lo que se
traduce en actos de violencia, drogadicción, alcoholismo y otros más, que
repercuten negativamente en el mismo estudiante, en su núcleo familiar y desde
luego en la institución como ente responsable del proceso de formación.
Por otra parte, los estudiantes que han obtenido bajas calificaciones no cuentan
con sistemas de información automática que les alerte, les de orientaciones y a la
vez les brinde recursos didácticos tales como: ejercicios, talleres, auto-
evaluaciones, que apunten a reforzar el área de deficiencia identificada a través
del mismo sistema. Igualmente, los padres de familia no conocen de manera
actualizada, los estados académicos, sociales y financieros de su(s) hijo(s) en la
institución.
Por último, existe el problema de adaptación del software en las instituciones
7
oficiales y no oficiales, ya que el Artículo 1290 estandariza para las instituciones
oficiales ciertos modelos educativos diferentes a los no oficiales, el desarrollo de
un software que permita adecuarse a estos modelos sin tener que realizar grandes
cambios en la plataforma suelen ser difícil de encontrar.
Todos estos inconvenientes dieron paso al querer desarrollar una plataforma
integral educativa que tiene como reto superar todos estos problemas presentados
en el mencionado proyecto.
1.1.2. Formulación del Problema
Para la formulación del proyecto se han planteado las siguientes preguntas:
¿Con la implementación de una plataforma en ambiente web de un sistema de
gestión de procesos académicos apoyado en las redes neuronales, mejorará el
nivel de aprendizaje de los estudiantes y a su vez ayudará al control académico,
social y financiero de las instituciones de educación básica y media del municipio
de Valledupar?
¿Son las redes neuronales artificiales una herramienta útil para un Sistema de
gestión de procesos académicos en ambiente web para instituciones de
educación básica y media del municipio de Valledupar?
1.2. OBJETIVOS
1.2.1. Objetivos Generales
Implementar un Sistema de Información de Gestión de Procesos Académicos
apoyado con Redes Neuronales Artificiales como estrategias pedagógicas de
8
evaluación y predicción para el desempeño académico de los estudiantes de las
instituciones educativa de Básica y Media de Valledupar.
1.2.2. Objetivos Específicos
Desarrollar una plataforma educativa que permita mediante la gestión de una Base
de Datos, proporcionar información académica, social y financiera de los
estudiantes.
Generar por medio de las Redes Neuronales Artificiales, información que permita
implementar estrategias pedagógicas para la predicción y prevención en el
desempeño académico de los estudiantes.
Desarrollar un módulo que permita a la Institución diagnosticar sintomatologías de
deserción escolar por estudiante, apoyada en Redes Neuronales.
Implementar un módulo para el manejo estadístico que refleje el desempeño
académico para reorientar los procesos educativos relacionados con el desarrollo
integral en la Institución.
1.3. JUSTIFICACIÓN
La elaboración de un Sistema de Información de Gestión de Procesos Académicos
apoyado con Redes Neuronales Artificiales para instituciones de educación
básica y media del municipio de Valledupar, contribuye con el desarrollo de
experiencias y proyectos interdisciplinarios e innovadores apoyados en el uso de
herramientas tecnológicas y pedagógicas, para la formación integral del
estudiante. Por ello, este proyecto propone implementar los siguientes procesos
para el desarrollo integral del mismo:
9
Realizar los procesos de inscripción, matricula, entrevistas psicológica a través
de la plataforma web.
Ingresar a la plataforma los logros cualitativos, calificaciones, asistencias,
estado de comportamiento.
Poder consular las notas, notificaciones, estados de pagos por parte de los
estudiantes y padres de familia.
Realizar procesos de carga académica para los docentes.
Identificar por medio del sistema las características personales, intereses,
ritmos de desarrollo y estilos de aprendizaje del estudiante para valorar sus
avances.
Proporcionar información básica para consolidar o reorientar los procesos
educativos relacionados con el desarrollo integral del estudiante a través de la
plataforma.
Suministrar información por medio de datos estadísticos que permita
implementar estrategias pedagógicas para apoyar a los estudiantes que
presenten debilidades y desempeños inferiores en su proceso formativo.
Determinar la promoción de estudiantes al final del año escolar.
Aportar información para el ajuste e implementación del plan de mejoramiento
institucional por medio de las proyecciones estadísticas utilizando las redes
neuronales.
10
Los procesos anteriores permiten mejorar las condiciones académicas y
financieras de una entidad educativa, acompañada en algunos casos por la
inteligencia artificial como una alternativa innovadora para el proceso académico.
La implementación de las redes neuronales está implícita en la estructura interna
del software permitiendo mayor robustez a esta aplicación logrando de forma
inteligente administrar, analizar y sugerir mejores métodos para futuros trabajos
académicos.
La Inteligencia Artificial se ha aplicado considerablemente en la medicina y la
psicología, pero poco se ha hecho por evaluar sus efectos en la educación ,
permitiendo asegurar la calidad de un producto que esté al servicio de las
instituciones educativas en el municipio de Valledupar, entendiendo ésta como un
proceso sinérgico en que el alumno no sólo crece en conocimiento, sino como
persona integral, por ello la información se debe tratar como un ente prioritario
para el estudio de comportamiento y conductas académicas que permitan prever
factores como la deserción escolar, estilos de aprendizajes, entre otros.
1.4. DELIMITACION
1.4.1. Delimitación Espacio Temporal
Este proyecto se ejecutará en el territorio municipal, más específicamente en el
Colegio Gimnasio del Saber, Colegio Juvenil, Colegio Osvaldo Vergara, Colegio
San Antonio, cabe destacar que por ser un sistema basado en ambiente Web se
puede visualizar desde cualquier parte del mundo la información pública en el
Sitio.
1.4.2. Delimitación Conceptual
11
La ejecución de este proyecto se limitará a la creación de un sistema que
administre los procesos académicos y administrativos de la institución así como
también la implementación de Redes Neuronales para el tratamiento de la Base
de Dato, el contenido será publicado en el Sitio Web, que permitirá la fácil y rápida
administración de dichos procesos, minimizando el tiempo de trabajo de cada uno
de los empleados en la Institución y también mejorando la calidad de servicio a los
estudiantes y padres de familia.
2. MARCO REFERENCIAL
2.1 ANTECEDENTES
La Implementación de un Sistema de Información de Gestión de Procesos
Académicos apoyado con Redes Neuronales Artificiales es un proyecto con un
enfoque innovador y de un contexto no explorado hasta el momento en la
Universidad Popular del Cesar ya que se conocen trabajos realizado para el
diseño e implementación de plataformas académicas en entorno web, que no
incluyen en sus estudios las redes neuronales artificiales, como por ejemplo:
“Desarrollo e Implementación de un Sistema Vía Web Para Los Procesos
Académicos Del Colegio Bilingüe Fisher Kids” de los autores: Diana Gutiérrez
Mercado, Lenin Nuñez Reales; “Construcción de Sitio Web Y Sistema De
Información para el Control de la Carga Académica en El Instituto Técnico
Del Norte Sede Valledupar” de los autores: Jaidy Laizaat Botello Rocha, John
Harold Díaz González; “Desarrollo e Implementación de un Portal Web
Educativo como Apoyo a los Procesos Educativos y Servicios de
Seguimiento Académico y Estudiantil En La Institución Educativa Técnica
Agropecuaria y de Participación Comunitaria Julio Cesar Turbay del
Municipio de el Carmen de Bolívar, Bolívar Colombia.” de los autores: Monica
Patricia Rodriguez Rada, Yuly Milena Amorocho Hernandez. Estos trabajo no
12
contienen seguimientos detallados aplicados a la población estudiantil, por la
naturaleza compleja de la información, de la parte socioeconómica (sexo, edad,
estudios del padre, estudios de la madre, trabajo del padre, trabajo de la madre) y
académica, es por ello que, sin desmeritar los trabajos anteriores, nuestro
proyecto trasciende más allá de las fronteras del seguimiento académico y enfoca
sus estudios en las redes neuronales como aplicación para resolver soluciones
que otros autores se habían planteado pero que no se habían a atrevido a
desarrollar.
A nivel nacional no se conocen trabajo que aplique el estudio de las redes
neuronales a los objetivos propuesto en nuestra investigación.
Por otra parte, a nivel internacional se han presentados investigaciones como
“Predicción del Éxito en Estudios Universitarios Mediante Redes
Neuronales”, de los autores: Lourdes Molera Mª Victoria Caballero, con este
trabajo se pretende estudiar la posibilidad que tiene un alumno matriculado en la
Universidad de Murcia (en la licenciatura de Economía o ADE, o en la diplomatura
de Ciencias Empresariales) de finalizar con éxito sus estudios en un determinado
periodo de tiempo. Para ello, se construye una red neuronal a partir de información
acerca de sus características socioeconómicas y sus resultados académicos, y
otros para tener en cuenta es “Predicción del Rendimiento de los Estudiantes
y Diagnóstico Usando Redes Neuronales” de los autores: Zulma Cataldi,
Fernando Salgueiro, Fernando Javier Lage de la Universidad Tecnológica
Nacional. Facultad Regional Buenos Aires, este proyecto es aplicado a los
estudiantes que comienzan una carrera universitaria en sus evaluaciones
parciales y finales. Se toman los datos de las evaluaciones parciales y a partir del
análisis de los mismos se busca efectuar un diagnóstico con base en los errores
cometidos. De este modo, en función de los datos de los primeros exámenes se
podrán predecir errores futuros y dar sugerencias para realizar una ejercitación
13
correctiva a fin de mejorar la producción. Para efectuar la predicción de los
próximos errores se usa una red neuronal y sobre esta base se le sugiere al
estudiante una secuencia de ejercicios y problemas a fin de mejorar su producción
y por lo tanto sus calificaciones. “Detección de alumnos de riesgo y medición
de la eficiencia de centros escolares mediante redes neuronales”. En este
trabajo, de aproximación a la tesis doctoral que el autor Daniel Santín González de
la Universidad Complutense de Madrid estaba elaborando en 1999, se utilizan las
redes neuronales para intentar solucionar empíricamente tres problemas
habituales en el campo de la economía de la educación: Detección de alumnos
con alto riesgo de fracaso escolar, evaluación de la eficiencia relativa de centros
educativos y evaluación de la eficiencia relativa de diferentes planes de estudio en
datos individuales de 7454 alumnos de enseñanzas medias de octubre de 1984
(1985) en 256 centros públicos y privados.
Por lo anterior, en la actualidad, no se encuentran estudios realizados en la
educación básica y media en Colombia que permitan aplicar las redes neuronales
artificiales como lo describen los objetivos del presente proyecto.
3. MARCO TEORICO
Debido a que es de vital importancia implementar una herramienta tecnológica
que permita identificar las características personales, intereses, ritmos de
desarrollo y estilos de aprendizaje, comportamientos financieros del Estudiante
para así valorar sus avances académicos y que le facilite a las instituciones
educativas la información necesaria para consolidar o reorientar los procesos
educativos relacionados con el desarrollo integral del Estudiante y la Institución
educativa, permitiendo de esta manera dar un aporte al plan de mejoramiento
institucional, para esto el estudio pretende desarrollar en dos etapas el presente
proyecto, describiendo en su orden, estas etapas de la siguiente manera:
14
Desarrollo y puesta en marcha de los módulos Académicos y Financieros
de la Plataforma Educativa.
Implementación de las Redes Neuronales Artificiales a la Base de Datos de
la Plataforma Educativa.
3.1. Componentes que integran la Plataforma Educativa
El diseño del Sistema se basa en la premisa de disponer de una estructura
combinada de elementos de almacenamiento, acceso y análisis de la información
necesarios para dar solución a las necesidades planteadas. El proceso de
implementación ha consistido en cinco grandes fases (figura 1):
Análisis de las necesidades: Estudio de necesidades, usuarios y
posibilidades existentes para poner en marcha el Sistema de Información.
Diseño: Selección del hardware y herramientas necesarias.
15
Diseño lógico: Transformación del modelo de Sistema a alto nivel interno;
define el sistema y soluciones a emplear en función del esquema seleccionado
anteriormente.
Implantación física: Implementación del diseño en la realidad.
Testeo: Realización de pruebas y uso en proyectos de investigación educativa
en desarrollo.
Estrategias de actuación: Acciones a emprender para mejorar el Sistema de
Información Académica y Financiera.
3.1.1. Análisis de las necesidades.
En este apartado del diseño es donde se dimensiona el Sistema de Información a
implantar, en función de las necesidades de los usuarios potenciales (las
Instituciones Educativas) y el cumplimiento de los objetivos a alcanzar durante la
realización del proyecto. Para constituir de estudio presentado se han analizado
los requerimientos y necesidades en función de los usuarios potenciales y
necesidades de gestión y procesamiento de información.
Usuarios potenciales: Usuarios internos del sistema: Administrativos y
estudiantes de las instituciones educativas. De la estimación del número de
usuarios potenciales y sus necesidades ha sido posible presuponer la
potencia requerida por el Sistema y el costo final a abordar, así como la
normalización de usuarios internos en los servidores y terminales.
Necesidades de gestión y procesamiento: Introducción, almacenamiento
y actualización de la información de forma rápida, coherente y eficiente a
16
partir del estudio de las necesidades informativas, acceso, gestión y análisis
de los datos a partir de aplicaciones servidas.
Extracción de información a partir de la explotación de los datos
almacenados mediante salidas graficas, tabulares, etc.
3.1.2. Análisis de la información susceptible de ser introducida
Uno de los aspectos fundamentales a considerar en la Implementación un Sistema
de Información de Gestión de Procesos Académicos apoyado con Redes
Neuronales Artificiales es:
El análisis de los datos de interés
Disponibilidad de acceso
Estrategias de almacenamiento en función del modelo lógico de
almacenamiento
Debido al elevado número de datos que generan información espacial, este
apartado debe considerarse como un estudio preliminar de lo que será el núcleo
de la base de datos, abierto y susceptible de ser ampliado con nueva información.
Para ello se ha creado una Plataforma Educativa en entorno web basada en
MYSQL, PHP y utilizando técnicas de programación en AJAX, la implementación
de los aplicativos para las Redes Neuronales Artificiales aun son objetos de
estudios.
3.1.3. Diseño conceptual y lógico del Sistema.
Se ha optado por diseñar un Plataforma Educativa en entorno web a partir de una
17
arquitectura cliente-servidor distribuida basada en un servidor de datos y
aplicaciones (uno con sistema operativo Linux y otro con Windows) a los que los
usuarios acceden a través de estaciones de trabajo Windows o Linux (equipos
para acceso al servidor pero con capacidad para trabajar de forma autónoma a
través de Internet Explore, Mozilla y otros exploradores) o terminales, equipos con
poca potencia utilizados para acceso mediante escritorios remotos al sistema.
3.1.4. Implementación física del Sistema
El Sistema propuesto se basa en un servidor (tabla 1), el cual se ha configurado
para una serie de tareas concretas:
Almacenamiento, gestión y servidor de los datos (desde los datos
propios de la Plataforma Educativa hasta copias de seguridad de los
usuarios)
Gestión de los usuarios.
Servidor de aplicación de acceso a la información
Servidor S.O Procesador Memoria RAM
Capacidad
PowerEdge T110
Sistema Operativo
Windows Server® 2008 R2, Foundation
Procesador
Intel® Xeon® X3440, 2.4 GHz, 8M Cache, Turbo
4GB de memoria (2x2GB), 1066MHz, Dual Ranked UDIMM
Uno de 500GB 7.2k RPM Serial ATA 3Gbps 3.5-in Cabled Hard Drive
18
Tabla 1: Características técnicas del servidor
Figura 2: Servidor en torre PowerEdge T110
Dichos servidor, localizado bajo el dominio https://www.sinted.com es el núcleo del
Sistema implementado, dando cobertura a la totalidad de usuarios creados a partir
de un grupo de trabajo para Windows y Linux, considerado como la base de datos
espacial mas el conjunto de programas para gestión, visualización y explotación
de la información Académica. Esta Plataforma Educativa Proporciona los
siguientes servicios:
Sistema: Responde a parámetros que previamente el Administrador le
ingresa, contiene una interface visual indicando a los demás autores las
tareas que corresponde a cada uno de ellos.
Rector/Personal Administrativo: El Sistema le permite tener acceso a
todo los roles del aplicación.
19
Administrador: Tiene acceso a toda la información, altera parámetros del
Sistemas.
Psicóloga: interactúa con el Sistema alimentando las fichas psicológicas
del los actores como el Estudiante e Inscritos, dando su aprobación para el
ingresos de estos a la institución.
Docente: aplica su modelo pedagógico e ingresa las notas al sistema,
asigna tareas a los Estudiantes, envía notificaciones a Padre de Familia,
corrobora con los datos estadísticos del Sistema su método de enseñanza,
consulta en forma grafica los datos estadísticos generados por el Sistema.
Auxiliar Administrativo: imprime todo tipo de certificados en formato PDF,
genera fichas de matriculas.
Estudiante: consulta sus notas, realiza encuestas, autoevaluaciones, ve
notificaciones.
Padre de Familia: recibe notificaciones de los Docentes, consulta saldo de
pensiones, verifica las notas del Alumno.
Inscritos: Realiza procesos de inscripción para el ingreso a la Institución.
Docentes y Estudiantes Antiguos. Se ingresan las referencias del
estudiante en cuanto sus datos personales, datos de los padres,
información laboral; como también se registran los docentes asignándoles
la carga académica esta incluye curso, aula y asignaturas que solo a él le
corresponden. A estos el Sistema le asigna un nombre de usuario y
contraseña para poder ingresar a la plataforma ubicada en la web.
Proceso de ingreso de desempeños y valorativos. Se describen a
continuación:
o Se asignan el rango cuantitativo a cada desempeño de los logros.
o Se ingresan periodos, el conceptos, valorativo de Logros, el Sistema
genera los códigos.
20
o El docente ingresa las notas a los estudiantes correspondientes, El
sistema calcula los porcentajes y de acuerdo a la definitiva muestra
los logros de ese valorativo.
Asignación de Roles a los usuarios. A continuación en la figura No. 3 se
muestra los roles que cumplen cada usuarios.
Figura 3: Esquema del Asignación de Roles a los Usuarios del SINTED
3.1.5. Testeo
Realización de pruebas y uso en proyectos de investigación educativa en
desarrollo, con el fin de mejorar la Plataforma educativa y entregar un excelente
producto se hace necesario realizar pruebas al Sistema hasta lograr un nivel
óptimo.
21
3.1.6. Estrategias de actuación
Acciones a emprender para mejorar el Sistema de Información Académica,
teniendo en cuenta la opinión de los usuario se tomaran las medidas pertinentes al
diseño para ello se pretende mejorar en lo posible el diseño de la interfaz de
usuario, la programación, y en algunos casos la entidad relacional de la base de
datos.
4. MARCO CONCEPTUAL
En el presente anteproyecto se darán a conocer los conceptos que los términos
involucrados en nuestro estudio:
4.1 ¿Qué es una Red Neuronal?
Una red neuronal artificial es un modelo interconectado cuyos elementos o nodos
simulan las funciones desempeñadas por las células cerebrales denominadas
neuronas, siendo capaces de aprender, memorizar un conjunto de patrones,
clasificarlos, inferir o generalizar a qué clase pertenece un nuevo objeto a partir de
la experiencia acumulada durante un previo entrenamiento, puede establecer
asociaciones entre objetos, siendo por tanto capaces de reconocer símbolos, tales
como letras, números o cualquier otro patrón u objeto. En consecuencia, el
reconocimiento de patrones es su principal aplicación. Además, las redes
neuronales artificiales muestran un comportamiento robusto como los circuitos
neuronales reales. Esto significa que una red neuronal es capaz de reconocer un
objeto previamente memorizado, incluso si dicho objeto se le presenta a la red
neuronal ligeramente distorsionado o acompañado de un cierto nivel de “ruido”.[1],
por ello, se pensó en la implementación de un Sistema que sea capaz de
reconocer y clasificar patrones conformados por desempeños cualitativos
22
formadas por oraciones complejas y resumidas a valores de 1 o 0 en presencia o
ausencias de estos logros, esta clasificación se logra gracias a un valor
cuantitativo ingresado por el docente y de acuerdo a una escala valorativa la RNA
reconoce que logros debe asignar al estudiante, y a continuación llamar las tareas
o talleres si en realidad lo requiere el alumno. A pesar, que en este artículo se
toma solo un ejemplo puntual de la investigación y desarrollo de este, en su
contexto el Sistema es mucho más amplio en cuanto a sus niveles de aplicaciones
para todo el Sistema de Gestión de Procesos Académicos.
4.2. Un Poco de Historia
La inteligencia artificial (IA), entendida como el modelado y la simulación de las
actividades cognitivas complejas; percepción, memoria, solución de problemas,
etc. Que caracterizan a los organismos avanzados, y en particular a los seres
humanos se separó, tal y como señalan Waltz et al. (1988), casi desde su inicio en
dos ramas bien diferenciadas: Por un lado, se trató de modelar la actividad
racional compleja mediante sistemas formales de reglas y manipulación simbólica.
Esta es la rama más conocida de la IA, que se puede denominar simbólico-
deductiva, en donde se postulan una serie de reglas y el sistema resuelve los
problemas realizando deducciones sobre las reglas programadas. Las reglas Si-
Entonces le dicen al sistema cómo se debe reaccionar ante distintos estados. De
esta forma, un sistema experto es un método de representación y procesamiento
del conocimiento, mucho más rico y poderoso que un programa clásico de
ordenador. Sin embargo, con respecto al cerebro humano las limitaciones son
múltiples. Los problemas planteados en términos difusos o ambiguos son difíciles
de analizar con sistemas de procesamiento simbólico.
23
Por otro lado, se desarrollaron modelos computacionales conexionistas inspirados
en las redes neuronales biológicas. Su principal característica es su inductividad,
ya que extraen la información necesaria para resolver un problema a partir de un
conjunto de ejemplos, sin necesidad de indicarle las reglas necesarias para
resolver dicho problema.
Si bien es mucho más conocida la aproximación simbólico-deductiva y su principal
aplicación: los sistemas expertos, (en general, sistemas basados en el
conocimiento), existe un considerable y renacido interés por los modelos
conexionistas. Los avances tecnológicos ofrecen, como ya ha sido apuntado,
recursos cada vez mayores para representar estructuras muy complejas y realizar
cálculos a gran velocidad y en paralelo, apoyando y fomentando la investigación
en este campo y sus aplicaciones a distintas áreas del conocimiento. En la tabla 3
se puede observar un resumen de las principales diferencias entre ambos
enfoques.
4.3 Organización del Cerebro humano y la Neurona
Las neuronas son células que forman el cerebro humano y animal. Con un tamaño
variable y comprendido entre 3 y 1.000 μ con células excitables al exhibir la
propiedad de transmisión de señales de una neurona a otra, ver tabla 3. Una de
las características más llamativa de una neurona es su organización,
distinguiéndose el soma o cuerpo celular, el axón y las dendritas. Si consideramos
un modelo general de neurona que incluya las características input y output de un
modelo, entonces las dendritas representan en la neurona las estructuras
responsables de la percepción de la señales de entrada u input. Una vez
procesada por la neurona las señales de entrada, la neurona producirá o no una
señal muy particular denominada potencial de acción. El potencial de acción, cuyo
24
origen se sitúa en la unión entre el soma y el axón, es el resultado de un
fenómeno conocido como despolarización de membrana. Ver Fig. 4.
Fig. 4: Modelo general de una neurona.
Cada una célula individual que se relaciona, y por tanto se conecta con otras
neuronas, a través de una conexión muy particular llamada sinapsis. Por
consiguiente, una neurona de una célula en que el conjunto de sus actividades
están orientadas al procesamiento de las señales de entrada así como al
mantenimiento y modificación de las sinapsis. Esta ultima propiedad de la
sinapsis, la posibilidad de su modificación, es uno de los conceptos centrales del
presente artículo, ya que es precisamente el mecanismo celular en que se basa el
aprendizaje de nuestras redes neuronales. Si modificamos la sinapsis, es decir si
cambiamos la calidad de las conexiones entre neuronas, entonces la facilidad o
dificultad con la que se transmiten las señales entre neuronas cambian, y por tanto
la respuesta o output de un circuito neuronal a las señales de entrada.
25
Actualmente, salvo en operaciones simples de cálculo aritmético, el cerebro
humano es superior a cualquier ordenador. Las principales características del
cerebro son su robustez y paralelismo masivo, ya que su funcionamiento no se ve
alterado ante cambios de pequeña importancia, y su flexibilidad, ya que se adapta
con rapidez a entornos cambiantes y, además, puede tratar con información
ambigüa o incompleta. Como se verá más adelante, la propiedad del cerebro
humano más buscada en las RNAs es la capacidad de aprender de la experiencia
y generalizar a partir de ella.
4.4 Las Redes Neuronales Biológicas
Se estima que el cerebro humano está compuesto por más de cien mil millones de
neuronas interconectadas de forma variable y compleja. Su especial forma de
trabajo le convierte en el dispositivo más versátil y eficaz para procesar todo tipo
de información procedente del mundo real.
En la figura 4 se puede ver la representación esquemática de dos neuronas
biológicas.
En el cuerpo de la célula o soma se localiza el núcleo de la misma. De este soma
se extienden fibras en forma de árbol llamadas dentritas, que son receptoras de
impulsos procedentes de otras neuronas. También del soma sale una única y muy
larga fibra llamada axón, que transporta la señal procesada por la neurona al
exterior. El axón se subdivide arborizándose en más fibras denominadas
ramificaciones axionales. Al final de éstas se encuentran las uniones sinápticas o
sinapsis, que constituyen los puntos de conexión con las dentritas de otras
neuronas. Una neurona recibe información de miles de otras neuronas y a su vez
envía información a miles de neuronas más. La transmisión de una señal de una
neurona a otra en la sinapsis es un proceso químico altamente complejo (figura 4).
26
El proceso comienza cuando la neurona transmisora libera neurotransmisores,
especialmente iones de sodio y potasio, en la sinapsis. Su misión es incrementar,
(si la neurona es excitadora), o decrementar (si es inhibidora), el potencial
eléctrico del soma de la neurona receptora y su efecto puede ser más o menos
intenso en función de la cantidad de neurotransmisores liberados. Las señales
excitadoras e inhibidoras recibidas por una neurona se combinan en el soma y, en
función de la estimulación total recibida, la neurona toma un cierto nivel de
activación. Si esta activación supera un determinado nivel umbral, se traduce
enviando breves pulsos, o potencial de acción, de una determinada fuerza y
duración a lo largo del axón. Se dice entonces que la neurona se ha activado.
Estos pulsos viajan por el axón hasta alcanzar las sinapsis con otras neuronas
desde donde el proceso se repite otra vez. No todas las sinapsis son iguales y por
tanto, no todas tienen el mismo efecto sobre la neurona receptora ya que algunas
señales son más fuertes que otras. Otro factor que importa a la hora de activar
una neurona es el número de conexiones que recibe.
Aunque todavía se desconoce mucho sobre la forma en que el cerebro aprende a
procesar la información, las teorías actuales sobre el aprendizaje nos dicen que su
efecto en el cerebro resulta de la modificación de las conexiones o sinapsis entre
neuronas, lo que unido al procesamiento de información de la neurona determinan
el mecanismo básico de la memoria, [Arbib, 1995]. Este mecanismo de
modificación de los pesos sinápticos se produce en el tiempo por medio de la
experiencia del sujeto y se realiza aumentando o disminuyendo el número de
neurotransmisores liberados en determinadas sinapsis ante un mismo estímulo.
Así, una neurona cuyo potencial antes no lograba alcanzar el umbral, ahora sí lo
hace y se activa, y viceversa, otra que antes se activaba ahora puede que no lo
haga y así la respuesta que el individuo da ante una misma situación real sea bien
distinta, decimos entonces que hemos aprendido. Normalmente el aprendizaje
27
requiere además de un maestro que indique como realizar bien una tarea. Tras un
proceso de ensayo-error el individuo es capaz de realizar correctamente una tarea
que antes no era capaz de resolver.
4.5. Elementos y Organización de una red Neuronal Artificial
Las neuronas artificiales o como comúnmente se llaman nodos o elementos
procesadores, se reúnen en capas. En una red neuronal artificial hay al menos dos
capas. En primer lugar, y en contacto con el mundo exterior; se encuentra la capa
de entrada, esta recibe información de entrada: las características de un objeto,
una letra, un número, un perfil sicológico con ciertos rasgos, unas características
académico, familiar. En segundo lugar una vez concluido el procesamiento de la
información de entrada en la red neuronal, el resultado es enviado hacia la capa
de salida, también en contacto con el mudo exterior, y cuyas neuronas suministran
la información de salida.
4.6. Algunas ventajas e inconvenientes de las redes neuronales.
Tras esta aproximación al mundo de las redes de neuronas parece conveniente
resaltar someramente algunas de sus ventajas e inconvenientes respecto a otras
técnicas estadísticas y econométricas:
No necesitan ser programadas; son capaces de aprender a partir de
ejemplos reales mediante la adaptación de los pesos.
No hace supuestos acerca de la distribución de las variables
independientes y por tanto permite la introducción de variables continuas y
categóricas lo cual resulta una importante ventaja frente al análisis
discriminante que supone distribución normal multivariante.
28
La red permite realizar transformaciones no lineales lo que es una ventaja
frente a los modelos de regresión y análisis discriminante múltiple
tradicionales a la hora de llevar a cabo clasificaciones ya que puede
generar superficies de decisión arbitrariamente complejas.
La principal desventaja de las redes de neuronas son por un lado la
imposibilidad de determinar cómo se procesa internamente la información y
por otro su incapacidad para contrastar el modelo.
A continuación se muestra una tabla comparativa del cerebro humano y un
computador:
CEREBRO COMPUTADOR
Unos 100.000 millones de unidades de proceso.
Una unidad de proceso.
Cientos de operaciones por segundo. Millones de operaciones por segundo.
Precisión aritmética muy escasa. Precisión aritmética absoluta.
Paralelismo masivo. Operaciones en serie.
Lógica difusa. Lógica rígida.
Memoria de tipo asociativo y almacenada de forma dispersa.
La información se guarda en posiciones de Memoria de acceso directo.
Tolera fallos (muerte de neuronas). Los pequeños fallos (averías) son críticos.
Maneja todo tipo de información, incluso sujeta a incertidumbre, en poco
Sistemas altamente especializados con capacidad para procesar información
29
tiempo pero no necesariamente con exactitud.
muy concreta, siguiendo instrucciones dadas.
Tabla No. 2 Comparaciones entre el Cerebro y un Computador
4.7 Aplicabilidad técnica de las redes neuronales a los problemas
propuestos
El ejercicio empírico que desarrollamos a continuación aplica la técnica de las
redes neuronales a los problemas propuestos. Estos problemas podrían ser
afrontados con las técnicas de clasificación estadísticas y econométricas
tradicionales (análisis discriminante y regresión logística). No es el objetivo de este
estudio llevar a cabo comparaciones entre las distintas técnicas capaces de
aportar soluciones; existen distintos estudios empíricos que ratifican la mayor
fuerza predictiva de las redes (véase Bonilla, M. y Puerta, R. (1997). En general
pensamos que para aplicaciones prácticas lo ideal sería aplicar varias técnicas y
complementar los resultados de unas y otras de forma que las predicciones
resulten lo más eficientes posibles.
Como se mencionó anteriormente, el reconocimiento de las RNA es adquirido por
medio de un aprendizaje. Se distinguen tres tipos de aprendizajes: supervisado,
no supervisado y por refuerzo. El primero, y en el que se basa nuestro estudio,
consiste en aprender una función a partir de ejemplos de sus entradas y sus
salidas. Para ello se enumeran tres componentes:
Una proyección directa de las condiciones del estado actual a las acciones.
Un método para inferir las propiedades relevantes del mundo a partir de una
secuencia de percepciones.
30
Información sobre de cómo evoluciona el entorno y sobre los resultados de las
posibles acciones que el sistema pude llevar a cabo.
Cada uno de estos componentes puede aprenderse con una realimentación
apropiada. Consideremos, por ejemplo, un Sistema entrenándose para convertirse
en supervisor de bajas calificaciones. Cada vez que perciba una calificación por
debajo de un rango “menor que x”, x es igual a un número menor o igual a 10, el
Sistema puede aprender una regla condicional-acción que le indique cuando
asignar conceptos pertenecientes al rango, esto es indicado en el componente 1.
Informando que ciertos patrones lógicos pude reconocerlos como síntomas básico
de un bajo, medio o alto desempeño académico, aprendiendo a reconocer esos
patrones (componente 2). Realizando acciones y observando sus resultados
puede aprender las consecuencias de sus acciones (componente 3).
En el caso (componente 1) del ejemplo anterior, el Sistema aprende la regla
condición - acción para asignar conceptos, esto es, una función que a partir del
estado genera una salida booleana (asignar o no un concepto). En el caso
(componente 2), el sistema aprende una función que a partir de un patrón genera
una salida booleana (enviar una tarea al alumno o no). En el caso (componente 3),
aprende una función que a partir del estado y las acciones de asignar tareas
genera una labor pedagógica de ayuda académica. Nótese que tanto en los casos
(componente 1) y (componente 2), el docente suministra el valor correcto de la
salida de cada ejemplo; en el tercero, el valor de salida proviene de lo que el
Sistema percibe. En entornos totalmente observables, como es este caso, el
Sistema siempre puede observar los efectos de sus acciones, y por lo tanto,
puede utilizar métodos de aprendizaje supervisado para aprender a percibirlos.
Por el contrario, en entornos que son parcialmente observables, el problema es
más difícil, ya que los efectos más inmediatos pueden ser invisibles.
31
4.8 Definición y conceptos básicos de las Redes Bayesianas
Una red bayesiana es un grafo a cíclico dirigido y anotado que describe las
distribución de probabilidad conjunta que gobierna un conjunto de variables
aleatorias.
Sea U =X1,X2, ...,Xn un conjunto de variables aleatorias .Formalmente,
una red Bayesiana para U es un para B = <G, T > en el que:
G es un grafo a cíclico dirigido en el que cada nodo representa una de las
variables X1, X2, ...,Xn, y cada arco representa relaciones de dependencia
directas entre las variables. La dirección de los arcos indica que la variable
„apuntada‟ por el arco depende de la variable situada en su origen.
T es un conjunto de parámetros que cuantifica la red. Contiene las probabilidades
PB(xi|xi) para cada posible valor xi de cada variable Xi y cada posible valor xi de
Xi, donde éste último denota al conjunto de padres de Xi en G.
Así, una red bayesiana B define una distribución de probabilidad conjunta única
sobre U dada por:
𝑃𝐵 𝑋1 ,𝑋2 ,…,𝑋𝑛 = 𝑃𝐵 𝑋 𝑖 | 𝑋𝑖 1 𝑛𝑖=1
Es importante observar que la topología o estructura de la red no sólo proporciona
información sobre las dependencias probabilísticas entre las variables, sino
también sobre las independencias condicionales de una variable o conjunto de
ellas dada otra u otras variables. Cada variable es independiente de las variables
32
que no son descendientes suyas en el grafo, dado el estado de sus variables
padre.
La inclusión de las relaciones de independencia en la propia estructura del grafo
hace de las redes bayesianas una buena herramienta para representar
conocimiento de forma compacta (se reduce el número de parámetros
necesarios). Además, proporcionan métodos flexibles de razonamiento basados
en la propagación de las probabilidades a lo largo de la red de acuerdo con las
leyes de la teoría de la probabilidad. La figura5 muestra cómo representar un
clasificador Naive Bayes en forma de red bayesiana.
Figura 5: Grafo de un clasificador de Naiv e Baye s
Esta red captura la suposición fundamental de Naive Bayes: todos los atributos Ai
(hojas del árbol) son independientes entre sí conocida la clase C, por lo que no
existen arcos entre los atributos s y existe un arco del nodo raíz a cada uno de los
atributos.
La figura 6 presenta un ejemplo concreto de una red bayesiana que representa un
cierto conocimiento sobre Educación. En este caso los nodos representan
33
síntomas de deserción escolar y factores que la causan. Como ya se ha
mencionado, la variable a la que apunta un arco es dependiente de la que está en
el origen de éste. Por ejemplo, desconcentración depende de deserción y
embarazo.
Figura 6: Ejemplo de red bay esiana con algunos de sus parámetros
Pueden observarse las suposiciones de independencia acertadas por la red, por
ejemplo, reacciones es condicionalmente independiente de económico, embarazo,
desconcentración y Falta de Interés (nodos no descendientes de reacciones) dado
deserción (su único nodo padre).Es decir, se observa en la red que:
P(R|E,DESER,EMBA,DESC,F)=P(R|DESER) donde R es reacciones, E es
economía, DESER es deserción, EMB es embarazo, DESC es desconcentración,
y F es falta de Interés.
34
Se han representado también los parámetros de probabilidad condicional
asociados a algunos de los nodos de la red. La tabla P (Econ) guarda los valores
de probabilidad a-priori de economía; P (DESER|Econ) la probabilidad de
deserción dada economía; y P (desc|deser,emba) la probabilidad de
desconcentración dados deserción y embarazo. Nótese que, en este caso, para
guardar los parámetros no es necesario mantener las tablas completas, ya que las
variables estudiadas son binarias, por lo que para cada una sólo sería necesario
conservar los valores de una fila. Teniendo en cuenta que el tamaño de las tablas
de parámetros crece exponencialmente con el número de padres de un nodo, es
conveniente observar distintas técnicas para reducir el número de parámetros
necesarios. Una forma de reducirlos es empleando los denominados modelos
canónicos, entre los que pueden mencionarse:
Modelo de interacción disyuntiva (Noisy OR).
Modelo de interacción conjuntiva (Noisy AND).
Compuerta Max (Noisy Max gat e).
Compuerta Min (Noisy Min gat e).
Los modelos no pueden aplicarse indiscriminadamente, sino que dependen de la
naturaleza de las relaciones, y por tanto del dominio. El más común es el Noisy
OR, que se aplica cuando varias causas pueden ocasionar un efecto cada una por
sí sola, y la probabilidad del efecto no disminuye si se presentan varias de ellas.
Por ejemplo, en el modelo de la figura se puede aplicar cuando varios casos de
deserción pueden producir el mismo síntoma. En este caso sólo se especificaría
un parámetro por cada nodo padre (por ser los padres binarios), en vez de 2n,
siendo n el número de padres. En el caso de la figura 5, en lugar de la tabla
P(desc|deser,emba) podría aplicarse Noisy OR y guardar únicamente las
probabilidades correspondientes a P (desc | deser =Si) y P(deser | emba =Si).
35
4.9 Inferencia
A partir de una red ya construida, y dados los valores concretos de algunas
variables de una instancia, podrían tratar de estimarse los valores de otras
variables de la misma instancia aplicando razonamiento probabilístico.
El razonamiento probabilístico sobre las redes bayesianas consiste en propagarlos
efectos de las evidencias (variables conocidas) a través de la red para conocer las
probabilidades a posteriori de las variables desconocidas. De esta forma se puede
determinar un valor estimado para dichas variables en función de los valores de
probabilidad obtenidos.
Cuando se conocen los valores observados para todas las variables de la red
excepto para una, obtener una estimación para ésta es inmediato a partir de la
fórmula de la distribución de probabilidad conjunta de la red.
En un caso más general interesaría obtener una estimación del valor de alguna
variable dados valores observados para un subconjunto de todas las restantes. En
general, una red puede usarse para calcular la distribución de probabilidad para
cualquier subconjunto de variables dados los valores de cualquier subconjunto de
las restantes.
La solución exacta de esta forma de inferencia es, en general, un problema NP-
duro Incluso el uso de soluciones aproximadas resulta ser en ciertos casos NP-
duro, aun que en la práctica estos últimos resultan eficientes en muchos casos.
Existen diferentes tipos de algoritmos propuestos, que se aplican dependiendo de
la topología del grafo y de si obtienen la probabilidad de una sola variable objetivo
o de todas las desconocidas. No es objetivo de este anteproyecto entrar en
36
detalles sobre los distintos algoritmos. Una breve taxonomía de los algoritmos más
conocidos sería la siguiente:
Un variable, cualquier grafo:
Algoritmo de eliminación. Cualquier variable, estructuras
sencillamente conectadas (árboles, poli árboles).
Algoritmo de propagación de Pearl.
Cualquier variable, cualquier grafo:
Agrupamiento (junction tree), simulación estocástica, acondicionamiento.
El mecanismo de inferencia sobre redes bayesianas permite utilizarlas para
construir clasificadores. Para ello, se ha de construir una red bayesiana en la que
clase y atributos sean las variables interrelacionadas en el grafo. La clase
corresponderá a la variable desconocida, objetivo de la inferencia. Dada una
instancia cual quiera para la que se conozcan todos sus atributos, la clasificación
se efectuará infiriendo sobre el grafo la probabilidad posterior de cada uno de los
valores de la clase, y seleccionando aquél valor c que maximice dicha
probabilidad. Nótese que si se emplea una red no restringida se elimina el bias
introducido por la suposición de independencia del clasificador Naive Bayes.
4.10 Aprendizaje de redes bayesianas
Durante mucho tiempo las redes bayesianas se construyeron a mano a partir del
conocimiento de expertos. La pregunta a plantearse a continuación es la siguiente:
¿pueden inducirse a partir de conjuntos de datos clasificadores basados en redes
37
bayesianas? Si no se restringe la topología de las redes inducidas, ¿pueden
obtenerse clasificadores mejores que Naive Bayes?
El problema del aprendizaje bayesiano puede describirse informalmente como:
dado un conjunto de entrenamiento D =u1,u2,...,uN de instancias de U,
encuéntrese la red B que se ajuste mejor a D. Típicamente, este problema se
divide en dos partes:
Aprendizaje estructural: obtener la estructura de la red.
Aprendizaje paramétrico: conocida la estructura del grafo, obtener las
probabilidades correspondientes a cada nodo.
4.10.1. Aprendizaje paramétrico
4.10.1.1 Datos completos
El aprendizaje de los parámetros es simple cuando todas las variables son
completamente observables en el conjunto de entrenamiento. El método más
común es el llamado estimador de máxima verosimilitud, que consiste
sencillamente en estimar las probabilidades deseadas a partir de la frecuencia de
los valores de los datos de entrenamiento, de forma análoga a como se hace en
NaiveBayes.
La calidad de estas estimaciones de penderá de que exista un número suficiente
de datos en la muestra. Cuando esto no es posible se puede cuantificar la
incertidumbre existente representando la mediante una distribución de
probabilidad, para así considerar la explícitamente en la definición de las
probabilidades. Habitualmente se emplean distribuciones Beta en el caso de
38
variables binarias, y distribuciones Dirichlet para variables multi valuadas. Esta
aproximación es útil cuando se cuenta con el apoyo de expertos en el dominio de
la aplicación para concretar los valores de los parámetros de las distribuciones.
Si existen variables de tipo continuo la estrategia más habitual es aplicar
discretizarlas antes de construir el modelo estructural. Existen algunos modelos de
redes bayesianas con variables continuas, pero están limitados a variables
gaussianas relacionadas linealmente. Es posible también efectuarla discretización
mientras se construye el grafo de la red, si éste se aprende utilizando el principio
MDL como medida de ajuste.
4.10.1.2. Datos incompletos
A parecen mayores dificultades cuando los datos de entrenamiento no están
completos. Pueden plantearse dos tipos de información incompleta:
Valores faltantes: faltan algunos valores de uno o varias variables en
algunos ejemplos.
Nodo oculto: faltan todos los valores de una variable.
El primer caso es más sencillo, y existen varias alternativas, entre estas:
Eliminar los ejemplos con valores ausentes.
Considerar un nuevo valor adicional para la variable: “desconocido”.
Considerar el valor más probable a partir de los datos de la misma en
las de más instancias.
Considerar el valor más probable en base a las demás variables.
39
Las dos primeras opciones son habituales en problemas de aprendizaje, y válidas
siempre y cuando se cuente con un número elevado de datos completos. La
tercera opción viene a ignorar las posibles de pendencias de la variable con las de
más, cuando ya se cuenta con la estructura que las describe en el grafo; no
siempre proporcionar los mejores resultados.
La cuarta técnica se sirve de la red ya conocida para inferir los valores
desconocidos. Primero se rellenan las tablas de parámetros usando todos los
ejemplos completos. Después, para cada instancia incompleta, se asignan los
valores conocidos a las variables correspondientes en la red y se propaga su
efecto para obtener las probabilidades a posteriori de las no observadas. Entonces
se toma como valor observado el más probable y se actualizan todas las
probabilidades del modelo antes de procesar la siguiente instancia incompleta.
La aparición de nodos ocultos requiere un tratamiento más complejo. Existen
diferentes técnicas para estima las probabilidades faltantes en este caso. Una
habitual es la aplicación del algoritmo EM (Expectation Maximization), cuya
aplicación ya se ha estudiado en la asignatura en el contexto de las técnicas de
agrupamiento. Su aplicación al aprendizaje de parámetros se traduce en lo
siguiente:
Asignar valores aleatorios(o basados en conocimiento experto, si se
dispone de él) a las probabilidades desconocidas de la red.
Utilizar los datos conocidos para estimar desconocidos infiriéndolos sobre el
modelo con las probabilidades actuales.
Completar el conjunto de datos con los valores estimados y volver a
calcular las probabilidades de la red a partir de ellos.
Repetir los dos pasos anteriores hasta que no hay a cambios significativos
en las probabilidades.
40
Se destaca que existe cierta similitud entre el aprendizaje de la red bayesiana
cuando existen nodos ocultos y el aprendizaje de pesos en las capas ocultas de
un perceptrón multicapa en el que se conocen los valores de entrada y salida para
cada ejemplo, pero ningún valor para los elementos de proceso intermedios.
Basándose en esta idea se propone una técnica de gradiente similar a la usada en
el algoritmo de retro propagación. La técnica trata de maximizar la probabilidad
de los datos de entrenamiento conocida la hipótesis P(D | h),considerando como
espacio de hipótesis el conjunto de todas las posibles combinaciones de valores
para las probabilidades que parametriza la red. Para ello, sigue el gradiente de
lnP(D|h) con respecto a las probabilidades de la red, actualizando cada parámetro
Wijk desconocido de forma iterativa con el incremento:
𝑤𝑖𝑗𝑘 = 𝑤𝑖𝑗𝑘 + 𝑘. 𝑃 𝑥𝑖𝑗 ,𝜋𝑖𝑘 𝑑
𝑤𝑖𝑗𝑘𝑑𝜖𝐷
(2)
Donde Wijk es el parámetro desconocido correspondiente a la probabilidad
condicional de que la variable Xi tome el valor X ij cuando sus padres i toman los
valores ik, y k es una tasa de aprendizaje. En cada iteración las probabilidades Wijk
se renormalizan tras el incremento.
Tanto el algoritmo EM como el de gradiente ascendente encuentran soluciones
que son sólo óptimas localmente, por lo que en ambos casos la calidad del
resultado de penderá de la asignación inicial de las probabilidades desconocidas.
4.10.3. Aprendizaje estructural
El aprendizaje estructural conlleva explorar un espacio de grafos. Esta tarea es
muy compleja. A poco que se incrementa el número de variables (nodos), el
41
número de posibles grafos a construir con ellas se dispara. Por eso en muchos
ocasiones se restringe el espacio de búsqueda a grafos con características
concretas. Existen muchos algoritmos específicos para el aprendizaje de redes
donde G se limita a un árbol, o aun poli árbol, o a otras estructuras menos
generales.
No obstante, existen técnicas para aprender redes con estructuras generales.
Trabajar sin restricciones debería permitir, idealmente, construir redes que ajusten
mejor al conjunto de entrenamiento, por complejas que sean las dependencias
entre los atributos.
Hay dos aproximaciones básicas al aprendizaje de redes sin restricciones. La
primera de ellas reúne métodos que exploran las relaciones de dependencia
existentes entre pares, tripletas u otros subconjuntos de variables para elegir la
forma en que deben conectarlas. El estudio de esas relaciones requiere establecer
un a criterio cuantitativo para medir la de pendencia entre variables, y es dicho
criterio el que guía la construcción de la red. Un ejemplo de algoritmo que se
engloba en esta familia de técnicas es el de construcción de TAN de Friedman y
Goldz Smith.
Dicho algoritmo crea una red con una topología restringida, pero el principio que
guía la construcción es el mismo, una medida de información mutua que cuantifica
la relación entre las variables.
La otra aproximación habitual al aprendizaje de redes consiste en realizar una
búsqueda guiada por una medida global de calidad. Nótese que en la
aproximación anterior el criterio guía es local, se aplica a subconjuntos reducidos
de variables, no a toda la red. En esta otra aproximación, la operación general
42
consiste en generar distintos grafos mediante un algoritmo de búsqueda y aplicar
a cada uno de ellos una función de medida de calidad para decidir qué grafo
conservar en cada paso.
Existen muchos algoritmos que siguen esta técnica, definidos a partir de la
combinación de dos elementos:
Algoritmo de búsqueda
Medida global de ajuste
Es habitual emplear algoritmos de búsqueda heurística. Intentar una búsqueda
exhaustiva por todo el espacio de grafos es sencillamente intratable. Algunas
posibilidades son las técnicas de ascenso de colinas (hillclimbing), algoritmos
genéticos, búsquedas bidireccionales, etc...Otra opciones aplicar una búsqueda
voraz. Se comienza con una red vacía y se aplican sucesivas operaciones locales
mejorando de forma maximalla medida de ajuste hasta que se encuentra un
óptimo local. Las operaciones aplicadas incluyen la adición, borrado e inversión de
arcos.
También hay muchas medidas de ajuste. Dos habituales son la medida bayesiana
y el principio de mínima longitud de descripción.
La medida bayesiana trata de maximizar la probabilidad de la estructura dados los
datos de entrenamiento P(Bs|D).Como el objetivo de la medida es comparar el
valor obtenido para distintas estructuras i y j , es habitual recurrir al cociente:
P(BSi|D)/P(BSj|D)=P(BSi,D)/P(BSj,D)
43
Considerando variables discretas y datos independientes, las probabilidades
conjuntas del segundo cociente se pueden estimar utilizando las predicciones
hechas por cada estructura ante los datos de entrenamiento.
Por su parte, el principio MDL caracteriza el aprendizaje en términos de
compresión de los datos. El objetivo del aprendiz es encontrar un modelo que
facilite la obtención de la descripción más corta posible de los datos originales. La
longitud de esta descripción toma en cuenta:
La descripción del propio modelo, penalizando la complejidad del mismo.
La descripción de los datos que usan el modelo, alentando su verosimilitud.
En el contexto de las redes bayesianas, el modelo es la red. Dicha red B describe
la probabilidad condicional PB sobre las instancias que aparecen en los datos.
Usando esta distribución, puede construirse y codificarse un esquema que asigne
palabras de código más cortas a las instancias más probables. De acuerdo con el
principio MDL, debería escogerse una red B tal que la longitud combinada de la
descripción de la red y los datos codificados (con respecto a PB) sea mínima.
A partir de este punto, distintos autores definen diferentes formas de medir cada
elemento de la descripción a partir del esquema general:
MDL (B|D)=complejidad (B)–verosimilitud (D) ,en el que un valor menor MDL(B|D)
de es mejor. Por ejemplo, se define:
𝑀𝐷𝐿 𝐵 𝐷 = 𝐵 . 𝑙𝑜𝑔 𝑁
2− 𝑁. 𝑙𝑜𝑔 𝑃𝐵 𝑑𝑖 3
𝑁
𝑖=1
44
El primer término (complejidad (B)) representa la longitud de una descripción de la
red en la que se emplean 𝑙𝑜𝑔 𝑁
2 bits para cada parámetro (N es el tamaño de D),
siendo |B| el número total de éstos. El segundo término mide cuántos bits se
necesitan para describir todos los elementos di en D asignando las longitudes de
código en función de la distribución de probabilidad PB.
Tanto la medida bayesiana como MDL son bien conocidas y están bien
estudiadas. Ambas funciones son asintóticamente equivalentes cuando aumenta
el tamaño de la muestra, y además asintóticamente correctas: con probabilidad
igual a uno la distribución aprendida converge a la distribución subyacentea
medida que el número de muestras aumenta.
4.11. Clasificador Naive Bayes Aumentado con un Árbol (TAN)
A la hora de construir un clasificador bayesiano teniendo en cuenta las
dependencias existentes existen alternativas más sencillas que enfrentarse a la
construcción de una red bayesiana sin restricciones. Dichas alternativas consisten
en extender el clasificador Naive Bayes con modificaciones estructurales.
La idea general es construir una estructura que refleje algunas relaciones de
dependencia entre los atributos, manteniendo separada la variable clase. Una vez
construida dicha estructura, se añade un arco desde el nodo correspondiente a la
clase a cada uno de los atributos, tal y como ocurre en Naive Bayes.
Cuando no se imponen restricciones sobre la estructura de dependencias entre
atributos se habla de un clasificador BAN–Naive Bayes aumentado con una red.
Esta opción es exactamente igual de compleja que construir una red bayesiana sin
tener en cuenta el carácter especial del nodo clase. Sin embargo, si se imponen
45
restricciones razonables en la estructura que se creará entre los atributos se
pueden construir clasificadores en tiempo polinómico.
En este apartado se considerará la restricción de que los nodos atributos formen
tan solo un árbol, construyendo así un clasificador TAN (Tree Augmented Naive -
Bayes). La figura 7 muestra un ejemplo de clasificador TAN.
Figura 7: Ejemplo de estructura Naive Bayes aumentada con un árbol
Puede observarse que cada nodo atributo un solo un nodo padre (aparte del nodo
clase C) con la excepción de A1, que es el nodo raíz del subárbol de atributos.
4.11.1. Algoritmo de Friedman-Goldszmidt (1996)
Se presenta un algoritmo para la construcción de estructuras TAN. Este algoritmo
se inspira directamente en uno propuesto por [CHOW] para construir redes
bayesianas conforma de árbol. En el algoritmo original se usa la cantidad de
información mutua entre pares de variables como criterio para determinar entre
cuáles de ellas se incluyen arcos de dependencia. En el algoritmo para construir
TAN se emplea la información mutua condicionada a la variable clase, dado que
46
ésta se incorpora posteriormente al grafo. Dadas dos variables discretas X, Y la
cantidad de información mutua entre ellas condicionada a la variable Z se define
como:
𝐼 𝑋;𝑌 𝑍 = 𝑃 𝑥, 𝑦, 𝑧 . 𝑙𝑜𝑔 𝑃 𝑥, 𝑦, 𝑧
𝑃 𝑥 𝑧 𝑃𝑃 𝑦 𝑧
𝑧∈𝑋𝑦∈𝑌𝑥∈𝑋
4
La información mutua, por definición, proporciona una medida de la dependencia
entre las variables que relaciona. La información mutua condicionada hace la
propio, teniendo en cuenta que se conoce el valor de una tercera.
El algoritmo para la construcción del TAN consta de 5 pasos:
Paso F1.Calcular I(Xi; Xj|C)con i< j;i, j=1,2,...,n. Los valores se estiman a partir de
la frecuencia de los datos de entrenamiento.
Paso F2. Construir un grafo no dirigido completo cuyos nodos correspondan a los
atributos X1,X2,...,Xn. Asignar a cada arco entre nodos Xi y Xj un peso dado por
I(Xi,Xj|C).
Paso F3. Aplica r el algoritmo de Kruskal al grafo anterior para construir un árbol
expandido máximo.
Paso F4. Transformar el árbol no dirigido resultante en uno dirigido, escogiendo
un nodo cualquier como raíz y asignando direcciones a todas las aristas a partir de
él.
Paso F5.Construir un modelo TAN añadiendo un nodo etiquetado como C y
posteriormente un arco desde C a cada atributo Xi.
47
El algoritmo de Kruskal parte de los n(n–1)/2 pesos del grafo completo para
construir un árbol que incluya todos sus nodos y en el que la suma de los pesos
de todos los arcos sea máxima. Kruskal opera escogiendo arcos del grafo original
a través de los siguientes pasos:
PasoK1.Asignar las dos aristas de mayor peso al árbol a construir.
PasoK2. Examinar la siguiente arista de mayor peso y añadirla al árbol a no ser
que forme un ciclo, en cuyo caso se descarta y se examina la siguiente arista de
mayor peso.
PasoK3.Repetir K2 hasta que se hayan seleccionado n–1 aristas.
Consideremos un ejemplo de uso del algoritmo para ver paso a paso la forma en
que opera. Supóngase un dominio en el que los ejemplos se describen con cinco
atributos X, Y, Z, V, W, y se clasifican en valores de C. Los resultados en cada
paso del algoritmo serán los siguientes:
PasoF1.Se calculan todos los valores de información mutua condicionada por C
para cada par de variables. Sea el orden de los valores obtenidos el siguiente:
I(X,Z|C)>I(Y,V|C)>I(X,Y|C)>I(Z,V|C)>I(X,V|C)>
>I(Z,W|C)>I(X,Y|C)>I(X,W|C)>I(Y,Z|C)>
>I(Y,W|C)>I(V,W|C)
Paso F2. Se construye el grafo no dirigido completo. Basta concrear los nodos
correspondientes a todos los atributos y mantener los valores de información
48
mutua accesibles como pesos de los arcos –no es necesario construir
explícitamente los arcos en memoria. Véase más adelante la figura 7a.
Paso F3. Aplicación de Kruskal para obtener un árbol expandido de peso
máximo.
PasoK1.Se añaden los dos arcos de mayor peso (figura 7b).
- Paso K2. Se añade el siguiente arco de mayor peso: X-Y (figura 7c).
-Paso K2.Se añade el siguiente arco de mayor peso: Z-V (figura 4d).Sin embargo,
se comprueba que forma un ciclo, por lo que se descarta y se añade el siguiente:
X-V(figura 4e). De nuevo X-V forma un ciclo, así que se descarta también y se
añade Z-W (figura 7f).
-Paso K3. Ya existen tantos arcos como nodos menos uno. Finaliza Kruskal.
Paso F4.Se selecciona el nodo X como origen del árbol. A partir de él, se asignan
direcciones a los arcos recorriendo todas las ramas alejándose se X (figura 7g).
Paso F5. Se añade un nodo para la clase C y se conecta cada nodo atributo con
C mediante un arco (figura 7h).
49
Figura 7: TAN paso a paso con el algoritmo de Friedman y Goldszmidt
Se demuestra que el algoritmo propuesto construye un TAN qué maximiza
el valor de LL(BT|D),siendo D el conjunto de datos de entrenamiento.
También se asevera que la complejidad temporal del algoritmo es O(n2
N), siendo n el número de atributos y N el tamaño del conjunto de
entrenamiento. El análisis propuesto es el siguiente:
El paso F1 tiene complejidad O(n 2 N).
El paso F3 tiene complejidad O(n2logn)–alalgoritmo de Kruskal es un
algoritmo clásico bien conocido.
Los pasos F2 (sólo requiere construir los nodos), F4 y F5 tienen
complejidad O(n).
50
Usualmente se cumple que N > log n, por lo que se toma como
complejidad global O(n 2 N).
En un contexto en el que los datos de entrenamiento hubieran sido
generados por una estructura TAN, el algoritmo visto es asintóticamente
correcto, en el sentido de que si la muestra de casos es suficientemente
grande, recuperará exactamente la estructura que generó los datos.
4.11.2 Algoritmo de Keogh y Pazzani
Keoghy Pazzani (1999) proponen un algoritmo voraz que va añadiendo
arcos a una estructura Naïve Bayes. En cada paso se añade el arco que
manteniendo la condición de que en la estructura final cada variable no
tenga más de un padre, mejore en mayor medida el porcentaje de bien
clasificados obtenidos mediante el mismo.
5. Diseño del Sistema de Redes Neuronales
El diseño del Sistema se basa en la premisa de disponer de una estructura
combinada de elementos de almacenamiento, acceso y análisis de la información
necesarios para dar solución a las necesidades planteadas.
5.1. Diseño Cualitativo: Estudio de necesidades, usuarios y posibilidades
existentes para poner en marcha el Sistema de Información. A continuación se
presenta un diagrama de Contexto para un Sistema de Información para la gestión
de los procesos académicos y financieros.
51
Figura 8. Diagrama de Contexto
Diseño de la Plataforma Educativa: La interface grafica permitirá interactuar con
los Docentes, padres de familia, estudiantes, entre otros.
Diseño de los modelos de Red Neuronal Artificial: Transformación del modelo de
RNA interno; define soluciones del Sistema a emplear en función del esquema
seleccionado anteriormente.
5.2 Diseño Cuantitativo
Para este análisis se tomaron muestras de diferentes instituciones educativa, se
realizaron los estudios correspondientes a la implementación de una plataforma
educativa que cumpliera con el decreto 1290 del Ministerio de Educación el cual
fija las pautas para el correcto ingreso de las notas a la plataforma, como también
verificar si existía en el mercado laborar un software que cumpliera con estos
52
objetivos. Además, se ejecutó investigación cualitativa empleando el método de
estudio de caso a través de una investigación, cuya estrategia metodológica se
baso en los valorativos de desempeños fueron facilitados por los docentes quienes
tomaron sus conclusiones de cada capítulos de los libros que utilizan para las
enseñanza de cada asignaturas.
Para el desarrollo de la aplicación se tendrá en cuanta, el siguiente algoritmo de
entrenamiento aplicado a una red neuronal backpropagation, ver Fig. 9 en la que a
se definen las siguientes fases:
1. Inicializar pesos
2. Definir la Matriz de Entrenamiento
3. Calcular los estados de activación
4. Calcular el error en cada una de las capas de salidas
5. Calcular el error en cada una de las neuronas de la capa oculta o
intermedia
6. Modificar Cada uno de los pesos
7. Repetir el paso anterior hasta que el error total E cometido por la red
neuronal sea igual o inferior a cero
53
Fig. 9: Diagrama de flujo de una Backpropagation.
A continuación se describe cada proceso teniendo en cuenta las referencias
bibliográficas [1], y sin olvidar el enfoque pedagógico de los objetivos de la
investigación presente.
1. Inicializar los pesos wjk de las conexiones entre las neuronas de la capa de
salida e intermedia y los pesos wij de las conexiones entre las neuronas de
la capa intermedia y de entrada asignándoles, por ejemplo, valores
aleatorios por medio de una función de números aleatorios.
2. Definir la matriz de entrenamiento y en las que este representados para
cada vector de entrada el valor de salida deseado. Supóngase que
deseamos clasificar objetos, identificados como los desempeños
cualitativos de las evaluaciones, en las categorías A1, A2,…An, ya que
estaremos definiendo la red neuronal como un clasificador, entonces los
componentes Ii de los vectores de entrada representaran las características
54
de los objetos, asignándole a cada componente un valor de 1 o 0 en función
de su presencia o ausencia, respectivamente. En la tabla No.3 se describen
para cada caso los conceptos que corresponden, indicando si la
característica esta o no presente.
CASO 1 Reconoce los elementos y propiedades de la multiplicación.
CASO 2 Distingue analíticamente en una serie de ejercicios prácticos.
CASO 3 Realiza multiplicaciones de hasta dos cifras y multiplicaciones abreviadas.
CASO 4 Aplica correctamente estas operaciones en la solución de problemas matemáticos sencillos.
Tabla 3: Casos de conceptos para las Fortalezas, Debilidades de la
asignatura Matemáticas y Geometría del Grado primero hasta quinto.
En la tabla No. 4 a cada vector de entrada le asociaremos una salida S con
componentes de estudios correctamente elegidos para cada rango de calificación
ingresado por el docente.
DESEMPEÑO C1 C2 C3 C 4 S NOTA
SUPERIOR 1 1 1 1 16 10.0
55
Tabla 4: Matriz de entrenamiento corresponde a los valores c1, c2, c3, c4 de
SUPERIOR 1 1 1 0 15 9.0-9.9
SUPERIOR 1 1 0 1 14 8.0-8.9
SUPERIOR 1 1 0 0 13 7.5-7.9
SUPERIOR 1 0 1 1 12 7.0-7.4
ALTO 1 0 1 0 11 6.6-6.9
ALTO 1 0 0 1 10 6.0-6.5
ALTO 1 0 0 0 9 5.0-5.9
ALTO 0 1 1 1 8 4.6-4.9
ALTO 0 1 1 0 7 4.0-4.5
BAJO 0 1 0 1 6 3.0-3.9
BAJO 0 1 0 0 5 2.6-2.9
BAJO 0 0 1 1 4 2.0-2.5
BAJO 0 0 1 0 3 1.6-1.9
BAJO 0 0 0 1 2 1.3-1.5
BAJO 0 0 0 0 1 1.0-1.2
56
La Red Neuronal
El valor de salida deseado será el que identifique a la clase o categoría a la que
pertenece cierto objeto. Cada salida contiene el concepto que se presentan en la
siguiente tabla (tabla no. 5).
SALIDA Concepto
S1 Mejore más sus hábitos de estudio y cumpla con sus compromisos académicos en la asignatura.
S2 Procure cumplir con sus compromisos académicos.
S3 Debe retomar las temáticas desarrolladas durante el bimestre y resolver ejercicios de aplicación.
S4 Debe repasar los conceptos y las ecuaciones para la solución de ejercicios.
S5 Se recomienda retomar la lectura y análisis del texto.
S6 Procure ser más constante en sus participaciones y retome las temáticas vistas.
S7 ¡Usted puede lograr mejores resultado, cuente con mi apoyo!
S8 Se recomienda repasar los procedimientos de las sesiones del bimestre B.
S9 Debe participar más en clase y aumentar su interés por el inglés.
57
S10 Con un poco más de dedicación su desempeño mejorará.
S11 Con un pequeño esfuerzo alcanzarás el nivel superior.
S12 Procure analizar con más detenimiento las situaciones y esquemas que se le plantean.
S13 Continúe con el mismo entusiasmo y dedicación al estudio.
S14 Siga con el mismo entusiasmo y desempeño.
S15 Figura disciplinariamente, como un(a) estudiante modelo para sus compañeros felicitaciones. Continúe así!
S16 Su desempeño es superior. ¡Felicitaciones!
Tabla 5: Conceptos de Recomendaciones según el número de salida
identificado por la RN.
3. Calcular el estado de activación Ok de las neuronas de la capa de salida y
el estado de activación Oj de las neuronas de la capa intermedia, es decir
obtener los valores net para las neuronas de la capa de salida e intermedia:
𝑛𝑒𝑡𝑘 = 𝑤𝑗𝑘𝑂𝑗 𝑗
(5)
𝑛𝑒𝑡𝑖 = 𝑤𝑖𝑗 𝐼𝑖
𝑖
(6)
58
Obteniendo a continuación:
𝑂𝑘 = 𝑓(𝑛𝑒𝑡𝑘)
𝑂𝑗 = 𝑓(𝑛𝑒𝑡𝑗 )
Los valores net se obtienen considerando que por requerimiento del modelo la
función de activación es continua, por ejemplo la función sigmoidal.
4. Calcular el error o valor 𝛿𝑘 en la capa de salida aplicando la expresión que
se muestra en la ecuación 7:
𝛿𝑘 = 𝐷𝑘 − 𝑂𝑘 𝜕𝑂𝑘
𝜕𝑛𝑒𝑡 𝑘 (7)
Obsérvese que el término 𝐷𝑘 − 𝑂𝑘 representa el error de una neurona k siendo
similar al término de error utilizado en la regla del perceptrón. Ahora bien, en la
regla de aprendizaje de una red backpropagation ya no sólo consideramos si una
neurona de salida se encuentra o no en error, tal y como ocurre si I y D solo toman
valores 0 o 1. Asimismo, tampoco consideramos únicamente la magnitud del error,
como ocurre en algunas aplicaciones prácticas en las que se requieren
componentes I y D en los vectores de entrada y salida definidas por vectores
reales, por ejemplo 0,126. En una red backpropagation además de calcular el error
escalamos su valor al estar este multiplicado por la derivada:
𝜕𝑂𝑘𝜕𝑛𝑒𝑡𝑘
(8)
59
Si se utiliza la función de activación sigmoidal, sustituyendo la derivada por su
valor tendremos que:
𝛿𝑘 = 𝐷𝑘 − 𝑂𝑘 𝑂𝑘 1−𝑂𝑘 (9)
ya que 𝑂𝑘 1− 𝑂𝑘 es la derivada de la función sigmoidal.
Calcular el error o valor 𝛿𝑗 en cada una de las neuronas de la capa oculta o
intermedia. Ahora bien, ¿cómo calcular Dj − Oj si no es posible comparar la
salida Oj de las neuronas de la capa intermedia con un valor deseado para dicha
capa? Obsérvese que en el caso de la capa intermedia no disponemos de un
vector deseado con componentes Dj . La solución adoptada creadores de esta
red constituye por su originalidad la principal contribución de la regla de
aprendizaje. Delegando la responsabilidad del cálculo de error en la capa
intermedia a la capa de salida de la red. El error δj en cada una de las neuronas
de la capa de salida se calcula aplicando la expresión que se muestra a
continuación:
δj = δk wjk k
∂O j
∂net j (10)
Leyendo la expresión deducimos que el error en una neurona j es proporcional a la
suma ponderada de los errores en la k neuronas de la capa de salida, siendo la
derivada el factor de proporcionalidad. Si observamos detenidamente el término
60
entre paréntesis concluiremos que los pesos wjk de las conexiones entre las
neuronas j de la capa oculta y las k neurona de salida, representa los factores de
ponderación. En consecuencia cuanto mayor sea el peso, y por tanto la fuerza
sináptica, entre alguna de las k neuronas de salida y una neurona j mayor será la
responsabilidad de la neurona k en el error de la neurona. Finalmente, y
asumiendo que utilizamos la función de activación sigmoidal, sustituyendo en la
derivada que aparece en la expresión obtendremos:
δj = δk wjk
k
∂Oj
∂netj Oj(−Oj) (11)
5. Modificar el valor de los pesos aplicando la expresión general en la que se
recoge la regla de aprendizaje. La actualización del valor de los pesos debe
ser efectuada tanto en los pesos wjk de las conexiones entre las neuronas
de la capa de salida e intermedia, ver ecuación ().
wjk t + 1 = wjk t + ∆wjk (12)
Como en los pesos wij de las conexiones entre las neuronas de la capa intermedia
y de entrada:
wij t + 1 = wij t + ∆wij (13)
La regla de aprendizaje de una red backpropagation establece que el cambio
61
experimentado por un peso es proporcional al error δ y a la señal de entrada,
siendo la tasa de aprendizaje ∝ el factor de proporcionalidad. Por consiguiente,
tendremos que el cambio experimentado por los pesos de las conexiones entre la j
neuronas de la capa oculta y las k neuronas de salida será igual a:
∆wij = ∝ δkOj (14)
Mientras que para los pesos asociados a las conexiones entre las j neuronas de la
capa oculta y las i neuronas de la capa de entrada:
∆wij = ∝ δjOi (15)
Si finalmente sustituimos en las expresiones para los pesos el cambio
experimentado, es decir el valor ∆w, sustituyendo a su vez el valor δ por la
expresión correspondiente representada en los pasos 4 y 5, tendremos las
expresiones con las modificaciones una y otra vez los pesos durante la fase de
entrenamiento de la red. En el caso particular de los pesos asociados a las
conexiones entre las neuronas de la capa de salida e intermedia, obtendremos la
expresión general siguiente:
∆wjk t + 1 = wjk t + α Dk − Ok Ok 1− Ok Oj(16)
Siendo la expresión que corresponde a los pesos de las conexiones entre las
neuronas de la capa oculta y de entrada la que se muestra a continuación, en la
62
ecuación (13):
wij t− 1 = wij t + α δk wjk
k
Oj 1 − Oj Ii (17)
6. Repetir el paso anterior hasta que el error total E cometido por la red
neuronal sea igual a cero o inferior a un cierto valor o cota preestablecido
previamente. El valor del error E es una medida de aprendizaje en la red, y
por tanto de su ejecución durante la fase de entrenamiento, calculándose
de acuerdo con la siguiente expresión:
E = δ2kk (18)
Obsérvese que sustituyéndose en la expresión el valor δk sin tener en cuenta la
derivada, tendremos que E es igual a:
E =1
2 (Dk − Ok)2 k (19)
Una vez la red neuronal haya alcanzado sus valores óptimos estos valores son
guardados en una base de datos de conocimiento para luego presentarlos como
un banco del saber y identificar de acuerdo a los valores de entrada los
desempeños cualitativos, a los que pertenece para así poder dar sus
consideraciones de trabajos asignada a estos valores relacionados.
La implementación de las redes neuronales artificiales en los sistemas de gestión
63
educativa representan una excelente herramienta para evitar tareas rutinarias al
docente, clasificar conceptos, permitiéndole a este poder obtener mejoras los
modelos académicos de evaluaciones, también la sistematización de sus labores
representa una avance al plan de mejoramiento institucional. Un sistema basado
en RNA de tipo backpropagation resulto practico para la implementación de este
ejemplo práctico descrito en el presente artículo debido a que se utilizaron un
vector de cuatro entradas, ocho neuronas ocultas y una neurona de salida, los
datos de entrada que inicialmente eran valores numérico debieron ser
transformado, según su escala correspondiente en binarios para poder
presentárselos a la Red Neuronal y de esta forma poder clasificar las salidas
deseadas. Sin embargo, para futuros trabajos pensando en un clasificador de
soporte para asignar tareas y aprendizaje de conceptos de temas ya vistos en
clase de un sistema de notas, por ejemplo, seria recomendado utilizar las redes
bayesianas, u otras RNA que permitan la implementación del mismo.
Para los resultados de la investigación se guardaron los patrones de entradas, se
empleó la utilización de los conceptos para las Fortalezas, Debilidades de la
asignatura Matemáticas y Geometría del Grado primero hasta quinto contenidos al
final de cada capítulo y para la información de las recomendaciones se tuvo en
cuenta las opiniones de los docentes de cada grado. De esta manera se
clasificaron todo un banco de perfiles para que mas adelantes estos se pudieran
identificar al ser presentados como patrones de entradas para cada clase o
categoría en particular y de este modo regístralos en el sistema.
La clasificación, identificación y análisis de esos patrones obtuvieron un
rendimiento en las consultas del 90 % ya que para los docentes se le facilitó la
asignación de calificaciones utilizando el modelo estudiado.
64
6. MARCO LEGAL
Este proyecto está enmarcado en el artículo 1290 de 2009 del MINISTERIO DE
EDUCACIÓN NACIONAL, por el cual se reglamenta la evaluación del aprendizaje
y promoción de los estudiantes de los niveles de educación básica y media, y en
cuyos artículos describe lo siguiente:
ARTÍCULO 1. Evaluación de los estudiantes. La evaluación de los aprendizajes de
los estudiantes se realiza en los siguientes ámbitos:
1. Institucional. La evaluación del aprendizaje de los estudiantes realizada en
los establecimientos de educación básica y media, es el proceso
permanente y objetivo para valorar el nivel de desempeño de los
estudiantes.
ARTÍCULO 3. Propósitos de la evaluación institucional de los estudiantes. Son
propósitos de la evaluación de los estudiantes en el ámbito institucional:
1. Identificar las características personales, intereses, ritmos de desarrollo y
estilos de aprendizaje del estudiante para valorar sus avances.
2. Proporcionar información básica para consolidar o reorientar los procesos
educativos relacionados con el desarrollo integral del estudiante.
3. Suministrar información que permita implementar estrategias pedagógicas
para apoyar a los estudiantes que presenten debilidades y desempeños
superiores en su proceso formativo.
4. Determinar la promoción de estudiantes.
5. Aportar información para el ajuste e implementación del plan de
mejoramiento institucional.
65
ARTÍCULO 4. Definición del sistema institucional de evaluación de los
estudiantes. El sistema de evaluación institucional de los estudiantes que hace
parte del proyecto educativo institucional debe contener:
1. Los criterios de evaluación y promoción.
2. La escala de valoración institucional y su respectiva equivalencia con la
escala nacional
3. Las estrategias de valoración integral de los desempeños de los
estudiantes.
4. Las acciones de seguimiento para el mejoramiento de los desempeños de
los estudiantes durante el año escolar.
5. Los procesos de autoevaluación de los estudiantes.
6. Las estrategias de apoyo necesarias para resolver situaciones pedagógicas
pendientes de los estudiantes.
7. Las acciones para garantizar que los directivos docentes y docentes del
establecimiento educativo cumplan con los procesos evaluativos
estipulados en el sistema institucional de evaluación.
8. La periodicidad de entrega de informes a los padres de familia.
9. La estructura de los informes de los estudiantes, para que sean claros,
comprensibles y den información integral del avance en la formación.
10. Las instancias, procedimientos y mecanismos de atención y resolución de
reclamaciones de padres de familia y estudiantes sobre la evaluación y
promoción.
11. Los mecanismos de participación de la comunidad educativa en la
construcción del sistema institucional de evaluación de los estudiantes.
ARTICULO 5. Escala de valoración nacional: Cada establecimiento educativo
definirá y adoptará su escala de valoración de los desempeños de los estudiantes
en su sistema de evaluación. Para facilitar la movilidad de los estudiantes entre
66
establecimientos educativos, cada escala deberá expresar su equivalencia con la
escala de valoración nacional:
Desempeño Superior
Desempeño Alto
Desempeño Básico
Desempeño Bajo
La denominación desempeño básico se entiende como la superación de los
desempeños necesarios en relación con las áreas obligatorias y fundamentales,
teniendo como referente los estándares básicos, las orientaciones y lineamientos
expedidos por el Ministerio de Educación Nacional y lo establecido en el proyecto
educativo institucional. El desempeño bajo se entiende como la no superación de
los mismos.
ARTÍCULO 14. Derechos de los padres de familia. En el proceso formativo de
sus hijos, los padres de familia tienen los siguientes derechos:
1. Conocer el sistema institucional de evaluación de los estudiantes: criterios,
procedimientos e instrumentos de evaluación y promoción desde el inicio de
año escolar.
2. Acompañar el proceso evaluativo de los estudiantes.
3. Recibir los informes periódicos de evaluación.
4. Recibir oportunamente respuestas a las inquietudes y solicitudes
presentadas sobre el proceso de evaluación de sus hijos.
ARTÍCULO 16. Registro escolar. Los establecimientos educativos deben llevar un
registro actualizado de los estudiantes que contenga, además de los datos de
67
identificación personal, el informe de valoración por grados y el estado de la
evaluación, que incluya las novedades académicas que surjan.
ARTÍCULO 17. Constancias de desempeño. El establecimiento educativo, a
solicitud del padre de familia, debe emitir constancias de desempeño de cada
grado cursado, en las que se consignarán los resultados de los informes
periódicos.
Cuando la constancia de desempeño reporte que el estudiante ha sido promovido
al siguiente grado y se traslade de un establecimiento educativo a otro, será
matriculado en el grado al que fue promovido según el reporte. Si el
establecimiento educativo receptor, a través de una evaluación diagnóstica,
considera que el estudiante necesita procesos de apoyo para estar acorde con las
exigencias académicas del nuevo curso, debe implementarlos.
7. METODOLOGIA
7.1 Población Y Muestra
La Implementación de un Sistema de Información de Gestión de Procesos
Académicos apoyado con Redes Neuronales Artificiales se ha tomado como
muestra los estudiantes de las instituciones educativa de Básica y Media de
Valledupar, ver tabla 5, para esta forma tener en cuenta el nivel socioeconómico,
académico, pues, existen diferencias en estos tres colegios que pueden presentar
resultados interesantes al momento de la investigación.
68
INSTITUCION
No.
POBLACIONAL
PORCENTAJE
DE LA MUESTRA
NIVEL
SOCIO-
ECONOMICO
ESTRATO
Gimnasio Del Saber
1400 10% ALTO 6
Juvenil 210 10% MEDIO 3
San Antonio 260 10% MEDIO-BAJO 1
Osvaldo Vergara
Fernández
260 10%
MEDIO-BAJO 2
Tabla No.5 relación de Niveles socioeconómicos y medida poblacional
Para esto, se tomarán muestras de tipo de opinión, encuestas, formularios de
datos, las escalas de mediciones son de tipo cualitativo y cuantitativo, utilizando
para la obtención o recolección de información la Plataforma Educativa.
7.2 Tipo de Estudio
Teniendo en cuenta los objetivos plateado de la investigación y desde el marco
epistemológico nuestro estudio es de tipo Analítico (comparativo), ya que se
pretende aplicar a un número poblacional de estudiantes un aplicativo basado en
redes neuronales para determinar sus comportamientos.
7.3 Técnicas y Recolección de información
69
A continuación se describen las actividades en las diferentes fases, los
requerimientos de personal, hardware y software, para que la instalación y puesta
en marcha se desarrolle con éxito en los tiempos estimados y para que las
Instituciones asimilen con beneficio el cambio tecnológico al que se enfrenta.
Figura 10. Actividades y sus fases de implementación del software
En la fase de asimilación, se expone la metodología a los integrantes del proyecto,
se definen los diferentes roles y las responsabilidades de cada rol; adicionalmente,
se preparan los recursos logísticos necesarios para iniciar la actividades propias
del proyecto.
La fase de experimentación o afinamiento del diseño, inicia con la
conceptualización de sistema y termina con la aprobación del documento de
alcance funcional. Durante esta fase, el usuario entra en contacto con el sistema
para entender la globalidad del mismo. Facilitando la toma de decisiones frente a
alternativas de parametrización. Durante esta fase el recurso humano del
contratista asimila las propiedades y necesidades del usuario final y las directivas
del Colegio insumo requerido para el ajuste para el ajuste del diseño de la solución
y para delinear etapas restantes del proyecto.
En la Fase de construcción, se realizan todos los ajustes requeridos al diseño de
la solución a nivel de desarrollo de software, las labores de parametrización,
70
migración de información y cargue de los saldos iníciales en aquellos módulos
que así lo requieran. Adicionalmente, se efectúan pruebas de funcionalidad.
Finalmente en la fase de entrega, se verifica el cumplimiento de los compromisos
adquiridos para firmar el acta de recibo a satisfacción del sistema.
Fases de la metodología
Figura 11. Metodología del tiempo y sus niveles de actividad
Interacción Fases de la metodología
Figura 12 Interacción Fases de la metodología del tiempo y sus niveles de
actividad
7.3.1. Revisión de requerimientos Técnicos (Hardware y software)
71
En el proceso de implantación del sistema es requisito indispensable la instalación
y puesta en marcha de la plataforma computacional con todas las pruebas y
ajustes necesarios.
Para el funcionamiento del sistema se requiere como mínimo:
Un servidor de base de datos descrito en la sección 3.1.4. Implementación física
del Sistema.
La configuración recomendada para el servidor se estima para poner con 100
usuarios concurrentes. De antemano no puede proyectarse el crecimiento de
servidores y canales de comunicación por cuanto no se conoce el volumen de
transacciones, el número de usuarios del sistema y los tiempos de respuesta
requeridos por el cliente. El departamento de tecnología del Colegio deberá hacer
las mediciones del caso para determinar este crecimiento.
El sistema puede operar instalado el servidor de aplicaciones y servidor de base
de datos en un solo computador. El sistema permite, si el cliente lo estima
conveniente, distribuir los componentes del sistema en diferentes servidores (uno
o más servidores de aplicaciones, servidor de bases de datos, servidor web,
servidor de reportes). Todos los requeridos en hardware deben estar instalados y
funcionando.
7.3.2. Plan de trabajo de la implementación (tiempo de ejecución)
El plan de trabajo del proyecto se llevara a cabo en nueve (11) meses calendario,
contados a partir de la fecha del acta de inicio, con la participación del equipo del
proyecto será definido más adelante y con el cronograma propuesto (ver Anexo
No.1 CRONOGRAMA DEL PROYECTO).
72
7.4. Fuentes Primarias
Las principales fuentes de información que se utilizan como punto de referencia
para la elaboración, diseño, e implementación del Sistema
7.5 Fuentes Secundarias
Para la realización de este proyecto se toman en cuenta otros sistemas
73
ANEXOS
CRONOGRAMA DE ACTIVIDADES
El cronograma de las actividades a realizar se muestra a continuación:
Paralelo a estas actividades, los procesos financieros que se pretende
implementar en la aplicación con un tiempo estipulado de once meses, descritos
de la siguiente manera:
74
75
PRESUPUESTO
El capital que se necesita para la realización del proyecto se resume en la siguiente
tabla:
FUENTES TOTAL
PERSONAL 35‟200.000
EQUIPO Y ACCESORIOS 5‟000.000
PAPELERIA 400.000
LIBROS 1‟000.000
INTERNET 2‟100.000
CD Y DISQUETES 50.000
SERVIDOR 23‟750.000
TOTAL 63‟750.000
Tabla 1. Presupuesto general del proyecto (en $).
76
BIBLIOGRAFIA
Andina de la Fuente, D. "Tutorial de redes neuronales". Dpto. de Señales,
Sistemas y Radiocomunicaciones. Grupo de circuitos. Universidad Politécnica de
Madrid.
Arbib, M.A. (1995): "The Handbook of Brain Theory and Neural Networks". The
MIT Press.
Beltratti, A.; Margarita, S.; Terna, P. (1996): "Neural Networks for economic and
financial modelling". International Thomson. Computer Press.
Bonilla Musoles, M.; Puerta Medina, R.(1997): "Análisis de las redes neuronales:
Aplicación a problemas de predicción y clasificación financiera". Documento de
Trabajo. Departamento de Economía Financiera y Matemática. Universidad de
valencia.
Hanushek, E. (1986): "The economics of Schooling". Journal of Economic
Literature. Vol 24, nº3, pp. 1141-1171.
Hebb, D.O. (1949): "The organization of behavior". Science Editions, New York,
NY.
Hornik, K., Stinchcombe, M. and White, H. (1989): "Multilayer Feed-forward
Networks are Universal Approximators". Neural networks 2, pp. 359-66.
77
Hornik, K., Stinchcombe, M. and White, H. (1990). "Universal Approximation of an
Unknown Mapping and its Derivatives using Multilayer Feed-forward Networks".
Neural Networks 3, pp. 551-60.
Le Cun, Y. (1985): "Une Procédure d¢ Apprentissage pour Réseau à Seuil
Asymétrique", in Proceedings of Cognitiva.
Martínez de Lejarza, I. (1996): "Redes Neuronales Auto-Organizadas y Clustering:
Una Aplicación a la Agrupación Económico-Funcional de Entidades de Población".
Documento de Trabajo. Facultat de CC. Econòmiques i Empresarials.
Departamento de Economía Aplicada. Universitat de València.
Mc Culloch, W.S. y Pitts, W.A. (1943): "A logical Calculus of the Ideas Immanent in
Nervous Activity". Boulletin of Mathematics and Biophysics, 5, págs. 115-133.
Minsky, M. y Papert, S. (1969): "Perceptrons: An introduction to Computacional
Geometry". The MIT Press. Cambridge, MA.
Modrego, A.; San Segundo, M.J. (1988): "Ecuaciones de rendimiento escolar para
la evaluación de las enseñanzas medias". Revista de Educación. Septiembre-
Diciembre 1988. pp 147-179
Parker, D.B. (1985): "Learning Logic". MIT Center for Computational Research in
Economics and Management science, T.R. 47.
Pedraja, F. y Salinas, J. (1996): "Eficiencia del gasto público en educación
secundaria: una aplicación de la técnica envolvente de datos". Hacienda Pública
Española Nº138, pp. 87-96.
78
Rosemblatt, F. (1958): "The Perceptron: A probabilistic model for information
storage and organization in the brain". Psychological Review 65, págs 386-408.
Rosemblatt, F. (1959): "Principles of Neurodynamics". Spartan Books, New York.
Rumelhart, D. E.; Mc Clelland, J.L.; and the PDP Research Group (Eds.) (1986):
"Parallel Distributed Processing: Explorations on the Microstructure of Cognition,
vol.I. Foundations", MIT Press, Cambridge, MA.
San Segundo, M.J. (1991): "Evaluación del Sistema Educativo a Partir de Datos
Individuales". Economía Industrial. Marzo - Abril 1991, pp. 23-37.
San Segundo, M.J. (1998): "Igualdad de oportunidades educativas". Ekonomiaz Nº
40 1.er Cuatrimestre.
Santín, Daniel (1998) "Eficiencia relativa de las Comunidades Autónomas en
Enseñanza Secundaria: un enfoque socioeconómico" Documento de Trabajo
Facultad de Ciencias Económicas y Empresariales. UCM, nº 9822.
Tejedor, F. J.; Caride, J. A. (1988): "Influencia de las variables contextuales en el
rendimiento académico". Revista de Educación. Septiembre-Diciembre 1988. pp
112-146.
VV.AA. (1994): "Acerca de la producción eductiva: Estudio de los Centros
Educativos de la Comunidad Autónoma del País Vasco". Colección estudios y
documentos Nº 20. Gobierno Vasco. Departamento de educación, universidades e
investigación.
79
Werbos, P.J. (1974): "Beyond Regression: New tools for Prediction and Analysis in
the Behavioral Sciences". Unpublished Ph.D. Dissertation, Harvard University.
Department of Applied Mathematics.
White, H. (1992): "Artificial Neural Networks: Approximation and Learning Theory".
Blackwell, Oxford.