Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 1 de 24
La Unidad Administrativa Especial de Catastro Distrital, comprometida con su quehacer misional y con el cumplimiento de su visión ha establecido, a nivel técnico y tecnológico, un horizonte que en el corto, mediano y largo plazo propende por el Mejoramiento Integral de la Gestión Catastral. De esta manera, y como parte de esta iniciativa se ha considerado un proyecto (en el nivel Táctico y Operativo), que busca:
1. El desarrollo de modelos ontológicos que contribuyan a definir la semántica en algunos dominios de conocimiento (Censo Inmobiliario y Mapa de Referencia) relacionados con la Gestión del Catastro y la disposición de información geográfica.
2. Integrar los Modelos de Bases de Datos que soportan la operación a los modelos ontológicos.
3. Innovar en la adopción de tecnologías basadas en lenguajes semánticos que permitan de manera eficiente la gestión de las bases de datos así como la consulta, recuperación y administración de datos.
4. La disposición de servicios e información en la Web 3.0.
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 2 de 24
En este propósito, este documento busca delimitar los requerimientos técnicos y tecnológicos que tendrán que ser soportados por la Arquitectura Tecnológica de Referencia de la UAECD y que hacen parte de los principios de: Gestión del Cambio Organizacional, Productos y Servicios a la Medida y a la Selección de Soluciones Tecnológicas. Como parte de dichos requerimientos se indica a continuación:
1. Un análisis de algunas de las herramientas que actualmente se encuentran disponibles
para el manejo de bases de datos semánticas el cual se poblará con los datos que sean priorizados por la entidad.
2. Exploración de la herramienta que permite la migración de datos de una Geodatabase a nuestro Servidor de Oracle Spatial, la cual se encuentra al alcance del proyecto debido a que la UAEDC tiene licenciamiento de dicho software.
3. Las características del servicio de host y almacenamiento en el servidor donde se habiliten
las URI y se aloje el SMBDS.
4. Unos ejemplos de interfaz de usuario que basan su plataforma en modelos ontológicos y
datos en leguaje semántico.
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 3 de 24
Dentro del desarrollo del proyecto de linked data, uno de los aspectos con mayor relevancia ha sido la migración de una GeodataBase (datos geográficos) a una base de datos Oracle, dicho proceso debe ofrecer integridad en los datos que se requieren migrar.
En tal sentido se realizó exploración de las herramientas tecnológicas con las que cuenta en la actualidad la UAECD con el fin de aprovechar de manera eficiente los recursos que se tienen al alcance. Una vez agotada esta etapa, se encontró una herramienta licenciada que permite realizar lo interoperabilidad de las dos bases de datos. La solución surge con el software denomina en su 3, producido y comercializado
por . Esta herramienta es una de las más utilizadas y cuenta con el siguiente grupo de componentes ArcReader, ArcMap, ArcCatalog, ArcToolbox, ArcScene y ArcGlobe. El uso de esta herramienta permite la transformación automática de datos geográficos a sistemas leíbles o importables a una base de datos . Grafica 1. Proceso de Migración:
En el laboratorio de prueba se tomara un lote datos almacenados en la
de la UAECD como lo muestra la gráfica 1, estos elementos componen el
, los cuales deberán ser importados desde la aplicación que en forma automática a través de un geoproceso realiza la conversión y
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 4 de 24
vaciado a la base de datos de , es de anotar que la base de datos Oracle deberá estar creada y estructurada para recibir la Información del importe.
se compone de un conjunto de tipos de datos de objetos, métodos de tipo y operadores, funciones y procedimientos que utilizan estos tipos. Una geometría se
almacena como un objeto, en una sola fila, en una columna de tipoLa creación del índice espacial y el mantenimiento se realiza utilizando las declaraciones DDL
básicas .1 Dentro de las características en la guía de v.10.3, están relacionados los siguientes aspectos:
2.1 Plataformas compatibles
1.1 Plataformas soportadas para ArcGIS for Server (Linux)
1.2 Plataformas soportadas para ArcGIS for Server (Windows)
Figura 1.2 Sistema instalado que debe tener su ordenador para ejecutar ArcGis for desktop.
1 http://docs.oracle.com/cd/B28359_01/appdev.111/b28400/sdo_objrelschema.htm 2 http://www.sigsa.info/Req.Tec.ArcGISforServer
Sistemas Operativos Versión MínimaVersión
Máxima
Red Hat Enterprise Linux Server 6 (64-bit)
Red Hat Enterprise Linux Server 5 (64-bit) Update 7 + libX11 patch*
SUSE Linux Enterprise Server 11 (64-bit) SP1
Versión Versión
Mínima OS Máxima OS
Windows Server 2012 Standard y Datacenter (64-bit (EM64T))**
Windows Server 2008 R2 Standard, Enterprise y Datacenter (64-bit [EM64T]) SP1
Windows Server 2008 Standard, Enterprise, y Datacenter (64-bit [EM64T]) SP2 SP2
Windows Server 2003 Standard, Enterprise y Datacenter (64-bit [EM64T]) SP2 SP2
Windows 8 Basic, Professional y Enterprise (64-bit(EM64T))**
Windows 7 Ultimate, Enterprise, Professional, Home Premium (64-bit [EM64T]) SP1
Windows Vista Ultimate, Enterprise, Business, Home Premium (64-bit [EM64T]) SP2 SP2
Windows XP Professional Edition, Home Edition (64-bit [EM64T]) SP2 SP2
Sistemas Operativos
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 5 de 24
2.2 Requerimientos y limitaciones de sistema operativo para ArcGIS for Server
Todas las plataformas
ArcGIS for Server requiere un sistema operativo de 64-bit.
Python 2.7 (64 bit) es instalado junto con ArcGIS for Server.
2.3 Microsoft Windows ArcGIS for Desktop
Windows 8 (64 bit), Windows 7 (64 bit), Vista (64 bit), and XP (64 bit): Estos sistemas
Operativos están soportados para testeo básico y desarrollo de aplicaciones únicamente.
No están recomendados para despliegue en un ambiente de producción.
Figura1.sistema operativo para ejecutar ArcGIS for Desktop
3
3 http://www.sigsa.info/Req.Tec.ArcGISforDesktop
Versión OS Versión OS
Mínima Máxima
Windows Server 2003 Standard, Enterprise, and Datacenter (32-bit and 64-bit
[EM64T])SP2 SP2
Windows Server 2003 Terminal Services SP2 SP2
Windows Server 2008 Standard, Enterprise, y Datacenter (32-bit and 64-bit
[EM64T])SP2 SP2
Windows Server 2008 R2 Standard, Enterprise, y Datacenter (64-bit [EM64T]) SP1
Windows Server 2008 R2 with Citrix XenApp 6 y XenApp 6.5** SP1 SP1
Windows Server 2012 Standard, y Datacenter (64-bit [EM64T]) ***
Windows 8 Basic, Professional y Enterprise (32-bit y 64-bit [EM64T])***
Windows 7 Ultimate, Enterprise, Professional, Home Premium (32-bit and 64-bit
[EM64T])SP1
Windows Vista Ultimate, Enterprise, Business, Home Premium (32-bit and 64-bit
[EM64T])SP2 SP2
Windows XP Professional Edition, Home Edition (32-bit) SP3 SP3
Windows XP Professional Edition, Home Edition (64-bit [EM64T]) SP2 SP2
Sistemas Operativos Soportados
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 6 de 24
2.3.1 Requerimientos de Hardware
Figura1.hardware ejecutar ArcGIS for Desktop4
2.3.2 Requerimientos de Software
.NET Framework 3.5 SP1 debe ser instalado antes de instalar ArcGIS for Desktop. Requerimientos para Internet Explorer: ArcGIS for Desktop requiere una instalación
mínima de Microsoft Internet Explorer versión 7.0 or 8.0. Si no está instalado Microsoft Internet Explorer 7.0/8.0, debe de ser instalado antes de ArcGIS for Desktop.
Requerimientos de Phyton para geoprocesamiento: Las herramientas de ArcGIS for Desktop para geoprocesamiento, requieren que Phyton 2.7.x y Numerical Phyton 1.6.x estén instalados. Si el instalador de ArcGIS for Desktop no encuentra cualquiera de los dos, estos serán instalados en el proceso de instalación completo. Podrá escogerse la instalación personalizada para deseleccionar la opción de Phyton para evitar instalarlo. Adicionalmente, si el instalador de Phyton es ejecutado durante la instalación de ArcGIS for Desktop, se tendrá la oportunidad de revisar su localización de instalación, la cual no debe incluir espacios.
5
4 http://www.sigsa.info/Req.Tec.ArcGISforDesktop 5 http://www.sigsa.info/Req.Tec.ArcGISforDesktop
Velocidad CPU 2.2 GHz mínimo ; Hyper-threading (HHT) o Multi-core recomendado
Procesador
Intel Pentium 4, Intel Core Duo, or Xeon Processors; SSE2 mínimo - Corre esta utilidad de
Microsoft desde tu Windows command prompt para revisar tu procesador. Política de
soporte para doble núcleo
Memoria RAM 2 GB mínimo
Propiedades de Color Profundidad de color de 24-bit
Pantalla 1024 x 768 recomendados (96 dpi)
Espacio de Intercambio Determinado por el S.O.; 500 MB mínimo.
Espacio en Disco
2.4 GB - Puede ser que adicionalmente se utilicen 50 MB en el directorio Windows System
(normalmente C:\Windows\System32). Puedes observar el espacio en disco requerido para
cada uno de los componentes de la 10.1 en el programa de instalación. - Si se utiliza
ArcGlobe, más espacio extra puede ser requerido. ArcGlobe creará archivos caché cuando
sea utilizado.
Adaptador de Video y Gráficos Revisa si tu computadora puede correr ArcGIS
64 MB RAM mínimo, 256 MB RAM o más recomendado. NVIDIA, ATI, y chipsets de Intel
están soportados. - Acelerador de gráficos de 24-bit - Versión 2.0 de runtime OpenGL es
requerida y se recomienda Shader Model 3.0 o superior.
Hardware de RedTCP/IP, tarjeta de red, o adaptador Loopback de Microsoft es requerido para el
Administrador de Licencias.
Advanced, Basic, Standard
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 7 de 24
2.4. Linux
ArcGIS for Server solamente es soportado en Linux x86_64, en CPUs que estén adheridos a
una arquitectura x86_64 (64-bit), con versiones compatibles de Linux. Es un requerimiento
que el S.O. (binario) no haya sido modificado. Esri no provee ningún soporte si los
Productos han sido instalados en versiones para desarrolladores.
El límite de manejo de archivos para la instalación, necesita ser configurado a 65535.
El límite de procesos necesita ser incrementado de 1024 a 25059.
2.5 Red Hat Enterprise Linux 6 (solo 64 bit)
Los parches Linux desde RHEL AS/ES serán soportados mientras los parches lo estén por
Los servidores web y sean desde Red Hat sin ninguna modificación a la última versión de
kernel/glibc.
Los siguientes grupos de paquetes son requeridos: Desde el grupo Desktop → Paquete
grupo X Window System
2.6 Red Hat Enterprise Linux 5 (solo 64 bit)
Los parches Linux desde RHEL AS/ES serán soportados mientras los parches lo estén por
los servidores web y sean desde Red Hat sin ninguna modificación a la última versión de
kernel/glibc.
Los siguientes grupos de paquetes son requeridos: Desde el grupo Desktop → Paquete
grupo X Window System6
2.7 SUSE Linux 11 (solo 64 bit)
Los parches para SUSE Linux Entrerprise Server serán soportados mientras estos no tengan
Modificación alguna en la última versión kernel/glibc versión.
Los siguientes paquetes de software son requeridos: Desde System System/X11/grupo de
Utilidades → X Window System
6 http://www.sigsa.info/Req.Tec.ArcGISforServer
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 8 de 24
3. Requisitos del sistema
Figura 2. 7 Requisitos mínimos de hardware
3.1 Requerimientos de Hardware para servidor
El requerimiento mínimo de RAM para un ambiente para desarrollo, son 4 gb. Este requerimiento está basado en un servidor típico con el siguiente ambiente:
Dos servicios de mapas en caché
Un servicio de mapeo dinámico
Un servicio localizador
Un servicio de geoprocesamiento
Servicio de geometría
Servicio de herramientas de impresión
Servidor SQL Express
IIS con Adaptador Web8
7,. http://desktop.arcgis.com/es/desktop/latest/get-started/system-requirements/arcgis-desktop-system-requirements.htm#ESRI_SECTION1_4D839759F08146819E273A6DDD01DCBB 8 http://www.sigsa.info/Req.Tec.ArcGISforServer
Advanced, Basic, Standard
Velocidad de CPU 2,2 GHz como mínimo; se recomienda Hyper-threading (HHT) o multinúcleo
Plataforma x86 o x64 con extensiones SSE2
Memoria/RAM 2 GB como mínimo
Propiedades de visualización Profundidad de color de 24 bits
Resolución de pantalla Se recomienda 1024 x 768 como mínimo a tamaño normal (96 ppp)
Espacio de intercambio Determinado por el sistema operativo; 500 MB como mínimo.
2,4 GB
Además, es posible que se requieran hasta 50 MB de espacio en disco en el directorio del sistema
de Windows (habitualmente C:\Windows\System32). Puede ver los requisitos de espacio en
disco para cada uno de los componentes de la versión 10.1 en el programa de instalación.
Si se usa ArcGlobe, puede que se necesite espacio adicional en disco. Cuando se utilice, ArcGlobe
creará archivos caché.
64 MB de RAM (mínimo), se recomiendan 256 MB de RAM o más. Se admiten chipsets NVIDIA, ATI
e Intel.
Acelerador de gráficos con capacidad de 24 bits
se requiere runtime OpenGL versión 2.0 como mínimo y se recomienda Shader Model 3.0 como
mínimo.
Asegúrese de utilizar el controlador más actualizado disponible.
Hardware de redPara License Manager se requiere TCP/IP simple, tarjeta de red o adaptador de bucle invertido de
Microsoft
Espacio en disco
Adaptador de vídeo/gráficos
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 9 de 24
4. Versiones de base de datos compatibles.
Standard Edition/Standard One Edition/Enterprise Edition:
Oracle 10g R2 (64 bits) 10.2.0.3
Oracle 11g R2 (64 bits) 11.2.0.3
Oracle 12c R1 (64 bits) 12.1.0.1
Figura 3. Compatibilidad con Oracle
Dentro de se incluye los siguientes componentes, necesarios en la implementación de Linked Data:
Servidor de base de datos (Desktop): instalación de instancia de SQL Server Express para
almacenar geodatabases.
ArcGIS License Manager (Windows y Linux): esta versión es necesaria para ejecutar ArcGIS
10.3 for Desktop y Engine con licencias de uso concurrente. También admite todas las
demás versiones de uso concurrente de ArcGIS 10.x.
5. Herramientas para desarrolladores:
ArcObjects SDK for Microsoft .NET Framework: documentación y código de muestra para
los desarrolladores de Microsoft .NET Framework que personalizan y amplían ArcGIS
Engine, ArcGIS for Desktop y ArcGIS for Server.
ArcObjects SDK for Java: documentación, herramientas y código de muestra para los
desarrolladores de la Plataforma Java que personalizan y amplían ArcGIS Engine, ArcGIS for
Desktop y ArcGIS for Server.9
9 http://desktop.arcgis.com/es/desktop/latest/get-started/quick-start-guides/arcgis-desktop-quick-start-guide.htm
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 10 de 24
Para dar continuidad a la iniciativa de Web Semántica que ya se ha venido desarrollando en la UAECD, con el desarrollo de los modelos ontológicos se hace necesario dar paso a las etapas de implementación, poblamiento y validación a partir de los datos, establecimientos de vínculos y disposición de la información. Gran parte de esta labor se logra con algunas herramientas de software que permiten almacenar el modelo ontológico (como referente para resolver las sentencias de consulta) y la base de datos. Estos reciben el nombre de Sistemas Manejadores de Bases de Datos Semánticas – SMBDS, y son los que posibilitan la gestión de los datos en términos de: Almacenamiento: Esta fase que se da posteriormente a la transformación de los datos a
un formato válido para la web semántica, tiene por objetivo un almacenamiento persistente eficiente que garantice la integridad de los datos y sus relaciones. En el caso de los SMBDS, la capacidad de almacenamiento se da en términos de números de sentencias que pueden llegar de cientos de miles a millones y hasta miles de millones; por lo tanto uno de los aspectos a tener en cuenta son: el mantenimiento de la información, los esquemas de distribución que soportan los modelos y tiempos de carga razonables.
Manipulación: Dado la dinámica de los datos es obvio pensar que estos deberán ser
modificados por su fuente, por lo tanto es normal que se realicen actividades de: modificación de registros, agregación de contenido, modificación del esquema de datos e inclusión de recursos relacionados. Sin embargo hay que considerar la forma de almacenamiento y su mecanismo de inferencia, puesto que si al modificar el dato este influye sobre otra información el problema puede ser grande. Según los tipos de inferencia se consideran algunas implicaciones, que son:
- Forward-chaining, se caracteriza porque el razonamiento se realiza antes de incluir la
información en la base de datos. En estos casos la modificación de una relación requerirá de una nueva inferencia sobre la información original y, sucesivamente, todos los elementos obtenidos de dicho cálculo, antes y después del cambio.
- Backward-chaining, para este tipo de almacenamiento la modificación podría ser inmediata, sin embargo tiene una repercusión importante en términos de eficiencia dado que si el criterio de indización incluye a los campos literales, será necesario recalcular los índices, lo que para estructura con varios millones de registros puede ser altamente costoso.
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 11 de 24
Obtención de Datos: Este aspecto considera la recuperación de información a partir de una
sentencia de búsqueda. Y En cuanto a los modelos semánticos (representan universos abiertos) la búsqueda y razonamiento se realiza en memoria, lo que repercute en términos de tiempo puesto que se tiene que analizar las diferentes combinaciones de variables cuando se busca al mismo tiempo Sujeto, Predicado y Objeto lo que puede tardar tiempos largos y más aún cuando las consultas se producen sobre varios modelos que pueden corresponder o no con almacenes físicos diferentes.
Teniendo en cuenta lo anterior se podría indicar que un criterio de eficiencia entre herramientas dependerá de un análisis conjunto de dichos 3 aspectos. Sin embargo, el principal problema de todos los sistemas actuales consiste en la cantidad de tiempo para recuperar los datos a partir de una consulta.
La evaluación de los sistemas que se presentan a continuación, está basado en los pocos documentos que se encuentran disponibles sobre el tema y sobre la descripción que se hace de los mismos a través de sus páginas web. Por lo tanto este documento no se puede considerar como un análisis exhaustivo y simplemente tiene un carácter indicativo de las posibles diferencias entre una y otra herramienta. Su adopción o no dependerá entonces de los criterios técnicos y económicos frente a la ATR de la Unidad, los cuales deberán ser evaluados por la Gerencia de Tecnología. Los sistemas que se citan son analizados a través de una comparación en aspectos como licencia, lenguaje de programación, arquitectura, extensibilidad, interacción, modos de almacenamiento, tratamiento de la información, inferencia y lenguaje de consulta. Estos sistemas son:
1. Sesame10 2. Jena11 3. Virtuoso12 4. Oracle Database 12c13
El análisis de dichas herramientas se presentará a nivel de tablas para una mejor compresión según los aspectos anteriormente mencionados.
10 http://rdf4j.org/ 11 http://jena.apache.org/ 12 http://www.openlinksw.com/virtuoso/ 13 http://www.oracle.com/technology/tech/xml/xds/index.html
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 12 de 24
- Licencias y Demos On-Line
Tabla 1. Cuadro comparativo entre Datos Básicos
Producto - Software
Versión Licencia Demo On-Line Documentación
Sesame 2.7.14
2.8 BSD14 No Si
Jena 2.12 Open Source No Si Virtuoso 7.0 GPL 2 Si Si Oracle 12c 12c Propietaria No Si
- Extensibilidad Tabla 2. Comparativo de Extensibilidad
Producto - Software
Lenguaje API Soporte
Sesame Java 5 Si Comunidad y Comercial Jena Java Si Contribución Virtuoso C No Listas de Correo Oracle 12c - Si Si
- Capacidad de Interacción
Tabla 3. Comparación de las capacidades de Interacción
Producto - Software
Interfaz Cliente/Servidor Consultas
Distribuidas
Sesame Modo consola y
aplicación Web Client Si No
Jena Modo Consola Si No Virtuoso ISQL y Conductor Si Si Oracle 12c Si Si Si
- Modo de Almacenamiento
14 Berkeley Software Distribution. Licencia que posee menos restricciones que una GPL muy cercana al dominio público, ya que permite el uso del código fuente en software no libre.
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 13 de 24
Tabla 4. Comparación en el modo de almacenamiento
Producto - Software
Almacenamiento (Persistencia)
Esquema Índices Soporte de
tipos Permisos
Específicos
Sesame Memoria, archivos y
SGBD externos Genérico +
Binario spoc y posc, ampliable
No No
Jena Memoria, archivos y
SGBD externos
Genérico de-normalizado +
Binario Por Defecto No No
Virtuoso Archivos, SGBD y SGBD
propio Genérico de-normalizado
gspo y ogps, configurable
XSD Si
Oracle 12c Oracle Genérico Oracle B-Tree XSD Si
- Tratamiento de Información
Tabla 5. Comparación en el tratamiento de información
Producto - Software
Carga Masiva Manipulación de
Sentencias Manipulación de
Esquemas Sesame Si Si No Jena Si Si Si Virtuoso Si Si No Oracle 12c Si Si Si
Producto - Software
Transacciones Concurrencia Colecciones Serialización
Sesame Si No Indirectamente N3 (solo escritura), N-Triple, RDF/XML, TRIG,
TRIX y Turtle
Jena Si Si No RDF/XML, N3, N-Triple y
Turtle Virtuoso Si Si No RDF/XML y Turtle Oracle 12c Si Si No RDF/XML
- Mecanismo de Inferencia
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 14 de 24
Tabla 6. Comparación en el modo y mecanismo de inferencia
Producto - Software
Inferencia Nativa Mecanismo Razonadores
Externos
Escalabilidad (Millones de Sentencias)
Sesame RDFS y jerarquía directa de tipo
Forward-chaining Implementables 70 (106, 64)
Jena Configurable hasta
subconjunto de OWL-Lite y reglas
Configurable Implementables 200 (106)
Virtuoso rdfs:subClassOf
rdfs:subPropertyOf owl:sameAs
Backward-chaining
Si 1106.6 (106, 47)
Oracle 12c Subconjunto OWL-
LD Forward-chaining Si 1 billón15
- Lenguajes de Consulta
Tabla 7. Comparación en los lenguajes de consulta
Producto - Software
Consultas Interpretadas Funciones Agrupadas
Texto Libre
Sesame SPARQL y SeRQL De SPARQL y SeRQL No Si
Jena SPARQL y RDQL mediante ARQ
No Si Mediante
LARQ Virtuoso SPARQL y SPARUL No Si Si
Oracle 12c SPARQL embebido
en SQL Si Si Si
Sesame es un framework RDF, software libre desarrollado en Java, que soporta inferencia y búsqueda sobre RDF Schema y OWL. Fue diseñado para ser flexible, pudiendo trabajar sobre varios sistemas de almacenamiento (bases de datos relacionales, en memoria, en sistema de archivos, etc.) con soporte transaccional, así como ofrecer una serie de herramientas para facilitar a los desarrolladores el aprovechamiento de los beneficios de RDF y RDFS, como una API de acceso a los datos que soporta comunicación local y remota (a través de RESTful HTTP), varios lenguajes de consulta (de los cuales SeRQL es, según los creadores de Sesame, el más
15 http://download.oracle.com/otndocs/tech/semantic_web/pdf/OracleSpatialGraph_RDFgraph_1_trillion_Benchmark.pdf
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 15 de 24
potente) y diversos formatos de entrada y salida RDF. Puede ser utilizado como servicio como componente de otros sistemas.
1.1 Datos básicos: Originariamente, Sesame fue desarrollado por Aduna Software como prototipo para el proyecto de la Unión Europea On-To-Knowledge. Actualmente es mantenido por Aduna en cooperación con NLnet Foundation y una comunidad de voluntarios, pertenecientes en su mayoría al foro OpenRDF. Sus desarrolladores principales son Arjohn Kampman y Jeen Broekstra.16
El sésamo es una base de datos RDF rápido y escalable. Sirve como uno de los componentes básicos de la Web Semántica (también conocido como "Web 3.0"). Sésamo se basa en estándares abiertos desarrollados por el W3C y está disponible bajo una licencia de código abierto (BSD). 1.2 Modos de almacenamiento: Existen cuatro modos de almacenamiento en Sesame: 1.2.1 En la memoria principal: es la configuración más simple y rápida, que almacena los datos RDF en la memoria principal. 1.2.2 En repositorio nativo: a diferencia de las dos primeras, no mantiene los datos en memoria, sino que los guarda directamente en el disco, en formato binario optimizado para almacenamiento comprimido y recuperación rápida. Es una solución eficiente, rápida y escalable para conjuntos de datos demasiado grandes como para mantenerlos por completo en memoria. 1.2.3 En base de datos: a través de Sail para bases de datos se soporta actualmente MySQL 5.0 y PostgreSQL 8.2 y 8.3. 1.2.4 Repositorio remoto: un repositorio que hace las veces de proxy para otro repositorio en un servidor Sesame. 17
1.3 Características:
Almacenamiento RDF altamente escalable. Carga rápida de RDF triple.
16 https://www.lsi.us.es/docs/doctorado/memorias/Torre-Moreno-Pablo-Memoria-Investigacion.pdf 17 https://www.lsi.us.es/docs/doctorado/memorias/Torre-Moreno-Pablo-Memoria-Investigacion.pdf
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 16 de 24
Alto rendimiento de la consulta. Soporte para varios lenguajes de consulta RDF incluyendo SPARQL y SeRQL. Tienda Nativa de almacenamiento escalable y consulta con Soporte persistencia confiable
para varias tiendas de back-end, incluyendo Mulgara, AllegroGraph, bigdata, Virtuoso. 18
1.4 Software necesario
El software de servidor de sésamo requiere lo siguinte:
Java 6 o más reciente
Un Java Servlet Container que soporte Java Servlet API 2.4 y Java Server Pages (JSP) 2.0 o
más reciente. Recomendamos el uso de una reciente versión estable de Apache Tomcat19
Es una API (Application Programming Interface) de Java para aplicaciones web semánticas, es una interface de programación de aplicaciones, que se pude utilizar para crear y manipular gráficos RDF, Jena tiene métodos para leer y escribir RDF como XML. Estos pueden ser usados para guardar un modelo RDF en un archivo y volver a ser leído, consultas mediante el uso de RDF, RDFS, OWL y SPARQL, e incluye un motor de inferencia basado en reglas para RDFS y OWL. 2.1 Datos básicos: Jena ha sido desarrollado por Hewlett-Packard Development Company, LP, y posee licencia específica basada en la Open Source Initiative, en la que la redistribución y uso de las fuentes y binarios, con o sin modificación, se permite manteniendo la mención al copyright de la empresa. 2.2 Inferencia: Mientras que en las versiones anteriores soportaba RDFS y un pequeño Subconjunto de OWL, las últimas versiones quedaron solo en unconjunto de RDFS.20 El siguiente ejemplo ilustra cómo funciona JENA:
La unión de dos modelos es la unión de los conjuntos de enunciados que representan a cada modelo. This is one of the key operations that the design of RDF supports. Esta es una de las operaciones de tecla que el diseño de RDF apoya. It enables data from disparate data sources to be merged. Permite a los datos de fuentes de datos dispares que se fusionen.21
18 http://www.aduna-software.com/technology/sesame 19 http://rdf4j.org/sesame/2.8/docs/using+sesame.docbook?view 20 https://www.lsi.us.es/docs/doctorado/memorias/Torre-Moreno-Pablo-Memoria-Investigacion.pdf
21 http://www.aduna-software.com/technology/sesame
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 17 de 24
Cuando estos se combinan, los dos http: nodos //...JohnSmith se fusionan en uno solo y el duplicado VCARD:FN arco se redujo a producir:
utiliza un motor que soporta lenguaje de consulta.
Cuando los modelos se fusionan dan origen ra los dos http: nodos //...JohnSmith se fusionan en uno solo y el duplicado VCARD:FN arco se redujo a producir:
proporciona tres operaciones para manipular modelos como un todo. Estas son las operaciones de conjuntos comunes de unión, intersección y diferencia.
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 18 de 24
La unión de dos modelos es la unión de los conjuntos de enunciados que representan a cada modelo. Esta es una de las operaciones de tecla que el diseño de RDF apoya. Permite a los datos de fuentes de datos dispares que se fusionen22. Considere los siguientes dos modelos:
Es un motor de base de datos híbrido que combina la funcionalidad de un tradicional RDBMS , ORDBMS , base de datos virtual , RDF ,XML , texto libre , servidor de aplicaciones Web y servidor de archivos funcional en un solo sistema. Software de tipo comercial producido por la empresa OPENLINK SOFTWARE, que ofrece una licencia de prueba de 30 días. Luego esta tiene que ser adquirida.
3.1 Requerimientos de Instalación
La instalación típica requerirá de un mínimo de 400 Mb de espacio en disco duro para instalar el código, ejemplos, documentación y un ejemplo de la base de datos. La base de datos necesitará de espacio adicional para alojar los datos a insertar, backups, reportes, páginas web, etc.
3.2 Requerimientos de Operación La base de datos de Virtuoso requiere un mínimo de 64Mb de sistema de memoria para cada instancia en operación. Cada conexión consumirá entre 70Kb y 130 Kb de memoria. La memoria usada se ve afectada por los siguientes parámetros del archivo de configuración de Virtuoso: · ServerThreads · ServerThreadSize · MainThreadSize · FutureThreadSize · NumberOfBuffers
3.3 Sistema Operativo de Soporte
22. https://jena.apache.org/tutorials/rdf_api.html
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 19 de 24
Virtuoso corre en los siguientes sistemas operativos: · Windows · Linux · Unix: AIX, HP-UX, Solaris, etc. · Mac OS X
3.4 Límites En la siguiente tabla se listan los parámetros más importantes y limitaciones para una base de datos como instancia de Virtuoso Server:
Google Refine: software para la migración de los datos a RDF. Versión gratuita. 3.5 Inferencia:
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 20 de 24
Virtuoso SPARQL infiere sentencias que no han sido almacenadas físicamente; es decir, utiliza un mecanismo backward-chaining. Utiliza una base de reglas para realizar sus razonamientos, que en su versión 5.0 reconoce únicamente rdfs:subClassOf, rdfs:subPropertyOf y un soporte limitado para el predicado owl:sameAs. Este aspecto parece constituir la característica más débil del producto.23
3.6 Tecnológicos
3.6.1 Espacio en un equipo servidor con sistema operativo Windows de 64 bits con una capacidad de almacenamiento de 250 Gigas donde se almacenarán los distintos software’s así como los ficheros RDF del modelo ontológico y del conjunto de datos. 3.6.2 Asignación de un dominio el cual tendrá que ser considerado para la construcción DEL patrón de URI que soportará los datos dentro de la iniciativa de Linked Data.
Base de Datos Oracle 12 c introduce una nueva arquitectura multiusuario que facilita la consolidación de muchas bases de datos de forma rápida y gestionarlos como un servicio en la nube. Oracle Database 12 c también incluye capacidades de procesamiento de datos en memoria que entregan rendimiento analítico avance. Innovaciones de base de datos adicionales ofrecen nuevos niveles de eficiencia, rendimiento, seguridad y disponibilidad.24 Se puede encontrar esta base de datos en tres ediciones y estas son: Enterprise Edition, Standard Edition y Standard Edition One.
Oracle Spatial and Graph proporciona funciones avanzadas para la gestión de datos espaciales y análisis, así como las gráficas para aplicaciones de datos vinculados física, red y social. Sus características de datos geoespaciales están diseñados para apoyar los requisitos más complejos que se encuentran en los Sistemas de Información Geográfica (SIG), aplicaciones empresariales y aplicaciones de servicios de localización. Oracle Spatial and Graph amplía las funciones de consulta y análisis espacial en Locator Base de Datos Oracle 12 c con capacidades de análisis y procesamiento espaciales más avanzados. Proporciona soporte para dos modelos de datos del gráfico: Modelo de datos de red gráfico (NDM), y RDF Gráfico Semántica. 25
4.1. Programación
23 https://www.lsi.us.es/docs/doctorado/memorias/Torre-Moreno-Pablo-Memoria-Investigacion.pdf 24 https://www.oracle.com/database/index.html 25 http://www.oracle.com/technetwork/database/oracle-database-editions-wp-12c-1896124.pdf?ssSourceSiteId=ocomlad
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 21 de 24
Oracle Programmer proporciona una interfaz de programación para los desarrolladores que crean aplicaciones empresariales que acceden y manipular la base de datos Oracle. Incluye incrustado interfaz al estilo SQL: Pro*C / C ++, COBOL*Pro, Pro*Fortran, SQL*Módulo para Ada, SQLJ; y utilidades para generar enlaces de acogida de habla de esquemas de bases de datos: Tipo de objeto traductor y JPub26
4.2 Disponibilidad de las Nubes de Bases de Datos
4.2.1 Global Data Services: permite balanceo de cargas y tolerancia a fallos a las configuraciones de bases de datos distribuidas. 4.2.2 Data Guard Far Sync: amplía la protección en espera de cero pérdida de datos a cualquier distancia y no está limitada por la latencia.
4.2.3 Application Continuity: complementaría a los RAC. Repetiría transacciones falladas de
manera transparente.27
4.3 Características mínimas para instalar Oracle 12c base de datos (12.1.0.1.0) Instalación en Oracle Linux
En primer lugar, antes de empezar, asegúrese de que su servidor Linux cumple con los
requisitos mínimos de hardware:
1 GB de RAM (más espacio de intercambio de tamaño adecuado)
6.4GB de espacio en disco para la instalación del software 1 GB de espacio en disco para el directorio / tmp28
4.4 Requisitos para Instalar Oracle 12c R1 en Linux x86 para RHEL6 (Red Hat Enterprise Linux)29
Configuración automática de Oracle Linux con Oracle RDBMS Pre-Install RPM.
26 http://www.oracle.com/technetwork/database/oracle-database-editions-wp-12c-1896124.pdf?ssSourceSiteId=ocomlad 27 http://mundodb.es/nuevas-funcionalidades-oracle-database-12c 28 http://www.snapdba.com/2013/07/oracle-database-12c-12-1-0-1-0-installation-on-oracle-linux-6-4/ 29 http://oracleenespanol.blogspot.com/2013/06/requisitos-para-instalar-oracle-12cr1.html
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 22 de 24
Configuración manual de Oracle Linux con Oracle RDBMS: 4.4.1 Requisitos de Memoria
Por lo menos 1 GB de RAM
Espacio swap “verificar el tamaño de espacio”
4.4.2 Requisitos de Software
Determinar la distribución y versión de Linux instalado “ con el fin de verificar si tiene el kernel
requerido”
RAM Disponible Espacion Swap Requerido
Entre 1 GB y 2 GB 1.5 veces el tamaño de la RAM
Entre 2 GB y 16 GB Igual al Tamaño de la RAM
Mas que 16 GB 16 GB
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 23 de 24
4.5 Requisitos de base de datos Oracle para ArcGIS 10.3
4.6 Requisitos de base de datos
Debe estar instalado el componente de texto de Oracle. El componente de texto se instala de forma predetermina en Oracle; sin embargo, si no ha realizado una instalación predeterminada, este componente puede no estar instalado.30
Tenga también en cuenta que si no hay una edición de ArcGIS nativa para el sistema operativo del servidor que aloja la base de datos de Oracle, entonces no hay compatibilidad con el acceso SQL a ST_Geometry o ST_Raster. El almacenamiento
30 http://desktop.arcgis.com/es/desktop/latest/get-started/system-requirements/database-requirements-oracle.htm#ESRI_SECTION1_6B9C5FEBEC0F4E03BAAAA34868C0167D
IBM AIX 6.1.0.0
Red Hat Enterprise Linux AS/ES 5 (64 bits) Update 7
Sun Solaris 9 (64 bits [SPARC])
Sun Solaris 10 (64 bits [SPARC])
Windows 2008 R2 Server Standard, Enterprise & Datacenter (64
bits [AMD64/EM64T])SP1
IBM AIX 6.1.0.0
IBM AIX 7.1.0.0
Oracle Linux Server 5 (64 bits) (ver nota siguiente) Update 8
Oracle Linux Server 6 (64 bits) (ver nota siguiente)
Red Hat Enterprise Linux AS/ES 5 (64 bits) Update 7
Red Hat Enterprise Linux AS/ES 6 (64 bits)
Sun Solaris 10 (64 bits [SPARC])
Sun Solaris 11 (64 bits [SPARC])
SUSE Linux Enterprise Server 11 (64-bits) SP1
Windows 2008 R2 Server Standard, Enterprise & Datacenter (64
bits [AMD64/EM64T])SP1
Windows Server 2012 Standard y Datacenter (64 bits (EM64T))
IBM AIX 7.1.0.0
Oracle Linux Server 5 (64 bits) Update 8
Oracle Linux Server 6 (64 bits)
Red Hat Enterprise Linux AS/ES 5 (64 bits) Update 7
Red Hat Enterprise Linux AS/ES 6 (64 bits)
Sun Solaris 10 (64 bits [SPARC])
Sun Solaris 11 (64 bits [SPARC])
SUSE Linux Enterprise Server 11 (64-bits) SP1
Windows 2008 R2 Server Standard, Enterprise & Datacenter (64
bits [AMD64/EM64T])SP1
Windows Server 2012 Standard y Datacenter (64 bits (EM64T))
Base de datos Sistemas operativos compatiblesVersión mínima
de SO
Versión
máxima de SO
Oracle 12c R1 (64 bits) 12.1.0.1
(compatibilidad con parches de Oracle)
Oracle 10g R2 (64 bits) 10.2.0.3
(compatibilidad con parches de Oracle)
Oracle 11g R2 (64 bits) 11.2.0.3
(compatibilidad con parches de Oracle)
Unidad Administrativa Especial de Catastro Distrital Carrera 30 No 25 – 90 PBX 2347600 www.catastrobogota.gov.co http://mapas.bogota.gov.co
Este documento es de uso confidencial
Página 24 de 24
ST_Geometry y ST_Raster puede utilizarse desde clientes de ArcGIS, pero no es compatible el acceso SQL a estos datos.
4.7 Software necesario para conectar a un DBMS
Su equipo cliente (por ejemplo, el que esté ejecutando ArcMap) necesitará tener instalados
los archivos de cliente apropiados para el RDBMS que esté utilizando. Estos archivos de cliente
están disponibles a través de los proveedores RDBMS, aunque algunos también están
disponibles en My Esri para su comodidad. Los archivos de cliente de RDBMS disponibles en
My Esri son IBM DB2, IBM Informix, Microsoft SQL Server y PostgreSQL. Los archivos de
cliente para ALTIBASE, IBM Netezza, Oracle, SAP HANA y Teradata no están disponibles en My
Esri y se deben obtener de los proveedores de RDBMS.31
Castelló Avilleira, A.B. (2006). Web Semántica: RDF y SGBD que lo soportan. TFC – I.T. Informática Gestión.
De la Torre, P. (2011). Almacenes de Datos para la Web Semántica. Departamento de Lenguajes y Sistemas Informáticos – Universidad de Sevilla.
Santa Cruz Jimenez, R.F. (2013). Bases de Datos en el Contexto de la Web Semántica – Comparativa entre SGBD orientados a la Web Semántica. Universitat Oberta de Catalunya.
31 http://desktop.arcgis.com/es/desktop/latest/get-started/system-requirements/database-requirements-oracle.htm#ESRI_SECTION2_DF109307FA4B495C9E122F482BC820A3