UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS
ENTREGA DE SERVICIO DE TI EN UNA SOLUCIÓN DE “BIG DATA” PARA ANALIZAR Y PREDECIR EL COMPORTAMIENTO DEL TRÁFICO EN LA
CIUDAD DE LIMA
Monografía que como parte del curso de Seminario de investigación para Ingeniería
Presentan los alumnos
Omar Bugosen Abi-Gosen
Christian Tejada Ruiz
Noviembre 2013
A Dios.
RESUMEN
El tema de esta monografía trata sobre la entrega de servicio de TI en una solución de Big
Data para analizar y predecir el comportamiento del tráfico en la ciudad de Lima. Con ello
en mente, la hipótesis plantea que la implementación de la gestión de servicio para Big
Data permite el análisis y predicción del comportamiento del tráfico mediante la excelencia
en la entrega de servicio para "Big Data", el tratamiento de la información con herramientas
de inteligencia de negocios y mediante el uso de información desde diferentes dispositivos.
En el primer capítulo se explican los conceptos de Big Data y de entrega de servicio de TI,
así como los de componentes lógicos y físicos involucrados con la entrega de servicio de TI
para Big Data. En el segundo capítulo abordamos el tema del análisis del tratamiento de
información de Big Data mediante el uso de herramientas de inteligencia de negocios y se
explica el uso del servicio de “Big Data” desde diversos dispositivos para analizar y
predecir el comportamiento del tráfico. Así, se concluye que el tratamiento de información
con una solución de Big Data provee un servicio para el análisis y predicción del tráfico de
la ciudad de Lima, para poder aliviar dicho inconveniente en la capital del Perú.
ÍNDICE
Introducción VII
Capítulo 1. Entrega de servicio TI para una solución Big Data 8
1.1 Concepto de Solución de Big Data 8
1.1.1 Definición y ventajas de Big Data 9
1.1.2 Consideraciones en el uso de Big Data 9
1.2 Componentes físicos y lógicos de Big Data 10
1.2.1 El componente físico o infraestructura de una solución Big Data 10
1.2.2 El aspecto lógico de una solución Big Data: las fuentes y el tratamiento de datos 10
1.3 Concepto de entrega de servicio de TI 12
1.3.1 Definición y tipos de servicio de TI 12
1.3.2 Organización dentro de la entrega de servicio de TI 13
1.4 Modelo de negocio de entrega de servicio de TI para Big Data 13
1.4.1 Determinación del costeo según el modelo de negocio 14
1.4.2 Valor económico en el análisis de tendencias 14
1.5 Fundamentos de una solución de Big Data 15
1.5.1 Los 7 pasos necesarios para explotar el potencial de una solución de Big Data 15
1.5.2 Inteligencia en un entorno Big Data 16
Capítulo 2. Tratamiento de información y uso de servicio Big Data 18
2.1 Análisis de información de las herramientas de inteligencia de negocios 18
2.1.1 Servicio de entrega de información de Big Data 19
2.1.2 Soluciones de Inteligencia de Negocios para tráfico y accidentes 21
2.2 Uso del servicio de Big Data mediante dispositivos móviles y computadoras 22
2.2.1 Características de Big Data en móviles 22
2.2.2 Información y equipos inteligentes 24
2.2.3 Pago mediante teléfonos móviles 25
Conclusiones 27
Bibliografía 31
INTRODUCCIÓN
El panorama que observamos en el mundo está plagado de fenómenos nuevos y, de hecho,
otros no tan nuevos. Es de importancia mencionar que la sociedad contemporánea se
encuentra inmersa en una diversidad de medios de comunicación que, sin duda alguna,
facilitan la vida a las personas. El funcionamiento de nuestra sociedad está estrechamente
relacionado con el uso de tecnologías, las que naturalmente van evolucionando con el
transcurrir del tiempo. Las diversas tecnologías que existen se vuelven mucho más
atractivas cuando, valga la plétora de palabras, tienen aplicaciones interesantes en la vida
cotidiana de las personas. Uno de los tantos problemas que atraviesa nuestra sociedad
limeña, el tráfico, urge de soluciones efectivas. Una manera de evitar el excesivo tráfico
vehicular es mediante el análisis de este, ya sea para la elección de alguna vía alterna o para
la determinación de las causas del congestionamiento que se observa día a día. La
propuesta de análisis se basa en la entrega de servicio de TI para una solución de Big Data
para analizar y predecir el comportamiento del tráfico en nuestra ciudad: Lima. ¿Quién no
ha llegado tarde al trabajo por culpa del tráfico? ¿De quién es el agrado estar tanto tiempo
en un aburridísimo embotellamiento? Es muy probable que los lectores sufran una catarsis
con el simple hecho de imaginarse esas situaciones y, además, es más probable aún que
urjan de soluciones innovadoras y efectivas en costo y tiempo.
VI
VII
CAPÍTULO 1
ENTREGA DE SERVICIO DE TI PARA UNA SOLUCIÓN BIG DATA
La solución de Big Data propone el adecuado tratamiento de grandes cantidades de
información mediante herramientas de tecnología para el análisis y predicción del tránsito
vehicular. Ya sea mediante el uso de recursos de software o tangibles, la propuesta se
enfoca en utilizar los recursos de la mejor manera para generar información de interés para
cualquier agente interesado en el proyecto. Mitigar el tráfico no es tarea sencilla y, para
ello, se requiere el uso de tecnologías adecuadas.
El presente capítulo tiene como objetivo definir y explicar el concepto y las ventajas de una
solución Big Data para aportar soluciones de interés para el tráfico, el cual más bien se
parece cada vez más a un mal que se propaga por toda la ciudad.
1.1 Concepto de Solución de Big Data
El término Big Data está referido a sistemas que manipulan grandes cantidades de
información. En ese sentido, conjuntos grandes de datos (como lo son los factores que
influyen en la generación del tráfico) requieren ser procesados de manera adecuada, con
tecnologías y técnicas pertinentes y, claro está, en un tiempo oportuno.
1.1.1 Definición y ventajas de Big Data
8
Big Data es considerado como un conjunto grande de datos caracterizados por su gran
volumen y variedad, que son generados con rapidez y con un nivel de certeza relativo. De
manera más formal, se define formalmente a nuestro concepto de interés:
“Big Data [son las] técnicas de análisis para procesar grandes cantidades de información relativamente extensas (de terabytes hasta exabytes1) y complejas (…) y que requieren del soporte de almacenamiento avanzado y especializado, así como de tecnologías de gestión, análisis y visualización.” (Ping Fung 2013)
Con lo mencionado por el autor, se considera que esta abundante cantidad de información
requiere de equipos tecnológicos especializados para poder ser analizados. Los datos serán
extraídos de formas particulares que serán luego explicadas, así como serán almacenados y
tratados con herramientas relacionadas entre sí.
1.1.2 Consideraciones en el uso de Big Data
Es claro que a mayores volúmenes de datos, las necesidades de tratamiento de estos van a
ser especiales. Big Data representa la cambiante necesidad de procesar muchos datos con
soluciones tecnológicas innovadoras.2 Así, se redondea la idea al considerar a Big Data
como un conjunto de tecnologías y prácticas emergentes destinadas a coleccionar, procesar,
descubrir y almacenar grandes volúmenes de data de manera rápida y con eficiencia en
temas de costos. La compatibilidad entre las herramientas a utilizar es importante, ya que
en las fases de recolección, procesamiento y análisis será vital que las aplicaciones trabajen
de manera conjunta para lograr resultados coherentes.
1 Un terabyte equivale a 1012 bytes y un exabyte equivale a 1018 bytes. Referencia2 Cfr. Dyche 2012
9
Con el concepto definido, resultará más sencillo entender en subcapítulos posteriores los
componentes lógicos y físicos, además de las aplicaciones de esta tecnología para fines de
nuestro interés.
1.2 Componentes físicos y lógicos de Big Data
Como es natural en cualquier solución tecnológica de cierta complejidad, Big Data se
integra tanto por componentes lógicos como físicos. Los componentes lógicos son aquellos
en los que se basa Big Data para el tratamiento y análisis de la información, como
herramientas de software y sistemas operativos. Por su parte, los componentes físicos son
constituidos por equipos y recursos tangibles para el tratamiento y análisis de la
información, ya sean servidores, discos duros, equipos de cómputo, etc.
1.2.1 El componente físico o infraestructura de una solución Big Data
Como se expuso líneas arriba, una solución Big Data consta de componentes lógicos y
físicos que, si bien han sido definidos por separado, se complementan entre sí y trabajan en
conjunto. En este sentido, se sugiere tener la solución de Big Data sobre clústeres de
computadoras; es decir, sobre conjuntos de computadoras relacionadas entre sí que
funcionan como si fueran una sola.3 La idea de utilizar clústeres funciona bien, ya que así
se provee una infraestructura dinámica y flexible frente a los cambios que pudiesen surgir
en el tiempo. Así, esto será de utilidad para separar las aplicaciones de base de datos,
sistemas de archivos, herramientas de análisis de datos, etc. Estas aplicaciones constituyen
el aspecto lógico de la solución Big Data, a detallar a continuación.
1.2.2 El aspecto lógico de una solución Big Data: las fuentes y el tratamiento de datos
3 Cfr. Cisco 2013
10
Los datos que pueden alimentar a una solución Big Data y, por ende, funcionar como
materia prima para su tratamiento, se encuentran en todos lados. En un documento de
investigación de Big Data para entornos empresariales, se enumera algunos ejemplos: el
constante monitoreo de la salud de los pacientes para tratar enfermedades crónicas, la
permanente evaluación de datos provenientes de sensores instalados en automóviles para
detectar patrones de uso y evitar accidentes, la detección de potenciales clientes que puedan
ser identificados por el uso de dispositivos móviles y que estén cerca de una tienda, etc.4 Es
razonable concluir que los datos de velocidades promedio de los autos en una vía dada, de
la fecha y hora del día y hasta del clima son válidos para su tratamiento y análisis si lo que
se desea es estudiar el comportamiento del tráfico.
Para fines prácticos sobre el tratamiento de una gran cantidad de datos, se propone dividir
el tratamiento de estos en la recolección, organización y análisis de la data.5 Para ello, en el
componente lógico, se formula el uso de su sistema de base de datos NoSQL para la fase de
recolección y almacenamiento de grandes cantidades de información. Con dicha aplicación,
se asegura que los datos se almacenarán en una estructura simple y dinámica que permitirá
flexibilizar el tratamiento de la información para evitar incurrir en costosos cambios de ser
necesaria alguna modificación6. Para la organización, se sugiere la tecnología Hadoop,
sistema de archivos que permite una carga rápida de datos en la base de datos. Para el
análisis, se sugieren soluciones gratuitas que permitan el análisis estadístico de datos y la
minería de datos.7 Esta distribución de aplicaciones y componentes es adecuada para el
proyecto, ya que las computadoras podrán tomar decisiones sobre cómo acomodar los
4 Cfr. Oracle 2012: 45 Cfr. Oracle 2012: 56 Cfr. Oracle 2012: 57 La minería de datos se refiere al proceso de detectar patrones en grandes volúmenes de datos.
11
distintos elementos relacionados a los datos tomados del tráfico y, de esa manera, arrojar
resultados en tiempos adecuados en comparación si no se usase la tecnología para
descentralizar la carga de trabajo sobre los grandes volúmenes de datos a tratar. El
diagrama de despliegue de la solución tanto lógica como física se muestra en la Figura 1.
Figura 1: Solución de Big Data Oracle integrada
Fuente: Oracle 2013
Así, y como cierre a la explicación de los componentes lógico y físico, podremos ahora
definir el concepto de entrega de servicio de TI.
1.3 Concepto de entrega de servicio de TI
1.3.1 Definición y tipos de servicio de TI
12
Definimos a la entrega de servicio de TI como un conjunto de principios, estándares,
políticas y procesos que se usan para diseñar, desplegar y operar tecnologías por parte de un
proveedor con experiencia en el contexto de negocio de TI.
La entrega de servicio de TI en una organización puede consistir en proveer diversos
servicios como servicios de servidores, almacenamiento, networking8, seguridad,
recuperación de desastres, control de activos, gestión de servicios y aplicaciones de TI.9
1.3.2 Organización dentro de la entrega de servicio de TI
Es de importancia decidir cómo es que se van a formar los grupos de trabajo. La entrega de
servicio de TI puede ser realizada de varias formas, como se menciona a continuación:
“La entrega de servicio de TI es realizada por equipos de trabajo, que bien pueden ser trabajadores contratados, contratistas, proveedores en los que se terceriza el trabajo, o una mezcla de los mencionados”. (Ping Fung 2013: 2)
Con conceptos claros sobre la entrega de servicio de TI y de una solución Big Data,
podemos presentar y explicar ya un bosquejo de modelo de negocio que relacione la
entrega de servicio con la solución tecnológica para grandes bases de datos.
1.4 Modelo de negocio de entrega de servicio de TI para Big Data
A partir de la automatización de la recolección, organización y análisis de datos, se pueden
idear interesantes modelos de negocio para ser ofrecidos al cliente. Como ejemplo,
podemos recolectar fotos de las placas de autos que circulen por una avenida determinada a
una hora dada, para descubrir información que está detrás de la placa del auto capturado.
Así, podremos obtener la marca y modelo del auto, así como identificar a su propietario.
8 El término networking se refiere a la integración de dos o más redes de computadoras.9 Cfr. Ping Fung 2013: 2
13
Con esta información, se podría indagar en bases de datos relacionadas para determinar el
nivel socioeconómico de la persona y, así, determinar (luego de detectar patrones en la
avenida tratada) la publicidad a colocar en la ruta, por ejemplo. Sin embargo, nuestra
materia de estudio no es el análisis del poder adquisitivo de los conductores, sino el tráfico
que se genera en dicha avenida en circunstancias especiales.
De esta forma, el negocio toma un giro algo distinto: se registrará el número de autos que
circulan por una vía dada, en una fecha y hora específica. Con esta información, además del
clima y de otros factores como la proporción de transporte público, se podrán tratar los
datos recolectados para generar estadísticos e incluso predecir cómo serán las condiciones
del tráfico en el futuro.
1.4.1 Determinación del costeo según el modelo de negocio
La entrega de servicio de TI para Big Data puede ser útil para muchas personas (en el caso
del tráfico, por ejemplo, para la Municipalidad de Lima) y, además, será preciso vender
dicho servicio como corresponda. Para calcular los costos, se sugiere diferentes modelos de
negocio, como la distribución prorrateada de costos, fijación de precios a mano alzada,
precios escalera, precios por unidad multiplicada por cantidad, etc.10 Como ejemplo, podría
cobrarse más al cliente mientras el análisis sea más preciso; por ejemplo, cuando una mayor
cantidad de datos haya sido analizada y procesada de manera adecuada con herramientas de
Inteligencia de Negocios, a detallar en el próximo subcapítulo.
1.4.2 Valor económico en el análisis de tendencias
Como se mencionó líneas arriba, es propicio considerar muchos datos que pudiesen en el
tráfico vehicular de Lima (y, de hecho, lo hacen). Así, se indica que factores como el clima,
las noticias y otros aspectos coyunturales (como partidos de fútbol) que afecten el tráfico
10 Cfr. Ping Fung 2013: 8
14
podrán y serán recogidos de diversas fuentes digitales de data y así nos proveerán de
análisis más precisos que redunden en nuevas fuentes de valor económico para el modelo
de negocio.11
Asimismo, y como corolario del párrafo anterior, la recolección, organización y análisis de
la data mencionada permitirá tomar decisiones mejor informadas. Ahora bien, conocemos
el mecanismo del modelo de negocio y su interacción con la solución de Big Data, pero
ahora profundizaremos en el análisis de dicha interacción entre la data y su tratamiento con
herramientas de inteligencia de negocios.
1.5 Fundamentos de una solución de Big Data
En esta sección se explicarán los fundamentos de una solución de Big Data mediante la
Inteligencia de Negocios (BI, Business Intelligence, por sus siglas en inglés).
1.5.1 Los 7 pasos necesarios para explotar el potencial de una solución de Big Data
Para explotar el potencial de una solución de Big Data, los pasos necesarios son: 1)
recolectar, 2) procesar, 3) gestionar, 4) medir, 5) consumir, 6) almacenar y 7) gobernar. 12
Ahora detallaremos cada paso a continuación:
Recolectar
La data se recolecta desde distintas fuentes, como fue explicado anteriormente. Luego, se
distribuye en otros nodos (como se explicó en la solución basada en clústeres), donde a su
vez un subconjunto de la data es procesada para descentralizar la carga de trabajo.
Procesar
La data se procesa y depura para ser más fácil de entender para los analistas. Luego, será
utilizada para ser analizada por otras herramientas, como por ejemplo de Inteligencia de
Negocios. 11 Cfr. Oracle 2013: 1512 Cfr. Dyche 2012
15
Gestionar
Toda la data que fue obtenida de diversas fuentes se limpia y homogeniza bajo estándares
de seguridad pertinentes.
Medir
Se deberá medir que porcentaje de la data es útil para ser utilizada de manera concomitante
con otros datos para su análisis e interpretación.
Consumir
Los requerimientos de consumo de data deberán estar supeditados a los resultados que se
hayan obtenido de manera histórica; es decir, si una fuente arrojó data de valor en el
pasado, entonces será adecuado volver a utilizar dicha fuente.
Almacenar
Se deberá contar con soluciones de almacenamiento para corto y largo plazo.
Gobernar
El gobierno de data está referido a las políticas que manejan todos los 6 pasos anteriores
aquí descritos.
1.5.2 Inteligencia en un entorno Big Data
Según Sokol y Ames, doctores que colaboraron en una investigación realizada por IBM:
“La inteligencia de negocios se asegura con la extracción de características, contextualización y conocimiento de la situación, modelado predictivo y análisis de los datos” (IBM Redbooks 2013)
La extracción de características se refiere a la extracción de información de forma
estructurada de una fuente. En lo que a contextualización y conocimiento de la situación
refiere, no siempre más datos significan mayor inteligencia; los datos deben estar en un
16
contexto dado y deberemos saber de qué tratan y qué podemos obtener de ellos. El
modelado predictivo tiene que ver con la predicción de eventos basada en data histórica
relacionada. Finalmente, el análisis de los datos tiene que ver con analizar cada dato que se
extraiga, buscar su relación con los demás y acomodarlo para que pueda proveer
información.
En resumen, las nuevas tecnologías de BI permitirán analizar grandes y variados volúmenes
de datos con costos razonables. Esto es de especial interés para el proyecto, pues el parque
automotor se hace cada vez más grande, y conviene ser cautos con la data a tratar para
arrojar resultados coherentes y en tiempos adecuados.
CAPÍTULO 2
17
TRATAMIENTO DE INFORMACIÓN Y USO DE SERVICIO BIG DATA
2.1 Análisis de información de las herramientas de inteligencia de negocios
Los datos obtenidos y procesados con el servicio Big Data, de la manera que se expuso en
el capítulo anterior, nos sirvió como referencia para entender la importancia que tienen los
datos en una aplicación práctica dada, como es el caso del tránsito vehicular. Ahora bien, en
tiempos de innovación, se propone la creación y uso de una plataforma integrada de
inteligencia de negocios y de Big Data13. La razón de esto tiene que ver con que la
integración entre ambas tecnologías nos va a asegurar una fuente de datos confiables, lo
que a su vez redundará en sistemas con las mismas características. Para la integración de
datos estructurados y no estructurados se deben combinar soluciones de tecnología que
permitan el depósito de ambos tipos de datos; en ese sentido, IBM refiere:
“En la capa de almacenamiento de depósito de datos, Netezza es una gran opción para su sistema de base de datos de MPP. Este sistema está equipado para los datos estructurados, pero cuando usa Hadoop o Cassandra para datos sin estructura o semiestructurados es posible crear una plataforma integrada de BI y analítica de big data” (IBM Developer Works 2013)
De esta manera, se asegura que la solución Big Data cuente con datos estructurados y datos
que no lo son, como objetos sin estructura uniforme, ya sea texto, audio, video, datos de
sensores, fotopapeletas14, información sobre el clima, placas de los autos, publicaciones en
redes sociales, señales de GPS de teléfonos móviles, etc.
13 Cfr. IBM Developer Works 201314 Las fotopapeletas son multas aplicadas a los vehículos por transitar a velocidades no permitidas.
18
El análisis de toda la información relativa a los puntos mencionados líneas arriba nos
ayudará a indagar sobre problemas del tráfico e incluso se podrían mitigar riesgos, pues se
cuenta con diversas fuentes de información relevante en comparación a las bases de datos
típicas o relacionales que sólo contemplan datos estructurados, como texto o cadenas de
caracteres que no ayudan mucho. Esto significa que, claramente, nos encontramos al frente
de una oportunidad para realizar análisis de mayor complejidad, ya que contamos con más
fuentes de información de calidad que, al interpretarlas de manera inteligente, podremos
sacarles provecho.
2.1.1 Servicio de entrega de información de Big Data
Un servicio de entrega de información Big Data especializado provee información de
tráfico, data histórica sobre rutas determinadas, mapas con el volumen de tráfico en un
momento dado, velocidades de los autos, condiciones de la carretera y otros tipos de
información sobre el tráfico que se haya registrado antes o incluso que se esté registrando
en el presente.15
La figura 2 nos muestra un despliegue asociado a una solución Big Data, donde se puede
apreciar la manera en la que se obtienen los datos desde diversas fuentes, tales como
dispositivos móviles de conductores o peatones, información de servicios telemáticos que
registren el número de autos que circulan por un lugar en una hora dada y a una velocidad
determinada o incluso de otras fuentes como lo son redes sociales.
Figura 2: Diagrama de una solución Big Data
15 Cfr. Green Car Congress 2013
19
Fuente: Green Car Congress 2013
Los vehículos que cuenten con equipos de telemática; es decir, que envíen mensajes con
información sobre el vehículo (marca, modelo, velocidad, equipamiento) constituyen
información valiosa en la medida que, además de aplacar el tráfico, puede reflejar el nivel
socioeconómico de la persona que lo conduce. Una gran cantidad de vehículos que fluyan
por una avenida dada y que tengan características de pertenecer a gente de clase media,
podrán alimentar la idea de colocar publicidad relacionada a su estilo de vida en lugares
aledaños. Otra forma de usar la información de marca y modelo es, si por ejemplo, se
identifican muchos camiones grandes que circulan por una ruta determinada. Esto
propiciará tomar medidas en cuanto a desvíos, planes de reordenamiento del tránsito o
incluso podría hacer pensar al gobierno en la construcción de nuevas carreteras. Datos del
tipo estructurado como marca, modelo, velocidad son tan útiles como los datos no
estructurados, y no deberá subestimarse la capacidad de aporte de cada uno de estos.
2.1.2 Soluciones de Inteligencia de Negocios para tráfico y accidentes
20
La información obtenida por los medios ya descritos es de suma utilidad para gobiernos y
empresas que, al contar con dicha información, podrían ayudar a aliviar el tráfico e incluso
conocer la ubicación de lugares seguros o de asistencia médica en caso de desastres
naturales.
Todos los datos obtenidos deben ser aprovechados al máximo; por ejemplo, conocer qué
porcentaje de autos que cuente con sistema de ABS16 permite manejar ese dato para luego
establecer una relación entre dicha métrica medida en una ruta y compararla con la tasa de
accidentes en ese mismo camino; por otro lado, se puede conocer si los conductores de
vehículos que transiten por un lugar en el que haya ocurrido un siniestro cuentan con un
Smartphone, lo que ayudaría a indicarles por medio de una aplicación los lugares de
evacuación más cercanos, así como equipos de rescate que pudiesen estar disponibles. Otro
dato de interés (del tipo no estructurado) para aliviar el tráfico serían las imágenes de los
lugares con más tráfico que sean compartidas por conductores que cuenten con un
Smartphone o Tablet, de manera que los potenciales interesados (la municipalidad, por
ejemplo) puedan enviar refuerzos como policías de tránsito para aliviar la carga vehicular.
Es claro que el procesamiento de los datos antes de ser utilizados es de suma importancia.
Por ese motivo, los datos se cargan en una solución de inteligencia de negocios, de manera
que se filtren para que sean utilizados únicamente los datos que serán luego información
con integridad, oportunidad y disponibilidad pertinentes.
16 Sistema Antibloqueo de Frenos (o ABS por sus siglas en inglés), que sirve para impedir el bloqueo de las llantas en una frenada fuerte, lo que podría causar accidentes al perderse estabilidad. Referencia
21
En conclusión a este punto, la información debidamente recogida por una solución de Big
Data y tratada con herramientas de inteligencia de negocios mejora la calidad de vida de las
personas y alivia accidentes por los motivos ya expuestos.
2.2 Uso del servicio de Big Data mediante dispositivos móviles y computadoras
2.2.1 Características de Big Data en móviles
El servicio de entrega que se detalló da cuenta de la forma en la que por medio de
información recibida en grandes cantidades y por distintos usuarios, se logra alimentar el
servicio de información Big Data con el propósito de aliviar el tráfico o de asistir zonas en
las que haya ocurrido algún tipo de siniestro. En la figura 3 se muestra la aplicación móvil
de Twitter, en la que se aprecia cómo los usuarios colaboran informando sobre las zonas de
mayor tráfico. En este caso, los tweets17constituyen un dato del tipo no estructurado y son
relativamente nuevos para ser tratados en una base de datos con una solución de
inteligencia de negocios.
Este tipo de información resulta útil pues es obtenido en tiempo real y se puede procesar
para tomar acciones de inmediato, como aliviar el tránsito; o bien a mediano o largo plazo,
para proponer soluciones, arreglar las pistas, colocar semáforos donde sea propicio o tomar
otras medidas como las que se propusieron en el punto previo.
Figura 3: Aplicación móvil que informa sobre el estado del tráfico
17 Un tweet es un mensaje corto y de cualquier tipo que se publica en la red social Twitter. Referencia
22
Fuente: Twitter 2013
Es bastante común que la gente opine sobre temas sociales y políticos; entonces, ¿por qué
no aprovechar lo que la gente opine sobre el tráfico vehicular? Los tweets en mención
logran funcionar como una encuesta que se realiza de manera permanente con la finalidad
de conocer los sitios con mayor congestión de vehículos en la ciudad. Estos mensajes de
corta extensión también informan sobre accidentes vehiculares, temblores, sugerencias de
atajos y otros consejos que pueden ser de gran ayuda a los ansiosos conductores de la
ciudad. Además de ser consumida esta información por otros conductores, también forman
parte de un gran conjunto de datos no estructurados que podrán ser tratados por el servicio
de información de Big Data para procesarse con herramientas de inteligencia de negocios.
23
2.2.2 Información y equipos inteligentes
Un tipo de información que muchas veces la gente ignora está relacionada con las obras en
las autopistas o eventos como conciertos o ferias que se van a llevar a cabo.18
Circunstancias eventuales como esta generan mucho tráfico por la gran afluencia que
dichos eventos suelen tener. Un servicio de información que se alimente de fuentes que
indiquen la mayor cantidad de causas que provoquen congestión vehicular es preciso para
el diagnóstico y alivio de esta.
Otros datos del tipo no estructurado también son de gran utilidad cuando son captados por
el servicio de información de Big Data. Hay ciertos tipos de data que pueden o no ser
obtenidos por colaboración de los usuarios: el volumen del tráfico puede ser captado por
cámaras de seguridad; sin embargo, algunos detalles o datos son mejor interpretados
cuando una persona describe algún fenómeno en especial que pudiese estar ocurriendo y
generando tráfico.
Sea cual fuere el motivo del tráfico, la idea de la inteligencia de negocios radica en utilizar
técnicas y herramientas de minería de datos para detectar patrones que permitan explicar y
hasta predecir el comportamiento del tráfico, ya sea para evaluar cuando habrá mayor o
menor congestión, o para obtener información nueva e interesante para los clientes de la
solución. El gobierno funciona como cliente en la medida que consumiría información
obtenida por medios innovadores y con un tratamiento inteligente de la data recolectada.
Por otro lado, diversas empresas que anuncien en la vía pública también funcionarían como
clientes, siempre y cuando se logre brindar una información objetiva y suficiente sobre las
características de conductores que circulen por una vía determinada de la ciudad: sucede
18 Cfr. Siemens AG 2013: 6
24
que todos los conductores son potenciales clientes de algún bien o servicio que se ofrezca
en carteles, y con mayor razón si es que el producto en promoción coincide con sus
preferencias.
2.2.3 Pago mediante teléfonos móviles
La tendencia en cobro de tarifas de peaje está orientada al uso de tarjetas recargables o
incluso de los teléfonos móviles, con lo que se agilizaría el proceso de pagar el peaje y se
evitarían costos derivados de la recaudación de dicho gravamen.19 Lo mismo ocurre con los
estacionamientos: un sistema de cobro automático evitaría colas a la entrada y salida de
locales de aparcamiento de autos.
Lo importante en la posibilidad de la proliferación de estas tecnologías es que se tiende a
reducir tiempos de espera y costos de recursos humanos, a la vez que se realizan esfuerzos
constantes para llevar a cabo una reingeniería de todos los procesos de una empresa a fin de
hacer al negocio más eficiente y cómodo para los usuarios. Podrán considerarse además
otras formas de cobrar de manera más rápida el peaje o los estacionamientos. Dado que el
uso de dispositivos móviles con acceso a datos es cada vez más difundido, se podría tomar
el número de teléfono como otra entrada en la tabla de la base de datos asociada a un
automóvil o conductor, para así relacionar el pago de servicios con una persona.
Adicionalmente, podrá estudiarse cuál fue el estacionamiento más usado, por cuánto
tiempo, cuántas veces se paga el peaje por semana, etc. Otra forma de realizar la cobranza
podría ser con la utilización de sistemas de reconocimiento de placas; las que, obviamente,
estarán almacenadas en una base de datos para poder corroborar si es que están o no
afiliadas a los servicios de pago adelantado de peajes o estacionamientos.
19 Cfr. Siemens AG 2013: 6
25
En conclusión, los dispositivos móviles brindan la posibilidad de enviar información al
servicio de Big Data y, por otro lado, permiten también el acceso a la información con
mayor rapidez. Finalmente, observamos que el uso de estas tecnologías mejoran los
procesos cotidianos que generan tráfico, como lo es el pago del peaje.
26
CONCLUSIONES
Grandes cantidades de información requieren ser tratadas de manera especial con
herramientas de tecnología apropiadas, como lo es Big Data.
En la implementación de una solución Big Data, es preciso escoger adecuadamente
los recursos lógicos y físicos que serán utilizados. En el aspecto físico, es
recomendable utilizar clústeres de computadoras (o conjunto integrado de equipos
de cómputo) de manera que la carga de trabajo sea distribuida y se pueda procesar
la información en tiempos adecuados. En el aspecto lógico, se recomienda el uso de
la base de datos de Oracle NoSQL, en la medida que esta ofrece estructuras simples
y dinámicas que son flexibles frente a cambios. Otras tecnologías sugeridas son
Hadoop, eficiente gestor de sistemas de archivos y otras soluciones que permiten el
análisis estadístico de datos y la minería de estos (o el descubrimiento de patrones
en conjuntos de datos).
La entrega de servicio de Big Data es de utilidad para muchos agentes interesados,
de manera que el proyecto puede funcionar como idea de negocio para clientes
como municipalidades o empresas privadas interesadas en el análisis del tráfico
vehicular y factores relacionados a este.
27
Una solución de Big Data se vale de siete pasos fundamentales en el tratamiento de
la información, que son: recolectar, procesar, gestionar, medir, consumir, almacenar
y gobernar.
En soluciones de Big Data, es propicio contextualizar los datos a tratar, así como
tener conocimiento de los mismos, ya que de esa manera se podrán tomar decisiones
mejor informadas sobre la información que se quiere obtener de los datos
recolectados.
Un servicio de entrega de información de Big Data logra captar información de
diversas fuentes para almacenarlas y tratarlas según sea conveniente. Todas las
fuentes deben ser consideradas como importantes, y toda información del pasado y
del presente se podrá utilizar para analizar el tráfico y predecirlo en un futuro.
La información obtenida en el servicio de Big Data sirve para analizar el
equipamiento de seguridad de automóviles y relacionarlo con las tasas de
accidentes, también para obtener la ubicación de accidentes y enviar ayuda, así
como los usuarios podrán enviar tweets o imágenes de las zonas con tráfico para
aliviarlo de inmediato, proponer soluciones a mediano o largo plazo (en forma de
propuestas del gobierno) e incluso para estudiar las causas de la congestión
vehicular.
28
La información obtenida por cada usuario por el servicio Big Data para ser
procesada y utilizada funciona como una encuesta, ya que cada vehículo representa
una incidencia sobre los lugares con más tráfico.
La información obtenida por el servicio Big Data deberá ser oportunamente
procesada por herramientas de inteligencia de negocios, con la finalidad de detectar
patrones en el comportamiento del tráfico y poder proponer soluciones. Causas
como obras en las vías y la realización de eventos de gran escala pueden generar
congestión vehicular.
El cobro tradicional de peajes y otros procesos cotidianos a estudiar son causantes
de tráfico vehicular, por lo que es recomendable utilizar tecnologías como el cobro
automático de las tarifas por medio de equipos relacionados con teléfonos
inteligentes o tarjetas recargables.
En conclusión, diversas fuentes colaboran con la obtención de información para la
identificación de las causas del tráfico; las que podrán ser tratadas por el gobierno si
así se decide. Dicha información estará compuesta por datos tanto estructurados
como no estructurados, pudiendo componerse por tweets, imágenes, monitoreo del
tráfico o videos. Cada reporte independiente de los conductores será analizado con
herramientas adecuadas de inteligencia de negocios, de manera que se puedan
detectar patrones para la posterior propuesta de soluciones. En conclusión, diversos
fenómenos o eventualidades pueden ser las causas de la congestión vehicular que se
observa a diario, por lo que será propicio atender cada incidencia con la importancia
29
que se merece para poder proponer soluciones basadas en tecnología como el uso de
servicios telemáticos o una comunicación que facilite la identificación de las causas,
a fin de evitarlas o mitigar el efecto de las mismas.
30
BIBLIOGRAFÍA
CISCO (2013) Cisco UCS with StackIQ Solution: Deliver Big Infrastructure for Big Data (consulta: 25 de setiembre) (http://www.cisco.com/en/US/solutions/collateral/ns340/ns517/ns224/ns944/whitepaper_c07-727919.html)
DYCHE, Jill (2012) The seven steps of big data delivery (consulta: 25 de setiembre de 2013) (http://www.sas.com/news/sascom/big-data-delivery.html)
GREEN CAR CONGRESS (2013) Toyota to launch new “Big Data Traffic Information Service” in Japan (consulta: 25 de setiembre) (http://www.greencarcongress.com/2013/05/tmc-201230529.html)
IBM Developer Works (2013) Analítica de inteligencia de negocios de Big Data (consulta: 30 de octubre) (http://www.ibm.com/developerworks/ssa/library/ba-big-data-bi/)
IBM Redbooks (2013) Analytics in a Big Data Environment (consulta: 25 de setiembre) (http://www.redbooks.ibm.com/redpapers/pdfs/redp4877.pdf)
IBM The Big Data Hub (2013) Sitio web oficial de IBM, contiene información sobre Big Data y enlaces de interés (consulta: 25 de setiembre) (http://www.ibmbigdatahub.com/whitepapers)
LARSON, Eric (2013) 5 Big Data Projects That Could impact Your Life (consulta: 25 de setiembre) (http://mashable.com/2013/07/17/big-data-projects/)
ORACLE (2013) Oracle: Big data for the Enterprise (consulta: 25 de setiembre) (http://www.oracle.com/us/products/database/big-data-for-enterprise-519135.pdf)
PING FUNG, Han (2013) Using Big Data Analytics in Information Tchnology (IT) Service Delivery (consulta: 25 de setiembre)
31
(http://www.academia.edu/3567945/Using_Big_Data_Analytics_in_Information_Technology_IT_Service_Delivery)
SIEMENS AG (2013) “Soluciones inteligentes para el tráfico de hoy y del mañana” (consulta: 25 de setiembre) (https://www.swe.siemens.com/spain/web/es/industry/mobility/Documents/traffic.pdf)
TWITTER (2013) “Tráfico RPP” (consulta: 31 de octubre) (https://twitter.com/traficorpp)
32