View
9
Download
0
Category
Preview:
Citation preview
Protocolo deDatos Abiertos
Dirección General de Proyectos de Ciudad inteligente y Gobierno abierto
Subsecretaría de Innovación y Ciudad lnteligente.Ministerio de Modernización, Innovación y Tecnología.Gobierno de la Ciudad de Buenos Aires.
¿Cómo surge la iniciativa?
Misión, visión y valores.
¿Qué es el portal de datos abiertos?
¿Cuál es el proceso de creación de un dataset?
¿A qué iniciativa responde?
¿Cuál es la vinculación con los usuarios?
Beneficios de los datos abiertos.
Algunas definiciones.
¿Cómo está conformado?
Tratamiento de datos personales.
03
05
10
02
03
09
06
Índice
¿Cómo surge la iniciativa? El portal de datos abiertos (data.buenosaires.gob.ar) es una iniciativa que comenzó en 2012 en
la Ciudad de Buenos Aires mediante la sanción del Decreto 156/12 con el objetivo de favorecer
la transparencia de la administración pública. Con la posterior sanción del Decreto 478/13 el
Ministerio de Modernización, Innovación y Tecnología se establece como encargado de
publicar en el portal todos los datos producidos a través de medios digitales por las distintas
áreas de gobierno, con excepción de aquella información que esté excluida por normas
específicas. Además se establece la obligación de todos los Ministerios, Secretarías, Organismos
Descentralizados y Entidades Autárquicas del Gobierno de la Ciudad a presentar un Plan de Datos Abiertos donde se explicite un cronograma de publicación gradual de información en los
formatos correspondientes.
Actualmente la Gerencia Operativa de Datos Abiertos perteneciente a la Dirección General de Proyectos de Ciudad Inteligente y Gobierno Abierto de la Subsecretaría de Innovación y Ciudad Inteligente es la encargada de gestionar el portal de datos abiertos y asesorar a las
diferentes áreas en la tarea.
I Protocolo de Datos Abiertos 02
Misión, visión y objetivos del portal de datos
abiertosMisión
Visión
La misión del Portal de Datos Abiertos es ser un
canal de comunicación entre las múltiples áreas que
conforman el Gobierno de la Ciudad y los ciudadanos.
A través de la publicación de datos en formato abierto
se busca transparentar la gestión pública, empoderar
a los ciudadanos con información y fomentar la
participación y la opinión pública. Asimismo se busca
presentar análisis comunicacionales para ejemplificar
posibles lecturas de los datos.
El gobierno debe ejecutar políticas públicas de manera
transparente y ser proactivo en la publicación de
información de su gestión. Para ello se propone un
portal de datos con información completa, consistente
y exhaustiva que se encuentre alineada con los
requerimientos ciudadanos y los compromisos de la
Ciudad de Buenos Aires
I Protocolo de Datos Abiertos 03
ObjetivosEL PORTAL DE DATOS ABIERTOS TIENE COMO OBJETIVO CONCRETAR LAS INICIATIVAS DE GOBIERNO ABIERTO QUE LLEVA A CABO LA CIUDAD DE BUENOS AIRES A TRAVÉS DEL TRABAJO CON OTRAS ÁREAS.
EN CUANTO A LOS OBJETIVOS ESPECÍFICOS EL PORTAL DE DATOS ABIERTOS BUSCA:
En relación a la administración pública:Visibilizar el trabajo de las diferentes áreas
de gobierno.
Ejecutar iniciativas de Gobierno Abierto.
Potenciar el uso de los datos públicos.
Cumplir con la Agenda de Transparencia.
En relación a la ciudadanía:Dar a conocer iniciativas privadas basadas
en datos abiertos.
Involucrar a los ciudadanos mediante
la participación.
Promover el desarrollo económico a través
de datos públicos.
Impulsar el análisis y la opinión ciudadana a partir
de los datos.
Utilizar recursos didácticos para mejorar la
comprensión y la lectura de la información.
ValoresTodas las iniciativas de datos abiertos que lleva a
cabo la Ciudad de Buenos Aires están ancladas en
los principios del Gobierno Abierto tales como la
Transparencia, Rendición de Cuentas, Colaboración
y Participación Ciudadana.
Quienes conformamos el equipo de datos
abiertos creemos fielmente que la información
es empoderamiento y por ello buscamos
constantemente mejorar en términos de calidad y
cantidad, la información que se encuentra disponible
en el portal de datos abiertos. Para ello consideramos
crucial el compromiso de cada uno de los miembros
del equipo con las iniciativas de Gobierno Abierto.
Consideramos que para cumplir nuestra labor es
necesario estar atentos y dispuestos frente a las
necesidades tanto de los ciudadanos como del
gobierno para poder lograr, progresivamente, el
cambio cultural que requiere el gobierno abierto.
I Protocolo de Datos Abiertos 04
¿Qué es el portal de datos abiertos?
El catálogo de datos es una herramienta que fomenta
la transparencia, la colaboración y la reutilización de información por parte de la ciudadanía. Está
conformado por información de todos los ministerios
de la ciudad, organizada en diferentes conjuntos de
datos abiertos denominados datasets. Para permitir
la reutilización de la información se emplea el formato
dato abierto que implica que la información esté
dispuesta en formatos digitales, estándar y abiertos.
El portal no contiene datos estadísticos ni análisis sino
que se trata de un sitio que funciona como nexo entre
las múltiples áreas gubernamentales y el ciudadano.
Algunas definiciones: ¿Cómo está conformado?Los datasets en portales de datos abiertos
representan carpetas con información anexada.
Dentro de ellas se pueden encontrar uno o más
recursos que hacen referencia a las bases de datos
que lo componen. Un recurso puede ser generado
a partir de un archivo o un servicio web.
Para cumplir con los estándares internacionales
los datasets publicados deben estar alineados con
principios universales tales como: ser completos,
El catálogo de datos abiertos se encuentra
conformado por 190 datasets proporcionados por todos los Ministerios de la Ciudad de Buenos Aires. Cada uno contiene uno o más recursos asociados,
como la Guía de Datos que busca contextualizar
y describir la información que incluye cada recurso.
públicos, actualizados, accesibles, libres de todo
uso, no discriminatorios y no sujetos a licencias y/o
normativas específicas.
Además deben encontrarse en formatos específicos
como son el csv (valores separados por comas), XML
(lenguaje etiquetado extensible), RDF (infraestructura
para descripción de recursos), RSS (sindicalización
realmente sencilla), ODATA (open data protocol).
I Protocolo de Datos Abiertos 05
¿Cuál es el proceso de creación de un dataset?
PARA EL CONTACTO Y ASESORAMIENTO A LAS DIFERENTES REPARTICIONES DEL GOBIERNO EN LA CREACIÓN DE CONJUNTOS DE DATOS CON EL FORMATO CORRESPONDIENTE A LA INICIATIVA DE DATOS ABIERTOS, LA GERENCIA OPERATIVA DE DATOS APLICA EL SIGUIENTE PROTOCOLO:
1- Selección de Información: Los datasets que
conforman el portal pertenecen a todos los Ministerios
del Gobierno de la Ciudad y se originan a partir de
diversos motivos:
Incluir temas de la Agenda de Transparencia Compromisos de gobierno.
Formar parte de los Planes de Apertura por
Ministerio (como indica el decreto 478/13).
El área se acerca proactivamente a publicar
información.
Se encuentra dentro del Plan de Transparencia Activa.
Los usuarios solicitan nuevas aperturas
contactandose directamente a través de la
cuenta de Twitter del Laboratorio de Gobierno
(@LABgcba), el mail oficial (gobiernoabierto@
buenosaires.gob.ar), o a través del portal de datos
por el canal de comentarios o la asistente que
lleva a un formulario específico.
1Selecciona la info
3Privacidad de la info
Formato abierto
2Recibir y comprender
el universo
4
Cheqeo de calidad
7
Recepción de datos Calidad de datos
5 6
Asignación de categoríasy etiquetas
8Asignación de fuente
y productor
9
Visualizaciones
10Notificación
11Difusión
122 - Recepción y comprensión del universo de la información: antes de publicar los datos se hace
un primer contacto con el área en el que se solicita una
breve descripción de la información, usándola como
referencia para que el contenido del dataset y sus recursos,
5- Recepción de la base de datos: a esta instancia se
puede llegar vía mail o ser extraída de algún servidor
indicado por el área.
Los formatos de recepción de la información son:
CSV
XLS (que luego será transformado a formato CSV).
SHP
RAR
ZIP
3 - Privacidad de la información: en esta instancia
se evalúa que la información que se recibe no infringe
ninguna normativa relativa a datos personales y/o
sensibles. En caso de que ocurra, se procede a un
tratamiento especial de la información (Ver apartado
de Datos Personales).
4 - Formato abierto : en conjunto con el área productora
se establece la información necesaria para generar
el formato abierto en cada uno de los recursos que
conforman el dataset. Entre los pasos que componen
este punto se encuentran:
A- Nombre del dataset y de cada uno de los
recursos: Se buscar un nombre sencillo y que sea
representativo al contenido del dataset y de las
bases de datos.
B- Frecuencia de actualización: Se refiere a la
periodicidad con la cual el área envía información.
Se pacta teniendo en cuenta el movimiento de
los datos y siempre intentando que los plazos
sean lo más corto posibles. Un dataset podrá
tener recursos con diferentes frecuencias de
actualización. Actualmente éstas contemplan
desde diaria a bianual.
C- Descripción: Para facilitar la comprensión de
la información se le solicita al área que envíe una
breve descripción del dataset y de cada uno de los
recursos que explique en contexto la información.
Acá se incluye normativa que regule el tema,
aclaraciones específicas, sitios web de referencia,
entre otros puntos.
D- Descripción de las variables que componen los
recursos: Al igual que el punto anterior se solicita al
área que elabore una pequeña descripción de cada
uno de los campos que componen la base de datos
a publicar (en caso de que se trate de un archivo
CSV). Luego de ser procesados por el equipo de
datos estos se transformarán en la Guía de datos del
Recurso que acompaña a cada uno de los datasets.
1
2
3
sean claros procurando que cualquier ciudadano,
independientemente de su previo conocimiento en el
tema, se involucre con los datos abiertos.
Asimismo existen recursos que extraen información de APIs
o se conectan a Web Services. En estos casos el área envía la
ruta correspondiente para anexar al dataset.
6- Calidad de datos: se realizan procesos de análisis de
coherencia y consistencia de los datos. Dentro de ellos se
incluyen algunas de las siguientes operaciones:
Corroborar que la cantidad de registros sea coherente
con previas entregas.
Eliminar tildes, símbolos y transformar las bases
a mayúscula.
Asignar la codificación UTF8 sin BOM a todos
los archivos.
I Protocolo de Datos Abiertos 07
7- Chequeo de calidad: Una vez terminado el archivo
a publicar será enviado al área para confirmar que los
datos sean los correctos. Si todo cumple con lo pactado
el dataset será subido al portal conteniendo como
mínimo dos archivos que se identifican como Recursos.
Los mismos serán:
8- Asignación de Categorías y Etiquetas: Luego de
corroborar que la información sea consistente y esté
lista para la publicación, se le asigna al dataset una o más
categorías y etiquetas con el objetivo de que los usuarios
puedan buscar información sobre un área específica
mediante la ayuda del filtro.
Asimismo, existen algunos recursos que se publican en
otros formatos como son XML, RAR y SHP cuyo trabajo
se realiza de la misma forma que el CSV.
NOTA: Los puntos 6 y 7 se realizan únicamente cuando el archivo es recibido vía mail o a través de un servidor indicado por el área.
Verificar que no existan campos vacíos donde
corresponda completar información.
Asegurar que los formatos de las celdas sean
los correspondientes a los datos que allí se
contienen.
En el caso de archivos que cuenten con ejes de
coordenadas, se corrobora que las mismas se
encuentren bien geocodificadas para que se
pueda mapear la base de datos.
Normalizar las direcciones y agregar datos
de Código Postal, Código postal argentino,
barrio y comuna.
Normalizar los campos.
Actividad Económica.
Administración Pública y Normativa.
Ambiente.
Cultura y Turismo.
Educación.
Infraestructura y Obra Pública.
Movilidad y Transporte.
Salud y Servicios Sociales.
Seguridad.
Urbanismo y Territorio.
Guía de datos del Recurso (En formato PDF).
Un archivo, en su mayoría es CSV, que contenga
la base. En caso de que el dataset se encuentre
conformado por más de una base de datos estas
serán agregadas como nuevos recursos.
En cuanto a las etiquetas, éstas consisten en palabras
claves que ayudan a la hora de buscar información
dentro del sitio. Como ya se mencionó estas se asignan a
datasets y no a recursos.
Para conocer otra forma de cómo se puede estructurar la
información en formatos abiertos recomendamos consultar la “Guía
para la publicación de datos en formatos abiertos” producida por el
Ministerio de Modernización de la Nación en: http://paquete-apertura-
datos.readthedocs.io/es/stable/guia_abiertos.html
En el caso de archivos muy pesados las diferentes áreas envían la
información en formatos comprimidos para agilizar el proceso de
publicación. Asimismo cuando se trata de información que cuenta con
archivos de diferentes extensiones (como ser por ejemplo html, prj,
shp) también se envían de esta forma. Como ejemplo de esto último
podríamos citar el dataset Barrios.
Idem 2.
1
2
3
Las categorías disponibles son:
9- Asignación de la Fuente del Dato/Productor: dentro de la plataforma se asigna una organización que
figure como Fuente de la información. Ésta se encuentra
generalmente compuesta por información del Ministerio,
Secretaría (SEC) o Subsecretaría (SS) y Dirección General
(DG) a la que pertenece.
I Protocolo de Datos Abiertos 08
11- Notificación: una vez publicado el dataset con sus
respectivos recursos se envía un email al área para dejar
constancia de que el conjunto de datos ha sido publicado
y/o actualizado.
12- Difusión de la publicación: con el objetivo de
mantener informados a los usuarios se utiliza el canal
de Twitter (@LABgcba) para anunciar la actualización
o publicación de nueva información en el portal.
Usualmente se realizan publicaciones escritas o imágenes
representativas a la información.
10- Producción de Visualizaciones: una
vez finalizada la carga del recurso se elaboran
visualizaciones. Entre ellas, mapas y/o gráficos que
pueden ser realizados desde la misma plataforma o ser
embebidos de otro sitio web. Actualmente los mapas
embebidos pertenecen al repositorio de la Unidad de
Sistemas de Información Geográfica (USIG) y los gráficos
son realizados con herramientas de visualización tanto
internas como externas. Las mismas que se presentan
en el portal funcionan a modo de ejemplo para mostrar
cómo se pueden graficar los datos del recurso.
Existen casos en los que la fuente de información
no coincide con el Productor de la misma. Por
ejemplo, cuando se trata de un dataset que es posible
geocodificar, el productor será la Unidad de Sistemas
de Información Geográfica (USIG) y la fuente del dato
será el área que elabora la información. Los recursos de
un mismo dataset podrán tener diferentes fuentes de
información en caso de que los datos tengan origen en
diferentes áreas.
Tratamiento de datos personales
En el caso de que las bases contengan datos sensibles,
realizamos un tratamiento particular de la información
teniendo en cuenta la normativa existente sobre protección
de datos personales expresada en la Ley Nº 25.326.
En la misma, se establecen como datos personales la
información de cualquier tipo referida a personas físicas o
de existencia ideal determinadas o determinables. Por su
parte los datos sensibles son aquellos datos personales
que revelan origen racial y étnico, opiniones políticas,
convicciones religiosas, filosóficas o morales, afiliación
sindical e información referente a la salud o a la vida sexual.
La primera parte del proceso es la que ya se mencionó en
el apartado ¿Cuál es el proceso de creación de un dataset?,
aunque a la hora de realizar el proceso de Calidad de
Datos (ítem 6) se procede de la siguiente forma:
Existen casos en los cuales se encuentran publicados datos
como nombre, apellido y DNI porque se trata de datos que
ya están incluídos en un registro público, como es el caso de
los inspectores de las diversas reparticiones de la ciudad.
Aplicar técnicas de disociación para evitar la
identificación de la persona. Los datos que
habitualmente se eliminan son el nombre y
apellido de una persona aunque no excluye
anonimizar otro tipo de información pertinente.
Asignar un número de identificación (ID) para que
se entienda que se trata de información del mismo
sujeto aunque se desconozca quién es.
Realizar los procedimientos de calidad de datos como
cualquier otro dataset.
I Protocolo de Datos Abiertos 09
¿A qué iniciativa responde?
¿Cuál es la vinculación con los usuarios?Beneficios de los datos
abiertos
La política de datos abiertos del Gobierno de la Ciudad
responde a iniciativas transversales vinculadas al
paradigma del gobierno abierto y la transparencia. Entre
ellas, la presencia de la Ciudad de Buenos Aires en la
Alianza para el Gobierno Abierto, las políticas de
Transparencia Activa y las iniciativas de Modernización
e Innovación en la Gestión Pública. En este sentido, el
paradigma de los datos abiertos debe enmarcarse en
prácticas de gobierno que buscan afianzar la confianza
de los ciudadanos hacia el mismo, a través de la proactiva
rendición de cuentas de lo que se realiza dentro de la
administración pública. Asi como también en llevar a
cabo políticas públicas que puedan basarse en evidencias
y una gestión de la información que genere una mejora
en la calidad de los servicios públicos.
Los datos abiertos son una de las tantas herramientas
con las que cuenta el Gobierno de la Ciudad para
transparentar las actividades y acciones que realiza
y así generar confianza en la ciudadanía a través de
la rendición de cuentas. Asimismo, la publicación de
información representa un gran insumo para muchos
investigadores, periodistas, desarrolladores y otros
profesionales que buscan darle un valor agregado a
los datos que produce la ciudad. Es por ello que el área
de datos abiertos está en permanente contacto con
diversas ONGs, universidades y empresas que con sus
Muchas veces los pedidos de información que
se realizan a las diversas áreas de gobierno
provienen de compromisos de transparencia.
Otras, de los usuarios con los que el área de
datos tiene permanente contacto a través del
mail gobiernoabierto@buenosaires.gob.ar, vía Twitter (@LABgcba) o mediante el espacio de
sugerencias incluído en el portal. El área de datos
abiertos busca además de ampliar la cantidad
de datasets publicados, mejorar la calidad de la
información, haciéndola más sencilla e inclusiva
para una comunidad más amplia y participativa.
inquietudes y requerimientos que ayudan a aumentar la
calidad y cantidad de datos publicados.
La apertura también significa una oportunidad para el
Gobierno que puede beneficiarse del conocimiento de
los ciudadanos a partir de las iniciativas privadas que
surjan (como son las investigaciones o desarrollos de
aplicaciones). Asimismo es una gran herramienta para
poder emprender modelos de gestión cuyas decisiones
se encuentren basadas en datos ya que permite poner
en contacto a los diversos poderes y áreas de gobierno y
así fomentar la interoperabilidad dando como resultado
una mayor eficiencia en el funcionamiento de la
administración pública.
I Protocolo de Datos Abiertos 10
@labgcba @labgcba
gobiernoabierto@buenosaires.gob.ar
labgcba
Recommended