Upload
truonglien
View
217
Download
0
Embed Size (px)
Citation preview
La Utilidad del Big Data para la Planeación y Medición de las
Políticas Públicas en el Estado de México
Manzanillo, ColimaMayo 30, 2019
2º Foro de Estadística y Geografía para Estados y MunicipiosINEGI
Alberto L. Peredo Jiménez
Instituto del Informacion e Investigación Geográfica, Estadística y Catastral del Estado de México (IGECEM)
1. Mandato de IGECEM
2. ¿Qué es el Big Data?
3. La Utilidad del Big Data para la Planeación y Medición:
Algunos ejemplos
4. Diseminación de Datos y su Impacto en la Re-valuación
Catastral
5. Minería de Datos para el Monitoreo de Diabéticos-
Complicados de Alto Costo
6. Inteligencia Artificial para la Prevención del Crimen
7. Minería de Datos e Inteligencia Artificial para la Detección
del Cáncer de Mama
8. Conclusiones
Contenido
2
El Instituto de Investigación Geográfica, Estadística y Catastral
del Estado de México (IGECEM), al cubrir a una población de
17 M, representa como Dependencia Pública un caso
particular.
Hasta donde sabemos existen solo otras dos
entidades federativas –-Tamaulipas y Campeche— que
reúnen bajo el mandato de un único Instituto Estatal a las
Direcciones de Geografía, Estadística y Catastro.
Lo anterior representa para el IGECEM una oportunidad
ineludible para aprovechar la capacidad de compilación de
información para promover un mayor y mejor desarrollo del
Estado.
1. Mandato del IGECEM
3
El mandato del IGECEM incluye requerimientos vinculantes de
información a las Dependencias en el Estado.
Lo cual abre la posibilidad de un repositorio único, confiable y
con capacidad para hacer Alianzas Estratégicas para el diseño de
políticas públicas bajo un contexto de colaboración efectiva.
Partimos de la premisa de que con datos es posible: detectar y
diagnosticar problemas; presupuestar e identificar
oportunidades de ahorro y mejor asignación de recursos
públicos; y evaluar y medir el desempeño.
Los datos permiten planear, prevenir y mejorar.
1. Mandato del IGECEM
4
La relevancia del Big Data nació con el siglo XXI.
Las organizaciones nacidas alrededor del Big Data fueron:
Google, Amazon, Facebook y LinkedIn, entre otras.
Al igual que otras innovaciones tecnológicas, el Big Data
conlleva a mejoras sustanciales en la velocidad para
realizar tareas computacionales, lo cual resulta en
reducciones significativas en costos y en una vinculación
masiva y permanente con clientes y usuarios, al estar
promoviendo una retroalimentación instantánea y
permanente.
2. ¿Qué es el Big Data?
5
El Big Data se describe usualmente a partir de las 3 V´s:
• Volumen
• Velocidad
• Variedad
Volumen: Se refiere a la cantidad de datos generados.
“Del nacimiento de la civilización al año 2003 la
humanidad generó 5 exabytes* de datos.
Hoy se producen 5 exabytes cada 2 días.”
2. ¿Qué es el Big Data?
6
Fuente: Eric Schmidt, CEO Google
* Un exabyte son: 1018 bytes.
Velocidad: Se refiere a la rapidez con la que se generan nuevos
datos y con la que estos se mueven de un lado a otro.
Hoy, la tecnología permite analizar datos al momento en el que se
generan sin tener que almacenarlos en un repositorio propio.
Variedad: Se refiere a los distintos tipos de información
disponibles.
En el pasado, el enfoque era en datos alfanuméricos,
almacenables en bases de datos relacionales.
Hoy, el 80% de los datos son no-alfanuméricos:
texto, imágenes, video, voz, etc. Y las herramientas
del Big Data permiten integrar y analizar
información de distintos tipos.
2. ¿Qué es el Big Data?
7
Herramientas del Big Data para analizar la información.
• Minería de Datos
• Inteligencia Artificial
Minería de Datos: Se refiere al filtrado de la información para
identificar grupos con características comunes. Útil en políticas de
mercadeo, de precios o públicas enfocadas a grupos vulnerables.
Inteligencia Artificial: Se refiere a la explotación de los datos
mediante la estimación de modelos predictivos cuyos parámetros
se actualizan con base en la nueva información que retroalimenta
al sistema.
2. ¿Qué es el Big Data?
8
Las Secretarías y Dependencias estatales y municipales, en
el ejercicio de su operación cotidiana, acumulan gran
cantidad de información referente a distintos aspectos de
la ciudadanía.
El Big Data demuestra su utilidad cuando los registros
operativos así capturados son analizados para conocer las
condiciones y conductas ciudadanas susceptibles de
mejora.
Asimismo, dichos datos --capturados en la operación--
sirven para medición y para el modelaje y eventual diseño
de las políticas públicas.
3. La Utilidad del Big Data para la Planeación y Medición
9
El mandato del IGECEM lo posiciona idealmente para jugar el rol
de compilador e integrador de la información proveniente de los
registros operativos.
Para esto, el IGECEM debe contar con la habilidad para gestionar
Alianzas Estratégicas con las Dependencias Estatales y
municipales.
El IGECEM debe tener asimismo, la capacidad técnica de
almacenaje y manipulación de la información para su
explotación.
A continuación citamos algunos ejemplos en los cuales el
IGECEM, puede contribuir con el uso de Big Data al diseño y
medición de las políticas públicas en el Estado de México:
3. La Utilidad del Big Data para la Planeación y Medición
10
La información geográfica, estadística y catastral debe poderse integrar de
forma que el público usuario tenga acceso a una visualización espacial que
converja hasta el nivel del registro catastral.
Lo anterior dotaría al usuario y a los gobiernos municipal y estatal, de un
cúmulo de datos referentes al área conurbada que contenga información
sobre:
• El perfil socio-económico de los habitantes,
• El balance de género y los grupos etarios preponderantes,
• La dispersión comercial e industrial,
• La oferta de servicios públicos tales como: escuelas, espacios culturales y oferta
cultural, centros de salud, y centros de atención al adulto mayor, etc.
Este ejercicio de minería de datos segmenta información por localidad
sobreponiendo filtros adicionales definidos por el usuario desplegando las
características y la oferta de servicios en el entorno del registro catastral.
La diseminación de información genera tráfico, causando un impacto en el
desarrollo, en la plusvalía del entorno y en la recaudación tributaria.
4. Diseminación de Datos y su Impacto en la Re-valuación Catastral
11
Partiendo de registros del expediente clínico se obtiene un listado de usuarios
del sistema de salud estatal diagnosticados con Diabetes Mellitus tipo 2.
Cruzando esta información con el parte de atención hospitalaria, se detecta al
subgrupo de diabéticos que han sufrido complicación por la enfermedad
derivando en estancia en cama de hospital.
Como último paso—y con base en los registros hospitalarios—se filtra al
conjunto de diabéticos-complicados cuya intervención ha transcurrido por sala
de hemodinamia por complicación cardiovascular.
El listado resultante de pacientes diabéticos-complicados constituye el grupo focal sobre el
cual se diseña una estrategia de monitoreo del nivel de glucosa en sangre, con objeto de
prevenir complicaciones subsecuentes, cuyo costo asociado resulta muy elevado.
Determinándose la erogación por paciente en las decenas de miles de pesos—y
dadas las probabilidades de ocurrencia de eventos extremos—el programa
resulta viable desde la perspectiva de la planeación anual del sistema de salud.
5. Minería de Datos para el Monitoreo de Diabéticos Complicados de Alto Costo
12
Este proyecto se concentra en la explotación de información sobre denuncia
del delito, así como de los registros de persecución y procesamiento
criminal.
El objetivo es mejorar la capacidad de la autoridad competente para incidir
en la prevención del crimen a través de programas focalizados, con un
componente eminentemente geográfico.
El grupo focal de interés se define a través de un modelo predictivo (que se
obtiene con sistemas de información geográfica y con estadísticas) que perfila
al individuo propenso a cometer un delito.
La retroalimentación del modelo con base en nuevas denuncias, así como en
procesos judiciales recientes, afinaría la capacidad del modelo para detectar
individuos en riesgo y de la autoridad para ejercer acciones preventivas.
La información dotaría a la Secretaría de Seguridad y a la Fiscalía del Estado
de elementos para el diseño de programas de acción concentrados en
polígonos que cumplen con el perfil de zonas propensas al delito.
6. Inteligencia Artificial para la Prevención del Crimen
13
El proyecto parte de la definición del grupo objetivo de mujeres susceptibles
a contraer cáncer de mama.
Una vez definido dicho grupo, se canaliza a las mujeres que conjuntan los
factores de riesgo a la toma de la mastografía.
El proyecto se enfoca en el análisis comparativo de la mastografía, la cual se
envía vía internet a un repositorio donde un mecanismo avanzado de
imagenología (IA) la compara con una biblioteca de imágenes.
El objetivo es la segmentación de falsos positivos, lo cual reduce
significativamente la carga de trabajo del médico radiólogo y mejora su
productividad para detectar el padecimiento.
Una vez analizada la mastografía y concluido el proceso de diagnóstico, cada
imagen es añadida a una biblioteca de imágenes retroalimentando el acervo
y enriqueciendo la capacidad de segmentación del procedimiento de
imagenología comparativa.
7. Minería de Datos e Inteligencia Artificial para la Detección de Cáncer de Mama
14
Como instituto de información e investigación estatal, el IGECEM reúne
todos los elementos necesarios para coadyuvar con las Dependencias
Estatales en la planeación y medición de las políticas públicas en el Edomex.
El IGECEM tiene la encomienda de alcanzar el potencial máximo de “alianzas
estratégicas” para integrar a la información geográfica, estadística y de los
registros administrativos de todas las Dependecias del Estado. Se requiere
lograr a plenitud las “alianzas estratégicas” necesarias.
El rango de acción del Instituto es amplio al estar vinculado con todas y cada
una de las Dependencias del Estado que diseñan y ejecutan programas en
pos del desarrollo económico y social de la población mexiquense.
La integración de los repositorios de datos y la explotación de las
herramientas vigentes es una tarea prioritaria de la presente Administración
Estatal. Estamos trabajando en ello para lograr una mejor medición y diseño
las políticas públicas.
8. CONCLUSIONES
15