16
La Utilidad del Big Data para la Planeación y Medición de las Políticas Públicas en el Estado de México Manzanillo, Colima Mayo 30, 2019 2º Foro de Estadística y Geografía para Estados y Municipios INEGI Alberto L. Peredo Jiménez Instituto del Informacion e Investigación Geográfica, Estadística y Catastral del Estado de México (IGECEM)

Presentación de PowerPoint - inegi.org.mx La... · 3. La Utilidad del Big Data para la Planeación y Medición: Algunos ejemplos 4. Diseminación de Datos y su Impacto en la Re-valuación

Embed Size (px)

Citation preview

La Utilidad del Big Data para la Planeación y Medición de las

Políticas Públicas en el Estado de México

Manzanillo, ColimaMayo 30, 2019

2º Foro de Estadística y Geografía para Estados y MunicipiosINEGI

Alberto L. Peredo Jiménez

Instituto del Informacion e Investigación Geográfica, Estadística y Catastral del Estado de México (IGECEM)

1. Mandato de IGECEM

2. ¿Qué es el Big Data?

3. La Utilidad del Big Data para la Planeación y Medición:

Algunos ejemplos

4. Diseminación de Datos y su Impacto en la Re-valuación

Catastral

5. Minería de Datos para el Monitoreo de Diabéticos-

Complicados de Alto Costo

6. Inteligencia Artificial para la Prevención del Crimen

7. Minería de Datos e Inteligencia Artificial para la Detección

del Cáncer de Mama

8. Conclusiones

Contenido

2

El Instituto de Investigación Geográfica, Estadística y Catastral

del Estado de México (IGECEM), al cubrir a una población de

17 M, representa como Dependencia Pública un caso

particular.

Hasta donde sabemos existen solo otras dos

entidades federativas –-Tamaulipas y Campeche— que

reúnen bajo el mandato de un único Instituto Estatal a las

Direcciones de Geografía, Estadística y Catastro.

Lo anterior representa para el IGECEM una oportunidad

ineludible para aprovechar la capacidad de compilación de

información para promover un mayor y mejor desarrollo del

Estado.

1. Mandato del IGECEM

3

El mandato del IGECEM incluye requerimientos vinculantes de

información a las Dependencias en el Estado.

Lo cual abre la posibilidad de un repositorio único, confiable y

con capacidad para hacer Alianzas Estratégicas para el diseño de

políticas públicas bajo un contexto de colaboración efectiva.

Partimos de la premisa de que con datos es posible: detectar y

diagnosticar problemas; presupuestar e identificar

oportunidades de ahorro y mejor asignación de recursos

públicos; y evaluar y medir el desempeño.

Los datos permiten planear, prevenir y mejorar.

1. Mandato del IGECEM

4

La relevancia del Big Data nació con el siglo XXI.

Las organizaciones nacidas alrededor del Big Data fueron:

Google, Amazon, Facebook y LinkedIn, entre otras.

Al igual que otras innovaciones tecnológicas, el Big Data

conlleva a mejoras sustanciales en la velocidad para

realizar tareas computacionales, lo cual resulta en

reducciones significativas en costos y en una vinculación

masiva y permanente con clientes y usuarios, al estar

promoviendo una retroalimentación instantánea y

permanente.

2. ¿Qué es el Big Data?

5

El Big Data se describe usualmente a partir de las 3 V´s:

• Volumen

• Velocidad

• Variedad

Volumen: Se refiere a la cantidad de datos generados.

“Del nacimiento de la civilización al año 2003 la

humanidad generó 5 exabytes* de datos.

Hoy se producen 5 exabytes cada 2 días.”

2. ¿Qué es el Big Data?

6

Fuente: Eric Schmidt, CEO Google

* Un exabyte son: 1018 bytes.

Velocidad: Se refiere a la rapidez con la que se generan nuevos

datos y con la que estos se mueven de un lado a otro.

Hoy, la tecnología permite analizar datos al momento en el que se

generan sin tener que almacenarlos en un repositorio propio.

Variedad: Se refiere a los distintos tipos de información

disponibles.

En el pasado, el enfoque era en datos alfanuméricos,

almacenables en bases de datos relacionales.

Hoy, el 80% de los datos son no-alfanuméricos:

texto, imágenes, video, voz, etc. Y las herramientas

del Big Data permiten integrar y analizar

información de distintos tipos.

2. ¿Qué es el Big Data?

7

Herramientas del Big Data para analizar la información.

• Minería de Datos

• Inteligencia Artificial

Minería de Datos: Se refiere al filtrado de la información para

identificar grupos con características comunes. Útil en políticas de

mercadeo, de precios o públicas enfocadas a grupos vulnerables.

Inteligencia Artificial: Se refiere a la explotación de los datos

mediante la estimación de modelos predictivos cuyos parámetros

se actualizan con base en la nueva información que retroalimenta

al sistema.

2. ¿Qué es el Big Data?

8

Las Secretarías y Dependencias estatales y municipales, en

el ejercicio de su operación cotidiana, acumulan gran

cantidad de información referente a distintos aspectos de

la ciudadanía.

El Big Data demuestra su utilidad cuando los registros

operativos así capturados son analizados para conocer las

condiciones y conductas ciudadanas susceptibles de

mejora.

Asimismo, dichos datos --capturados en la operación--

sirven para medición y para el modelaje y eventual diseño

de las políticas públicas.

3. La Utilidad del Big Data para la Planeación y Medición

9

El mandato del IGECEM lo posiciona idealmente para jugar el rol

de compilador e integrador de la información proveniente de los

registros operativos.

Para esto, el IGECEM debe contar con la habilidad para gestionar

Alianzas Estratégicas con las Dependencias Estatales y

municipales.

El IGECEM debe tener asimismo, la capacidad técnica de

almacenaje y manipulación de la información para su

explotación.

A continuación citamos algunos ejemplos en los cuales el

IGECEM, puede contribuir con el uso de Big Data al diseño y

medición de las políticas públicas en el Estado de México:

3. La Utilidad del Big Data para la Planeación y Medición

10

La información geográfica, estadística y catastral debe poderse integrar de

forma que el público usuario tenga acceso a una visualización espacial que

converja hasta el nivel del registro catastral.

Lo anterior dotaría al usuario y a los gobiernos municipal y estatal, de un

cúmulo de datos referentes al área conurbada que contenga información

sobre:

• El perfil socio-económico de los habitantes,

• El balance de género y los grupos etarios preponderantes,

• La dispersión comercial e industrial,

• La oferta de servicios públicos tales como: escuelas, espacios culturales y oferta

cultural, centros de salud, y centros de atención al adulto mayor, etc.

Este ejercicio de minería de datos segmenta información por localidad

sobreponiendo filtros adicionales definidos por el usuario desplegando las

características y la oferta de servicios en el entorno del registro catastral.

La diseminación de información genera tráfico, causando un impacto en el

desarrollo, en la plusvalía del entorno y en la recaudación tributaria.

4. Diseminación de Datos y su Impacto en la Re-valuación Catastral

11

Partiendo de registros del expediente clínico se obtiene un listado de usuarios

del sistema de salud estatal diagnosticados con Diabetes Mellitus tipo 2.

Cruzando esta información con el parte de atención hospitalaria, se detecta al

subgrupo de diabéticos que han sufrido complicación por la enfermedad

derivando en estancia en cama de hospital.

Como último paso—y con base en los registros hospitalarios—se filtra al

conjunto de diabéticos-complicados cuya intervención ha transcurrido por sala

de hemodinamia por complicación cardiovascular.

El listado resultante de pacientes diabéticos-complicados constituye el grupo focal sobre el

cual se diseña una estrategia de monitoreo del nivel de glucosa en sangre, con objeto de

prevenir complicaciones subsecuentes, cuyo costo asociado resulta muy elevado.

Determinándose la erogación por paciente en las decenas de miles de pesos—y

dadas las probabilidades de ocurrencia de eventos extremos—el programa

resulta viable desde la perspectiva de la planeación anual del sistema de salud.

5. Minería de Datos para el Monitoreo de Diabéticos Complicados de Alto Costo

12

Este proyecto se concentra en la explotación de información sobre denuncia

del delito, así como de los registros de persecución y procesamiento

criminal.

El objetivo es mejorar la capacidad de la autoridad competente para incidir

en la prevención del crimen a través de programas focalizados, con un

componente eminentemente geográfico.

El grupo focal de interés se define a través de un modelo predictivo (que se

obtiene con sistemas de información geográfica y con estadísticas) que perfila

al individuo propenso a cometer un delito.

La retroalimentación del modelo con base en nuevas denuncias, así como en

procesos judiciales recientes, afinaría la capacidad del modelo para detectar

individuos en riesgo y de la autoridad para ejercer acciones preventivas.

La información dotaría a la Secretaría de Seguridad y a la Fiscalía del Estado

de elementos para el diseño de programas de acción concentrados en

polígonos que cumplen con el perfil de zonas propensas al delito.

6. Inteligencia Artificial para la Prevención del Crimen

13

El proyecto parte de la definición del grupo objetivo de mujeres susceptibles

a contraer cáncer de mama.

Una vez definido dicho grupo, se canaliza a las mujeres que conjuntan los

factores de riesgo a la toma de la mastografía.

El proyecto se enfoca en el análisis comparativo de la mastografía, la cual se

envía vía internet a un repositorio donde un mecanismo avanzado de

imagenología (IA) la compara con una biblioteca de imágenes.

El objetivo es la segmentación de falsos positivos, lo cual reduce

significativamente la carga de trabajo del médico radiólogo y mejora su

productividad para detectar el padecimiento.

Una vez analizada la mastografía y concluido el proceso de diagnóstico, cada

imagen es añadida a una biblioteca de imágenes retroalimentando el acervo

y enriqueciendo la capacidad de segmentación del procedimiento de

imagenología comparativa.

7. Minería de Datos e Inteligencia Artificial para la Detección de Cáncer de Mama

14

Como instituto de información e investigación estatal, el IGECEM reúne

todos los elementos necesarios para coadyuvar con las Dependencias

Estatales en la planeación y medición de las políticas públicas en el Edomex.

El IGECEM tiene la encomienda de alcanzar el potencial máximo de “alianzas

estratégicas” para integrar a la información geográfica, estadística y de los

registros administrativos de todas las Dependecias del Estado. Se requiere

lograr a plenitud las “alianzas estratégicas” necesarias.

El rango de acción del Instituto es amplio al estar vinculado con todas y cada

una de las Dependencias del Estado que diseñan y ejecutan programas en

pos del desarrollo económico y social de la población mexiquense.

La integración de los repositorios de datos y la explotación de las

herramientas vigentes es una tarea prioritaria de la presente Administración

Estatal. Estamos trabajando en ello para lograr una mejor medición y diseño

las políticas públicas.

8. CONCLUSIONES

15

¡MUCHAS GRACIAS!