41
Perfil Alianza Caoba Reporte técnico CAOBA - Universidad de los Andes ACUA-M-R-PerfilCaoba-P001 Julio 2017

PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza CaobaReporte técnico

CAOBA - Universidad de los AndesACUA-M-R-PerfilCaoba-P001Julio 2017

Page 2: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Índice

1. Introducción 3

2. Problemática 4

2.1. Características de los proyectos de Big data analytics y data Analytics . . . . . . . . 4

2.2. Perfiles existentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.3. Necesidad de un nuevo perfil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3. Antecedentes 6

3.1. Otras propuestas de perfiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

3.2. Metodología de ASUM de IBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.3. Taxonomía de Bloom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3.4. Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

4. Marco conceptual para el perfil Big data y Data Analytics 11

4.1. Fundamentos del marco conceptual . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

4.2. Formulación matemática del perfil . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

4.3. Perfil Núcleo - P0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.3.1. El núcleo del negocio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4.3.2. El núcleo en TI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4.3.3. El núcleo en analítica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.3.4. El núcleo en administración de proyectos . . . . . . . . . . . . . . . . . . . . 16

4.3.5. El núcleo transversal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.4. Perfil de Negocio - P1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.5. Perfil en TI - P2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4.6. Perfil en Analítica - P3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4.7. Perfil en Administración de proyectos - P4 . . . . . . . . . . . . . . . . . . . . . . . . 18

1

Page 3: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

5. Validación de la propuesta de los perfiles CAOBA 20

6. Formalsimo gráfico de representación de los perfiles CAOBA 21

6.1. Estrella de Bloom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

6.2. Los perfiles profesionales según la estrella de Bloom . . . . . . . . . . . . . . . . . . 21

6.3. Los perfiles Caoba según la estrella de Bloom . . . . . . . . . . . . . . . . . . . . . 24

6.3.1. Perfil Núcleo - P0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

6.3.2. Perfil de Negocio - P1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6.3.3. Perfil en TI - P2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

6.3.4. Perfil en Analítica - P3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

6.3.5. Perfil en Administración de proyectos - P4 . . . . . . . . . . . . . . . . . . . . 28

7. Uso del Perfil 29

7.1. Oferta de formación académica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

7.1.1. Cursos ofrecidos por la Universidad de los Andes . . . . . . . . . . . . . . . 29

7.1.2. Programas y Cursos ofrecidos por la Pontificia Universidad Javeriana . . . . 35

7.1.3. Programas y Cursos ofrecidos por la Universidad ICESI . . . . . . . . . . . . 37

7.2. Perfil para la demanda académica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

8. Conclusiones 39

CAOBA - Universidad de los Andes Página 2

Page 4: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Cuadro 1: Habilidades técnicas

Habilidades o capacidades técnicasMas importantes

para las empresasLas más difíciles

de encontrarAnalytics/Business Intelligence/Big Data/Data Scientist 47.1 % 46.1 %Data/Information Architecture 28.5 % 26 %Functional Area Knowledge 23.8 % 24.8 %Enterprise Architect 22.3 % 23.2 %Application/Solution Architecture 23.2 % 21.4 %

1. Introducción

Actualmente el mundo experimenta grandes cambios con el avance de las tecnologías de lainformación y la generación continua de datos. Esto ha creado nuevas oportunidades para los ne-gocios en temáticas como la analítica de datos (DA) y Big data (BD), para las cuales se requierenprofesionales con conocimientos y habilidades específicas, aplicados a determinados campos deacción.

La analítica vista como los procesos de transformación de datos en información, ha permeado lasociedad y está cambiando la forma de hacer negocios, la interacción entre personas, empresas,entre otras. En este nuevo contexto, el trabajo en equipo es un factor clave que ayuda en laefectividad de los proyectos.

El desarrollo de proyectos de analítica, en todas sus formas (desde la descriptiva hasta la pres-criptiva), es un reto y una tendencia a nivel mundial, donde las habilidades que se requieren paraestos perfiles son cada vez más difíciles de encontrar. Esto se evidencia en el estudio realizadopor SIM International & Leon Kappelman [10], en el cual se preguntó a 785 empresas acerca desus necesidades en el tema y la dificultad para encontrar esos recursos. El cuadro 1 muestra losporcentajes más relevantes, ordenado por su dificultad. Para el caso de Analytics/Businnes intelli-gence/Big data/Data Scientist se observa que es considerada para el 47 % de las empresas comouna de las habilidades técnicas más importantes y en un 46 % difícil de encontrar en los perfilesprofesionales. En contraposición por ejemplo, las habilidades en Application/Solution Architectureson importantes para el 23.2 % de las empresas, pero tienen sólo un 21.4 % de dificultad paraencontrarlas en el mercado laboral.

Así mismo, en el cuadro 2 se observa un listado de habilidades transversales que son requeridasen los perfiles que se están buscando y la dificultad para encontrarlas en el mercado, ordenadopor la dificultad. Para este caso, el 45.2 % de las empresas consideran el liderazgo como unade las más importantes y con un 43.8 % de las más difíciles de encontrar; un 17.2 % de lasempresas consideran la comunicación escrita como una de las menos importantes entre el listado,demostrando así las preferencias que tienen sobre ciertas habilidades. Se puede observar quelas habilidades más difíciles de encontrar no necesariamente son las más importantes para lasempresas, como lo es el caso de Pensamiento Holístico donde es considerada más difícil deencontrar que importante para las empresas.

En respuesta a lo anterior, en los últimos años se han definido nuevos perfiles profesionales, querecopilan conjuntos de habilidades que se requieren para la implementación de los proyectos quesurgen en las áreas de BD&DA. Lograr una formación en estos temas, constituye un reto, y paraenfrentarlo, los países generan nuevos centros de formación y las universidades incluyen en sus

CAOBA - Universidad de los Andes Página 3

Page 5: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Cuadro 2: Habilidades tranversales

Habilidades transversalesMas importantes

para las empresasLas más difíciles

de encontrarLiderazgo/Proponer liderazgo 45.2 % 43.8 %Pensamiento del Sistema / Pensamiento Holístico 27 % 33.5 %Análisis de negocios 39 % 31 %Innovación 28 % 27.4 %Solución de problemas 25.7 % 21.7 %Comunicación escrita 17.2 % 20.5 %Toma de decisiones 19.7 % 20.5 %Comunicación oral 19 % 19.4 %Colaboración con otros 27.6 % 17.5 %

currículos cursos pertinentes que intentan suplir la alta demanda que se presenta en la actualidad[12]. Sin embargo, las exigencias son cada vez mayores y aún no se comprende bien el rol quedebe jugar este profesional, lo que conlleva a la dificultad para encontrarlos, contratarlos y paraformarlos.

Esto motiva el trabajar en la definición unificada de un perfil, con el fin de entender las capacidadesque incluye y su interacción con otros perfiles profesionales, lo cual es el principal objetivo delpresente documento.

2. Problemática

Actualmente se buscan perfiles profesionales para el desarrollo de proyectos de Big Data (BD)y Data Analytics (DA), pero surge como problemática el hecho de que las empresas no puedendefinir claramente el perfil que requieren debido a la novedad de estas temáticas, no existe unlenguaje común, y cada vez se dificulta más conocer un perfil acorde a las necesidades que sebuscan para el desarrollo de estos proyectos.

Para una mejor comprensión de la problemática, se presenta a continuación las característicasque presentan los proyectos de Big Data (BD) y Data Analytics (DA), los diferentes perfiles quehan sido propuestos hasta el momento y se concluye con la necesidad de un nuevo perfil.

2.1. Características de los proyectos de Big data analytics y data Analytics

El término Big data se refiere a gigantescas cantidades de información que deben ser captura-das y analizadas, con el fin de que las empresas aprovechen la información que poseen de sunegocio (información de clientes, histórico de ventas etc.), en su toma de decisiones estratégicas.Sin embargo, muchas veces las empresas no poseen entre su personal los profesionales quedesarrollen y realicen la analítica requerida sobre este tipo de datos [6].

Hoy en día el Big data está cambiando la manera como trabajan las empresas, pues se generamucha información y oportunidades para aprovecharla, en la búsqueda de ventajas competitivas.

CAOBA - Universidad de los Andes Página 4

Page 6: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Sin embargo, todavía no son muchas las empresas que, aunque sienten la necesidad, se decidena enfrentar estos retos y aplicar esta nueva disciplina, lo que genera la oportunidad de formarprofesionales en esta temática.

Los datos que poseen las empresas son complejos de manejar y además se generan rápidamentelo que complica el análisis de la información. De allí surge la necesidad de implementar proyectosen BD y DA con el fin de apoyarse en los datos para la toma de decisiones (acertadas). Poresta razón, los proyectos de BD y DA son estratégicos en las empresas, involucran grupos deprofesionales y requieren de una metodología que les permita trazar un plan apropiado de trabajo.

El uso de tecnologías (TI) apropiadas es fundamental para el desarrollo de estos proyectos queestán orientados a extraer información valiosa de los datos, y así encontrar oportunidades para elnegocio partiendo del análisis de la información. Debe hacer posible identificar ideas de negocioen los datos y fijar metas claras para el proyecto.

Actualmente grandes empresas como: SAS,Ibm y Oracle ofrecen como servicios soluciones enBig data y data analytics para beneficiar a las empresas con el manejo adecuado de sus datos.

2.2. Perfiles existentes

Teniendo en cuenta la problemática anterior, se han creado en los ultimos años perfiles para supliresta necesidad. Estos cumplen con habilidades y competencias (cuadro 1) para suplir cargos quedemandan profesionales con las siguientes características: Manejo de herramientas de Big Datapara procesar información, manejo de lenguajes de programación, dominio de bases de datosrelacionales y no relacionales, uso de herramientas de visualización, habilidades en analítica, usode herramientas de Machine Learning [13].

A continuación se mencionan cargos representativos, que existen en la actualidad.

Chief Data Officer (CDO):Es un miembro de la dirección ejecutiva que se encarga de liderarla gestión de datos y analítica asociada con el negocio, por lo tanto es el responsable de losdiferentes equipos que están especializados en datos en la empresa [9, 7].

Data Scientist(científico de los datos):Interpreta grandes volúmenes de datos para transfor-marlos en información útil para la empresa. Se caracteriza por tener habilidades en matemáticas,estadística, programación ser creativo y tener habilidades comunicativas que le permitan exponerlos resultados de su trabajo para ayudar a la empresa en su toma de decisiones.(Ingeniero delfuturo) [1, 9, 14, 5].

Citizen Data Scientist:En palabras de Gartner ”El citizen Data Scientist es una persona que creao genera modelos que aprovechan el análisis predictivo o prescriptivo, pero cuya principal funciónde trabajo se encuentra fuera del ámbito de la estadística y análisis"[8].

Data Engineer:Es el responsable de entregar al científico de datos los datos que requiere. Tie-ne gran conocimiento en bases de datos, arquitecturas de cluster, lenguajes de programación ysistemas de procesamiento de datos [1, 9].

Data Steward (administrador de datos):Es el responsable de mantener la calidad, disponibili-dad y seguridad de los datos.Posee conocimientos en los procesos del negocio e identifica cómoson usados dentro de la empresa [1, 9].

Business Data Analyst(analista de datos):Participa en el análisis de los datos con el fin derecolectar las necesidades del cliente para sustentarlas de manera clara al científico de datos

CAOBA - Universidad de los Andes Página 5

Page 7: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

[1, 9].

Data Artist:Es un experto en Business Analytics y tiene delegada la tarea de mostrar de manerasencilla (gráficos, infografías y herramientas visuales), los resultados del análisis de los datospara comprender grandes volúmenes de información [1, 9].

Estadístico:Sus funciones se centran en obtener,analizar e interpretar datos cualitativos y cuan-titativos usando los métodos estadísticos existentes (e.g., medias, histogramas, desviaciones,regresiones,test-X, test-Z) [15].

Administrador de bases de datos:Tiene conocimientos fuertes en el manejo de bases de datos,típicamente relacionales [15].

Los perfiles vistos anteriormente poseen diversos significados y no se ha determinado un están-dar para ellos [15, 9, 5, 14]. Muchos de ellos se sobrelapan y no existe una definición común loque impide una claridad en los nuevos cargos que se requieren con tales conocimientos.

2.3. Necesidad de un nuevo perfil

Con el fin de obtener un perfil completo para desarrollar proyectos en BD y DA, se crea la nece-sidad de definir un nuevo perfil que incluya las habilidades necesarias para realizar este tipo deproyectos.

En la ejecución de proyectos de BD y DA, se debe contar con el apoyo de un equipo de trabajocapaz de comprender los diferentes ejes de conocimiento de un proyecto. Es decir, no basta conel conocimiento del Data Scientist o del Ingeniero de Datos por separado, siendo roles diferentesdentro de los perfiles orientados a datos, sino que se necesita la integración de conocimientos enun equipo armónico, en el que se dispongan de habilidades múltiples para el desarrollo satisfac-torio de un proyecto.

3. Antecedentes

El problema de definir perfiles para proyectos de BD y DA se ha abordado en la literatura desdediferentes perspectivas[11, 3]. Este problema puede ser analizado usando descripciones de perfi-les, metodologías y aproximaciones pedagógicas que aporten a una conceptualización del mismo.Estos enfoques son descritos en esta sección y son utilizados para identificar los fundamentosque permiten definir un perfil para desarrollar este estilo de proyectos.

3.1. Otras propuestas de perfiles

El modelo que se presenta en la figura 1 muestra la propuesta de Gartner para conformar unCentro de competencia en Inteligencia de Negocios (BICC), el cual parte de la idea de especializarlas habilidades de acuerdo a áreas de interés (e.g., IT en la figura), resaltando las habilidadesen temas de datos, gobierno y comunicación. Por otro lado resalta una serie de conceptos aconsiderar, tales como la integración y manejo de la información, herramientas y aplicaciones,organización y procesos, y las necesidades del negocio a ser abordadas. Lo anterior, en lo querefiere a las cualidades analíticas, en negocio y TI que se requieren para el desarrollo de unproyecto de analítica.

CAOBA - Universidad de los Andes Página 6

Page 8: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 1: Propuesta de Gartner para adaptar las Competencias BICC

3.2. Metodología de ASUM de IBM

La metodología ASUM-DM de IBM, la cual se encuentra establecida con base en la metodologíaCRISP DM, aun si tiene algunas similitudes con metodologías reconocidas para realizar proyectosde minería de datos, enfatiza varias de las nuevas prácticas en la ciencia de datos como el uso devolúmenes de datos muy grandes, la incorporación de análisis de texto en el modelado predictivoy la automatización de algunos procesos.

La figura 2 muestra las fases de la metodología ASUM-DM.

Esta metodología se concentra en 5 grupos de fases globales: (1)Analizar, (2)Diseñar, (3)Confi-gurar y Construir, (4)Desplegar, (5)Operar y Optimizar.

Dentro de cada uno de los grupos, se despliegan las 10 fases que componen la metodologíaASUM-DM. A continuación se habla brevemente sobre cada elemento, para un mejor entendi-miento, tomando como punto de partida la figura 2, en la cual se evidencia el agrupamiento decada uno de los elementos dentro de las fases previamente mencionadas:

Comprensión del Negocio: Esta primera etapa establece las bases para abordar de formaexitosa el proyecto ya que se orienta al entendimiento de un negocio, con el fin de definirproyectos y soluciones alienados con las estrategias de las organizaciones.

Enfoque Analítico: Implica traducir el problema de negocio a un problema técnico. Una vezque el problema de negocio de la empresa ha sido claramente establecido, el científico de

CAOBA - Universidad de los Andes Página 7

Page 9: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 2: Metodología ASUM-DM de IBM. Recuperada dehttp://www.ibmbigdatahub.com/blog/why-we-need-methodology-data-science

datos puede definir el enfoque analítico para resolver el problema. Esta etapa implica expre-sar el problema en el contexto de las técnicas estadísticas y de aprendizaje automático, paraque la organización pueda identificar y seleccionar las más adecuadas para el proyecto.

Requisitos de los datos: La elección del enfoque analítico determina los requisitos delos datos, ya que los métodos analíticos que se utilizan requieren un contenido de datos,formatos y representaciones particulares, guiados por el conocimiento del dominio.

Recolección de los datos: El científico de datos identifica y reúne los recursos de datosnecesarios, relevantes para el dominio del problema. Al encontrar brechas en la recopilaciónde datos, el científico de datos podría necesitar revisar los requisitos de datos y recopilarmás información.

Entendimiento de los datos: Técnicas de visualización o estadística pueden ayudar aun científico de datos a comprender el contenido de los datos, evaluar su calidad y tenerhallazgos iniciales de interes para el proyecto.

Preparación de los datos: La etapa de preparación de datos comprende aquellas activi-dades para construir el conjunto de datos que se utilizará en la etapa de modelado. Estosincluyen la limpieza de datos y otras técnicas de análisis de datos para satisfacer la necesi-

CAOBA - Universidad de los Andes Página 8

Page 10: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

dad de tener un conjunto robusto para la construcción de modelos apropiados para abordarel problema.

Modelamiento: A partir de la primera versión del conjunto de datos preparado, la etapade modelado se centra en el desarrollo de modelos predictivos de acuerdo con el enfoqueanalítico previamente definido. Con modelos predictivos, los científicos utilizan un conjuntode formación (datos históricos en los que se conoce el resultado del interés) para construirel modelo. Esta etapa suele ser iterativa, lo que lleva a refinamientos en la preparación delos datos y la especificación del modelo.

Evaluación: El científico de datos evalúa el modelo para entender su calidad y asegurar-se de que aborda adecuada y completamente el problema del negocio. La evaluación delmodelo implica el cálculo de diversas medidas de diagnóstico.

Despliegue: Después de que se ha desarrollado un modelo con resultados satisfactoriosen su evaluación, se despliega en el entorno de producción o en un entorno de pruebacomparable.

Retroalimentación: Al recolectar los resultados del modelo implementado, la organizaciónobtiene retroalimentación sobre el rendimiento del modelo y observa cómo afecta su entornode despliegue.

Una vez descritos los niveles que componen la metodología, cabe aclarar que esta es una meto-dología planteada para el desarrollo del proyecto en un equipo de trabajo. Esto es un elementofundamental para el cumplimiento de los objetivos planteados por el mismo. Por esta razón, im-plica un conocimiento base de cada uno de los integrantes del grupo en las diferentes áreas delconocimiento de un proyecto para tener un lenguaje común.

3.3. Taxonomía de Bloom

En el contexto de la definición de un perfil, es necesario definir un esquema de valoración deconocimiento que se adquiere o requiere en procesos de formación y transferencia. Para esto, sepropone utilizar la taxonomía de Bloom, definida en el contexto de aprendizaje de las personas.Esta taxonomía es jerárquica y se evidencian diferentes niveles de conocimiento [2].

Figura 3: Pirámide de conocimiento. Taxonomía de Bloom

CAOBA - Universidad de los Andes Página 9

Page 11: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Como se puede observar en la figura 3, dicha pirámide consta de los siguientes niveles, los cualesbrevemente se explican según la teoría y la Real Academia Española (RAE):

Conocer: Se refiere a la capacidad de recordar hechos específicos y universales, métodosy procesos, esquemas, estructuras o marcos de referencia.

Según la RAE, la definición del verbo Conocer corresponde a averiguar por el ejercicio delas facultades intelectuales la naturaleza, cualidades y relaciones de las cosas.

Comprender: Es la capacidad de comprender qué se le está comunicando. Es decir, setrata del entendimiento demostrativo de hechos e ideas por medio de la organización, lacomparación, la interpretación, las descripciones, entre otros.

Según la RAE, Comprender es entender, alcanzar o penetrar algo.

Aplicar: Se refiere al uso del conocimiento nuevo. Es decir que este se basa en la resoluciónde problemas en nuevas situaciones aplicando el conocimiento adquirido, hechos, técnicasy reglas en un modo diferente.

Según la RAE , se da la definición del verbo Aplicar : Emplear, administrar o poner en prácti-ca un conocimiento, medida o principio, a fin de obtener un determinado efecto o rendimientoen alguien o algo.

Analizar: Consiste en descomponer un problema, planear, proponer nuevas maneras deejecutar y/o hacer, aplicando sus conocimientos. Examina y divide la información en partesidentificando motivos o causas. Hace inferencias y encuentra evidencia para apoyar genera-lizaciones. Según la RAE , se da la definición del verbo Analizar : Someter algo a un análisis.

Crear: Es el proceso de trabajar con partes, elementos y organizarlos u ordenarlos paraformar un todo claro. Compila la información de manera diferente combinando elementosen un nuevo patrón o proponiendo soluciones alternativas.

Según la RAE , el verbo Crear corresponde a establecer, fundar, introducir por vez primeraalgo; hacerlo nacer o darle vida, en sentido figurado.

Evaluar: Se refiere a la capacidad para evaluar, a través de los procesos de análisis ysíntesis. Presenta y defiende opiniones haciendo juicios sobre la información, la validez delas ideas o la calidad del trabajo sobre la base de un conjunto de criterios.

Según la RAE, se da la definición del verbo Evaluar : Señalar el valor de algo. Estimar,apreciar, calcular el valor de algo.

Por lo pronto, conociendo las definiciones impartidas tanto por la teoría de los niveles de conoci-miento de la taxonomía de Bloom como por la RAE, es importante recalcar cómo se relacionanlos niveles en la jerarquía para la definición de los alcances de un equipo en el desarrollo de unproyecto de BD y DA.

3.4. Conclusión

De acuerdo a lo presentado en las secciones anteriores, se resaltan los siguientes puntos:

CAOBA - Universidad de los Andes Página 10

Page 12: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Es importante que en un proyecto en BD y DA se maneje un esquema de trabajo en equipo.La interacción entre los conocimientos y experticias de cada uno de los miembros del grupo,al igual que el seguimiento de una metodología, son factores claves para el éxito de estosproyectos.

El trabajo en equipo dado que cada miembro del grupo, dispone de habilidades y tieneconocimientos en distintas áreas, requiere de un vocabulario, conocimientos y habilidadescomunes, para un trabajo armónico, eficiente y eficaz dentro de los proyectos.

Todos y cada uno de los integrantes del equipo poseen un conjunto de habilidades trans-versales que les permiten trabajar de manera conjunta, coherente y completa, pues entretodos deben llevar a buen término el proyecto.

Una primera aproximación a la definición de perfil, para un integrante de un equipo, es quedebe tener las capacidades y conocimientos necesarios y suficientes para participar de ma-nera efectiva en un proyecto de BD y DA. Implica experticia en su área de conocimientopara tomar las decisiones y acciones adecuadas para el buen desarrollo del proyecto. Adi-cionalmente, debe conocer lo suficiente de los otros dominios para entender las decisionesque allá se están tomando y las implicaciones que ellas tienen en su propio dominio.

Las aproximaciones metodológicas están enfocadas en su mayoría a las tareas dentro delproyecto, pero no a su administración. Sin embargo, es fundamental la inclusión de estaperspectiva de ”Administración del Proyecto” en pro de llevar a cabo una gestión organizada,planificada y coherente con el proyecto, de acuerdo a la disponibilidad de recursos, tiempo,entre otros.

Estos puntos son incorporados en la propuesta presentada por el grupo CAOBA-Uniandes en lassiguientes secciones.

4. Marco conceptual para el perfil Big data y Data Analytics

En la presente sección se describe una propuesta de marco conceptual que el grupo CAOBA-Uniandes tiene para definir un perfil en Big Data and Data analytics (BD y DA), el cual quiere, asu vez, servir de marco de referencia con respecto a las habilidades y conocimientos necesariospara el desarrollo de proyectos en el tema, para la definición de perfiles profesionales, de cursosde formación, o de requerimientos de una empresa proveedora de soluciones.

Esta propuesta tiene tres partes importantes. La primera de ellas corresponde a las bases delmarco conceptual para definir perfiles. La segunda es una formulación matemática, que permiteexpresar el marco de referencia en términos de los conocimientos y habilidades necesarios paradesarrollar un proyecto de BD y DA y la tercera, corresponde a la definición de perfiles específicospara la formación de profesionales en los temas de Big Data y Data analytics.

La propuesta se creó basada en la idea de definir cualidades del equipo de trabajo en términosde diferentes dominios (e.g., negocio, tecnologías de información), propuestos en el BICC deGartner. En particular, los dominios propuestos involucrados en este estilo de proyecto de BigData y Data analytics son: negocio, tecnologías de información (TI), analítica, administración deproyectos y habilidades transversales. Estos dominios permiten expresar un perfil completo y sedescriben a continuación.

CAOBA - Universidad de los Andes Página 11

Page 13: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Negocio: Definición y comprensión de la temática específica del proyecto, que está definida porlas necesidades y reglas del negocio.

TI: Administración de la tecnología de TI, despliegue de la solución y manejo del ciclo de vida delos datos, al igual que temas transversales de los mismos.

Analítica: Selección y análisis de los datos de forma apropiada, al igual que selección y cons-trucción de los modelos adecuados para la solución.

Administración de proyectos: Gestión del proyecto, al igual que la gestión del equipo de trabajocolaborativo.

Habilidades transversales: Conjunto de habilidades que apoyan el desarrollo efectivo de unproyecto de BD&DA.

4.1. Fundamentos del marco conceptual

Los tres elementos fundamentales para el desarrollo efectivo de proyectos en Big Data y Dataanalytics son: el aspecto metodológico (ver sección 3.2), los conocimientos y habilidades en losdiferentes dominios, a nivel del equipo y de cada integrante del mismo, implícitamente abordadoen la metodología ASUM-DM y la existencia de un lenguaje común para facilitar la comunicación alinterior del grupo, al igual que la comprensión y participación en las decisiones relacionadas con elproyecto. Algunos de estos elementos han sido abordados por propuestas como la metodologíaASUM-DM, las características que deben tener los centros de competencia de inteligencia denegocios y la taxonomía de Bloom. Aunque estos elementos permiten definir el trabajo a realizaren proyectos de BD y DA, dado que no fueron propuestos para la definición de perfiles, carecende elementos importantes, tales como la administración de proyectos, la forma de explicitar eltrabajo en equipo y de medir el conocimiento y habilidades que debe tener el equipo, y cada unode sus integrantes.

Por lo anterior, se realiza una propuesta que integra los aspectos faltantes mencionados previa-mente y que se describen a continuación.

1. Aspecto metodológico: Basado en la metodología de ASUM-DM, como se muestra en lafigura 4, se hace énfasis en la administración de proyectos y en la etapa de modelamiento.A nivel de modelamiento, se extiende el alcance de proyectos de analítica predictiva, y seincluye la analítica descriptiva. En particular, se abarcan soluciones de visualización comolo son los tableros de control (Dashboards), la visualización de cuadros de mando y engeneral, resultados de modelos descriptivos.

2. Valoración de conocimiento y habilidades: Para definir el conocimiento y las habilidades queposee cada integrante del grupo se usa la taxonomía de Bloom. Esta taxonomía permitedefinir qué nivel de conocimiento/habilidad tiene cada integrante del grupo, en cada dominiopara participar activamente en el desarrollo del proyecto, como se muestra en la figura 5.De igual manera, al explicitar el nivel de conocimientos y habilidades de cada integrante, setendrá también la valoración del equipo de trabajo.

CAOBA - Universidad de los Andes Página 12

Page 14: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 4: Metodología ASUM-DM adpotada por CAOBA

3. Lenguaje común: Es necesario definir un núcleo para que el equipo trabaje de maneraefectiva, con un lenguaje común y estándar que facilite el entendimiento del proyecto y lasdecisiones asociadas al mismo, en todos los dominios: TI, Negocio, Analítica y Adminis-tración de proyectos. De igual manera, el núcleo debe incluir un conjunto de habilidadestransversales, para garantizar la participación activa de todos los integrantes del equipo.

Por otro lado, vale la pena aclarar que en términos de habilidades transversales el nivel de Bloomrequerido es de usar y analizar, ya que en esos temas no se está pretendiendo avanzar la fronteradel conocimiento.

Desde el punto de vista de los integrantes, no se espera que todos tengan toda la experticiaplanteada, sino que cada uno aporte la suya al equipo completo. Sin embargo, sí se requiere dehabilidades y conocimientos compartidos, comunes por todos los miembros para llevar a buentérmino el proyecto.

4.2. Formulación matemática del perfil

Con el fin de facilitar el entendimiento del perfil que poseen las personas que hacen parte de unequipo de trabajo en BD y DA, se propone una representación de acuerdo a lo ilustrado en laecuación 1.

Perfil BD&A = P0 +4∑

i=1Ci ∗ Pi, donde Ci ∈ (0, 1)3i | Ci 6= 0 (1)

La ecuación del perfil BD&A se define en términos de un perfil núcleo (P0), más la sumatoria deuno ó más de los perfiles especializados (Negocio -P1 a Administración -P4). Para comprendermejor la ecuación es necesario identificar el significado de cada perfil de la siguiente manera.

Perfil núcleo (P0) considerado el núcleo-visión global, facilita la comunicación entre los miembrosdel grupo, permite manejar un lenguaje común y tener una comprensión de conceptos en los

CAOBA - Universidad de los Andes Página 13

Page 15: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 5: Metodología ASUM-DM adpotada por CAOBA

diferentes dominios, para participar en las decisiones del proyecto. Por otra parte, los perfilesespecializados, Perfil de negocio, Perfil en TI, Perfil en analítica y Perfil en administración deproyectos se detallan en las siguientes secciones.

A manera de ejemplo, la ecuación 1 es utilizada para representar dos perfiles de BD y A confortalezas en algunas áreas.

Perfil profesional 1: Un profesional con estudios de pregrado de matemática pura, que quiereespecializarse en el dominio de analítica. Este perfil puede ser expresando en el formalismo comose muestra en la ecuación No: 2.

Perfil BD&A = P0 + P3 (2)

Perfil profesional 2: Un ingeniero de sistemas con maestría en analítica, con fuertes conoci-mientos en analítica y tecnologías de la información. Este perfile se representa en el formalismocomo se muestra en la ecuación No: 3.

Perfil BD&A = P0 + P2 + P3 (3)

De acuerdo a los ejemplos se puede hacer énfasis en que el formalismo utilizado para representarun perfil BD y DA permite describir proyectos o profesionales en BD y DA con diferentes énfasis.

4.3. Perfil Núcleo - P0

Este perfil, ilustrado en la figura 6, representa la participación de manera efectiva en el proyecto,ya que conoce y comprende las decisiones de los cuatro dominios (P1 a P4) y en esos dominios,tiene un conjunto fundamental de conocimientos y habilidades.

CAOBA - Universidad de los Andes Página 14

Page 16: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

El tener conocimientos y habilidades en los 2 primeros niveles de Bloom permite al profesional conel perfil núcleo estar en la capacidad de conocer la idea del negocio, las posibles herramientasen TI a usar, los modelos matemáticos existentes y los procedimientos para la administraciónde proyectos que junto con habilidades (transversales) como trabajo en equipo, comunicación,responsabilidad, liderazgo,disciplina, y pasión entre otras le permiten comprender las decisionesy las consecuencias de las decisiones que se toman durante el proyecto (desde la concepciónhasta el cierre).

A continuación se mencionan en detalle los conocimientos que poseen en cada uno de los domi-nios.

Figura 6: Representación del perfil P0

4.3.1. El núcleo del negocio

Conoce y comprende acerca del negocio, su participación en el proyecto se caracteriza por cono-cer acerca de la misión y visión de la empresa con el fin de alinear el proyecto con los objetivosde la organización.

4.3.2. El núcleo en TI

Identifica las tecnologías de información existentes que se ajustan a los requerimientos solicita-dos por parte del cliente y es capaz de identificar sus ventajas, desventajas e implicaciones alusarlas adecuadamente. Adicionalmente, conoce y comprende los procesos asociados a la cali-dad de datos y a las implicaciones legales y éticas intrínsecas al uso de datos en los proyectosde tecnologías de información.

CAOBA - Universidad de los Andes Página 15

Page 17: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

4.3.3. El núcleo en analítica

Conoce y comprende las aproximaciones analíticas que pueden ser implementadas en este estilode proyectos teniendo como guía el objetivo para el cual han sido diseñadas, y comprendiendolas ventajas y desventajas que implica su uso en estos proyectos.

4.3.4. El núcleo en administración de proyectos

Conoce y comprende los conceptos de la gestión de proyectos que es parte fundamental paralograr los objetivos que se han planteado para un proyecto, conoce el presupuesto, los recursos yel cronograma con el cual está dirigido el proyecto, esto le permite participar de manera efectiva.

4.3.5. El núcleo transversal

Contiene el conjunto de habilidades blandas requeridas para el desarrollo efectivo de este estilode proyectos, tales como creatividad, curiosidad, pasión, disciplina, honestidad, liderazgo, ac-tualización permanente, disciplina de documentación, comunicación efectiva en español y muydeseable en inglés, poder de abstracción, negociación, toma de decisiones, definir criterios, eva-luar, comparar, escoger, trabajo en equipo, tenacidad y tolerancia a la frustración.

4.4. Perfil de Negocio - P1

Este perfil se caracteriza porque el profesional es capaz de actuar y tomar decisiones sobre elproyecto con base en el conocimiento del negocio y de la organización.

Las habilidades que lo caracterizan corresponden en conocer y comprender la idea de negocio,lo que le permite realizar acciones y tomar decisiones sobre el proyecto de forma adecuadamanteniendo los intereses que busca la empresa en la ejecución del proyecto.

Por otro lado, en términos de conocimientos domina temáticas como las que se presentan acontinuación:

Áreas: contexto del negocio, aspectos legales, misión y visión de la empresa, planeación(corto y largo plazo) e identifica las amenazas y oportunidades que se puedan presentar enla ejecución del proyecto debido a su experiencia del negocio.

Las metodologías y tecnologías: DOFA, VRIN, DELTA, BMM y arquitecturas empresariales.

Sus conocimientos le permiten hacer análisis de los costos, beneficios y herramientas que ayudenen el desarrollo del proyecto.

En la figura 7 se puede ver el diagrama del conocimiento que posee un perfil P1, donde el nivelde conocimiento en el dominio del negocio es completo y en las demás áreas su nivel de conoci-miento es básico según se muestra en detalle en la definición del perfil núcleo, explícitamente alinicio de la presente sección (sección 4.3).

CAOBA - Universidad de los Andes Página 16

Page 18: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 7: Representación del perfil P1: Dominio del Negocio

4.5. Perfil en TI - P2

El profesional en este perfil, realiza acciones y toma decisiones sobre el proyecto con base en elconocimiento de las tecnologías de información.

Este perfil es experto en tecnologías de información (TI) que apoyen proyectos de Big Data y Dataanalytics, como se puede observar en la figura (8). Adicionalmente es responsable de la admi-nistración de la infraestructura, en cuanto a hardware y software, y el despliegue de la solución.Cuenta con habilidades en manejo de datos, en términos de su ciclo de vida y calidad y tiene li-derazgo en la escogencia de lenguajes, herramientas y metodologías en temas relacionados conTI.

En cuanto a las demás áreas su nivel de conocimiento es básico según la definición del perfilnúcleo descrito en la sección 4.3.

En términos de los conocimientos domina temas tales como:

Áreas: sistema operacional, computación en la nube, computación de alto rendimiento,desarrollo de aplicaciones, lenguajes de programación, análisis sintáctico, bases de da-tos SQL, bases de datos NO SQL, consolidación de fuentes, arquitecturas de información-analítica.

Metodologías y tecnologías: Map/reduce, Text Mining, Data Mining, Web Mining, Social Mi-ning, repositorios y versionamiento, ETL, Sistemas de recomendación.

Herramientas: Python, java, unix, spark, posgress, hive, mongo, hadoop y github.

4.6. Perfil en Analítica - P3

En este perfil el profesional realiza acciones y toma decisiones sobre el proyecto con base en elconocimiento del área analítica.

CAOBA - Universidad de los Andes Página 17

Page 19: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 8: Representación del perfil P2: Tecnologías de información

En la figura 9 se pueden ver los niveles de conocimiento y habilidades que posee donde sufortaleza está en el dominio de analítica y en los demás dominios su nivel es un perfil núcleo (P0).

Este perfil tiene habilidades de manejo de los datos fuentes, en términos de descubrimiento, ex-ploración, selección, preparación y visualización, en la selección de modelos analíticos, la comu-nicación de los resultados de la solución construida y la selección de herramientas y metodologíasapropiadas para la temática analítica.

En términos de los conocimientos domina temas tales como:

Áreas: Álgebra Lineal, probabilidad, estadística, reducción de dimensión, optimización, si-mulación, metaheurísticas.

Metodologías y tecnologías: Modelos de Regresión, modelos de clasificación, Machine lear-ning, métodos gráficos, teoría de grafos y cadenas de Markov. Las herramientas que dominason: R, matLab, SAS y stata.

4.7. Perfil en Administración de proyectos - P4

En este perfil el profesional realiza acciones y toma decisiones sobre el proyecto con base en elconocimiento del área de administración de proyectos. Como se puede observar en la figura 10,su fortaleza está en el dominio de Administración de proyectos, en el cual se ve definido el perfil.

Este perfil tiene mayores habilidades en el conocimiento de gestión de proyectos en cuanto a laplaneación, tiempos, manejo de recursos y estructuración de las acciones a realizar en pro decumplir los acuerdos realizados con los distintos actores involucrados en el proyecto. Específi-camente, conoce y comprende de forma detallada cómo gestionar un proyecto, los recursos y elpresupuesto disponible, y además es capaz de organizar con el uso de herramientas y conoci-miento en metodologías la planeación, ejecución, monitoreo y ajuste de tareas antes, durante ydespués del desarrollo del proyecto. Incentiva y monitorea adicionalmente el trabajo en equipo.

Por otro lado, en términos de los conocimientos dominan temas tales como:

CAOBA - Universidad de los Andes Página 18

Page 20: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 9: Representación del perfil P3: Analítica

Áreas: Definir presupuestos, identificación de fuentes de datos pertinentes, mercadeo, per-filamiento de necesidades, clientes, usuarios y procesos a partir de las decisiones basadasen información, definición y aseguramiento de procesos de calidad de información, nego-ciación y administración del talento humano.

Metodologías y tecnologías: PMBOK, PMP y DAD.

Herramientas: MS-Project y T-Metrics.

CAOBA - Universidad de los Andes Página 19

Page 21: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 10: Representación del perfil P4: Administración de Proyectos

5. Validación de la propuesta de los perfiles CAOBA

La metodología ASUM-DM utilizada para realizar proyectos de Big Data y Data Analytics contieneun conjunto de fases y actividades, descritas en la sección 3.2, que apoyan el desarrollo completode este tipo de proyectos. Es por esto, que con el objetivo de validar la completitud de la propuestadel perfil CAOBA se utiliza como base tal metodología.

El proceso seguido para la validación consistió en:

Tomar cada actividad definida en ASUM-DM y:

• Identificar cuál o cuáles de los perfiles propuestos participan en dicha actividad

• Determinar cual de los perfiles identificados en el paso anterior, debe ser el responsa-ble de dicha actividad, dejando a los otros perfiles como colaboradores

Comprobar que todas las actividades ASUM-DM tienen un perfl responsable

Comprobar que cada perfil es responsable de al menos una de las actividades de ASUM-DM

El resultado mostró que, efectivamente, todas las actividades tienen un responsable y que todoperfil tiene explícitas sus responsabilidades, de donde se puede concluir que los perfiles CAOBApropuestos son válidos para el desarrollo de proyectos de Big Data y Data Analytics.

Un extracto del resultado de este ejercicio se muestra en la figura 11. La figura muestra para cadaactividad los perfiles participantes con una ’x’ y el perfil responsable de la actividad resaltado enamarillo.

CAOBA - Universidad de los Andes Página 20

Page 22: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 11: Extracto del ejercicio de validación de los perfiles propuestos vs. la metodología ASUM-DM

6. Formalsimo gráfico de representación de los perfiles CAOBA

Para poder representar, analizar y comparar los elementos del perfil CAOBA vistos hasta el mo-mento, es necesario encontrar un formalismo de representación gráfica del perfil que permitaexpresar los dominios disciplinares y nivel de logro de habilidades y conocimientos en cada unode ellos. El grafismo propuesto, ilustrado en la figura 12, se basa en un grafo polar y es deno-minado estrella de Bloom. La estrella de Bloom hace explícitas las fortalezas, en términos dehabilidades y conocimientos presentes en los proyectos de Big Data y Data Analytics.

6.1. Estrella de Bloom

La estrella de Bloom presentada en la figura 12 está compuesta por cinco ejes, que correspondena los dominios de conocimiento involucrados en los proyectos de Big Data y Data Analytics: ne-gocio, TI, analítica, administración de proyectos y habilidades transversales. Cada uno de los ejesdistingue los 6 niveles de conocimiento de la taxonomía de Bloom (3.3), mediante una escala decolores: el nivel central corresponde a ’Conocer’ y el nivel externo corresponde a ’Evaluar’. Conla definición en cada eje de un nivel de conocimiento se conforma un polígono de cinco lados querepresenta un perfil de conocimientos y habilidades en el área de Big Data y Data Analytics. Estepuede ser el perfil deseado de una persona o el perfil necesario para el desarrollo de un proyectoo el perfil de un curso en el área de Big Data y Data Analytics, como se verá en las seccionessiguientes.

6.2. Los perfiles profesionales según la estrella de Bloom

La validez de la estrella de Bloom está directamente relacionada con la facilidad para expresarperfiles existentes y describir espacios de formación. En esta sección se muestra el perfil decientífico de datos y del citizen Data Scientist en términos de lo Estrella de Bloom.

La representación gráfica del Data Scientist se puede ver en la figura 13, que representa unapersona con conocimientos y habilidades máximos en cada eje de la estrella. teniendo en cuenta

CAOBA - Universidad de los Andes Página 21

Page 23: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 12: Estrella de Bloom

que el área de su pentágono es la máxima para la representación del conocimiento usando laestrella de Bloom, se concluye que este perfil es el más completo usando esta representación.

Figura 13: Estrella de Bloom para el perfil de científico de datos

En palabras de Gartner ”El citizen Data Scientist es una persona que crea o genera modelosque aprovechan la analítica predictiva o prescriptiva, pero cuya función de trabajo principal seencuentra fuera del ámbito de la estadística y el análisis” [8].

La figura 14 muestra una representación de la ubicación del científico de datos y el Citizen DataScientist según el autor Carlos Guadián [8].

La figura 15 representa los niveles de conocimiento que debe poseer un citizen Data Scientist.

CAOBA - Universidad de los Andes Página 22

Page 24: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 14: Citizen Data Scientist y Data Scientist

Como se observa en los vértices del pentágono, en los ejes de negocio, habilidades transversalesy administración de proyectos tiene conocimientos básicos, lo que le permite conocer los temassin llegar a la capacidad de crear o evaluar; y los dos vértices restantes del pentágono muestranun mayor nivel de conocimientos en los ejes de TI y analítica, lo que permite aplicar y analizarconocimientos de estas áreas que son su fortaleza.

Figura 15: Estrella de Bloom para el perfil de Citizen Data Scientist

CAOBA - Universidad de los Andes Página 23

Page 25: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

6.3. Los perfiles Caoba según la estrella de Bloom

A continuación, se puede observar la descripción de los perfiles mencionados y explicados en lasección 4, utilizando como representación la estrella de Bloom.

6.3.1. Perfil Núcleo - P0

El perfil núcleo (P0) incluye las habilidades y conocimientos que debe poseer cada uno de losintegrantes de un proyecto de Big Data y Data Analytics y que le debe permitir participar demanera efectiva en uno de tales proyectos. Implica el uso de un vocabulario común, habilidadespara el trabajo en equipo y de comunicación, el conocimiento de la metodología y la capacidad decomprender las decisiones que se tomen en los cinco ejes de los proyectos de Big Data y DataAnalytics.

La figura 16 muestra gráficamente este perfil, descrito de manera detallada en la sección 4.3

Figura 16: Estrella de Bloom para el perfil CAOBA-Núcleo (P0)

CAOBA - Universidad de los Andes Página 24

Page 26: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

6.3.2. Perfil de Negocio - P1

El perfil de negocio (P1) aumenta el núcleo con los conocimientos y habilidades con respectoal negocio en el cual se está desarrollando el proyecto de Big Data y Data Analytics. De estamanera, el nivel de conocimiento en el eje de negocio debe ir hasta el nivel de ’Evaluar’ y seconservan los niveles del perfil núcleo en los otros ejes de la estrella de Bloom.

La figura 17 muestra gráficamente este perfil, descrito de manera detallada en la sección 4.4.

Figura 17: Estrella de Bloom para el perfil CAOBA-Negocio (P1)

CAOBA - Universidad de los Andes Página 25

Page 27: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

6.3.3. Perfil en TI - P2

El perfil en TI (P2) aumenta el núcleo con los conocimientos y habilidades con respecto a lastecnologías de información involucradas en el proyecto de Big Data y Data Analytics. De estamanera, el nivel de conocimiento en el eje de TI debe ir hasta el nivel de ’Evaluar’ y se conservanlos niveles del perfil núcleo en los otros ejes de la estrella de Bloom.

La figura 18 muestra gráficamente este perfil, descrito de manera detallada en la sección 4.5

Figura 18: Estrella de Bloom para el perfil CAOBA- TI (P2)

CAOBA - Universidad de los Andes Página 26

Page 28: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

6.3.4. Perfil en Analítica - P3

El perfil en Analítica (P3) aumenta el núcleo con los conocimientos y habilidades con respecto aestadística, modelaje y análisis requeridos para el desarrollo de un proyecto de Big Data y DataAnalytics. De esta manera, el nivel de conocimiento en el eje de Analytics debe ir hasta el nivelde ’Evaluar’ y se conservan los niveles del perfil núcleo en los otros ejes de la estrella de Bloom.

La figura 19 muestra gráficamente este perfil, descrito de manera detallada en la sección 4.6

Figura 19: Estrella de Bloom para el perfil CAOBA-Analytics (P3)

CAOBA - Universidad de los Andes Página 27

Page 29: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

6.3.5. Perfil en Administración de proyectos - P4

El perfil en Administración de proyectos (P4) aumenta el núcleo con los conocimientos y habilida-des con respecto a la administración de proyectos requeridos para llevar a buen fin un proyecto deBig Data y Data Analytics. De esta manera, el nivel de conocimiento en el eje de Administracióndebe ir hasta el nivel de ’Evaluar’ y se conservan los niveles del perfil núcleo en los otros ejes dela estrella de Bloom.

La figura 20 muestra gráficamente este perfil, descrito de manera detallada en la sección 4.7

Figura 20: Estrella de Bloom para el perfil CAOBA-Administración de Proyectos (P4)

CAOBA - Universidad de los Andes Página 28

Page 30: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

7. Uso del Perfil

La definición de la estrella de Bloom y la expresión de los diferentes perfiles mostrados en lasección 6 permite plantear que este formalismo puede ser utilizado como marco de referenciapara describir las habilidades y conocimientos presentes en los proyectos de Big Data y DataAnalytics .

En esta sección se ilustra entonces el uso de la estrella de Bloom, en la descripción de perfilesrequeridos por las empresas y de cursos de formación ofrecidos por Universidades.

7.1. Oferta de formación académica

En la actualidad las universidades cuentan con cursos dentro de sus programas de maestría o deeducación continuada, que permiten fortalecer determinadas áreas del conocimiento, relaciona-das con el desarrollo eficiente y eficaz de proyectos de Big Data y Data Analytics.

El objetivo de esta oferta es ofrecer un conjunto de habilidades, técnicas y conocimientos a seradquiridos por un estudiante durante un curso, que representa el perfil de salida del curso. Ahorabien, los cursos tienen una duración y dedicación para lograr esos objetivos, pero entonces exigenque los estudiantes tengan, antes de empezar, un cierto nivel de conocimientos y habilidades, loque representa el perfil de entrada al curso.

Todos estos elementos pueden ser representados mediante la estrella de Bloom, como lo muestrala figura 21, donde

Perfil de entrada: Son los conocimientos previos que debe tener una persona antes de tomarun curso, representado por el polígono PI, de color azul, de la figura 21.

Perfil de salida: Indica el nivel de habilidades y conocimientos que se adquieren y fortalecendurante el curso, representado por el polígono rojo (PO) de figura 21.

Siguiendo este marco de referencia, a continuación se muestran algunos de los cursos ofrecidospor algunas de las universidades pertenecientes a la Alianza CAOBA. Se debe resaltar que esteejercicio puede ser realizado por cualquier institución académica y que puede ser realizado a nivelde curso, o de programa académico completo.

7.1.1. Cursos ofrecidos por la Universidad de los Andes

a) Big Data e Ingeniería de Información: Desafíos y oportunidades (Educación continua-da Uniandes)

Este es un curso de divulgación que se dicta en modalidad de educación continuada, conduración de 12 horas teóricas. Por ser de divulgación, no requiere de conocimientos previosen el tema y debido a su duración el nivel de salida se restringe al nivel de ’Conocer’.

Los objetivos que busca cumplir este curso son [4]:

Comprender dimensiones de cambio y oportunidades que se presentan a través de laconvergencia tecnológica y la información.

CAOBA - Universidad de los Andes Página 29

Page 31: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 21: Representación del perfil de entrada y de salida de una oferta académica

Visualizar el impacto y sus ámbitos de aplicación en todas las áreas del quehacer: labiología, la física, la geociencia, la medicina, la ingeniería, entre otras.

Comprender los desafíos que desde el punto de vista tecnológico implica una soluciónbasada en Big Data.

El contenido responde preguntas como ¿Qué es big data? ¿Por qué surge? ¿Cómo es latecnología para construir soluciones de big data.

La figura 22 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 30

Page 32: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 22: Perfil de entrada y salida del curso Big Data e Ingeniería de Información: Desafíos yoportunidades

b) Análisis de información sobre Big Data (Maestría en Ingeniería de Información)

Este curso cuenta con 45 horas teóricas presenciales, talleres, laboratorios y exámenes. Seenfoca en los ejes área de TI y de analítica, y exige conocimientos relativamente avanzadosen TI y básicos en los otros ejes.

Los objetivos que se cumplen en este curso son [4]:

Identificar las oportunidades de transformación y generación de procesos de gene-ración de valor basadas en el análisis de información, proveniente tanto de fuentesinternas como externas a la organización.

Comprender, definir y evaluar arquitecturas orientadas por datos (Scalable Data-DrivenArchitectures), en particular aquellas que involucran requerimientos de alta escalabili-dad de procesamiento y almacenamiento

Integrar metodologías y tecnología para el descubrimiento y entendimiento de infor-mación basado en fuentes altamente escalables. Ejemplos de ellas son Linked Data,Social Data, Sentiment Analysis, Online Stream Analysis, Web Intelligence.

Integrar metodologías y tecnología de análisis de información apropiadas para esce-narios de datos no estructurados o semi-estructurados, en los cuales se enfrenta elproceso de análisis en condiciones de la alta escalabilidad y son necesarios procesosde adaptación y reacción en tiempo real.

Desarrollar una solución que permita generar valor y diferenciación a partir de procesosde análisis de información sobre big data.

La figura 23 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 31

Page 33: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 23: Perfil de entrada y salida del curso Análisis de información sobre Big Data

c) Ciencia de Datos Aplicada (Maestría en Ingeniería de Información)

Este curso requiere de 45 horas presenciales (30 de ellas prácticas), talleres semanales yde la implementación de un proyecto final utilizando datos de una organización real.

Se enfoca en los ejes de Negocio, analítica y TI, exigiendo un nivel relativamente alto en eleje de analítica.

Los objetivos del curso son [4]:

Desarrollar habilidades para la selección y uso de herramientas y técnicas apropiadaspara preparar, analizar datos y comunicar información que pueda ser acciónale enorganizaciones.

Preparar y analizar fuentes de datos con el fin de extraer información útil para unaorganización.

Utilizar de forma apropiada técnicas computacionales y de estadística para generarinformación.

Definir un modelo de beneficio para la organización al utilizar la información seleccio-nada y analizada previamente.

Comunicar efectivamente los beneficios de realizar un proyecto con los hallazgos iden-tificados, con el fin de que la organización comprenda la utilidad de la información einicie acciones enfocadas a su uso.

La figura 24 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 32

Page 34: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 24: Perfil de entrada y salida del curso Ciencia de Datos Aplicada

d) Business Analytics (Maestría en Tecnologías de Información para el Negocio)

Este curso requiere de 45 horas presenciales, talleres quincenales, evaluaciones y la reali-zación de un proyecto final sobre un caso de estudio real.

Se enfoca en los ejes de Negocio y analítica, exigiendo un nivel relativamente alto en losdos ejes.

Los objetivos del curso son [4]:

Explicar a los ejecutivos de la organización la importancia de utilizar Business Analyticsen las organizaciones para generar ventajas competitivas.

Identificar oportunidades para las empresas desde la perspectiva de Business Analy-tics, que les permitan ser competitivas. Identificar requerimientos analíticos que apoyendecisiones tácticas y estratégicas de la organización y que incluyan Minería de Datosen la construcción de la solución.

Utilizar metodologías y herramientas para construir modelos de análisis de datos quele permitan responder a un requerimiento analítico alineado con los objetivos y metasde la organización.

Entender el proceso de despliegue de una solución de Business Analytics en una or-ganización.

La figura 25 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 33

Page 35: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 25: Perfil de entrada y salida del curso Business Analytics

e) Visual Analytics (Maestría en Ingeniería de Sistemas y Computación)

Este curso requiere de 45 horas presenciales, talleres quincenales, evaluaciones y la reali-zación de un proyecto final sobre un caso de estudio real.

Se enfoca en los ejes de TI y analítica, exigiendo un nivel relativamente alto en el eje deanalítica.

Visual Analytics, o Analítica visual, es el conjunto de conocimiento que permite utilizar técni-cas de visualización interactiva con algoritmos y métodos de análisis de datos con el fin deapoyar el razonamiento analítico para la toma de decisiones. La Analítica visual es utilizadaen áreas muy diversas que cubren ciencias, ingeniería, negocios y gobierno. Encontramosejemplos de áreas de aplicación en análisis y toma de decisiones en sistemas urbanos,exploración petrolera, banca, seguridad, emergencias y desastres naturales, monitoreo desalud para manejo de epidemias, entre otros.

El contenido del curso posee tanto bases teóricas de esta área interdisciplinaria, análisisde casos de aplicación, como la realización de miniproyectos de aplicación de técnicas deanalítica visual en situaciones reales [4].

La figura 26 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 34

Page 36: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 26: Perfil de entrada y salida del curso Visual Analytics

7.1.2. Programas y Cursos ofrecidos por la Pontificia Universidad Javeriana

a) Diplomado en Analítica de Datos

Este es un programa de Diplomado, con duración de 111 horas, que incluye sesiones deteoría y de práctica usando herramientas comerciales y también de código abierto (opensource).

El objetivo general que busca cumplir este programa es promover en los participantes unaactitud analítica basada en datos para resolver problemas organizacionales y fortalecer latoma de decisiones gracias a la generación de modelos descriptivos y predictivos a partirde datos estructurados y narrativos.

Los objetivos específicos del programa son:

Fortalecer la capacidad de identificar necesidades y oportunidades de negocio y tradu-cirlas en términos de técnicas y métodos de analítica de datos.

Presentar las diferentes técnicas de analítica de datos contemplando necesidades or-ganizacionales de índole descriptivo y predictivo.

Reconocer nuevas tendencias y necesidades en la analítica de datos producto de ladiversidad y alto volumen de datos disponibles actualmente.

La figura 27 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 35

Page 37: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 27: Perfil de entrada y salida del Diplomado en Analítica de Datos

b) Curso de Analítica de Texto

Este curso tiene una duración de 60 horas, con sesiones de teoría y de práctica usandoherramientas comerciales y también de código abierto (open source).

El objetivo principal de este curso es promover en los participantes una actitud analíticabasada en datos que originalmente se encuentran en texto narrativo para resolver problemasorganizacionales y fortalecer la toma de decisiones, gracias a la identificación de patronesy a la generación de modelos a partir de este tipo de datos.

Los objetivos específicos del curso son:

A partir del análisis de casos de éxito, reconocer la utilidad de la analítica de los textosnarrativos para fortalecer el entendimiento empresarial.

Identificar las principales técnicas de obtención y pre-procesamiento de texto narrativoempleados para estructurarlos y así permitir realizar análisis sobre ellos.

Reconocer las técnicas descriptivas y predictivas más empleadas en la analítica detexto y cómo deben ser interpretados sus resultados.

La figura 28 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 36

Page 38: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 28: Perfil de entrada y salida del Diplomado en Analítica de Datos

7.1.3. Programas y Cursos ofrecidos por la Universidad ICESI

a) Diplomado en Analítica de Datos y Big Data

Este es un programa de Diplomnado, con duración de 120 horas, organizadas en 30 sesio-nes de 4 horas cada una.

Los objetivos del programa son:

Identificar el potencial de generar valor a partir de un conjunto de datos resultantes dela operación del negocio.

Formular preguntas relevantes para el negocio, que puedan ser respondidas a partirdel análisis de los datos disponibles.

Aplicar las técnicas de analítica más adecuadas para construir un modelo de solución.

Evaluar los resultados obtenidos a partir de diferentes modelos analíticos.

Aplicar técnicas de visualización para comunicar efectivamente los resultados de losmodelos analíticos.

Reconocer las implicaciones en la infraestructura computacional que se derivan deltratamiento de grandes volúmenes de información en proyectos de analítica de datos.

Aplicar la metodología ASUM-DM al desarrollo de proyectos de analítica de datos.

La figura 29 muestra este curso mediante el formalismo de la estrella de Bloom.

CAOBA - Universidad de los Andes Página 37

Page 39: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Figura 29: Perfil de entrada y salida del Diplomado en Analítica de Datos

7.2. Perfil para la demanda académica

Al igual que las instituciones académicas pueden expresar su oferta en términos de la estrella deBloom, las empresas pueden usarla, por ejemplo, para:

Definir sus necesidades de formación general de la empresa, con base en planes estratégi-cos de evolución de la empresa

Determinar las necesidad de formación específica para el desarrollo de un proyecto, conbase en los objetivos del mismo.

Determinar el personal necesario, y su perfil, para completar el equipo de trabajo necesariopara el desarrollo de un proyecto. Esto se logra con base en el perfil requerido para elproyecto y los perfiles de las personas que están actualmente en el equipo de trabajo.

CAOBA - Universidad de los Andes Página 38

Page 40: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

8. Conclusiones

Las principales conclusiones de este trabajo son:

La propuesta de perfiles especializados en cada uno de los dominios permite expresar clara-mente las habilidades y conocimientos presentes en un proyecto de Big Data y Data Analy-tics, ya que fue validada contra la metodología ASUM-DM.

Es más completa que otras propuestas de perfiles para este tipo de proyectos, pues incluyeexplícitamente los ejes de administración de proyectos y de las habilidades suaves (softskills) que son necesarias para el desarrollo exitoso de estos proyectos.

El formalismo gráfico propuesto, llamado la Estrella de Bloom, es poderoso en el sentido queexpresa de manera clara y sintética el nivel o los niveles de habilidades y conocimientos deinterés, como por ejemplo:

• El perfil de una persona

• El perfil de una propuesta de formación (perfil de salida) de un curso, o de un programade formación, mediante la unión de los perfiles de salida de cada uno de los cursos.

• El perfil requerido para acceder a la propuesta de formación (perfil de entrada), quecuando se ponen juntos en una misma estrella permite visualizar el énfasis de la pro-puesta de formación y el esfuerzo que se requiere para alcanzar los objetivos. En estesentido facilita la concepción de los programas o cursos ofrecidos.

• El perfil deseado por una empresa para afrontar con éxito el desarrollo de un proyectode Big Data y Data Analytics. Esta demanda puede ser a nivel de la empresa completao a nivel del equipo de trabajo para un proyecto en particular, o para la contratación depersonal especializado.

CAOBA - Universidad de los Andes Página 39

Page 41: PerfilAlianzaCaoba - Minciencias · La analítica vista como los procesos de transformación de datos en información, ha permeado la sociedad y está cambiando la forma de hacer

Perfil Alianza Caoba ACUA-M-R-PerfilCaoba-P001

Referencias[1] BIGDATACoeE Barcelona. Los 7 perfiles clave de los profesionales del big data.

http://www.bigdatabcn.com/es/los-7-perfiles-clave-los-profesionales-big-data/, 2016. Accedi-do 08-02-2017.

[2] M. D.; Furst E. J.; Hill W. H.; Krathwohl D. R. Bloom, B. S.; Engelhart. Taxonomy of educationalobjectives: The classification of educational goals. Handbook I: Cognitive domain. DavidMcKay Company, New York, 1956.

[3] Giovanni Cock Gómez et al. Big data en las empresas: una nueva era de la información. B.S.thesis, Universidad Militar Nueva Granada, 2015.

[4] Universidad de los Andes. Universidad de los andes. https://www.uniandes.edu.co/ , 2017.Accedido 20-02-2017.

[5] Oxford dictionaries. Data scientist. https://en.oxforddictionaries.com/definition/data_scientist,2016.

[6] Revista Dinero. Big data: la mina de oro. http://www.dinero.com/edicion-impresa/tecnologia/articulo/el-poder-economico-del-big-data-su-desarrollo-colombia/210853, 2015. Accedido 08-02-2017.

[7] Jane Griffin. The role of the chief data officer. Information Management, 18(2):28, 2008.

[8] Carlos Guaddián. Puedes ser un ciudadano científico de datos (citizen data scientist).http://www.k-government.com/2016/03/02/ciudadano-cientifico-datos/, 2017. Accedido 13-02-2017.

[9] Cristina Juan. Los perfiles profesionales más buscados de big data.http://comunidad.iebschool.com/iebs/software-de-gestion/profesionales-mas-buscados-big-data/, 2016. Accedido 08-02-2017.

[10] Leon Kappelman. It trends simposium. https://c.ymcdn.com/sites/www.simnet.org/resource/collection/7A70D436-28BA-4E88-B958-C86941C704C3/IT_Trends_SIMposium_2014_Keynote_Intro_Slides.pdf,2015. Accedido 15-03-2017.

[11] David López García et al. Análisis de las posiblidades de uso de big data en las organizacio-nes. Master’s thesis, Universidad de cantabria, 2013.

[12] Maribel tirados. La escasez de profesionales big data hace subir los sa-larios. http://www.bigdatahispano.org/noticias/la-escasez-de-profesionales-big-data-hace-subir-los-salarios/, 2014. Accedido 08-02-2017.

[13] Auribox Training. Curso de big data con hadoop y mongo db-auribox training.www.auriboxtraining.com, 2016. Accedido 20-02-2017.

[14] Wil MP Van der Aalst. Data scientist: The engineer of the future. In Enterprise InteroperabilityVI, pages 13–26. Springer, 2014.

[15] Rayo Ángel. Las habilidades y el perfil de un profesional big data.http://www.bit.es/knowledge-center/habilidades-y-perfil-de-un-profesional-big-data/, 2016.Accedido 08-02-2017.

CAOBA - Universidad de los Andes Página 40