125
El marcado digital de texto: una exploración con el archivo periodístico sobre desapariciones forzadas ocurridas en el conflicto armado interno del Perú Trabajo de grado para optar al título de: Maestro en Humanidades Digitales Luis García Bendezú Tutora: Maria José Afanador-Llach, Ph.D Universidad de los Andes Facultad de Artes y Humanidades Maestría en Humanidades Digitales Mayo de 2020

El marcado digital de texto: una exploración con el

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: El marcado digital de texto: una exploración con el

El marcado digital de texto: una exploración con el archivo periodístico sobre

desapariciones forzadas ocurridas en el conflicto armado interno del Perú

Trabajo de grado para optar al título de:

Maestro en Humanidades Digitales

Luis García Bendezú

Tutora:

Maria José Afanador-Llach, Ph.D

Universidad de los Andes

Facultad de Artes y Humanidades

Maestría en Humanidades Digitales

Mayo de 2020

Page 2: El marcado digital de texto: una exploración con el

2

Lista de contenidos

Resumen 5

1 - Introducción 7

2 - Planteamiento del problema y justificación 10

3 - Objetivos 15

4 - Marco teórico y antecedentes 16

4.1 La Comisión de la Verdad y Reconciliación como producto histórico 19

4.2 No una sino muchas memorias 25

4.3 Balance y vigencia del Informe Final: un análisis desde las humanidades digitales 29

4.3.1 Análisis de palabras clave con Voyant Tools 33

4.3.2 Redes en las referencias de los autores de memoria histórica en Perú 34

4.4 Entre lo macro y lo micro: una apuesta por el archivo y la memoria alternativa 39

4.5 Del archivo digital a las humanidades digitales y viceversa 44

4.6 El marcado de texto como herramienta de exploración 50

5 - Metodología 56

5.1 - El origen del material de investigación 57

5.2 - Descarga y exclusiones de los recortes periodísticos 58

5.3 - La clasificación de los recortes 61

5.4 - Recolección de metadatos, ensamble y transcripción de los recortes 66

5.5 - El etiquetado XML/TEI: estructura global de los recortes 68

5.6 - El etiquetado XML/TEI: el marcado semántico de elementos 70

6 - Resultados 78

6.1 - Operaciones transversales con el corpus marcado 78

6.2 - Operaciones con etiquetas para nombres propios 91

6.2.1 - <persName> 92

6.2.2 - <placeName> 95

6.2.3 - <orgName> 97

6.3 - Análisis de citas textuales: la voz de los protagonistas 100

7 - Conclusiones 107

ANEXOS 115

Page 3: El marcado digital de texto: una exploración con el

3

Lista de visualizaciones

Gráfico 1: Países y localidades en los que se han desarrollado comisiones de la verdad. 23 Gráfico 2: Nube de palabras clave en 70 artículos publicados bajo el auspicio del LUM. 33 Gráfico 3: Autores publicados por el LUM de acuerdo a la cantidad de referentes citados. 36 Gráfico 4: Redes en las referencias de los autores publicados por el LUM. 38 Gráfico 5: Ejemplo de marcado de texto en un documento literario. 51 Gráfico 6: Procesamiento y transformación de documentos en el ejercicio de marcado. 56 Gráfico 7: Recortes periodísticos digitalizados y disponibles en el CDI. 58 Gráfico 8: Filtros de búsqueda en la plataforma del CDI. 59 Gráfico 9: Ejemplo de una nota periodística de la plataforma digital del CDI. 59 Gráfico 10: Relación entre artículos descargados, descartados y aprobados. 61 Gráfico 11: Clasificación de los recortes descargados de la plataforma del CDI. 63 Gráfico 12: Distribución cronológica de los recortes periodísticos descargados. 64 Gráfico 13: Procedencia de los recortes según medio de comunicación. 65 Gráfico 14: Recomposición digital de las notas periodísticas del CDI. 66 Gráfico 15: Estructuración básica de las notas periodísticas. 67 Gráfico 16: Estructura XML global de una nota periodística marcada. 69 Gráfico 17: Nube de palabras más frecuentes en el corpus completo de notas marcadas. 85 Gráfico 18: Evolución cronológica de cuatro términos frecuentes en los recortes periodísticos. 87 Gráfico 19: Evolución de los términos más frecuentes en voladas, titulares y bajadas. 90 Gráfico 20: Porcentajes de etiquetas semánticas usadas en el corpus. 91 Gráfico 21: Diagrama aluvial de personas mencionadas según sexo y rol. 93 Gráfico 22: Nube de palabras de los 1.159 lugares mencionados en el corpus. 95 Gráfico 23: Diagrama de los espacios de violencia mencionados en el corpus. 96 Gráfico 24: Diagrama aluvial de las organizaciones mencionadas en el corpus. 98 Gráfico 25: Tipos de organizaciones estatales mencionadas en el corpus. 99

Page 4: El marcado digital de texto: una exploración con el

4

Lista de tablas

Tabla 1: Publicaciones impresas del LUM analizadas. 32 Tabla 2: Cantidad de artículos sobre memoria histórica seleccionados para análisis de referencias. 35 Tabla 3: Lista de etiquetas semánticas y principales atributos. 72 Tabla 4: Lista de titulares organizados por fecha de publicación. 79 Tabla 5: Evolución de términos en el corpus según frecuencia relativa. 89 Tabla 6: Relaciones entre rol y sexo de personas mencionadas en el corpus. 94 Tabla 7: Tipos de citas textuales marcadas, según fuente y sexo. 100 Tabla 8: Selección de voces femeninas en el corpus periodístico. 102 Tabla 9: Selección de citas de militares y funcionarios públicos. 105

Page 5: El marcado digital de texto: una exploración con el

5

Resumen

Este trabajo muestra los resultados de un experimento de marcado digital de texto aplicado en

147 recortes de prensa escrita que documentaron casos de desapariciones forzadas ocurridas en

el Perú durante el conflicto armado interno (1980 - 2000). Estos artículos, publicados entre 1982

y 1993 en diarios y revistas peruanos, fueron descargados de la plataforma web del Centro de

Documentación e Investigación (CDI) del Lugar de la Memoria, la Tolerancia y la Inclusión

Social (LUM) del Perú y luego sometidos a codificación digital mediante el lenguaje de marcado

XML, de acuerdo con directrices inspiradas en la Text Encoding Initiative (TEI). El

procesamiento automático del corpus permitió elaborar visualizaciones sobre la representación

mediática de las desapariciones forzadas en el Perú; extraer información acerca del discurso de

los familiares de las víctimas, militares y autoridades políticas; y, por último, explorar ciertas

características de la prensa escrita durante los años del conflicto. Con este ejercicio, el proyecto

invita a la comunidad de humanistas digitales latinoamericanos a reflexionar sobre la

digitalización del archivo histórico, las fuentes disponibles para la construcción de la memoria y

las posibilidades del marcado de texto como un método enriquecido de indagación académica.

Palabras clave

Desapariciones forzadas, conflicto armado interno del Perú, humanidades digitales, archivo

histórico digital, marcado de texto, XML/TEI, periodismo

Page 6: El marcado digital de texto: una exploración con el

6

Abstract

This work presents the results for an experiment based on digital text markup applied in 147

newspaper cuttings that supported cases of enforced disappearances that occurred in Peru during

the internal armed conflict (1980-2000). These articles, published between 1982 and 1993 in

journals and weekly magazines, were downloaded from the website of the Centro de

Documentación e Investigación (CDI) of the Lugar de la Memoria, la Tolerancia y la Inclusión

Social (LUM) located in Peru. Then, they were put through digital encoding using the XML

markup language, according to the guidelines based on the Text Encoding Initiative (TEI). The

automatic processing of the corpus allowed, firstly, the elaboration of visual representations of

the enforced disappearances in Peru; to extract information of the speech from the victims'

relatives, the military and political authorities; and finally, to explore certain features from the

written press during the conflict years. With this exercise, the project invites to the Latin

American community of digital humanists to reflect on the digitalization of the historical archive,

the sources available for the construction of memory, and the possibilities of text markup as an

enriched method of academic inquiry.

Keywords

Enforced disappearances, Peru's internal armed conflict, digital humanities, digital historical

archive, text markup, XML / TEI, journalism

Page 7: El marcado digital de texto: una exploración con el

7

1 - Introducción

En los últimos veinte años del siglo pasado, la extrema violencia y la crueldad marcaron al Perú.

El conflicto armado interno, que enfrentó a dos organizaciones subversivas con las fuerzas del

Estado y los grupos campesinos de autodefensa, dejó más de 69 mil muertos y desaparecidos,

según la estimación dada en el Informe Final de la Comisión de la Verdad y Reconciliación

(CVR). Entre las numerosas secuelas de la guerra, una de las más notorias y palpables hasta hoy

son las desapariciones forzadas. Durante los años que estuvo activa, entre el 2001 y 2003, la

comisión recibió reportes directos de 4.414 casos de desapariciones forzadas atribuibles a

agentes del Estado (CVR, tomo VI, 74). Hoy, a cuarenta años de iniciada la violencia, sabemos

que aquella cifra fue modesta. La información oficial más reciente del gobierno peruano señala

que al menos 20.511 personas desaparecieron entre mayo de 1980 y noviembre del 2000 . Las 1

víctimas de estos crímenes de lesa humanidad, al igual que el grueso de personas afectadas por el

conflicto, fueron campesinos indígenas y pobres de las regiones andinas o selváticas del país.

En el Perú, los casos de personas que siguen buscando a sus familiares tras más de veinte

años de ausencia se cuentan por miles. En el 2019, el Ministerio de Justicia y Derechos Humanos

de ese país confirmó que apenas se habían devuelto los restos óseos de 1.199 desaparecidos a sus

respectivos familiares; es decir, el 5,8% del total de víctimas. Al menos tres veces al año, el

gobierno realiza ceremonias públicas de restitución de cuerpos en los que participan los

familiares de los desaparecidos y representantes del Estado . En paralelo, varias organizaciones 2

La cifra de 20.511 desaparecidos fue proporcionada personalmente a este investigador en junio del 2019 por Mónica Barriga, 1

jefa de la Dirección General de Búsqueda de Personas Desaparecidas, que depende del Ministerio de Justicia y Derechos Humanos del Perú. Este número comprende tanto a las víctimas de las fuerzas estatales como a las de grupos subversivos.

La última ceremonia de restitución de restos óseos documentada en este ensayo fue en enero del 2020, cuando se entregaron los 2

cuerpos de 14 personas desaparecidas en mayo de 1983 en Ayacucho. Para más información ver: https://bit.ly/3fugVWG

Page 8: El marcado digital de texto: una exploración con el

8

defensoras de los derechos humanos suelen convocar a conferencias y otras actividades

informativas para mantener vigente en la agenda pública la problemática de las desapariciones.

Entre estos organismos destaca la Asociación Nacional de Familiares de Detenidos, Secuestrados

y Desaparecidos del Perú (ANFASEP), fundada en 1983, que recientemente presionó al gobierno

para que creara un banco de datos genéticos que garantice la identificación de los restos humanos

que yacen en al menos tres mil sitios de entierro clandestino.

Aunque el reconocimiento de los derechos de las víctimas de la violencia y las

reparaciones civiles que les corresponden avanzan a paso lento en el Perú , sí hay entidades 3

públicas que velan, al menos, por la conservación del patrimonio documental producido en torno

al conflicto armado. Uno de estos organismos es el Lugar de la Memoria, la Tolerancia y la

Inclusión Social (LUM), inaugurado en diciembre del 2015 en Lima y planeado como un recinto

pedagógico y conmemorativo sobre la violencia que azotó al país. El LUM, que depende

burocráticamente del Ministerio de Cultura del Perú, cuenta con salas de exhibición permanentes

y temporales, así como bibliotecas y espacios de interacción orientados a la reflexión del

conflicto. Un ambiente notable del LUM (cuya sede física se ubica frente al mar limeño, en el

distrito de Miraflores) es el Centro de Documentación e Información (CDI) que cuenta con salas

de lectura y computadoras de libre acceso. Además, el CDI gestiona una plataforma digital que

alberga archivos históricos, periodísticos y artísticos del conflicto.

Según su página web institucional, el CDI tiene como objetivo centralizar, clasificar,

organizar y digitalizar el patrimonio documental del conflicto armado con el fin de hacerlo

Una evaluación hecha en el 2013 por Sofía Macher, socióloga y miembro de la CVR, estimó que de las 85 recomendaciones 3

emitidas por la comisión al Estado peruano, un 55% tenía un avance insatisfactorio o ni siquiera se había iniciado. Para más información ver: “¿Hemos avanzado? A 10 años de las recomendaciones de la Comisión de la Verdad y Reconciliación”, IEP Instituto de Estudios Peruanos, 2014.

Page 9: El marcado digital de texto: una exploración con el

9

accesible a las “generaciones presentes y futuras” (LUM, página web). El material alojado ahí está

disponible gratuitamente para la investigación académica y tiene vocación pública: no hay horarios,

no se requiere carta de presentación ni registro del usuario para la revisión y descarga de los

archivos. El único requisito es respetar la propiedad intelectual de las colecciones. Consultado para

esta investigación, el equipo técnico del CDI informó que hasta el 3 de agosto del 2019 había en su

plataforma 188.302 documentos digitales. Esto incluía fotografías, videos, recortes periodísticos,

libros, revistas, afiches, procesos constitucionales, documentos desclasificados, historietas, entre

otros [ver anexo]. Estos documentos provenían de 25 colecciones de entidades estatales,

organizaciones no gubernamentales, museos y personas naturales.

Esta investigación explora una porción del archivo del CDI compuesta por 147 artículos

periodísticos que documentaron las desapariciones forzadas en el Perú. Este material fue

sometido a estructuración y etiquetado semántico mediante el esquema XML/TEI, usado en el

ámbito de las humanidades digitales para la codificación e intercambio de documentos (sobre

todo de fuentes escritas). El propósito de este ejercicio es comprobar la utilidad del marcado

digital de texto en el análisis académico. Mediante la extracción automática de listas de nombres

de personas, lugares u organizaciones y el resaltado de las citas, fue posible cuantificar la

información disponible en las notas periodísticas y activar un archivo que, hasta el momento,

tenía posibilidades de manipulación limitadas. Este ejercicio, cuyo carácter preliminar y

experimental se resalta, permitió definir varias características de la representación mediática de

las desapariciones forzadas y explorar la naturaleza del discurso de las víctimas, militares,

políticos y otros actores del conflicto.

Page 10: El marcado digital de texto: una exploración con el

10

Más allá de su componente metodológico, este ensayo también busca reflexionar sobre la

construcción de la memoria histórica en el Perú, a cuarenta años de iniciada la violencia y en un

momento en el que se realizan esfuerzos en aras de la digitalización del archivo. Por ello, en el

marco teórico se repasa la importancia del Informe Final de la Comisión de la Verdad (CVR)

que, a la fecha, sigue siendo el esfuerzo gubernamental de mayor alcance para establecer una

narrativa explicativa en torno al conflicto armado. Debido a que la CVR consideró en su informe

final fuentes de distinta naturaleza (testimonios de víctimas, informes policiales y militares,

estadísticas, pericias forenses, entre otros), no es un objetivo de esta investigación confirmar ni

desacreditar lo dicho por la comisión. Se busca, más bien, invitar a los académicos interesados en

temas digitales, memoria histórica y análisis del discurso periodístico a pensar en la

transformación de las fuentes históricas y hacer un uso reflexivo de un archivo abierto –el del

CDI– para aprovecharlo y construir una lectura más plural sobre el conflicto armado peruano.

2 - Planteamiento del problema y justificación

Presentado al público el 28 de agosto del 2003, el Informe Final de la CVR es el documento de

consulta por excelencia de los académicos que exploran el conflicto armado interno peruano. Un

análisis cuantitativo realizado en esta investigación entre 48 autores publicados en los libros,

revistas y boletines del LUM demostró que el informe de la CVR es, por mucho, el documento

más mencionado entre los referentes bibliográficos. Para quienes exploran las numerosas aristas

del conflicto entre la subversión y el Estado, el informe es un punto de partida, la fuente de

consulta obligada para construir argumentos sobre las violaciones de derechos humanos que

ocurrieron en ese país entre 1980 al 2000. Sin duda, esto se debe al carácter histórico y global de

la comisión, así como al auspicio gubernamental del que gozó en su momento. Como se

Page 11: El marcado digital de texto: una exploración con el

11

menciona en la introducción del Informe Final, la misión dada a la CVR por el gobierno de

transición de Valentín Paniagua (noviembre del 2000 - julio del 2001) fue “esclarecer la

naturaleza del proceso y los hechos del conflicto armado interno que vivió el país, así como

determinar las responsabilidades derivadas de las múltiples violaciones de los derechos

fundamentales ocurridas en aquellos años” (CVR, tomo I, 21).

Es decir, desde su origen la CVR se planteó como una guía explicativa del conflicto así

como un documento de relevancia política, jurídica y legal. Entre las amplias competencias de la

Comisión de la Verdad, de acuerdo al decreto de la Presidencia del Consejo de Ministros del Perú

que le dio partida, estaban analizar las condiciones políticas, sociales y culturales de la sociedad

peruana que contribuyeron a la violencia; esclarecer la responsabilidad de las violaciones de

derechos humanos y procurar determinar el paradero de las víctimas; elaborar propuestas de

reparación de víctimas y familiares; y recomendar reformas institucionales, legales y educativas

que garanticen la no repetición del conflicto (CVR, tomo I, 26).

Estos objetivos de tan largo aliento fueron materializados en un informe de más de cinco

mil páginas, en nueve tomos y seis anexos, que resumen los principales acontecimientos de la

guerra. Hay en el reporte una exposición general del conflicto armado; lo que incluye una

delimitación cronológica, análisis geográfico, determinación de los perfiles de la violencia y

varios tipos de análisis jurídicos. También se hizo una radiografía de los actores armados,

políticos y sociales; varios recuentos de historias representativas de la guerra y exploraciones

específicas sobre las notorias violaciones de derechos humanos cometidas, entre ellas las

desapariciones forzadas. Más adelante, en el marco teórico, se profundizarán las principales

características de este informe respecto al tipo de narrativa que presentó al país en el 2003.

Page 12: El marcado digital de texto: una exploración con el

12

Ahora bien, en los últimos 17 años, las universidades y centros de investigación en ciencias

sociales han producido una importante bibliografía sobre lo dicho -o lo silenciado- por la

comisión. Y hace cinco años, el Gobierno del Perú inauguró el Lugar de la Memoria, la

Tolerancia y la Inclusión Social (LUM), que recoge en su propuesta museográfica y de archivo

mucho de lo investigado por la Comisión de la Verdad. Es en este último punto, el del archivo,

ya sea físico o digital, en el que se inscriben los problemas de investigación de este ensayo: ¿Qué

entendemos con digitalización del patrimonio documental?, ¿Cuáles son sus ventajas y

desventajas?, ¿Es suficiente digitalizar los archivos –entiéndase ‘escanearlos’– y exhibirlos en

una página web, como ocurre con el Centro de Documentación e Información del LUM?, ¿Cómo

mejorar las herramientas de exploración del archivo?, ¿Cómo enriquecerlo y activarlo?

Estas preguntas intentan resolverse aquí mediante dos campos teóricos: 1) la memoria

histórica y el relato histórico; 2) las humanidades digitales, el archivo digital y el marcado de

texto. Estos serán detallados luego pero, a manera de resumen, aclaremos algunas características.

En primer lugar, respecto la memoria histórica y el relato histórico este proyecto recuerda

cuál fue el discurso de la CVR sobre el conflicto armado en general y sobre las desapariciones

forzadas en particular. Se trata aquí de examinar, por ejemplo, qué cronología estableció la

comisión para los años de conflicto y cómo esa temporalidad define una narrativa . Hay que 4

tener en cuenta las limitaciones propias de un informe que debe reseñar en espacio limitado

procesos sociales y acontecimientos históricos complejos. Sobre las desapariciones forzadas, por

ejemplo, el Informe Final de la CVR –en su tomo VI, capítulo 1.2– ofrece información

estadística, construye argumentos a partir de estos datos y los ilustra con casos particulares de

Cronología que es replicada, con ligeros cambios, por el Centro de Documentación e Información del CDI en su página web. 4

Page 13: El marcado digital de texto: una exploración con el

13

familiares de víctimas y testigos. Se trata de una narrativa global, que cubre un gran número de

sucesos en aproximadamente cien páginas. Quizá por urgencia de síntesis, es un discurso que se

concentra en las desapariciones ocurridas en el escenario central del conflicto: Ayacucho. Hoy

sabemos que las desapariciones también afectaron en amplia medida a las comunidades

amazónicas y a gremios urbanos como maestros, sindicalistas y periodistas . 5

Este ensayo también explora parte de la producción bibliográfica posterior a la publicación

del Informe Final que ha hecho hincapié en los silencios y vacíos en el relato de la CVR.

Documentación que advierte, entre otros temas, cierta subexposición de los testimonios de los

agresores (militares y subversivos) frente a las versiones ofrecidas por las víctimas y familiares

de víctimas. Varios autores que se han interesado por la memoria del posconflicto peruano

coinciden en que el Informe Final no es una versión oficial de la guerra ni un relato que clausure

las discusiones. Señalan, más bien, que es importante recurrir a nuevos archivos y ampliar el

espectro de voces para construir una memoria más democrática y completa [ver marco teórico].

En segundo lugar, desde las humanidades digitales, el archivo digital y la metodología del

marcado de texto, se reseñan en este ensayo los esfuerzos recientes del Estado peruano por la

conservación y digitalización de la documentación del conflicto armado interno. Trabajos que se

inscriben en un momento social específico: un mundo con futuro incierto, que a falta de grandes

narrativas (tras el fin de la Guerra Fría), se aboca a la exploración exhaustiva de su pasado

traumático reciente. Y un país latinoamericano en posconflicto, el Perú, que pese a que tiene un

informe que pretende explicar su conflicto más atroz, aún está lejos de curar sus heridas. Es en

Según cifras proporcionadas a la prensa por el Ministerio de Justicia del Perú en el 2018, las regiones donde se perpetraron más 5

desapariciones fueron Ayacucho, Junín, Huánuco, San Martín y Huancavelica. Tres de estos departamentos tienen amplias zonas selváticas. Para más información sobre desapariciones forzadas en la Amazonía véase el artículo “El contexto de los campos de internamiento de Sendero Luminoso y el derecho humanitario internacional” de la antropóloga Mariella Villasante.

Page 14: El marcado digital de texto: una exploración con el

14

este contexto en el que el CDI digitaliza archivos sobre el conflicto armado con objetivos

pedagógicos. Pero, ¿hay un norte en este proceso?, ¿se están invirtiendo los recursos, escasos en

un país de ingresos medios como el Perú, de una forma racional?, ¿se está produciendo

conocimiento académico sobre el conflicto armado a partir de fuentes digitales? Para este ensayo

se hicieron entrevistas y ejercicios que intentaron responder a estas preguntas. Y, no menos

importante, se propone que el marcado de textos –una herramienta vinculada a las humanidades

digitales– es útil para los propósitos pedagógicos que busca el CDI debido a que facilita la

estructuración de los documentos históricos y la extracción de información. Este ensayo explora

las ventajas y limitaciones del XML como lenguaje de marcado aplicado a la memoria histórica.

¿Cuál es la pertinencia de analizar estos temas? Esta investigación no pretende ser un

tutorial de una herramienta digital aplicada a un corpus de textos. El principal objetivo es aportar

una vía de exploración al debate sobre la memoria histórica que se está dando en Perú y

Colombia (país en el que se redacta este ensayo). Hoy, la discusión académica sobre el pasado

reciente traumático se desarrolla en estas naciones sobre todo en los campos más tradicionales de

las ciencias sociales: antropología, sociología, psicología e historia. En el caso peruano, pese a

que el CDI tiene herramientas de exploración en línea, la perspectiva digital aún no ha sido

incorporada de forma significativa en la producción bibliográfica. Por ejemplo, en el repositorio

de tesis de maestría de la Pontificia Universidad Católica del Perú (que tiene facultades sólidas

de ciencias sociales y un instituto especializado en derechos humanos) hay 186 investigaciones

relacionadas con las desapariciones forzadas . De ellas, solo una tesis, titulada “Espacio de 6

Simulación Virtual de la Memoria “Sonk´oymi Yuyanmi - Mi Corazón Recuerda”, aborda un

De acuerdo a una búsqueda realizada en marzo del 2020 en este repositorio digital: http://tesis.pucp.edu.pe/repositorio/6

Page 15: El marcado digital de texto: una exploración con el

15

tema digital de forma directa . Esta ausencia de investigaciones en temas digitales y de memoria 7

reflejaría las disparidades tecnológicas en los medios académicos latinoamericanos. Pese a que

prácticamente todos los investigadores de hoy usan computadoras e Internet para redactar sus

ensayos, la reflexión en torno a estas herramientas no abunda. En ese sentido, las humanidades

digitales buscan asistir a los académicos, dotarlos de habilidades informáticas y ampliar sus

marcos de investigación. Este experimento quiere contribuir en esa línea.

3 - Objetivos

Como pretende ser un proyecto de humanidades digitales, este ensayo tiene una doble finalidad:

hay objetivos de investigación procedimentales y también teóricos. En cuanto a lo

procedimental, este experimento busca enriquecer un archivo digital disponible que está

compuesto por 147 notas de prensa publicadas hace más de 27 años en el Perú. Este

enriquecimiento se persigue a través del marcado digital de texto, una metodología promovida

desde hace décadas en las humanidades digitales, que añade información codificada a un

documento y faculta su manipulación a través de métodos automáticos. Es decir, pasaremos de la

descarga de imágenes codificadas en píxeles (archivos en extensión JPG) a documentos de texto

electrónico cuyo procesamiento es posible a través de fórmulas informáticas, en este caso con

Transformaciones de Lenguaje de Hoja de Estilo Extensible (XSLT, por sus siglas en inglés). La

finalidad de este ejercicio es comprobar que el marcado digital de texto facilita la exploración del

archivo y que, en última instancia, la metodología aplicada en este ensayo puede extenderse al

tratamiento de otros materiales relacionados con la memoria histórica.

En este caso, la implementación de espacios de memoria a través del videojuego Second Life. 7

Page 16: El marcado digital de texto: una exploración con el

16

Respecto a los objetivos teóricos, este ensayo busca conciliar dos campos de investigación: la

memoria histórica y las humanidades digitales. En ese sentido, se describirá cómo el ejercicio de

la memoria sobre el conflicto armado peruano, a partir del trabajo de la Comisión de la Verdad y

Reconciliación, condujo a la construcción de archivos físicos y luego a la digitalización de los

mismos bajo la lógica de que la exhibición de los documentos en plataformas web ayuda a la

investigación académica. Por ello, se examinará en el marco teórico qué memorias sobre el

conflicto están vigentes en el Perú, cómo se comunican estas narrativas con el Informe Final de

la CVR y, finalmente, cuál es el estado del arte de la memoria histórica peruana en relación a los

trabajos con archivos físicos o digitales. Debido a que el material de investigación está

compuesto por notas periodísticas recolectadas originalmente por la Asociación Pro Derechos

Humanos (APRODEH) del Perú, y luego donadas por esta organización al CDI del LUM, en un

anexo se incluye una entrevista que detalla la historia de este archivo de prensa en particular.

4 - Marco teórico y antecedentes

Puede que suene redundante pero la historia –y la memoria histórica– son productos históricos.

Es decir, tienen una trayectoria, un pasado y un presente en desarrollo constante, voluble. Como

advierte la investigadora argentina Marina Franco, la historia de los hechos traumáticos recientes

“no deja de ser una construcción históricamente situada y sujeta a los avatares de su tiempo […]

dado que los vaivenes políticos y memoriales del presente condicionan y enmarcan aquello que

los historiadores pueden pensar y enunciar sobre los sucesos del pasado” (Franco 359). Aplicado

esto al caso peruano, es claro que la historia de la memoria histórica vinculada al conflicto

interno tiene un antes y un después con la publicación del Informe Final de la Comisión de la

Verdad y Reconciliación (CVR). La importancia de este reporte no solo se tradujo en el aumento

Page 17: El marcado digital de texto: una exploración con el

17

de la producción bibliográfica académica sobre la guerra posterior al 2003 sino que tuvo un

impacto evidente en la agenda de organizaciones activistas de los derechos humanos, en la

implementación de políticas estatales de reparación a las víctimas, e incluso, en la situación

jurídica de subversivos, militares y funcionarios públicos, entre ellos la del ex presidente peruano

Alberto Fujimori. Si el conflicto armado interno fue el acontecimiento que configuró la

naturaleza del Perú contemporáneo, el informe de la CVR es, en muchos sentidos, la lupa con la

que nos aproximamos a ese pasado. Un documento ineludible aunque de lectura controversial.

Ahora bien, ¿qué es lo que dijo la CVR en su Informe Final?, ¿cuáles son los marcos

ideológicos, historiográficos y narrativos en los que se inscribe?, ¿qué impacto académico tiene

hoy este documento, a 17 años de publicado? En resumen, ¿cuál es la historia de la CVR?

Revisemos estas preguntas que luego serán de utilidad para los propósitos de este proyecto.

Vayamos por partes. Como gran relato organizador de los acontecimientos ocurridos en el

Perú entre 1980 y el 2000, el Informe Final de la CVR concluyó que el conflicto armado interno

fue “el de mayor duración, el de impacto más extenso sobre el territorio nacional y el de más

elevados costos humanos y económicos de toda nuestra historia republicana” (CVR, Tomo I, 53).

Sin ambigüedades, el documento señala que la causa inmediata y fundamental del

desencadenamiento del conflicto fue la decisión del Partido Comunista del Perú - Sendero

Luminoso de emprender una guerra popular contra el Estado Peruano. Esta organización

subversiva, afirma la CVR, buscó derrocar por las armas a los sucesivos gobiernos peruanos

desde el 17 de mayo del 1980 y para ello hizo “uso sistemático y masivo de métodos de extrema

violencia y terror sin guardar respeto por las normas básicas sobre la guerra y los derechos

humanos” (CVR, Tomo I, 54). Frente a esta amenaza, señala el informe, el Estado tuvo el

Page 18: El marcado digital de texto: una exploración con el

18

derecho y el deber de defenderse dentro la Constitución. No obstante, la respuesta estatal a través

de las fuerzas armadas y policiales, fue decepcionante, añadió más violencia al país y ocasionó

graves violaciones a los derechos humanos, entre ellas miles de desapariciones forzadas . A este 8

escenario del conflicto, sufrido en medio de una severa precariedad social y de la debacle

económica de los ochentas, añade la CVR, se sumarían luego otros actores armados como el

Movimiento Revolucionario Túpac Amaru (MRTA), paramilitares y grupos campesinos de

autodefensa. La comisión distribuyó las responsabilidades de las miles de víctimas y concluyó

que Sendero Luminoso fue responsable del 53,68% de las muertes y desapariciones. Además,

atribuyó a los agentes del Estado, los Comités de Autodefensa (rondas) y paramilitares el 37,26%

de las víctimas. Eventualmente, a partir de 1992 tras la captura del líder terrorista Abimael

Guzmán, la subversión declinó en el Perú. El periodo de investigación de la CVR concluyó en

noviembre del 2000, cuando el ex presidente Alberto Fujimori huyó del país para luego renunciar

por fax a su cargo desde Japón. Eso en cuanto a los rasgos primordiales de la guerra.

Tan importantes como el marco temporal y de actores armados que trazó la CVR en su

Informe Final fueron las explicaciones estructurales y antecedentes ofrecidos respecto a la

violencia. La comisión situó al conflicto en un contexto político, social y cultural de

discriminación y marginalización en la sociedad peruana. Enfatizó que la violencia se sufrió de

forma desigual en el país y que afectó, sobre todo, a la población indígena, rural y empobrecida.

Señaló, además, que esta situación fue favorecida por la indiferencia de amplios sectores de la

sociedad respecto al dolor de otros peruanos que, ni entonces ni hoy, son considerados

Por fortuna, las desapariciones forzadas son crímenes reconocidos oficialmente por el Estado peruano. El Ministerio de Justicia 8

de ese país mantiene una Dirección General de Búsqueda de Personas Desaparecidas que actualiza la estadística sobre estos casos. Asimismo, en las ceremonias de restitución de restos óseos que organiza el gobierno, es usual que los representantes estatales pidan perdón a los familiares por los atropellos cometidos durante la violencia.

Page 19: El marcado digital de texto: una exploración con el

19

ciudadanos con pleno ejercicio de sus derechos. Así, la CVR fue rotunda en denunciar las

múltiples brechas que atraviesan el país de la cual la “más visible y dramática es la que separa

ricos y pobres” (CVR, Tomo VIII, 21). Según la comisión de la verdad, estos factores

permitieron que Sendero Luminoso captara seguidores en el país pues planteó a una población

descontenta y postergada “un discurso que producía la ilusión de abarcar toda la realidad, así

como la posibilidad de hacerse escuchar y de silenciar” (CVR, Tomo VIII, 21).

Dicho esto a modo de resumen, veamos ahora lo que han explorado algunos científicos

sociales respecto al contexto histórico en el que surge la CVR, la narrativa de memoria que

propone, la vigencia académica de este relato y su relación con nuestro objeto de investigación:

el archivo periodístico digitalizado sobre las desapariciones forzadas en el Perú.

4.1 La Comisión de la Verdad y Reconciliación como producto histórico

Quienes han estudiado a la Comisión de la Verdad y Reconciliación sugieren dos contextos de

producción: el nacional y el internacional.

Respecto a los factores internos que hicieron posible en el Perú la creación de un

organismo de esclarecimiento histórico sobre el conflicto armado, autoras como Cynthia E.

Milton, Rebekka Friedman y Lisa Laplante encuentran que la caída del régimen autoritario y

corrupto de Alberto Fujimori, y la posterior huída de este a Japón, ocasionaron un vacío de

poder particular. En este espacio, durante el cual se establece el gobierno provisional de

Valentín Paniagua, surge la alternativa de la CVR como un mecanismo de restablecimiento

democrático y de justicia transicional. Las investigadoras también coinciden en un punto que

distingue al caso peruano de otros conflictos Latinoamericanos: hacia el año 2001, cuando

inicia el trabajo de la comisión, las huestes de Sendero Luminoso y del MRTA habían sido

Page 20: El marcado digital de texto: una exploración con el

20

derrotadas militarmente, sus remanentes estaban aislados en sectores remotos del país y no

gozaban de simpatía ni respaldo social mayoritario. Por lo tanto, estas organizaciones carecían

de poder coercitivo, no fueron necesarias mesas de diálogo y, de acuerdo a Friedman, la

amnistía de los delitos no fue barajada como solución. “Como [Salomón] Lerner [presidente

de la comisión] recuerda, incluso si la CVR hubiera querido evitar la justicia retributiva, la

amnistía nunca fue una posibilidad dada la aversión local a Sendero Luminoso y la presión

internacional y regional de enjuiciar [a los responsables]” (Friedman 140, traducción propia).

En el caso de las fuerzas armadas, aunque victoriosas, fueron alcanzadas por los escándalos

de corrupción que envolvieron las postrimerías el gobierno de Fujimori. El Ejército, la Marina

y la Fuerza Aérea, apuntan las autoras revisadas, no evitaron que la CVR realice su labor pero

miraron con recelo al organismo, tuvieron pocas motivaciones para apoyarlo y más tarde

impugnaron los resultados del Informe Final. De hecho, uno de los doce comisionados

asignados por el gobierno para la dirección del proyecto fue el teniente general de la Fuerza

Aérea del Perú (en retiro hacia el 2001) Luis Arias Graziani. Él suscribió el Informe Final

bajo reserva y envió una carta a Salomón Lerner, presidente de la CVR, en la que consignó

sus desacuerdos con el reporte. Arias adujo que no podía juzgarse “con el mismo nivel de

responsabilidad” a Sendero Luminoso y al MRTA respecto a las fuerzas armadas debido a que

estas últimas “participaron en la acción contrasubversiva en cumplimiento de su misión

constitucional por disposición de los gobiernos de turno” (CVR, Tomo VIII, Carta del general

Luis Arias Graziani). Asimismo, Arias dijo estar inconforme con la cantidad de víctimas

estimada por la CVR (casi 70 mil) y con el porcentaje de responsabilidad que se le atribuía a

las fuerzas de gubernamentales. La misiva del ex militar comisionado, de cinco páginas, fue

Page 21: El marcado digital de texto: una exploración con el

21

consignada como parte del Informe Final. Más adelante, en el capítulo 4.2, detallaré cómo el

punto de vista de las Fuerzas Armadas es una de las narrativas sobre el conflicto armado que

participan en lo que Elizabeth Jelin denomina las “batallas por la memoria”.

Para complementar el panorama nacional en el que surge la CVR vale la pena tomar en

cuenta lo explicado por la socióloga peruana Sofía Macher (quien también fue parte de los

comisionados de la CVR) en el libro “¿Hemos avanzado? A 10 años de las recomendaciones

de la Comisión de la Verdad y Reconciliación”. En ese balance, Macher sitúa la historia de la

comisión en un panorama que va más allá del vacío de poder que dejó Fujimori tras su huida.

Para la socióloga, el camino hacia la conformación de la CVR inició en 1983 con la creación

de la Asociación Nacional de Familiares de Secuestrados, Detenidos y Desaparecidos del Perú

(ANFASEP) y de la Coordinadora Nacional de Derechos Humanos (CNDDHH). Es

significativo que Macher halle el germen de la comisión en los reclamos por las detenciones

arbitrarias y las desapariciones de ciudadanos, sobre todo teniendo en cuenta que durante el

conflicto se perpetraron otros crímenes atroces como masacres de pueblos enteros, torturas o

violaciones sexuales. La literatura jurídica y psicológica sobre desapariciones forzadas apunta,

por cierto, a que estos crímenes de lesa humanidad producen heridas sociales profundas

debido a su naturaleza de delito permanente, que no cesa, que genera en los familiares de los

desaparecidos una angustia continua debido a no saber el paradero de sus seres queridos.

Respecto a los factores internacionales que influyeron en el surgimiento de la CVR

peruana, la historiadora Cynthia E. Milton encuentra que esta organización nace en una época

en la que varias otras comisiones se creaban en el mundo tras el fin de la Guerra Fría.

Page 22: El marcado digital de texto: una exploración con el

22

Entrenada por consultores internacionales como el Centro Internacional para la

Justicia Transicional y alentada por grupos nacionales de derechos humanos, la CVR

peruana pudo ir más allá de otras comisiones de verdad y reconciliación. Sin embargo, a

pesar de tener a su favor la experiencia de las comisiones de otros países, la CVR

enfrentó limitaciones similares: tuvo un periodo de tiempo restringido para conducir sus

investigaciones sobre los 20 años previos, recursos limitados y dificultades para traducir

quechua u otras lenguas indígenas al español (Milton 148 y 149, traducción propia).

En la misma línea, Rebekka Friedman ubica a la CVR peruana en un legado regional que

vincula a las comisiones de la verdad con luchas por justicia y democratización y en un clima

de “fuerte apoyo normativo regional e internacional para la justicia criminal” (Friedman 139).

Las autoras mencionan también que la principal inspiración de la CVR peruana vino de

Guatemala debido a las similitudes en los contextos de opresión histórica contra poblaciones

pobres y comunidades indígenas en sus respectivos conflictos armados . 9

Al analizar las aristas filosóficas, políticas, forenses y legales que encierra el término

“verdad”, la investigadora Lisa Laplante aporta una mirada interesante respecto a estas

comisiones. Apoyándose en las ideas del filósofo canadiense Ian Hacking, Laplante halla una

relación entre los instrumentos que usamos para probar una verdad con la forma en la que

narramos este discurso.

“De hecho, los intentos de la CVR de escribir esta narrativa histórica, especialmente localizando la violencia en arraigados 9

patrones de racismo, son similares a los de la Comisión para el Esclarecimiento Histórico de Guatemala. Es esta perspectiva de longue durèe la que llevó al presidente de la CVR, Salomón Lerner, a situar (y en parte comparar) las muertes y desapariciones de las décadas de 1980 y 1990 con la lucha continua de una nación fracturada e incompleta que se remonta a la Guerra del Pacífico en la década de 1880”, señala Cynthia Milton en “La verdad después de 10 años de la Comisión de la Verdad y Reconciliación en Perú” [ver lista de obras citadas].

Page 23: El marcado digital de texto: una exploración con el

23

Desde este punto, uno podría decir que las comisiones de la verdad han generado

un nuevo tipo de verdad que surge de la memoria, presentando sus propios matices y

complejidades, y también creando una fascinación mundial con este mecanismo

generador de verdad. De hecho, cuando Perú formó su comisión de la verdad, en

2002 [2001, en realidad], se convirtió en uno de los treinta países desde 1970 en

embarcarse en tal esfuerzo (Laplante 437, traducción propia).

De acuerdo a esta lógica, las comisiones de la verdad configuran una tecnología de verdad

contemporánea orientada a la obtención de un discurso histórico - narrativo sobre el pasado

traumático reciente. Para mayor información sobre la naturaleza y objetivos de las comisiones

de la verdad en el mundo recomiendo la lectura de “Unspeakable Truths. Transitional Justice

and the Challenge of Truth Commissions” de Priscilla B. Hayner una de las exploraciones

mejor documentadas sobre el trabajo de cuarenta comisiones en el mundo. Según ese

documento, hacia el 2011 se habían ejecutado comisiones en los siguientes lugares:

Gráfico 1: Países y localidades en los que se han desarrollado comisiones de la verdad. Fuente: Priscilla B. Hayner. Elaboración propia con Google Maps. [ver detalle en anexo]

Page 24: El marcado digital de texto: una exploración con el

24

Tanto el contexto nacional como el internacional definieron la naturaleza de la CVR

peruana. Pero, ¿en qué radicó este carácter? Friedman, Milton y Laplante coinciden en que, a

diferencia de otras comisiones de la verdad, el organismo de esclarecimiento histórico

peruano tuvo una orientación altamente punitiva. Es decir, la información recabada por la

CVR no solo tuvo un objetivo académico, de acceso a la verdad y de restitución de derechos,

sino que condujo a los tribunales a muchos actores involucrados en el conflicto. Según

Laplante, al concluir su mandato, la CVR envió al Poder Judicial 47 casos que promovían el

enjuiciamiento de presuntos responsables de crímenes de lesa humanidad. Esta mirada clara

hacia la persecución del delito no habría sido posible, por ejemplo, en Chile donde los

militares conservaron un poder considerable tras la salida de Augusto Pinochet. Según Milton,

la comisión que se formó en ese país entre 1990 y 1991 tuvo un mandato más restringido que

la CVR peruana. La primera solo podía investigar casos de muertes y desapariciones mientras

que en Perú se recabó información sobre asesinatos, secuestros, desapariciones, torturas,

heridas graves, violaciones de derechos colectivos de comunidades indígenas entre otros. Una

caso similar es descrito en Sudáfrica, donde la comisión que operó ahí entre 1995 y el 2002

“solo consideró graves violaciones de derechos humanos y excluyó la violencia cotidiana que

fue resultado del apartheid” (Milton 149, traducción propia).

Para cerrar esta breve exposición sobre las condiciones históricas de la Comisión de la

Verdad y Reconciliación del Perú, veamos la composición de los doce miembros de su mesa

directiva. Esta fue presidida por el filósofo y catedrático Salomón Lerner Febres y compuesta

por Beatriz Alva Hart (abogada), Rolando Ames Cobián (sociólogo), José Antúnez de Mayolo

(sacerdote salesiano), Enrique Bernales Ballesteros (abogado constitucionalista), Carlos Iván

Page 25: El marcado digital de texto: una exploración con el

25

Degregori Caso (antropólogo), Gastón Garatea Yori (sacerdote de los Sagrados Corazones),

Humberto Lay Sun (pastor evangélico), Alberto Morote Sánchez (ingeniero y ex rector de la

Universidad San Cristóbal de Huamanga de Ayacucho), Carlos Tapia García (ingeniero y

analista político) y los ya mencionados Sofía Macher Batanero (socióloga) y Luis Arias

Graziani (teniente general de la Fuerza Aérea, en retiro al momento de la comisión). Esta

composición, como casi todo lo dicho y hecho por la CVR, fue motivo de discrepancia en en

el país. Friedman menciona, por ejemplo, que en una de sus investigaciones realizadas en

Ayacucho “algunos consideraron que la CVR era muy ‘académica’ e ‘intelectual’, los

entrevistados apuntaron que la mayoría de los comisionados eran personas educadas,

orientadas hacia la izquierda, hombres blancos de Lima y que solo uno de ellos hablaba

quechua” (Friedman 167, traducción propia). Vista hoy esta mesa directiva también podría

cuestionarse que solo dos de los doce comisionados hayan sido mujeres, que no se haya

incluido voces indígenas en la conformación, que ninguno haya sido historiador profesional o

que todos hayan sido peruanos y no se contemplara la inclusión de un especialista extranjero.

Vale tener en cuenta, eso sí, que el trabajo de la CVR no se limitó a estas doce personas sino

que, en total, trabajaron más de 800 funcionarios durante dos años para producir el informe.

4.2 No una sino muchas memorias

En el Perú hay tantas memorias sobre el conflicto armado interno como personas dispuestas a

recordar su experiencia, ya sea como un sufrimiento vivido en carne propia, como una historia

familiar heredada o como un discurso escuchado en los medios de comunicación. Debido a

esta multiplicidad de historias y vivencias, Cynthia E. Milton encuentra que la CVR no puede

ser considerada como la versión oficial del pasado reciente del Perú.

Page 26: El marcado digital de texto: una exploración con el

26

Pese a ser una comisión de la verdad con mandato gubernamental, los resultados y

recomendaciones de la CVR no han sido cabalmente adoptados por ninguno de los

gobiernos ulteriores. En consecuencia, los resultados de la CVR no pueden ser

declarados como la versión “oficial” del pasado, y diferentes bandos de memoria

refutan a su manera los resultados de la CVR, intentando ofrecer narrativas históricas

contrapuestas sobre dicho pasado (Milton 228).

Resumamos a continuación qué es lo que proponen algunas de estas narrativas históricas y

veamos si existe una geografía de la memoria peruana del conflicto. Una de las vertientes más

frecuentemente citadas por los académicos peruanos es la llamada memoria salvadora,

concepto acuñado por Steve Stern y descrito por el antropólogo Carlos Iván Degregori, tal vez

el principal investigador del fenómeno de Sendero Luminoso. De acuerdo a este discurso, la

victoria sobre la subversión solo podía darse en el país mediante la derrota militar del

enemigo, en una lucha en la cual los derechos humanos podían hacerse a un lado. Degregori

apunta que en esta historia

los protagonistas centrales de la gesta pacificadora eran Alberto Fujimori y

Vladimiro Montesinos. Las Fuerzas Armadas y Policiales aparecían como actores

secundarios y las instituciones civiles y ciudadanos de a pie como meros

espectadores pasivos de ese drama en blanco y negro en el cual la encarnación del

mal no solo eran Sendero Luminosos y el MRTA, sino todos aquellos que

discrepaban con la versión oficial sobre lo ocurrido en esos años. (Degregori 264).

En este drama en blanco y negro Milton encuentra un serio riesgo para la construcción de

una memoria democrática y de reconciliación. En la simplificación del conflicto, en la

Page 27: El marcado digital de texto: una exploración con el

27

presentación de la historia como un juego sucio de villanos y salvadores yacería, de acuerdo a

la investigadora, cierta voluntad de diluir la responsabilidad de las autoridades que

permitieron los abusos contra los derechos humanos.

Milton advierte que esta memoria salvadora en el Perú supera a las figuras de Alberto

Fujimori y su asesor Vladimiro Montesinos. En su artículo “Public spaces for the discussion

of Peru´s recent past”, la historiadora reseña la intención del ex presidente peruano Alan

García, durante su segundo gobierno (2006 - 2011), de reemplazar la nomenclatura de varias

calles del país con los nombres y apellidos de ex combatientes de las fuerzas armadas y

policiales caídos en combate con la subversión. La autora encuentra que el acto nombrar es

uno de los frentes de las batallas por la memoria descritas por Elizabeth Jelin . “Al elegir 10

nombrar a las fuerzas armadas y policiales como “nuevos héroes”, sus abusos contra los

derechos humanos y excesos documentados en el Informe Final se ven disminuidos en gran

medida, sino completamente borrados” (Milton 161). Como se verá más adelante, la acción de

nombrar, de interpretar y añadir una interpretación semántica a un documento es una de las

bases conceptuales del marcado digital de textos. Pero volvamos a la memoria histórica.

La llamada memoria salvadora no es el único discurso que se disputa en Perú el derecho

de construir un relato sobre el conflicto armado interno. Los autores señalan, más bien, que en

la actual etapa post CVR el país asiste a la emergencia de nuevas narrativas históricas que, en

mayor o menor medida, buscan desligarse o coincidir con lo dicho por la comisión. Sofía

Macher describe, por ejemplo, que la Comisión Permanente de Historia del Ejército del Perú

presentó en el 2012 el libro “En honor a la verdad” que busca ser una réplica institucional de

En “Los trabajos de la memoria” de Elizabeth Jelin (Siglo Veintiuno de España Editores, 2002).10

Page 28: El marcado digital de texto: una exploración con el

28

las fuerzas armadas a los argumentos presentados por la CVR en su Informe Final. “En ella se

ofrece una versión épica del conflicto, dedicada a “todas las personas militares y civiles que

desde 1980 defendieron y aún luchan por la causa de la patria con vigor heroico”” (Macher

163). Además, la socióloga y ex comisionada reseña la emergencia en la última década del

Movimiento por la Amnistía y los Derechos Fundamentales (MOVADEF), una agrupación

que reivindica el pensamiento de Sendero Luminoso y pide la amnistía para Abimael Guzmán

y los así llamados presos políticos. Por último, Macher señala que el gobierno tampoco ha

cesado en sus esfuerzos de regular la memoria del conflicto. Uno de estos trabajos, afirma, fue

la creación del Lugar de la Memoria, la Tolerancia y la Inclusión Social, cuyo Centro de

Documentación e Investigación es materia de estudio en este ensayo . 11

Por su parte, Laplante menciona que en los últimos años ha surgido en el Perú el impulso

por contar historias sobre el conflicto armado y que las “víctimas sobrevivientes están

empezando a rechazar la narración pasiva de sus historias a terceros y, en cambio, se están

apropiando de sus propias agencias para diseminar historias” (Laplante 435, traducción

propia). En tanto, Friedman describe que hay narrativas distintas de la violencia según la

ubicación geográfica de las víctimas. Para ella, la forma en la que se sufrió la violencia en los

Andes, y en Ayacucho en particular, respecto a la costa peruana y Lima, condicionan las

experiencias, y por tanto, los discursos. Un ejemplo de estas divergencias serían las

discrepancias que surgieron en la ANFASEP de Ayacucho respecto a la cantidad de muertes

que atribuyó la CVR a las fuerzas armadas debido a que los familiares de los desaparecidos

sufrieron, en mayor medida, la represión y el abuso de estos organismos estatales.

Vale la pena aclarar que Sofía Macher no encuentra una línea continua entre el establecimiento de la CVR (2001 - 2003) y la 11

implementación del LUM (inaugurado en el 2015). Ella ve, más bien, discrepancias entre ambas organizaciones.

Page 29: El marcado digital de texto: una exploración con el

29

¿Es algo negativo que el Perú aún no haya logrado un consenso sobre lo ocurrido entre

1980 y el 2000? En absoluto. Aunque con matices, los autores que forman parte de este marco

teórico coinciden en que es positivo que el conflicto armado interno no se considere un caso

cerrado y que sigan emergiendo narrativas que impugnen, interpelen y cuestionen lo que

sabemos hasta el momento acerca de este vergonzoso periodo de la historia peruana. En ese

sentido, Sofía Macher elogia el “dinamismo con el que se continúa utilizando la información

producida por la CVR” (Macher 166). Friedman señala que la CVR ha sido para el país un

importante catalizador de memorias alternativas. Milton añade que pese a que la CVR es,

paradójicamente, mejor valorada en el extranjero que en su propio país, ha tenido logros muy

positivos como la creación de un archivo documental abierto, hoy administrado por la

Defensoría del Pueblo. Laplante, aunque califica a los nueve volúmenes del Informe Final

como una memoria histórica inerte advierte que esta puede y debe activarse a través de

memorias alternativas para lograr un real impacto en la sociedad peruana. Y, por último, el

historiador peruano Carlos Aguirre –de quien hablaremos más en unas páginas– también hace

un llamado a descentralizar la producción de las memorias traumáticas en el país.

4.3 Balance y vigencia del Informe Final: un análisis desde las humanidades digitales

Pese a todos sus sesgos, imperfecciones y al relativo incumplimiento de las reformas

propuestas, la importancia política y de memoria histórica de la CVR es indudable. Sofía

Macher resalta en su balance del 2014 que la CVR jugó un papel fundamental en el

reconocimiento de quienes eran las víctimas en el Perú y de sus historias. El Informe Final dio

un sustento, un punto de apoyo, a comunidades campesinas brutalmente maltratadas durante

el conflicto, entre ellas los familiares de los desaparecidos. Laplante recuerda, por ejemplo, un

Page 30: El marcado digital de texto: una exploración con el

30

emotivo hecho ocurrido durante una exhumación de restos óseos en terrenos que habían sido

controlados por el Cuartel del Batallón de Infantería de Marina “Los Cabitos”, en Ayacucho.

En esta exhumación, ordenada por la CVR, estuvo presente Angélica Mendoza de Ascarza,

conocida como Mamá Angélica, fundadora de la ANFASEP, quien buscó sin éxito durante

décadas a su hijo Arquímedes, desaparecido por militares en 1983. Cuando se empezaron a

hallar los restos de las víctimas en “Los Cabitos”, Mendoza encaró a los soldados que

custodiaban el cuartel y les dijo: “Dígannos ahora que era una mentira”. Como está bien

documentado en los 147 artículos periodísticos analizados en esta investigación, los militares

–entre ellos las más altas autoridades castrenses– negaron durante años su participación en las

desapariciones de civiles en Ayacucho. En ese sentido, la CVR funcionó como un mecanismo

de compensación simbólica, de restitución de una verdad que había sido negada o

distorsionada en el país debido a que las víctimas eran ciudadanos pobres del campo.

Hay un punto importante no mencionado por los autores revisados para esta investigación.

La CVR no solo analizó el conflicto y cuantificó las responsabilidades sino que definió dos

aspectos esenciales de toda guerra: le dio un nombre (conflicto armado interno) y un espacio

temporal (una cronología dividida en cinco etapas) [ver anexo] . 12

Los autores también resaltan que la CVR peruana fue el primer organismo de su clase en

Latinoamérica que empleó audiencias públicas televisadas. En estos encuentros, los

comisionados escucharon los dolorosos testimonios de campesinos, varios de ellos

quechuahablantes, no solo en Lima sino también en las regiones andinas más afectadas por la

Incluso hoy la denominación “conflicto armado interno” no es aceptada por varios sectores políticos y mediáticos del país. Por 12

ejemplo, el diario El Comercio, vinculado a la derecha peruana, utiliza los términos “terrorismo” o “violencia” para referirse a los años de actividad subversiva. Menos polémica desata, en cambio, la cronología del conflicto.

Page 31: El marcado digital de texto: una exploración con el

31

violencia como Ayacucho y Apurímac. Muchas veces se lloraba. Las audiencias terminaban

con un apretón de manos y la entrega de un certificado de participación a la persona que había

ofrecido sus testimonios. El contenido de estas audiencias se encuentra hoy casi totalmente

digitalizado y forma parte del acervo de la CVR en manos de la Defensoría del Pueblo y del

CDI del Lugar de la Memoria, la Tolerancia y la Inclusión Social. Hay evaluaciones

académicas que cuestionan la metodología de las audiencias, la selección de los participantes

e incluso la utilidad de estos espacios para la reconciliación y reparación de heridas

psicológicas. No obstante, por motivos de espacio no entraré en detalles al respecto . 13

A continuación mostraré los resultados de dos experimentos realizados para esta

investigación con el objetivo de comprobar cuantitativamente la vigencia del Informe Final de

la CVR en la producción bibliográfica académica limeña, verificar si hay puentes con la

bibliografía propia de las humanidades digitales o la historia digital y, por último, observar

cuál es el estado del arte del debate sobre la memoria en ese país. Para ello, se analizaron ocho

publicaciones promovidas por el Lugar de la Memoria, la Tolerancia y la Inclusión Social

(LUM) entre el 2016 y 2019. Estos materiales son de libre acceso y están alojados en la

página web del LUM. Según su orden de impresión, estos documentos fueron:

Para más información leer los artículos de Lisa Laplante y Cynthia E. Milton mencionados en las obras citadas.13

Page 32: El marcado digital de texto: una exploración con el

32

Tabla 1: Publicaciones impresas del LUM analizadas.

En total, estas ocho publicaciones impresas agrupan 70 artículos, la mayoría firmados por

sus respectivos autores, que tratan temas de violencia, conflicto armado, grupos subversivos y

otros puntos relacionados con la memoria histórica. Tanto los dos libros analizados, como los

dos números editados de la revista +MEMORIA(S) son publicaciones de carácter académico,

con tiraje de 1.000 ejemplares en cada caso, e inscritos en la Biblioteca Nacional del Perú con

código ISBN. Por otro lado, los cuatro boletines del Centro de Documentación e Información

del LUM, aunque también contienen artículos firmados, son materiales de divulgación

institucional, cuya finalidad es dar a conocer a los visitantes del Lugar de la Memoria la

existencia del CDI y el trabajo que se realiza ahí. Además, en estos boletines se publicaron

textos de investigadores interesados en la exploración de archivos sobre el conflicto armado.

Los boletines no fueron registrados en la Biblioteca Nacional del Perú pero fueron

considerados para este análisis debido a que son los únicos materiales que hacen referencia

directa al archivo del CDI y a su plataforma digital.

Documento Fecha de publicación

Boletín del CDI Nº00 Marzo de 2016

Boletín del CDI Nº01 Abril de 2016

Boletín del CDI Nº02 Julio de 2016

Boletín del CDI Nº03 Octubre de 2016

Libro: Memorias del presente. Ensayos sobre juventud, violencia y el horizonte democrático

2017

Revista: +MEMORIA(S) Revista académica del Lugar de la Memoria, la Tolerancia y la Inclusión Social Nº1

2017

Libro: Juventud, memoria e identidad. Miradas generacionales sobre un pasado de violencia

2018

Revista: +MEMORIA(S) Revista académica del Lugar de la Memoria, la Tolerancia y la Inclusión Social Nº2

2019

Page 33: El marcado digital de texto: una exploración con el

33

4.3.1 Análisis de palabras clave con Voyant Tools

El primer ejercicio consistió en un análisis rápido de los temas tratados en los 70 artículos

mencionados a través de sus palabras clave o keywords. Es decir, una exploración de los

metadatos de los artículos académicos, de aquella información que, a su vez, describe la

información. Del total de artículos explorados, veinte tenían palabras clave descriptoras que

fueron copiadas sin modificación. A los cincuenta artículos restantes se le asignaron estos

atributos de forma manual, luego de su lectura . El resultado de la información procesada con 14

la aplicación de análisis de textos Voyant Tools fue el siguiente: 15

Gráfico 2: Nube de palabras clave en 70 artículos publicados bajo el auspicio del LUM.

En el caso de los artículos que no tenían keywords incorporadas, se les otorgó esta característica de forma manual. Luego de la 14

lectura de cada texto, se consignaron entre tres y cuatro palabras descriptoras como: “universidades”, “Sendero Luminoso”, “juventud”, “modernidad líquida”, de acuerdo a los temas principales de cada documento.

Voyant Tools es una aplicación web de acceso abierto que permite realizar análisis computacional de textos. Fue desarrollada 15

por Stéfan Sinclair y Geoffrey Rockwell a inicios de la década pasada y hoy goza de popularidad en la comunidad de humanistas digitales. Su página web es la siguiente: https://voyant-tools.org/.

Page 34: El marcado digital de texto: una exploración con el

34

En resumen, Voyant Tools analizó un documento con 508 palabras claves, de las cuales

235 eran términos únicos. Las palabras más frecuentes en el corpus de keywords fueron

“memoria” (33), “luminoso” (13), “sendero” (13), “violencia” (13) y “conflicto” (9). Es

resaltante, para esta investigación, que términos asociados directamente con las tecnologías

digitales como “Internet”, “archivo digital” o “bases de datos” no figuran entre las palabras

clave más frecuentes. Esto, desde luego, no es un defecto de los artículos pero sí aporta una

pista respecto a que la memoria histórica en Perú aún no tiende puentes con la investigación

digital. Esto pese a que ya se han hecho varios esfuerzos hacia la informatización del acervo

documental del conflicto. Figuran en el corpus de palabras clave, por el contrario, otras áreas

de la investigación clásica como “antropología”, “historia”, “política”, “corrupción”,

“archivo” o “fotografía”. Debido a que esta información era insuficiente para obtener más

conclusiones, se procedió a un segundo experimento con la bibliografía del LUM.

4.3.2 Redes en las referencias de los autores de memoria histórica en Perú

En este segundo ejercicio se trabajó con 53 artículos del total de 70 publicaciones antes

mencionadas. Estos trabajos fueron seleccionados debido a que incluían sus respectivas listas

de referencias bibliográficas. El objetivo era sencillo: conocer las relaciones entre los autores

publicados por el LUM, sus referentes, y ponderar estos vínculos con ayuda de los algoritmos

del programa de análisis de redes Gephi. Es decir, verificar cuáles son los documentos e

investigadores más citados por aquellas personas que exploran la memoria histórica en el

Perú. Esta fue la distribución de artículos según las publicaciones investigadas : 16

En la sección de anexos se detallan los títulos y autores de los artículos que formaron parte de este experimento.16

Page 35: El marcado digital de texto: una exploración con el

35

Tabla 2: Cantidad de artículos sobre memoria histórica seleccionados para análisis de referencias.

Luego de depurar la información entre artículos, autores y referentes bibliográficos y

transferirla a una base de datos, se obtuvo que los 53 artículos analizados tenían 48 autores

individuales o grupales [tres artículos consignaron dos autores, respectivamente ]. Por su 17

parte, estos 48 investigadores individuales o grupales publicados por el LUM citaban a 885

referencias bibliográficas entre académicos particulares (ej. Castells, M. o Portocarrero, G.),

autores grupales (ej. Rey de Castro, C., Larrabure y Correa, C., Zumaeta, P. y Arana J. C.),

autores corporativos (ej. CVR, Pontificia Universidad Católica del Perú, Equipo Peruano de

Antropología Forense, etc.) o a sí mismos (autorreferencias y autores publicados por el LUM

que citaron a otros autores publicados por el LUM).

Publicación Cantidad de artículos

Revista: +MEMORIA(S) Revista académica del Lugar de la Memoria, la Tolerancia y la Inclusión Social Nº1 13

Revista: +MEMORIA(S) Revista académica del Lugar de la Memoria, la Tolerancia y la Inclusión Social Nº2 12

Libro: Memorias del presente. Ensayos sobre juventud, violencia y el horizonte democrático 12

Libro: Juventud, memoria e identidad. Miradas generacionales sobre un pasado de violencia 8

Boletín del CDI Nº01 3

Boletín del CDI Nº02 1

Boletín del CDI Nº03 4

Total 53

Se trató de los artículos firmados de forma conjunta por Nory Cóndor y Nelson Pereyra; Rafael Barrantes y Mariana Chacón e 17

Isaac Gajardo y Macarena Alegría. Cada pareja de autores fue considerada como una sola unidad de análisis, respectivamente, debido a que no se podía saber la estricta distribución de citas entre ellos, es decir, quién citaba a quién.

Page 36: El marcado digital de texto: una exploración con el

36

Establecidas las relaciones entre autores publicados y citados, la información pudo ser

procesada con el programa Gephi , que permite realizar análisis de redes a través de grafos. 18

El primer gráfico extraído es sencillo y muestra a los autores publicados por el LUM como

nodos o círculos rojos (48 en total). Un algoritmo de distribución permitió proporcionar el

tamaño del nodo con la cantidad de autores referenciados. Es decir, los autores Wilton

Martínez (Martínez, W.), José Ramos (Ramos, J.) y Rainer Huhle (Huhle, R.) fueron quienes

tuvieron sus hojas de referencias más nutridas y proporcionaron más relaciones. Al centro del

grafo, en pequeños puntos negros, están 627 referentes citados (no se incluyen las

autorreferencias ni las veces en las que los autores publicados por el LUM se citaron entre sí).

Gráfico 3: Autores publicados por el LUM de acuerdo a la cantidad de referentes citados.

Gephi es un programa open-source de análisis de redes inicialmente desarrollado por estudiantes de la University of 18

Technology of Compiègne (UTC) en Francia. Está escrito en lenguaje Java en la plataforma NetBeans.

Page 37: El marcado digital de texto: una exploración con el

37

El segundo grafo procesado [ver página siguiente] muestra las relaciones entre los autores

(en círculos rojos) y sus respectivas referencias bibliográficas (en distintos tonos de verde).

En este caso, la tonalidad de verde de las referencias (de más claro a más oscuro), así como el

tamaño del círculo, es proporcional a la cantidad de veces que el elemento ha sido citado. Así,

los nodos correspondientes a la CVR (Informe Final de la Comisión de la Verdad), al

antropólogo peruano Carlos Iván Degregori y a la socióloga argentina Elizabeth Jelin resaltan

entre los demás debido a que son los referentes más citados por el total de autores publicados

en el LUM. En un segundo nivel están investigadores como el teórico búlgaro-francés

Tzvetan Todorov, el filósofo francés Michel Foucault y los peruanos Víctor Vich (crítico

literario), Ponciano del Pino (historiador) y Gustavo Gorriti (periodista).

¿De qué nos habla esta información? En principio, confirma la extraordinaria vigencia del

que aún goza el Informe Final de la CVR. Pese a que han pasado 17 años de su publicación,

es el elemento bibliográfico más citado por todos los investigadores. Como se mencionó en

este marco teórico, el informe de la comisión es la piedra de toque de muchas de las

investigaciones sobre memoria histórica. El discurso esbozado ahí, pese a todas sus

imperfecciones, es el punto de comparación en el panorama académico. Asimismo, este grafo

también nos habla sobre los espacios del discurso en los que se moviliza el debate sobre la

memoria histórica en el país: la antropología latinoamericana vinculada a la izquierda política

y a la defensa de los derechos humanos (representada por Degregori y Elizabeth Jelin), el

estructuralismo, la epistemología, la historia y, en menor medida, el periodismo. No figuran

en esta radiografía teóricos del archivo ni de las tecnologías digitales.

Page 38: El marcado digital de texto: una exploración con el

38

Gráfico 4: Redes en las referencias de los autores publicados por el LUM.

Page 39: El marcado digital de texto: una exploración con el

39

4.4 Entre lo macro y lo micro: una apuesta por el archivo y la memoria alternativa

Hasta el momento, este marco teórico ha presentado el Informe Final de la CVR, resumido su

naturaleza y ponderado su importancia en un segmento de la academia peruana, la que publica

en el LUM, que se interesa por la memoria histórica. Examinemos ahora por qué la

exploración de archivos –ya sean físicos o digitales– puede ser útil para complementar la

construcción del relato sobre la violencia sufrida en el Perú en el conflicto armado interno.

Para empezar, detengámonos un momento en el panorama internacional. Los esfuerzos del

Estado peruano por construir repositorios de información sobre la violencia política deben

verse en el contexto subcontinental de países que experimentaron dictaduras y conflictos

armados. En Chile, por ejemplo, el Museo de la Memoria y los Derechos Humanos cuenta

con el Archivo de Fondos y Colecciones que preserva información sobre las violaciones a los

derechos humanos cometidas entre 1973 y 1990 durante el régimen de Augusto Pinochet. Por

su parte, el Centro Nacional de Memoria Histórica de Colombia mantiene el Archivo Virtual

de los Derechos Humanos y Memoria Histórica que tiene una vocación similar al caso

chileno: es decir, almacenar

las voces de distintas comunidades y poblaciones a través de testimonios,

entrevistas, cartas, manuscritos, noticias de prensa, televisivas y radiales; materiales

desarrollados en talleres de memoria, fotografías, cantos, audiovisuales, libros, piezas

comunicativas y copias de expedientes judiciales, compartidos por líderes

comunitarios, organizaciones sociales, entidades públicas, investigadores del Centro

Nacional de Memoria Histórica (CNMH) y ciudadanos con documentos de interés

(Centro Nacional de Memoria Histórica de Colombia, página web).

Page 40: El marcado digital de texto: una exploración con el

40

Y en Argentina está el Archivo Virtual de los Derechos Humanos, que depende del Centro

Nacional de Memoria Histórica, y reúne, ordena y clasifica documentos relativos a la

violación de derechos humanos en ese país. A su vez, estos ejercicios de la memoria

subcontinentales forman parte de un movimiento mayor que se origina en Europa en las

primeras décadas del siglo XX tras el estallido de la Primera Guerra Mundial. Como recuerda

el historiador francés Henry Rousso en “La última catástrofe. La historia, el presente, lo

contemporáneo”, la pareja de industriales parisinos Louise y Henri Leblanc reunió desde 1914

miles de documentos de toda naturaleza sobre la guerra: libros, diarios, archivos,

pinturas, afiches, fotos, juguetes y otros pequeños objetos que son testimonio de la

cultura patriótica y del compromiso de todo un país en el conflicto. Puesto que la

guerra dura más de lo previsto, en 1917 los Leblanc donan su colección al Estado que

crea un verdadero ‘laboratorio de historia’ abierto al público masivo (Rousso 97).

Más allá de la anécdota de la colección de la familia Leblanc, Rousso ve en la instalación

progresiva de archivos sobre guerras un fenómeno sintomático del régimen de historicidad

contemporáneo, donde el conflicto ha aniquilado la lógica positivista de progreso y porvenir.

Hay en este movimiento no solo un interés por preservar la documentación burocrática sobre

la guerra, sino también los relatos de una nueva figura social que cada vez ocupa un lugar más

preponderante: el testigo sobreviviente. De ahí que concluyera el autor que “cada presente de

una determinada época comienza con la última catástrofe a esa fecha” (Rousso 23).

Ahora volvamos a la situación peruana tras la CVR. En el 2005, el historiador peruano José

Luis Igue publicó en la revista “Histórica” de la Pontificia Universidad Católica del Perú un

artículo titulado “Los silencios del gran relato” en el que pone en cuestión la visión general, la

Page 41: El marcado digital de texto: una exploración con el

41

gran narrativa, que plantea el Informe Final de la CVR sobre la historia reciente peruana. Sin

restarle mérito a los aportes de la comisión, el historiador apunta que hay una gran ausencia

en el Informe Final: la voz de quienes perpetraron la violencia, de quienes causaron dolor al

resto de peruanos ya sea desde las filas subversivas o desde las fuerzas estatales. Este silencio,

apunta el autor, “podría afectar la comprensión histórica del conflicto armado interno” (Igue

152) debido a que deja varias preguntas pendientes de solución.

¿A qué se debe este silencio? Varios autores explorados para este marco teórico coinciden

en que la CVR tuvo una orientación clara hacia el acopio de testimonios de las víctimas.

Como se mencionó anteriormente, se escuchó la voz de campesinos andinos que hasta ese

momento había sido menospreciados y marginados de los espacios de construcción del

discurso nacional. No obstante, tanto Friedman, Milton y Laplante advierten que esta

orientación hacia las víctimas se materializó en una sistematización de los testimonios desde

una mirada macro de la historia, es decir, una narrativa que buscaba explorar las causas

estructurales de la violencia (racismo, discriminación, pobreza histórica) y que evitó

sumergirse en las profundidades psicológicas de quienes participaron en esa violencia. Debido

a esta sistematización, la CVR concluyó, por ejemplo, que las desapariciones forzadas y los

otros numerosos abusos sufridos en el Perú en manos del Estado no fueron casos aislados,

desviaciones de malos agentes que actuaron sin consentimiento de sus superiores, sino que

ocurrieron por la intolerancia y el desprecio hacia la población indígena peruana.

Igue advierte que en esta mirada macro, en esta sistematización de la información, puede

que se haya perdido la perspectiva sobre la microestructura, sobre los factores individuales

que canalizaron la muerte en el Perú. El historiador sugiere, por ejemplo, que los conflictos

Page 42: El marcado digital de texto: una exploración con el

42

entre las comunidades andinas (o al interior de las mismas) pudieron haber generado varios

episodios de violencia y aún así quedado fuera del radar de la CVR. Igue se cuestiona, por

ejemplo, en qué medida las personas que fueron entrevistadas por la comisión estuvieron

dispuestos a delatar a sus padres, hermanos o tíos aunque estos hubieran estado involucrados

en actos violentos. Una evidencia que podría sustentar los cuestionamientos de Igue se

encuentra, por ejemplo, en el libro “¿Hasta cuándo tu silencio? Testimonios de dolor y coraje”

que editó la ANFASEP en el 2015. En ese documento hay testimonios de mujeres cuyos

familiares fueron desaparecidos durante el conflicto armado. Entre sus relatos de violencia

pueden advertirse varios casos de víctimas que aseguran que sus familiares fueron

desaparecidos por “ronderos” de comunidades vecinas, que fueron perjudicados por

“soplones” o por el rencor de un vecino con el que se había tenido una desavenencia. Es decir,

hay en estos relatos menciones a factores sociales relativamente ajenos al conflicto . 19

Respecto a las Fuerzas Armadas, ya se mencionó que estas vieron con escepticismo el

trabajo de la CVR, fueron reacias a trabajar con ella y, por lo tanto, a ofrecer su testimonio

sobre las causas de las masacres y desapariciones. En cuanto a Sendero Luminoso, Carlos

Aguirre sostiene que muchos de sus miembros al principio estuvieron entusiasmados con la

labor de la CVR y quisieron participar activamente con sus testimonios. No obstante, pronto

empezaron a cuestionar que no se les hubiera considerado entre los doce comisionados.

Demandaban que hubiera en la comisión representantes de “las dos partes”,

cuestionaban que se haga referencia a Sendero Luminoso como grupo “terrorista” y

rechazaban la idea de que la violencia había sido originada por Sendero. Sus

Estos testimonios fueron revisados por el autor de esta investigación como parte de su documentación bibliográfica. 19

Page 43: El marcado digital de texto: una exploración con el

43

testimonios apuntaban a deslegitimar el esfuerzo mismo de búsqueda de verdad y

reconciliación, pero al mismo tiempo querían que sus voces fueran escuchadas

(Aguirre 152).

En complemento, Friedman afirma que la CVR no se interesó mucho en la reintegración

social de quienes habían combatido y que los comisionados encontraron las entrevistas

realizadas con senderistas como poco productivas.

Frente a estos silencios, a los vacíos del relato histórico de la CVR, Igue propone historizar

las memorias de quienes perpetraron la violencia para “restituir el sentido original de las

acciones [de violencia] y el contexto en el cual se produjeron” (Igue 160). Por su parte,

Aguirre sostiene que es necesario reconstruir lo que pasó mediante los repositorios

documentales y ampliar este acervo con “otras formas de producción de memoria: tradiciones

orales, arte, música, monumentos y museos” (Aguirre 140). En un buen análisis que realizó

sobre el Centro de Información para la Memoria Colectiva y los Derechos Humanos de la

Defensoría del Pueblo, Aguirre menciona que este contiene valiosa información sobre

episodios ocurridos durante la guerra que nunca llegaron a la prensa.

Tanto en el caso de estos “eventos” ordinarios y poco conocidos como en el de

aquellos que tuvieron mayor publicidad al momento de producirse, los testimonios

recogidos por la CVR permiten recoger las visiones, recuerdos y experiencias de

quienes fueron sus víctimas y testigos (Aguirre 147).

En esta línea, ¿en qué medida el archivo periodístico pueden ayudar a complementar las

memorias recogidas por la CVR? El análisis de los recortes periodísticos contenidos en la

página web del LUM muestra que estos documentos son valiosos repositorios de testimonios

Page 44: El marcado digital de texto: una exploración con el

44

sobre la violencia política en el Perú. No son, para nada, documentos perfectos ni inocuos,

pero sí pueden aportar, por ejemplo, a la contextualización de las desapariciones forzadas.

Como veremos en los resultados de esta investigación, estos recortes preservan, por ejemplo,

las declaraciones de los militares que negaron la verdad, de los políticos que minimizaron el

horror y las preocupaciones de los familiares que incrementaban con los días.

4.5 Del archivo digital a las humanidades digitales y viceversa

Recapitulemos lo visto hasta ahora en este marco teórico para conectarnos con el tema de que

nos ocupa en esta sección. Hubo en el Perú, entre 1980 y el 2000, una guerra que enfrentó a

los ciudadanos de ese país. Culminada la violencia, el gobierno estableció una comisión para

investigar las masacres, violaciones, desapariciones y otros crímenes atroces que se

cometieron durante los veinte años precedentes. La comisión emitió en el 2003 un Informe

Final que hoy, a 40 años de iniciado el conflicto, es un documento referencial. En paralelo, en

el Perú se han construido importantes acervos documentales que preservan información sobre

la guerra recabada por tanto por la comisión como por otros organismos. Uno de estos acervos

es el del Centro de Documentación e Información (CDI) del Lugar de la Memoria, la

Tolerancia y la Inclusión Social (LUM). En esta investigación, procesamos 147 artículos

periodísticos sobre desapariciones forzadas que fueron digitalizados, almacenados y hoy son

exhibidos por este centro. Aquí empieza el terreno de las humanidades digitales.

La definición de las humanidades digitales es amplia y varía de acuerdo al autor o el

escenario donde estas se desarrollan. En el manual “Introducción a las humanidades

digitales”, la teórica cultural estadounidense Johanna Drucker y los coautores apuntan de

manera general que estas son un campo de convergencia entre las tecnologías digitales y las

Page 45: El marcado digital de texto: una exploración con el

45

disciplinas humanísticas. Entre estas últimas mencionan a las “artes, la literatura, la música, la

danza, el teatro, la arquitectura, la filosofía y otras expresiones de la cultura

humana” (Drucker 9). Por su parte, el sociólogo belga Dominique Vinck traza en su reciente

libro “Humanidades digitales. La cultura frente a las nuevas tecnologías” al menos cinco

aproximaciones bastante útiles que giran en torno a la desmaterialización del patrimonio

cultural, la cuantificación en las humanidades, la cultura geek, el impacto de Internet y la

transformación de las ciencias sociales. Y, más próxima en espacio y lengua, Isabel Galina, de

la Red de Humanidades Digitales (México) recuerda una definición dada en el 2011 donde las

humanidades digitales son “un término que engloba este nuevo campo interdisciplinario que

busca entender el impacto y la relación de las tecnologías de cómputo en el quehacer de los

investigadores en las Humanidades” (Galina et al 10). Con ánimos de llegar a una síntesis y

no entramparnos en discusiones terminológicas, este ensayo entiende a las humanidades

digitales como un campo de estudio dual: por un lado implican el uso de herramientas

computacionales aplicadas a la solución de preguntas clásicas de las humanidades (y algunas

ciencias sociales ) y, por otro lado, tenemos a la reflexión teórica sobre el impacto que estos 20

recursos tecnológicos ejercen en la sociedad y la cultura. Uno de los numerosos objetos de

estudio de las humanidades digitales son los repositorios o archivos digitales.

¿Qué tienen de especial los archivos digitales? ¿Qué los distinguen de los repositorios

físicos? En su artículo “El pasado, presente y futuro de las bibliotecas digitales” , el 21

No hay consenso respecto a qué disciplinas forman parte de las humanidades y cuáles integran las ciencias sociales. De hecho, 20

estas disciplinas se distribuyen de forma irregular en las universidades.

Artículo que forma parte del compendio “A Companion to Digital Humanities”, editado por Susan Schreibman, Ray Siemens, 21

John Unsworth. Oxford: Blackwell, 2004.

Page 46: El marcado digital de texto: una exploración con el

46

especialista en preservación digital Howard Besser explica que estos espacios virtuales

permiten a los académicos realizar ejercicios que antes eran difíciles o imposibles de ejecutar.

Los investigadores ahora pueden consultar fascímiles en línea de obras raras

alojadas en una gran cantidad de instituciones sin tener que visitar cada una. Los

estudiantes tienen la oportunidad de explorar fascímiles de trabajos raros y

correspondencia. Los académicos que se dedican al análisis léxico ahora tienen la

oportunidad de contar las ocurrencias de palabras / frases o hacer análisis sintácticos

no solo en un trabajo, sino en todo un conjunto de ellos (Besser, sin numeración,

traducción propia)

Este giro hacia la digitalización de los documentos físicos –como libros u otros

documentos textuales– tiene que ver con lo que Dominique Vinck llama desmaterialización

del patrimonio cultural. Es decir, la transformación de la información que antes se contenía en

papel, fotografías, discos de acetato o cualquier soporte analógico en una secuencia de cifras,

datos que no tienen peso en gramos sino en bytes, que viajan a velocidades enormes y que

pueden ser reproducidos o transformados a través de computadoras. Para Vinck esta

desmaterialización es uno de los pilares de la civilización digital aunque advierte que tal

fenómeno no es en realidad una evaporación de la materia, sino una rematerialización ya que

la información digital no se almacena en el aire (como sugiere la metáfora de la nube) sino en

gigantescas infraestructuras materiales.

Hablar de desmaterialización se vuelve irónico. Algunos incluso creen que esta

desmaterialización no reduce el consumo de materias primas ni de energía. El sector

Page 47: El marcado digital de texto: una exploración con el

47

de las tecnologías de la información nada tiene de virtual: servidores, antenas

repetidoras, terminales, cables transoceánicos, fibras ópticas (Vinck 32).

Desde luego, las humanidades digitales no solo están interesadas en el traslado de la

producción intelectual humana a plataformas informáticas de exhibición. El campo también

investiga los efectos de esta rematerialización en la manera en la que los humanistas se

aproximan a sus objetos de estudios clásicos. El historiador español Anaclet Pons, por

ejemplo, ha explorado en las últimas décadas cómo las fuentes digitales están recomponiendo

su disciplina . Para él es importante tener en cuenta la historicidad de los instrumentos 22

historiográficos pues las fuentes y los métodos de análisis varían con el tiempo. “Pensemos en

qué fuentes utilizaban y qué historia hacían los grandes maestros de las escuelas francesa y

alemana de finales del ochocientos. ¿Es esa nuestra manera de entender los documentos o de

escribir sobre ellos?” (Pons 42), se pregunta Pons en “Guardar Cómo: la historia y las fuentes

digitales?”. Esta relación entre el instrumento y la historiografía también es advertida por

Henry Rousso, a quien mencionamos en la sección anterior, aunque éste la lleva más atrás en

el tiempo y la aplica al contexto de la revolución científica de los siglos XVI y XVII. Para

Rousso, con la llamada Edad Moderna se instala en Occidente el paradigma de que es posible

acceder al conocimiento no solo con el pensamiento o la fe, sino a través de instrumentos de

medición. Es decir, una aproximación mediada de la realidad.

Este nuevo paradigma permite la observación y el análisis de objetos cada vez

más distantes, a imagen y semejanza del progreso de la astronomía. Así, abre el

“paso de un mundo finito a un universo infinito, es decir, del mundo de la inexactitud

Se recomienda la lectura del libro “El desorden digital: una guía para historiadores y humanistas” y del artículo “Guardar 22

como: la historia y las fuentes digitales”.

Page 48: El marcado digital de texto: una exploración con el

48

al mundo de la precisión”, cuestión que tiene consecuencias directas en la percepción

de la historia (Rousso 47).

Es decir, tanto Pons como Rousso advierten que los instrumentos historiográficos

(llámense tecnologías o modos de pensamiento) impactan en la forma en la que se concibe –y

se escribe– la historia. Bajo esta línea preguntémonos: ¿qué cambia la digitalización del

archivo histórico?

Pons describe algunas de estas transformaciones. En sintonía con Besser, el historiador

español señala que la digitalización contribuye a descentrar la profesión y la disciplina

[histórica] pues pone a disposición de casi todos un conocimiento reservado a pocos y permite

el surgimiento de perspectivas diferentes ya sea a escala internacional (la posibilidad de

acceder a un documento almacenado físicamente en otro continente) o a nivel local

(superación de brechas de infraestructura educativa entre las capitales y los pueblos del

interior de los países latinoamericanos). De hecho, este punto, el del acceso remoto a los

documentos, cobra una especial importancia al momento de escribir este ensayo. En estos

meses, entre marzo y mayo del 2020, la mayoría de bibliotecas y archivos físicos de los países

latinoamericanos están clausurados temporalmente debido a la pandemia del coronavirus. Las

recomendaciones de aislamiento social de la Organización Mundial de la Salud derivaron en

el cierre de los locales públicos, lo que revitaliza la importancia del acceso digital a los

documentos. Para no detener la investigación académica y las actividades lectivas, las

universidades y otros centros de producción de conocimiento han vuelto su mirada, sin duda

forzosamente, hacia implementación de repositorios digitales y nuevas formas de enseñanza o

colaboración en línea.

Page 49: El marcado digital de texto: una exploración con el

49

Pons también advierte que el formato digital puede favorecer una aproximación

cuantitativa a los textos gracias a la búsqueda automatizada y la generación de series

numéricas (que, dicho sea de paso, es lo que plantea esta investigación). “La digitalización

permite algo muy simple que tiene mayores consecuencias de las que se advierten a simple

vista: hace posible que convirtamos cualquier libro en una base de datos en la que

buscar” (Pons 50). En contraparte, el investigador también halla riesgos en esta tendencia

hacia la digitalización del archivo histórico. Señala, por ejemplo, que la digitalización puede

multiplicar los errores del proceso de reproducción (en el escaneo de documentos) o en la

construcción de los metadatos. Aunque estos problemas ya se daban con los archivos físicos,

la exhibición global de los documentos a través de plataformas digitales ocasionaría que estos

errores lleguen a públicos masivos. Asimismo, el historiador sostiene que aún no se ha

resuelto por completo el problema de la preservación de los archivos debido a la

obsolescencia progresiva de los programas y equipos informáticos. De hecho, apunta, “el libro

ha resultado ser menos perecedero que todos los soportes digitales” (Pons 46).

Por último, Pons encuentra que el archivo digital descontextualiza la información de su

ambiente de exhibición física (el repositorio clásico) haciendo de cada documento algo

aislado. Este es, precisamente, uno de los inconvenientes de los recortes periodísticos

almacenados por el CDI del Lugar de la Memoria. El acceso a este acervo tiene mucho de

aleatorio. Además, en el proceso de digitalización de las notas de prensa peruanas no se

consignó, por ejemplo, información sobre la ubicación del recorte dentro del periódico, es

decir, en qué sección fue publicado el documento. Esta clase de datos, perdidos o no tomados

Page 50: El marcado digital de texto: una exploración con el

50

en cuenta, pueden ser útiles para robustecer el análisis posterior de las notas. Sin embargo, el

investigador que explora el CDI debe contentarse hoy con la información disponible.

4.6 El marcado de texto como herramienta de exploración

Como se dijo, las humanidades digitales tienen varios intereses, uno de los cuales es el

archivo digital. Y entre las varias herramientas de análisis computacional disponibles, en esta

investigación se optó por trabajar con el marcado de texto, una metodología de larga

trayectoria en las humanidades digitales. En este apartado describiremos en qué consiste.

En “A Companion to Digital Humanities”, el filósofo Allen Renear describe a esta

herramienta de la siguiente forma:

El marcado, en el sentido en que estamos usando el término aquí, puede

caracterizarse al menos provisionalmente, como información formalmente distinta de

la secuencia de caracteres de la transcripción digital de un texto, que sirve para

identificar características lógicas o físicas para controlar un posterior procesamiento

(Renear, sin numeración, traducción propia).

Para simplificar esta definición expliquemos aquello de información formalmente distinta.

Marcar digitalmente es añadir, mediante códigos, información a un texto para que este pueda

ser procesable por la computadora de una manera más eficaz. Esos códigos son lo que Renear

llama información formalmente distinta. El marcado no forma parte del texto, se yuxtapone a

él, lo describe, lo estructura. Y en muchos casos, se oculta al lector del documento pues solo

se maneja a nivel de lenguaje informático, con procesadores de código. Quizá una ilustración

nos ayude a entender mejor de qué se trata esta herramienta.

Page 51: El marcado digital de texto: una exploración con el

51

Gráfico 5: Ejemplo de marcado de texto en un documento literario.

Este ejemplo –realizado con el título, fecha de publicación y primera oración de la novela

“Cien años de soledad”– es una aproximación al marcado de texto y a la sintaxis XML con la

que se procesaron los recortes de prensa del CDI. Con este segmento de código se

comprueban varias cosas: las etiquetas en letras rojas <libro>, <title> y <p> (con sus

respectivas marcas de cierre “ / ” ) estructuran el texto electrónico. Definen, por ejemplo, que

todo el documento forma parte de un libro y que este, a su vez, tiene un título y un párrafo.

Por su parte, las etiquetas en letras verdes <date>, <persName> y <placeName> aportan

información sobre el plano semántico del documento. Sabemos a través de ellas que “1967”

es una fecha, que “Aureliano Buendía” es el nombre propio de un personaje y que “Macondo”

es un lugar. Llevada esta codificación a la novela completa de Gabriel García Márquez, uno

podría obtener, por ejemplo, la lista completa de personajes, lugares o fechas mencionadas en

el documento. Además, las etiquetas (la información formalmente distinta de Renear) puede

ser invisible para el lector en una plataforma digital clásica como un navegador web. Estas

Page 52: El marcado digital de texto: una exploración con el

52

marcas son la información que da forma al documento, que habla de él a la computadora, pero

que no forma parte del mismo. Como advirtió atrás Pons, la digitalización (en este caso a

través del marcado) hizo posible que convirtamos un texto en una base de datos.

Ahora bien, hay varios tipos de marcado digital. Por ejemplo, cuando enviamos un archivo

de extensión .docx a una impresora, la computadora lee la codificación del documento y envía

una serie de instrucciones que determinan cómo los inyectores deben distribuir la tinta sobre

el papel. A esta clase de marcado paralelo, orientado hacia la máquina y no visible para el

usuario común se le conoce como procedimental. Otro sistema bastante más conocido es el

lenguaje de marcado presentacional, cuyo mejor exponente es el Lenguaje de Marcado de

Hipertexto (HTML, por sus siglas en inglés). HTML es un código que usan navegadores

como Google Chrome o Mozzila Firefox para presentar páginas web en computadoras,

teléfonos o tabletas. Con etiquetas como <html>, <head>, <body> o <h1>, este lenguaje de

marcado estructura la información de un documento para que pueda ser visualizada en una

página digital ya sea como texto, imágenes o sonidos. HTML es un marcado presentacional

debido a que las etiquetas usadas para organizar el documento añaden información sobre

cómo debe lucir la página web, pero no ofrecen información sobre el sentido del contenido.

Un tercer tipo de lenguaje de marcado, que es el que usó esta investigación, es el

descriptivo. Con esta tecnología, el usuario añade información semántica a un documento

para que la computadora interprete y organice los datos ahí alojados. El codificador, mediante

algunas etiquetas flexibles, puede incorporar a un objeto digital información sobre su

contenido o también características metalingüísticas como comentarios sobre el soporte físico,

la aparición de sonidos o ciertas gestualidades. Esta metodología es promovida desde las

Page 53: El marcado digital de texto: una exploración con el

53

humanidades digitales para estructurar la información de los textos y luego convertirlos en

bases de datos útiles para la investigación académica. De acuerdo a Drucker, pese a que es un

trabajo manual, demandante y que exige una organización jerárquica del contenido, “el

marcado [descriptivo] sigue siendo una práctica estándar en la edición, procesamiento y

publicación de textos en formas electrónicas” (Drucker 46, traducción propia). En esta

investigación, los recortes periodísticos digitalizados por el CDI fueron codificados con un

estándar inspirado en la Iniciativa de Codificación de Textos (TEI, por sus siglas en inglés),

que utiliza una gramática derivada del Lenguaje de Marcado Extensible (XML).

XML/TEI es un estándar ad-hoc para la codificación de objetos digitales en las

humanidades. Su primer protocolo data de inicios de los años noventa y actualmente está en

su quinta edición. Dentro de las humanidades digitales, XML/TEI se ha usado, por ejemplo,

en el tratamiento de manuscritos medievales (Medieval Nordic Text Archive), en compendios

de prosa y poesía (African American Women Writers of the 19th Century), o en ediciones

críticas de bibliografía del siglo XVII en México (Biblioteca Digital del Pensamiento

Novohispano). XML/TEI tiene más de 500 etiquetas descriptivas para codificar prosa, verso,

música o elementos gráficos como fotografías y videos. Algunas de estas etiquetas sirven para

identificar glifos de sistemas de escrituras antiguos o no occidentales y otras para consignar

elementos paralingüísticos o paratextuales como manchas en el papel, enmendaduras y

anotaciones hechas a mano. Las posibilidades de anotación con XML/TEI son tan robustas

que la mayoría de investigadores usa solo un porcentaje de todas las etiquetas disponibles.

Durante la última década se ha vuelto cada vez más claro que TEI es parte de lo

que hace que las humanidades digitales sucedan: se ha convertido en una parte de la

Page 54: El marcado digital de texto: una exploración con el

54

infraestructura con la que todos tienen que involucrarse, tanto técnica como

socialmente, una vez que comienzan a pensar en el texto u otras formas de recursos

culturales en forma digital (Burnard, sin numeración, traducción propia).

Otra de las ventajas de este estándar es que no requiere el uso de algún software de

propietario particular. Es decir, no obliga al usuario-codificador a la adquisición de una

licencia de uso específica como ocurre con otros sistemas de análisis de datos como Atlas.ti.

XML/TEI se sostiene más bien como una organización sin fines de lucro y es desarrollada por

académicos interesados en la codificación de textos. Como explica Burnard, “[XML/TEI] no

es una agencia gubernamental como ANSI, o una organización bien financiada como ISO, o

un consorcio industrial como W3C, aunque organizativamente tiene puntos en común con

todos estos” (Burnard, sin numeración, traducción propia). Para el autor, quien es uno de los

fundadores del estándar, este esquema es más que un conjunto de recomendaciones para la

codificación, es una forma de pensar la estructura de los objetos y las fuentes digitales.

En Latinoamérica, es destacable el uso de XML/TEI en el proyecto de la Biblioteca Digital

del Pensamiento Novohispano. Este repositorio –elaborado por docentes y alumnos de la

Facultad de Filosofía y Letras de la Universidad Nacional Autónoma de México– contiene las

transcripciones de 17 libros del siglo XVII y además ofrece herramientas digitales de

indexación automática de términos, referencias, nombres y fechas marcadas en los textos.

Respecto al desarrollo de esta plataforma, Priani explica que la Biblioteca Digital del

Pensamiento Novohispano nació como un proyecto de investigación tradicional y derivó en

una infraestructura para el desarrollo de investigaciones en las humanidades digitales (Priani

227). La evolución de este repositorio digital permitió no solo poner a disposición del público

Page 55: El marcado digital de texto: una exploración con el

55

académico una bibliografía que era de difícil acceso sino que mutó en una plataforma de

formación para humanistas digitales mexicanos que ya publican sus hallazgos . 23

Como señala John Bradley, el desarrollo de herramientas para la manipulación de textos ha

sido durante años uno de los intereses centrales de la comunidad de humanistas digitales. No

obstante, señala, “estamos aún en las primeras etapas de entender la completa relevancia de

trabajar electrónicamente con textos” (Bradley, sin numeración, traducción propia). ¿A qué se

debe esta aparente contradicción? Una explicación está en la elevada curva de aprendizaje que

demanda la codificación de textos, sobre todo para la comunidad de humanistas clásicos que

no han tenido una alfabetización digital esmerada. Hay que tener en cuenta que marcar un

texto con el estándar XML/TEI es la primera etapa del trabajo y hace falta aprender otros

lenguajes como XPath o XSLT para obtener la información marcada. De hecho, Bradley

sostiene que aprender a usar estas herramientas en el total de su capacidad puede tomar años.

Ahora bien, más allá de los requerimientos técnicos, es importante tener en cuenta un

punto en el que coinciden investigadores que han teorizado sobre el marcado de texto como

Allen Renear, Martha Nell Smith, Susan Hockey, Michael Sperberg-McQueen o Johanna

Drucker: “Cada acto de introducir marcado a un texto es un acto de interpretación” (Drucker

46). En efecto, las marcas que uno deja en un documento revelan la lectura que el codificador

tiene sobre el mismo. De ahí que sea importante declarar cuál es el esquema de interpretación

utilizado y abrir los códigos para que puedan ser interpelados por los usuarios . 24

Leer, por ejemplo, el artículo “Las relaciones de conocimiento en la Biblioteca Digital del Pensamiento Novohispano” de 23

Miriam Peña Pimentel y Ernesto Priani Saisó.

La colección completa de artículos marcados con el estándar XML/TEI puede hallarse en el anexo final de este ensayo.24

Page 56: El marcado digital de texto: una exploración con el

56

5 - Metodología

El procesamiento digital de los recortes periodísticos supuso los siguientes pasos: descarga,

transcripción, marcado y transformación. Como se observa en el gráfico de esta página, los

documentos descargados de la página web del Centro de Documentación e Información (CDI)

del LUM fueron imágenes en extensión JPG, cuyos textos no podían ser procesados por

computadora. Por ello, fue necesario transcribir la información de cada imagen para obtener

textos planos (en extensión TXT). A su vez, estos documentos de texto fueron convertidos en

archivos XML y codificados según estándares inspirados en las directrices TEI. Finalmente, con

ayuda de herramientas de transformación como XSLT y XPath se generaron de forma automática

nuevos documentos (archivos TXT, HTML o CSV) que permitieron el análisis computacional.

Gráfico 6: Procesamiento y transformación de documentos en el ejercicio de marcado.

Page 57: El marcado digital de texto: una exploración con el

57

5.1 - El origen del material de investigación

La colección de notas de prensa disponibles hoy en la plataforma digital del CDI fue donada

por la Asociación Pro Derechos Humanos (APRODEH), una ONG vinculada a la izquierda

peruana y activa en el país desde 1983. Estos documentos fueron cedidos en formato físico al

LUM en el 2014. La digitalización de los recortes se realizó en el 2016, en un proceso para el

que se contrató a una empresa externa al LUM. En rigor, el CDI recibió de esta compañía

réplicas digitalizadas de las notas de prensa en extensión JPG y no participó directamente en

la captura de la información. A la fecha, el CDI sigue organizando los materiales

digitalizados. El proceso implica catalogación y colocación de metadatos. Cuando el material

está listo para ser exhibido, el centro solicita al departamento de informática del Ministerio de

Cultura del Perú –entidad de la que depende– que suba los documentos a la plataforma web.

En una entrevista realizada para esta investigación, la APRODEH informó que su

colección completa de recortes periodísticos físicos incluyó más de 400 mil artículos. Por su

parte, el CDI comunicó que la empresa externa contratada para la digitalización les entregó

150 mil imágenes con sendos recortes periodísticos. Pese a esto, hacia marzo del 2020 solo se

habían subido a la plataforma digital del CDI 1.432 expedientes con una cantidad similar de

recortes periodísticos. Es decir, en la actualidad el público puede acceder apenas al 0,9% de

los recortes digitalizados por la empresa contratada. El CDI informó que debido a la falta de

personal, tienen planeado subir 300 de estos recortes periodísticos al año a su plataforma. Si el

gobierno peruano no asigna más recursos a esta tarea y continúa este ritmo de carga, la

colección completa del APRODEH estaría disponible en 495 años, es decir, en el 2515.

Page 58: El marcado digital de texto: una exploración con el

58

La relación entre recortes periodísticos digitalizados y entregados por la empresa externa

contratada y los recortes periodísticos disponibles en la plataforma del CDI es así:

Gráfico 7: Recortes periodísticos digitalizados y disponibles en el CDI.

5.2 - Descarga y exclusiones de los recortes periodísticos

Los recortes periodísticos manipulados para este ensayo fueron descargados en enero del 2020

de la página web del Centro de Documentación e Investigación (CDI) a través de su

herramienta de búsqueda, esto dentro del total de 1.432 notas de prensa disponibles. Como el

objetivo era obtener solo los artículos periodísticos publicados en prensa escrita y que hayan

documentado las desapariciones forzadas, se utilizaron dos criterios de filtrado como se

consigna en el siguiente gráfico.

Page 59: El marcado digital de texto: una exploración con el

59

Soporte: Artículo Palabras clave: Desapariciones y Desapariciones Forzadas.

Gráfico 8: Filtros de búsqueda en la plataforma del CDI.

La búsqueda realizada con estos dos filtros arrojó 169 resultados con sendos expedientes

que albergaban entre uno y seis recortes periodísticos. De este total, en este proyecto solo se

consideraron 139 expedientes que contenían recortes periodísticos de medios impresos que

circularon a escala nacional en el Perú durante el conflicto. Estos 139 expedientes alojaban, a

su vez, 163 notas de prensa publicadas entre 1982 y 1993 en 25 diarios y revistas. En la

siguiente imagen se reproduce una de estas réplicas digitales, descargada en extensión JPG.

Gráfico 9: Ejemplo de una nota periodística de la plataforma digital del CDI.

Page 60: El marcado digital de texto: una exploración con el

60

Entre los artículos descargados se detectaron errores de catalogación por lo que fueron

excluidos. Por ejemplo, uno de los expedientes del CDI debía contener una nota sobre la

desaparición del médico de Abimael Guzmán, cabecilla de Sendero Luminoso. No obstante, en

lugar de ese artículo se halló un reportaje sobre la pobreza en Apurímac. Asimismo, tres notas

periodísticas también fueron descartadas debido a que hacían referencia a la masacre de

periodistas en Uchuraccay (1983) y a la matanza de prisioneros en el penal de El Frontón (1986),

temas que se alejaban del objetivo principal de estudio: las desapariciones forzadas.

En este proyecto se optó por usar solo el material periodístico que corresponde a los

géneros de nota informativa, entrevista, reportaje y crónica. Se descartaron las columnas de

opinión, editoriales y pronunciamientos de organizaciones en avisos publicitarios. Esta decisión

se debió a que las notas informativas y reportajes tienden a consignar la noticia de forma más

concisa y cercana en el tiempo respecto al hecho ocurrido. En las columnas de opinión y

editoriales, en cambio, hay mayor distancia sobre la noticia y el producto informativo más

importante es el comentario del autor. Esto no quiere decir, desde luego, que los reportajes y

entrevistas sean más o menos ‘objetivos’ que las columnas de opinión. Hay que tener en cuenta

que todo producto periodístico contiene una postura política e ideológica.

Hechas todas estas exclusiones (16 artículos descartados en total), esta investigación se

propuso procesar 147 artículos periodísticos con el estándar XML/TEI de marcado digital. La

proporción entre artículos aprobados y descartados se consigna en el siguiente gráfico:

Page 61: El marcado digital de texto: una exploración con el

61

Gráfico 10: Relación entre artículos descargados, descartados y aprobados.

5.3 - La clasificación de los recortes

Hay varias formas de organizar un archivo periodístico. Se puede, por ejemplo, agrupar los

recortes de acuerdo a la fecha de publicación, al medio responsable de su impresión o según el

género de la nota (entrevista, reportaje, etc). Con la finalidad de darle una mayor coherencia

temática y de procedencia al corpus, en este experimento se clasificaron los 147 recortes

periodísticos en seis categorías, según los siguientes criterios:

Desapariciones en el país.- Artículos y reportajes generales que dieron cuenta de las

desapariciones forzadas. Describen, por ejemplo, la extrema violencia que sufrió la población

ayacuchana por parte de los militares, las alertas sobre estos crímenes que emitieron

organizaciones como Amnistía Internacional o la desaparición de dirigentes barriales o

sindicalistas en Lima. Esta categoría es la más nutrida: 58 notas (el 39% del total).

Los casos de Jaime Ayala y Jesús Oropeza.- Es el segundo grupo más nutrido de notas,

40 artículos, el 27% del total. Detallan la desaparición del periodista ayacuchano Jaime Ayala

Page 62: El marcado digital de texto: una exploración con el

62

y del dirigente agrario Jesús Oropeza. Ambos acontecimientos ocurrieron a mediados de 1984

y comparten otras tres características: se dieron en la zona declarada en emergencia por el

gobierno, involucraron a las fuerzas estatales y despertaron gran interés mediático.

Ocultamiento.- Son recortes que recogen las declaraciones de líderes políticos o militares

durante tres gobiernos peruanos: el de Fernando Belaúnde, Alan García y Alberto Fujimori.

Lo común es que, en muchos casos, estas autoridades interrogadas por la prensa negaron o

minimizaron el impacto de las desapariciones. Se recogen, por ejemplo, las palabras del ex

general Clemente Noel, líder del Comando Político-militar de Ayacucho, quien dijo que las

denuncias sobre desaparecidos eran “destructivas y estúpidas”. En total, hay 20 artículos en

esta categoría (el 14% del total).

La Cantuta y el grupo paramilitar Colina.- Conjunto de 17 artículos (12% del total) que

describen las circunstancias políticas posteriores a la desaparición de estudiantes y un

profesor de la Universidad Nacional Enrique Guzmán y Valle “La Cantuta” y del grupo

paramilitar “Colina” que estuvo involucrado en el crimen. Se trata de artículos publicados

durante el gobierno de Alberto Fujimori, hacia 1993.

Desapariciones en universidades.- Son artículos que documentaron las frecuentes y

violentas intervenciones del Ejército y la policía en los recintos universitarios de Lima y

Ayacucho. Fueron el preludio de lo ocurrido en “La Cantuta”. En total son 9 notas (6%).

Entrevistas.- Este último grupo recoge tres entrevistas realizadas al ex congresista Henry

Pease, a la ex alcaldesa de Ayacucho, Leonor Zamora y al ex jefe del Comando Político

Militar de Ayacucho, Wilfredo Mori.

Page 63: El marcado digital de texto: una exploración con el

63

La clasificación de las notas se resume en este gráfico:

Gráfico 11: Clasificación de los recortes descargados de la plataforma del CDI.

Respecto a la distribución cronológica de los artículos periodísticos, se tiene que el más

antiguo de estos fue publicado el 10 de marzo de 1982, a menos de dos años de iniciado el

conflicto armado interno. En tanto, el artículo más reciente fue impreso el 9 de julio de 1993,

a casi un año de la captura del cabecilla de Sendero Luminoso, Abimael Guzmán. Se trata, eso

sí, de una distribución irregular, que deja espacios temporales vacíos. Por ejemplo, no hay

artículos publicados entre 1989 y 1991, años cruciales en la lucha contrasubversiva en el

Perú . La siguiente infografía da cuenta de la irregular distribución cronológica de los 147 25

recortes periodísticos. Así, tenemos que el conjunto de artículos catalogados internamente

como “Desapariciones en el país” cubre un periodo de tiempo vasto: de 1982 a 1989. No

Ver en anexo la cronología del conflicto armado peruano.25

Page 64: El marcado digital de texto: una exploración con el

64

obstante, el segundo grupo más numeroso, que corresponde a los casos de las desapariciones

de Jaime Ayala y Jesús Oropeza, se concentra en los últimos meses de 1984 y un día de 1989.

Gráfico 12: Distribución cronológica de los recortes periodísticos descargados.

Respecto a la procedencia de los recortes según sus respectivos medios de publicación

impresa tenemos esta distribución [ver página siguiente].

Page 65: El marcado digital de texto: una exploración con el

65

Gráfico 13: Procedencia de los recortes según medio de comunicación.

De acuerdo a los metadatos extraídos de la plataforma digital del CDI del LUM, los 147

recortes de prensa provienen de 23 medios de comunicación impresos, entre diarios y revistas.

El periódico con más publicaciones analizadas (27,2% del total) fue “La República”, un

matutino fundado en 1981 y que se imprime hasta hoy en Lima. El segundo grupo más

numeroso está compuesto por un medio de comunicación vinculado a la izquierda peruana

que adoptó dos nombres en el tiempo “El Diario” y “El Nuevo Diario”. Debido a las

insuficiencias del proceso de digitalización y catalogación del CDI, no fue posible desagrupar

esta categoría y cuantificar estos 34 recortes (23,1% del total) según su debido origen.

Asimismo, en tres de las 147 notas (un 2%) del total, no se consignó la fuente de la

publicación. Por estas imperfecciones de los metadatos originales, en esta investigación no se

consideró contrastar el discurso de la prensa escrita según los medios impresos.

Page 66: El marcado digital de texto: una exploración con el

66

5.4 - Recolección de metadatos, ensamble y transcripción de los recortes

Las réplicas digitales de los recortes periodísticos estaban acompañadas de metadatos. Estas

categorías, en orden de aparición, eran: título, descripción, lugar del suceso, fecha del suceso,

clase, colección, soporte, palabras clave, fecha de ingreso, notas, fotos, periodo de la

violencia, periodos de gobierno, escenario de violencia. Estos metadatos fueron recogidos de

manera manual y trasvasados a una hoja de cálculo. Asimismo, a cada recorte se le asignó un

código único de identificación. De forma concatenada, estos iban de la nota con el código

D001 a la D139. En ciertos casos, se asignaron códigos compuestos (D133 - 1 y D133 - 2)

debido a que provenían de un mismo expediente que contenía más de un recorte periodístico.

Por último, en trece ocasiones se usó el programa de edición de imágenes Adobe

Photoshop para ensamblar recortes periodísticos que integraban una sola nota. Con ello, se

trató de componer la imagen de la forma más natural posible, como se observa en la imagen.

Gráfico 14: Recomposición digital de las notas periodísticas del CDI.

Page 67: El marcado digital de texto: una exploración con el

67

Para la transcripción de los textos se organizó primero la información de acuerdo a la

estructura básica de la nota periodística escrita: volada, titular, bajada, cuerpo y leyenda [ver

página siguiente]. Una vez establecida la información textual que se quería recoger de cada

nota, se procedió a la transcripción. En este proceso se usaron varias técnicas, desde la

transcripción manual, palabra por palabra; hasta sistemas semiautomáticos como el software

de dictado SpeechNotes, el programa de reconocimiento óptico de caracteres Fine Reader y, 26

por último, la herramienta de transcripción de documentos de Google (de la plataforma

Google Drive). Esta última aplicación fue la que simplificó más el proceso de transcripción.

Gráfico 15: Estructuración básica de las notas periodísticas.

Disponible en el laboratorio digital de la Facultad de Artes y Humanidades de la Universidad de los Andes, Bogotá, Colombia.26

Page 68: El marcado digital de texto: una exploración con el

68

Vale precisar que debido a los errores en la digitalización del archivo (impurezas,

contaminación e impericia), a la complejidad del diseño de los recortes (textos distribuidos en

varias columnas irregulares) y a la precariedad del material (notas impresas en papel de mala

calidad, con más de 30 años de antigüedad), ningún sistema automático de transcripción fue

confiable. Resultó necesario verificar los errores del reconocimiento óptico de caracteres con

el ojo humano. En ese sentido, el posterior proceso de marcado (que devuelve al lector/

codificador una y otra vez al mismo texto) es conveniente para detectar defectos inadvertidos.

5.5 - El etiquetado XML/TEI: estructura global de los recortes

El objetivo de la transcripción de los recortes periodísticos fue recuperar la información

codificada en píxeles del documento de extensión JPG y trasvasarla un archivo de texto plano

TXT que sí es manipulable a través de procesadores de texto. Estos documentos TXT, a su

vez, fueron convertidos en archivos de extensión XML gracias a la herramienta OxGarage

Conversion, disponible en la página web del Consorcio TEI. Entre las utilidades de OxGarage

Conversion está transformar un documento TXT en una estructura TEI básica. Es decir, forma

un código con una etiqueta raíz <TEI> con dos etiquetas anidadas: <teiHeader> y <text>. El

texto contenido en el archivo TXT es colocado automáticamente dentro de la etiqueta <text>.

Así el proceso de marcado puede comenzar.

Como se mencionó en el marco teórico, los propósitos del marcado de texto son variados.

En el caso de este proyecto, esta metodología sirvió tanto para organizar la información (darle

una estructura homogénea, explorable a través de rutas de lenguaje XPath) así como

identificar elementos del texto que eran de interés para este ensayo: nombres propios de

Page 69: El marcado digital de texto: una exploración con el

69

personas, de lugares, de organizaciones, leyes y citas textuales. El siguiente gráfico muestra

cuál fue la estructura XML usada para organizar las notas del archivo del CDI.

Gráfico 16: Estructura XML global de una nota periodística marcada.

De acuerdo a este esquema básico, cada nota periodística fue convertida en un documento

XML/TEI con una etiqueta raíz (<TEI>) de la cual se desprenden las etiquetas <teiHeader> y

<text>. La primera contiene los metadatos del documento (fecha de publicación, medio de

comunicación, página, etc.) y la segunda aloja el contenido textual del mismo. A su vez, la

etiqueta <text> tiene una marca anidada, <body>, en la que se consigna lo escrito en tres

divisiones (etiqueta <div>). Cada <div> estructura una parte distinta del documento, ya sea el

encabezado o primer nivel de lectura periodística (volada, titular y bajada), el cuerpo y la

leyenda. Tómese en cuenta que, en su forma más simple, toda nota de prensa debe tener un

titular y un cuerpo. Las voladas, bajadas y leyendas, en cambio, pueden o no aparecer de

acuerdo al tamaño de la nota y la aparición de contenido gráfico (fotografías o infografías).

Page 70: El marcado digital de texto: una exploración con el

70

La ventaja de estructurar un documento periodístico con este esquema es que luego, en el

procesamiento, el codificador puede solicitar a la computadora que extraiga el texto completo

marcado o solo partes de él. Con este método es posible, por ejemplo, obtener nuevos

archivos de texto solo con los titulares o con las voladas para realizar análisis específicos.

Asimismo, nótese que en las etiquetas <div type=“cuerpo> y <div type=“leyenda”> la

información se subdividió en etiquetas de párrafo <p> a las que, a su vez, se añadieron marcas

específicas para identificar nombres propios y otros elementos significativos del corpus.

5.6 - El etiquetado XML/TEI: el marcado semántico de elementos

Establecer el significado de un texto, o de partes de él, no es una tarea inocente. Si uno

remonta un poco más atrás, halla incluso que la definición del término “texto” es complicada.

Como señala Antonio Rojas Castro, el concepto de texto no es tan evidente como parece

(Rojas Castro 50). Por un lado, apunta el autor, están las aproximaciones que privilegian la

condición material del documento escrito y, por otro, la concepción del texto como un

artefacto de comunicación con leyes propias. En el caso del marcado digital de texto, tanto la

materialidad física como la potencia de comunicación del documento entran en juego. En la

transformación de los recortes periodísticos a textos electrónicos TXT hay un salto cualitativo.

El texto impreso es estático, frágil, dependiente del soporte. El texto electrónico en cambio es

ágil, maleable y puede enriquecerse. El propósito del etiquetado, precisamente, es añadir

contenido al término para realizar luego operaciones con él. La forma que adopta este

contenido añadido es un acto de interpretación pleno de subjetividad.

En este experimento, el etiquetado no fue usado solo para estructurar las notas periodísticas

e “informarle” a la computadora que determinadas palabras componen el titular o la leyenda

Page 71: El marcado digital de texto: una exploración con el

71

del documento. Tan importante como esa estructuración XML fue la incorporación de

etiquetas semánticas que definieron el sentido de algunas palabras o porciones de los textos.

Así, tenemos que la lista de etiquetas semánticas y sus respectivos atributos fue la siguiente:

Page 72: El marcado digital de texto: una exploración con el

72

Tabla 3: Lista de etiquetas semánticas y principales atributos.

* El atributo “age” solo se usó cuando la edad de la persona mencionada era enfatizada.

Etiqueta Atributo Valor Definición

<persName>

“role”

“desaparecido”

Rol asignado de acuerdo a la función de la persona mencionada en cada

nota periodística. En el caso del valor “víctima” este se asignó a una

persona que sufrió cualquier tipo de agresión pero no fue desaparecida.

“familiar”

“fallecido”

“víctima”

“testigo"

“político”

“dirigente”

“fuente”

“funcionario público”

“funcionario internacional”

“funcionario eclesiástico”

“presidente"

“militar”

“paramilitar”

“policía”

“subversivo”

“activista”

“abogado”

“periodista”

“no involucrado”

“sentenciado”

“sex”

“M” Sexo masculino

“F” Sexo femenino

“U” Sexo desconocido

“age” *“senior” Adulto mayor

“underage” Menor de edad

Page 73: El marcado digital de texto: una exploración con el

73

Etiqueta Atributo Valor Definición

<placeName>

type

“escenario de violencia” Espacio en el que se desarrolló un hecho violento.

“establecimiento estatal”Local administrado por una entidad estatal: la sede de un municipio, un hospital o colegio público, etcétera.

“área militarizada” Zona designada bajo control militar por disposición del Gobierno.

“espacio público”Una plaza, una calle o ambiente público no necesariamente relacionado con la

violencia.

“referencia”Término usado por el autor de la nota

periodística como referencia geográfica: un cerro, una carretera.

subtype

“centro de tortura”

Todos son subtipos aplicables al atributo “escenario de violencia”.

“botadero”

“masacre”

“asesinato”

“incursión subversiva”

“redada”

“desaparición"

“paramilitarismo"

“enfrentamiento”

“cárcel”

“cuartel”

“aeropuerto”

Todos son subtipos aplicables al atributo “establecimiento estatal”

“morgue”

“municipio”

“hospital”

“parlamento”

“universidad”

“colegio”

Page 74: El marcado digital de texto: una exploración con el

74

Etiqueta Atributo Subtipo Definición

<orgName>

“organización civil”

“gremio” Sindicato, colegio profesional o federación estudiantil.

“partido político”

“oenegé"

“orden episcopal” Organismos dependientes de la Iglesia Católica Peruana.

“asociación" Organización vecinal o comunidad campesina.

"organización estatal”

“servicio público”

“fuerza armada”

“policía"

“fiscalía"

“colegio”

"jurado electoral”

“congreso"

“poder ejecutivo”

“poder judicial”

“fuero militar”

“universidad"

“municipio"

"medio de comunicación” Diario oficial “El Peruano”.

“contraloría”

"organización subversiva” Sendero Luminoso o MRTA.

"organización paramilitar”

Grupo Colina o grupos campesinos de autodefensa.

“organización privada” "medio de comunicación” Periódicos, revistas y canales

privados.

“organización internacional”

“Iglesia Católica”

“Iglesia Evangélica”

“desconocido” Organización cuya naturaleza no fue precisable.

Page 75: El marcado digital de texto: una exploración con el

75

Etiqueta Atributo Valor Definición

<q>

type“spoken" Atributo que define si la

cita textual proviene del discurso oral o escrito.“written”

“who"

“familiar”

Valores que definen la fuente de enunciación de la cita. En algunos casos

se trata de grupos amplios de personas como

“familiar”, “funcionario público” o “congresista”; en otros sí se identificó la

fuente específica del discurso. Esto último con el objetivo de facilitar el procesamiento posterior.

“militar"

“congresista"

“ministro”

“funcionario público”

“fuente”

"fuente universitaria”

“Alan García”

“Luis Pércovich”

“Javier Alva”

“Óscar Brush”

“Clemente Noel”

“Fernando Belaúnde”

“Adrián Huamán”

"Wilfredo Mori”

“Álvaro Rey de Castro”

“Nicolás Hermoza”

“Henry Pease”

“libro”

Valores solo aplicables a fuentes escritas.“informe”

“comunicado"

“sex”

M Sexo masculino

F Sexo femenino

N Sexo no aplicable (por ser fuente escrita)

U Sexo no determinado.

Page 76: El marcado digital de texto: una exploración con el

76

Además de estas etiquetas, en este experimento de marcado se usaron los tags:

<addName>: para consignar los “alias” o pseudónimos de las personas.

<country>: para designar países.

<street>: para consignar calles.

<abbr>: para marcar abreviaturas.

<label>: para señalar dispositivos legales como artículos del Código Penal.

Como se puede ver, las posibilidades de etiquetado del sistema XML/TEI son robustas. De

hecho, en este ejercicio solo se usaron un puñado de estas marcas y siempre queda la

posibilidad de personalizar el ejercicio de acuerdo a las necesidades de los investigadores. En

buena cuenta, el ejercicio de marcar un texto conduce a preguntas de múltiple orden como:

1. ¿Es la Iglesia Católica una organización internacional o una organización nacional?

¿Forman parte de la sociedad civil o integran una casta especial? En la misma línea,

¿cómo definimos a las congregaciones evangélicas?

2. ¿Qué hacer cuando la toponimia es polivalente? Es decir, cuando el nombre propio de

un lugar designa a dos o más tipos de áreas geográficas/políticas. Este caso es

especialmente confuso en el Perú donde los nombres de las regiones (departamentos)

coinciden muchas veces con los de sus capitales. Un término como “Ayacucho” puede

designar tanto a la región Ayacucho como a la ciudad de Ayacucho, que también es

conocida como Huamanga. Lo mismo ocurre con las regiones de Lima, Ica, Arequipa y

otras tantas. Este fenómeno es distinto en Colombia, por ejemplo, donde solo el

departamento de Arauca comparte nombre con su respectiva capital.

Page 77: El marcado digital de texto: una exploración con el

77

3. ¿Cómo marcar una cita textual instalada dentro de otra cita textual? Por ejemplo,

cuando una víctima ofrece su testimonio y recuerda que un militar le dijo ciertas palabras.

¿Esas palabras recordadas deben ser consignadas como una nueva cita o forman parte del

discurso principal de la víctima? En el caso de este ejercicio, se apostó por mantener la

unidad del testimonio y no se marcaron de forma especial las citas dentro de las citas.

Mencionadas las etiquetas usadas en este experimento, veamos cuáles fueron los resultados

del ejercicio de marcado en los 147 recortes periodísticos.

Page 78: El marcado digital de texto: una exploración con el

78

6 - Resultados

Así como el marcado –en cuanto ejercicio de estructuración e interpretación textual– es una

operación subjetiva, el procesamiento y obtención de materiales a partir de él también depende

en buena medida de las necesidades e intereses del investigador. Para esta investigación

dividimos el análisis en tres: en primer lugar, realizamos operaciones con el cuerpo completo de

notas; luego extrajimos información según las etiquetas semánticas y, por último, procesamos las

citas textuales de las personas mencionadas en las notas de prensa. Veamos los resultados.

6.1 - Operaciones transversales con el corpus marcado

El primer procesamiento fue bastante sencillo: las notas periodísticas fueron organizadas

según su orden cronológico de publicación. Como se dijo en la metodología, las réplicas

digitales de los artículos almacenados en el CDI se descargaron de forma manual desde la

plataforma web y consistían en imágenes en extensión JPG. Si bien cada documento estaba

acompañado con metadatos, la plataforma del CDI no permite interactuar automáticamente

con esa información para realizar nuevas operaciones de reorganización. En consecuencia, el

usuario debe limitarse a manipular el material con las opciones limitadas que ofrece la web

del centro. Téngase en cuenta también que aunque en este experimento se trabajó con una

cantidad modesta de artículos, la lógica del marcado XML/TEI y sus posibilidades de

transformación pueden extenderse a decenas o cientos de miles de documentos. Así, con un

sencillo código XSLT aplicado al cuerpo entero de notas marcadas, se obtuvo esta relación de

titulares acompañados de su código de identificación interno y fecha de publicación. Nótese

que la fecha fue inscrita en un estándar procesable por computadora (año/mes/día).

Page 79: El marcado digital de texto: una exploración con el

79

Tabla 4: Lista de titulares organizados por fecha de publicación.

Código de identificación Titular Fecha de publicación

(año/mes/día)

D127 Hasta la fecha no se conoce suerte de escritor 19820310

D112 Publican lista de maestros muertos y desaparecidos 19830804

D111 Desaparecidos mueren en enfrentamientos 19830805

D115 Fiscal tiene nombres de desaparecidos en Ayacucho 19830830

D116 Noel dice que desaparecidos se han integrado a Sendero 19830910

D117 Desaparecidos en Ayacucho han sido detenidos en presencia de testigos

19830912

D119 Otro profesor desaparece en provincia de Tayacaja 19830913

D118 Destructivas y estúpidas son denuncias sobre desaparecidos 19830913

D113 En Ayacucho matan a sinchi de un disparo a quemarropa 19830919

D120 Desaparece maestro en Víctor Fajardo 19830929

D121 General Noel: Estas son sus víctimas 19831008

D122 Uno muere y 2 desaparecen por masacre en Tambillos 19831016

D123 Desaparece conocido dirigente barrial 19831106

D124 Hallan 4 desaparecidos muertos en quebrada a 10 km. de Ayacucho

19831111

D109 Se incrementa número de muertos en Ayacucho 19831112

D110 Fiscal amplía investigación en masacre de comuneros 19831112

D114 Apagón en Ayacucho 19831112

D126 ¿Huanta está destinada a cantar sólo el ayataqui? 19831228

D125 3 campos de concentración y 2 mil desaparecidos en Huanta 19831230

D106 Caen dos policías y 4 desaparecen en el parque extremista a Pampas Galeras

19840304

D107 Ayacucho sigue sumando sus muertos y desaparecidos 19840319

D062 600 denuncias sobre desaparecidos en Ayacucho 19840323

D108 192 denuncias de detenidos desaparecidos confirmadas 19840428

D061 - 1 y 2 Los ausentes que siempre se encuentran presentes 19840516

Page 80: El marcado digital de texto: una exploración con el

80

D086 GC detuvo dirigente desaparecido según asegura su madre en Puquio

19840804

D092 No hay ninguna pista del corresponsal desaparecido 19840806

D093 Denuncian desaparición de periodista en Huanta 19840806

D059 Pércovich ordena investigar denuncia sobre desaparecido 19840807

D085 DESAPARICION DE DIRIGENTE EN PUQUIO 19840808

D074 Dramática búsqueda de periodista de La República detenido en Huanta

19840809

D082 Barrantes demanda liberen a Oropesa 19840810

D091 Comando Conjunto confirma que el periodista Ayala visitó cuartel

19840813

D076 Fiscal de la Nación investigará en Ayacucho paradero de Ayala Sulca

19840814

D080 Huamán revela que los organismos policiales investigan caso Ayala

19840814

D090 Caso de periodista investiga el fiscal 19840815

D083 Alva reconoce que hay lagunas en el informe de Pércovich al Senado

19840816

D084 FF.AA. emiten comunicado sobre muerte de Oropeza 19840816

D094 Rey de Castro confía en una feliz solución a caso Ayala 19840816

D069 PÉRCOVICH NO SABE SI AYALA HA MUERTO 19840817

D071 Violencia se generaliza F.A. debe informar sobre Ayala 19840818

D073 Ayala estaría con vida 19840818

D075 Iglesia reza por los desaparecidos 19840818

D087 Jaime Ayala habría sido fondeado en una laguna 19840818

D099 Sigue el misterio sobre paradero de Ayala 19840818

D103 Se realizó ayer marcha por desaparición de Ayala Sulca 19840818

D060 Hoy o mañana se sabrá que pasó con el corresponsal Jaime Ayala

19840821

D070 "UBICAR A AYALA NO COMPETE A INTERIOR" 19840821

D096 Infante de Marina mató a Jaime Ayala 19840821

D102 Titular del Interior responsabiliza a general Huamán por el caso Ayala

19840821

Page 81: El marcado digital de texto: una exploración con el

81

D078 Completo mutismo sobre periodista Jaime Ayala 19840822

D089 Caso Ayala verá una comisión legislativa 19840822

D095 Testigo clave ratifica que vio a Ayala ingresar a cuartel el Huanta

19840825

D101 Ayala estaría vivo 19840825

D097 Periodistas de América se movilizan por Jaime Ayala 19840826

D098 28 días de la “desaparición” del periodista Jaime Ayala 19840830

D079 Este lunes entregan informe “Caso Ayala” 19840831

D104 Esta es la ruta de los cementerios clandestinos 19840908

D100 No se confirma muerte de Ayala 19840919

D105 Familia de Ayala llega a Lima para entrevistarse con Belaúnde

19840927

D068 Artaza y Silva Santisteban son comandantes "Camión" y "Lince"

19841002

D067 “Mi corazón me dice que Jaime Ayala está vivo” 19841003

D081 Exigen a FBT entregue cadáver de Jaime Ayala 19841006

D072 Investigan desaparición de Ayala 19841014

D066 Abren juicio por fosas de Pucayacu 19841017

D064 Aseguran que en el Perú no existen presos políticos 19841025

D065 - 1 Brusch pide se demuestre casos de desaparecidos 19841031

D065 - 2 Brush exige pruebas a fiscal sobre millar de desaparecidos en Ayacucho

19841031

D063 Demandan esclarecer todos los casos de desaparecidos 19841105

D046 Hay mil desaparecidos conforme denuncias 19850102

D047 Verificará desapariciones en zona de emergencia 19850105

D049 Entre 21 y 22 llega delegación que investigará desapariciones

19850109

D048 “En el Perú no hay presos políticos” 19850109

D050 Mil desaparecidos en lista para ONU 19850110

D051 Postergan visita de comisión ONU que Vera desapariciones en Perú

19850112

D052 Para Brush, Sendero Luminoso y desaparecidos son inventos 19850112

Page 82: El marcado digital de texto: una exploración con el

82

D054 Amnistía total piden en Encuentro Nacional sobre Derechos Humanos

19850121

D058 Amnistía denuncia desaparición de mil personas en dos años 19850123

D055 Con prudencia recibió EU informe de Amnesty 19850124

D056 Familiares de los desaparecidos en Ayacucho apoyan informe de Amnesty

19850126

D042 Supuestos desaparecidos tienen hasta 5 libretas 19850201

D043 ONU estudiará violación de los Derechos Humanos 19850203

D044 - 1 De 1,005 desaparecidos fueron reinscritos 426 19850223

D044 - 2 Supuestos desaparecidos sacaron nuevas libretas 19850223

D045 Amnistía se hace con Sendero 19850226

D041 No sólo con armas se reprime la subversión dice Gral. Mori 19850815

D038 Familiares de desaparecidos exigen al gobierno que actúe 19850917

D040 - 1 y 2 Accomarca, Umaro, Bellavista, Incaraccay, Pantin, Tankiwa, Echatata, Mayupampa son pueblos arrasados por el Ejército

19850928

D039 Fiscal niega que haya matanza de 69 campesinos 19851005

D034 Hallan tres fosas comunes en Huánuco 19851202

D031 Desaparecidos serían 1,300 19860126

D030 Continúan las desapariciones 19860221

D029 Denuncian a comisión de paz 19860515

D028 ONU investigará desde hoy suerte de 3.000 detenidos - desaparecidos

19861003

D027 - 1 Amnistía Internacional confirma: en el Perú hay más de dos mil desaparecidos

19861016

D027 - 2 Subversión y gobierno violan derechos humanos: Amnesty 19861016

D026 Ejército rapta y desaparece a 3 estudiantes en Ayacucho 19861109

D025 48 desaparecidos tiene Universidad de Huamanga 19861126

D137 “Desaparecen” a dos profesores ayacuchanos de cuartel militar

19870208

D134 Dirigente de CGTP "desaparece" 19870210

D136 - 1 "Cifra de desaparecidos en Perú bajó de forma notable" 19870211

D136 - 2 Violencia terrorista ya desbordó Ayacucho 19870211

Page 83: El marcado digital de texto: una exploración con el

83

D136 - 3 ONU condena acciones terroristas en el Perú 19870211

D136 - 4 Violencia terrorista continúa en el Perú 19870211

D135 Desaparición de dos de sus dirigentes denuncia el SUTEP 19870212

D024 Se incrementa número de estudiantes desaparecidos luego de intervención

19870218

D022 Policía "desaparece" a tres estudiantes de La Cantuta 19870219

D023 - 1 y 2 "Nos vendaron los ojos y, en el camino, desaparecieron algunos"

19870219

D021 - 1 al 4 Manipulación, mentira y represión para ocultar la verdad de universidades

19870221

D020 Estudiantes desaparecidos llegan a 21, según denuncian familiares

19870223

D019 Aumentan a 51 los estudiantes universitarios desaparecidos 19870224

D017 Práctica de detención - desaparición mantiene vigente el actual Gbno

19870320

D016 ¡Sí hay estudiantes desaparecidos! 19870327

D015 Se intensifican detenciones y desapariciones en Ayacucho 19870410

D012 Fueron 10 republicanos 19870427

D139 Desaparecidos aparecen torturados 19870725

D138 Colegio de Abogados de Lima ratifica respaldo a Comisión Vásquez Huayca

19871109

D133 - 1 Por caso de desaparecidos citan a Belaúnde y Morales Bermúdez

19880106

D133 - 2 Investigarán caso de desaparecidos 19880106

D132 Ex jefe de DIRCOTE es premiado por el APRA 19880106

D014 - 1 y 2 Origen de clase de la violencia reaccionaria 19880519

D013 - 1 y 2 Lista de víctimas entregada al fiscal 19880520

D131 Desaparecidos en Lima 19890105

D129 Desapariciones crecen en zonas de la selva 19890112

D130 Manos extrañas desaparecen expediente del caso Cayara 19890112

D128 La verdad, y nada más que la verdad 19890112

D007 - 2 Comunicado autoritarista 19930122

Page 84: El marcado digital de texto: una exploración con el

84

Con la misma facilidad con la que se obtuvo la lista de notas organizadas según fecha de

publicación y código de identificación interno, puede extraerse, por ejemplo, la colección

completa de notas marcadas, la lista de las bajadas o de las leyendas fotográficas (pies de

foto). Considérese que XSLT, el lenguaje de transformación usado en este experimento,

D010 Todo parece indicar que autores de las 10 desapariciones serían militares

19930404

D009 - 9 al 13 EL GOBIERNO DEBE RESPONDER 19930412

D009 - 1 al 4 ¿DÓNDE ESTÁ LA PACIFICACIÓN? 19930412

D008 - 1 Comisión del caso La Cantuta recogió testimonios ‘in situ’ 19930418

D008 - 2 La Cantuta: Pease dice que seguirán las investigaciones 19930418

D008 - 3 “Tengo los nombres del operativo de La Cantuta” 19930418

D008 - 4 Tensión e inseguridad en La Cantuta 19930418

D007 - 3 Comunicado del Ejército es lesivo a la autonomía del CCD 19930422

D007 - 4 Demuestran que es «apócrifo» documento de Henry Pease 19930422

D007 - 5 "No hay democracia con militares deliberantes y amenazadores"

19930422

D007 - 1 Altos mandos del Ejército amenazan a legisladores 19930422

D007 - 6 al 11 Se busca un escuadrón de la muerte 19930422

D006 FF.AA. están obligadas a colaborar en investigación de diez desaparecidos

19930424

D005 DESAPARICIÓN DE ESTUDIANTES DE LA CANTUTA NO SE OLVIDA

19930425

D004 - 2 Trabajo sucio 19930513

D003 - 1 y 2 Mayoría y minoría no quieren llegar a un acuerdo 19930523

D003 - 4 Respaldo a la investigación de caso ‘La Cantuta’ se votaría en plenaria

19930523

D002 Mayoría oficialista encubre a militares implicados en matanza de La Cantuta

19930525

D001 - 1 En 7 días se conocerá resultados de exámenes 19930709

D001 - 2 En CCD piden garantías para periodistas de la revista “Sí” 19930709

D036 20 propuestas para la paz plantearon durante marcha contra la violencia

Nota sin fecha

Page 85: El marcado digital de texto: una exploración con el

85

permite obtener resultados en varios formatos. Para esta investigación fueron útiles los textos

planos TXT (transformables luego en documentos de Valores Separados por Comas, CSV),

pero el lenguaje también puede usarse para obtener un documento HTML o incluso un PDF.

El siguiente ejercicio con el corpus marcado consistió en analizar a través de Voyant Tools

la colección completa de 147 notas (con encabezados, cuerpos y leyendas). En este caso, la

aplicación web de análisis textual procesó un documento con un total de 86.864 palabras, de

las cuales 10.184 eran palabras únicas. Los términos más frecuentes en el corpus fueron: 27

“Ayacucho” (280 apariciones), “general” (248), “Ayala” (232), “comisión” (232) y

“desaparecidos” (203). El resultado gráfico, en una nube de palabras, fue el siguiente:

Gráfico 17: Nube de palabras más frecuentes en el corpus completo de notas marcadas.

Entendamos el gráfico. Ayacucho, región ubicada en los Andes del sur del Perú, fue el

escenario central del conflicto armado. Sendero Luminoso inició ahí su actividad subversiva

Luego de una depuración en la que se excluyeron ciertas palabras vacías del español como preposiciones, artículos o adjetivos 27

demostrativos: “de”, “a”, “este”, “estos”, etc.

Page 86: El marcado digital de texto: una exploración con el

86

el 17 de mayo de 1980 y, tiempo después, el Gobierno Peruano desplegó gran parte de sus

tropas en esa región. Que Ayacucho sea el término más mencionado en el corpus refleja la

importancia que tuvo esa localidad en el periodo de violencia y sintoniza con las cifras más

recientes sobre desapariciones forzadas que apuntan que en esa región se registraron el 48%

de las más de 20 mil desapariciones . Por su parte, el término “general” debe ser 28

contextualizado dentro del corpus. Esta palabra no debe ser entendida en su acepción más

frecuente, “común a todos los individuos que constituyen un todo, a muchos objetos, aunque

sean de naturaleza diferente” (RAE), sino como el más alto rango castrense en los cuerpos

militares. Es decir, la segunda palabra más frecuente en el corpus tiene que ver con las fuerzas

armadas y la represión estatal. En contraste, llama la atención que entre esta nube de palabras

no aparezcan menciones a los grupos subversivos Sendero Luminoso y Movimiento

Revolucionario Túpac Amaru. Puede ser este un indicador, entonces, de que las

desapariciones forzadas en el Perú fueron un fenómeno especialmente asociado –en el

discurso de la prensa– al accionar de las fuerzas estatales y no a la insurgencia. Tal como se

dijo en el marco teórico, la Comisión de la Verdad y Reconciliación concluyó que la respuesta

de las Fuerzas Armadas, al menos en los primeros años del conflicto, contribuyó a exacerbar

la violencia en vez de apaciguarla. De ahí que se atribuyera a los agentes del Estado, comités

de autodefensa (rondas campesinas) y paramilitares el 37, 26% de las víctimas.

Respecto al término “Ayala”, el tercero más frecuente, este guarda relación con la

naturaleza particular de este corpus de prensa: el 27% de los artículos tratan exclusivamente

sobre la desaparición del periodista ayacuchano Jaime Ayala a manos de infantes de Marina

Según el Ministerio de Justicia y Derechos Humanos (2018), en Ayacucho se registraron 9.842 desapariciones forzadas.28

Page 87: El marcado digital de texto: una exploración con el

87

en la provincia de Huanta, hecho ocurrido en agosto de 1984. Al tratarse la víctima de un

periodista y corresponsal de un medio de comunicación limeño, el caso tuvo una notoria

atención mediática. Convendría entonces matizar esta cantidad de notas con un cuerpo mucho

mayor de artículos sobre desapariciones forzadas para dimensionar la real presencia de Jaime

Ayala en el discurso global de la prensa sobre estos crímenes de lesa humanidad.

Otra operación interesante realizada con Voyant Tools y el corpus de textos marcados es

constatar la evolución de las palabras de forma cronológica . Aplicada esta metodología a 29

cuatro términos frecuentes en los artículos se obtuvo el siguiente gráfico.

Gráfico 18: Evolución cronológica de cuatro términos frecuentes en los recortes periodísticos.

Téngase en cuenta que esta operación solo tiene lógica si el corpus está organizado de

forma secuencial. En este caso, los segmentos de texto que están más a la izquierda en el

plano cartesiano son aquellos de publicación más temprana (1982) mientras que los que están

Para este ejercicio solo se consideraron 146 de las 147 notas. El artículo periodístico excluido no tenía fecha de publicación y, 29

por lo tanto, sus términos no podían ser puestos en orden cronológico con certeza.

Page 88: El marcado digital de texto: una exploración con el

88

hacia la derecha corresponden a los más recientes (1993). Así, tenemos, por ejemplo, que el

término “Ayacucho” fue ampliamente mencionado hacia los primeros años del conflicto, tuvo

un segundo pico hacia finales de los años ochenta y, finalmente, decae en frecuencia en el

último segmento del corpus. En contraste con “Ayacucho”, la línea de frecuencia relativa del

término “Ayala” se extiende en la primera mitad del corpus para luego decaer

significativamente. Este ejercicio de evolución de términos puede realizarse con cualquier otra

palabra del corpus de 80 mil palabras, de forma tal que cualquier investigador interesado en el

discurso periodístico puede realizar comparaciones históricas de largo aliento. Para ilustrar

esta aproximación tenemos la siguiente tabla [ver página siguiente].

Page 89: El marcado digital de texto: una exploración con el

89

Tabla 5: Evolución de términos en el corpus según frecuencia relativa.

Frecuencia relativa del término

Diagrama comparativo entre los términos “Alan”, “Belaúnde” y

“Fujimori”. La frecuencia relativa de los nombres

distintivos de los ex presidentes peruanos coincide,

aproximadamente, con sus periodos de gobierno.

Evolución del término “campesino” en el corpus de 147

notas periodísticas. Vista en contraste con el flujo de la

palabra “universitario” tenemos que la prensa que documentó las desapariciones forzadas se ocupó más de la población estudiantil

hacia finales de los años ochenta y principios de los noventa.

Page 90: El marcado digital de texto: una exploración con el

90

Gracias a que el marcado XML/TEI permite la estructuración del corpus a gusto del

codificador, el investigador también puede analizar segmentos particulares como el primer

nivel de lectura periodística (solo voladas, titulares y bajadas). Este procesamiento, elaborado

también en la aplicación web Voyant Tools, dio este gráfico:

Gráfico 19: Evolución de los términos más frecuentes en voladas, titulares y bajadas.

En el diagrama anterior figuran los cinco términos más recuentes en el corpus de voladas,

titulares y bajadas organizados cronológicamente . Voyant Tools procesó esta vez un 30

documento de 3.197 palabras de las cuales las más frecuentes (luego de la depuración de

términos vacíos) fueron: “desaparecidos” (48), “Ayala” (31), “Ayacucho” (26),

“comisión” (19) y “caso” (17). Como se explicó, hacia la izquierda están las notas publicadas

en los años ochenta y hacia la derecha aquellas impresas hasta 1993. Nótese que en este

gráfico la palabra “desaparecidos” ocupa un lugar más preponderante que en corpus global.

Tampoco se incluyó la única nota que carecía de fecha de publicación.30

Page 91: El marcado digital de texto: una exploración con el

91

Otra posibilidad de análisis –no explorada en este ensayo– es realizar análisis del discurso

según el medio de comunicación. Es decir, organizar el corpus de acuerdo a la empresa

periodística responsable de la publicación de la nota. Se podría contrastar así, por ejemplo,

cómo un medio impreso trató determinado aspecto de las desapariciones forzadas respecto a

un diario coetáneo, qué fuentes fueron privilegiadas en la construcción de la noticia y qué

voces fueron las replicadas. Como se dijo, las posibilidades de organización del corpus y de

extracción de información son versátiles y dependen de las necesidades del investigador.

6.2 - Operaciones con etiquetas para nombres propios

Los nombres, ya sean de personas, lugares u organizaciones, y las citas textuales son

elementos vitales en las notas periodísticas. Por ello, en este experimento se marcaron 5.153

elementos con las etiquetas <persName>, <placeName>, <orgName> y <q>, cuya definición

explicamos en la metodología. Las herramientas de transformación de documentos XML

permiten recuperar estas marcas de forma automática para generar listas de contenido

semántico. El gráfico de estas cuatro etiquetas en los 147 artículos periodísticos es este:

Gráfico 20: Porcentajes de etiquetas semánticas usadas en el corpus.

Page 92: El marcado digital de texto: una exploración con el

92

6.2.1 - <persName>

La descripción de los nombres propios de personas (etiqueta <persName>) fue enriquecida

en este ensayo con tres atributos: @role, @sex y @age. El primero designa el rol que

cumple la persona mencionada en el texto, a la manera de una obra literaria. Así, con este

atributo clasificamos a las personas mencionadas como víctimas de desaparición, políticos,

funcionarios públicos, etc. De igual manera, se asignaron tres valores posibles al atributo

@sex: “hombre”, “mujer” y “desconocido”. Vale la pena precisar que nos estamos

refiriendo al sexo biológico de las personas, así identificadas en los textos periodísticos, y

no a la identidad de género que es más difícil de establecer en documentos como los

procesados. XML/TEI tiene atributos específicos para abordar temas de género si así lo

permite el corpus y lo demanda el objetivo de investigación. Por último, el atributo @age

fue utilizado cuando la condición de adulto mayor o menor de edad fue puesta de forma

explícita en las notas. Recuérdese que según la legislación de muchos países

latinoamericanos, estas poblaciones se consideran vulnerables. Al cruzar la información de

los atributos @role y @sex se obtuvo este diagrama aluvial:

Page 93: El marcado digital de texto: una exploración con el

93

Gráfico 21: Diagrama aluvial de personas mencionadas según sexo y rol.

Visto el gráfico, es evidente una alta asimetría entre la cantidad de menciones a hombres y

mujeres en el corpus de 147 notas periodísticas. Para ser precisos, el porcentaje de hombres

mencionados es del 91,4%, el de mujeres 8,4%. En un 0,2% de casos, no se precisó el sexo

de la persona mencionada . Es decir, por cada 10 personas mencionadas en el corpus, 9 31

eran hombres. Otros diagramas que cruzan información específica entre sexo y subgrupos

de personas confirman –y radicalizan- esta tendencia [ver página siguiente]:

No fue posible precisar el sexo de algunas personas mencionadas debido a que solo se consignaron sus apellidos en el corpus.31

Page 94: El marcado digital de texto: una exploración con el

94

Tabla 6: Relaciones entre rol y sexo de personas mencionadas en el corpus.

La preponderancia de varones es de más del 90% tanto en los roles de desaparecidos

como en posiciones de poder como políticos y funcionarios públicos. De igual forma, los

militares, que son el cuarto grupo más nutrido de personas mencionadas, son todos

hombres. El panorama cambia, sin embargo, cuando se analiza a los familiares de

desaparecidos (68% mujeres y 23% hombres). Tenemos aquí evidencia cuantitativa que

refuerza una característica de las desapariciones forzadas: fueron las mujeres (madres,

esposas e hijas) quienes más protestaron en medios de comunicación por los atropellos

cometidos durante los años de violencia política. A través de asociaciones de familiares,

comedores populares y organizaciones no gubernamentales, ellas presionaron al gobierno

para que garantizara los derechos fundamentales de los ciudadanos. El rol de estas mujeres,

Page 95: El marcado digital de texto: una exploración con el

95

entonces, debiera ser pieza fundamental de cualquier abordaje académico sobre las

desapariciones forzadas.

6.2.2 - <placeName>

En el caso de los nombres de lugares mencionados en los recortes periodísticos, se

marcaron en total 1.159 elementos con la etiqueta <placeName>. El procesamiento global

de estos términos a través de Voyant Tools dio esta nube de palabras:

Gráfico 22: Nube de palabras de los 1.159 lugares mencionados en el corpus.

Los términos “Ayacucho”, “Huanta”, “Perú y “Lima”, claras referencias geográficas,

ocupan un lugar preponderante en el corpus de <placeName>. Recuérdese además que el

término “Ayacucho” no solo designa al departamento donde estalló el conflicto armado,

sino también a la capital de la región, la ciudad de Huamanga. En paralelo, hay que tener

en cuenta la importancia de “cuartel”, “marina” e “infantería” en el léxico analizado. En el

corpus, estos términos solían ir vinculados mediante el sintagma “Cuartel de la Infantería

Page 96: El marcado digital de texto: una exploración con el

96

de Marina de Huanta”, espacio en el que se registraron múltiples violaciones a los derechos

fundamentales, entre ellas la desaparición del mencionado periodista Jaime Ayala . 32

Con ánimo de perfilar aún más el tipo de espacio mencionado, se añadieron varios

atributos a 533 de los 1.159 elementos <placeName> del corpus. Este subgrupo fue

dividido, según su función informativa, con estos criterios: escenario de violencia,

establecimiento estatal, área militarizada, espacio público y referencia [ver sección de

metodología para más detalles]. El segmento más numeroso en cantidad de menciones (405

en total) fueron los escenarios de violencia de acuerdo a la siguiente distribución:

Gráfico 23: Diagrama de los espacios de violencia mencionados en el corpus.

Las acusaciones sobre crímenes cometidos en el cuartel de la Marina en Huanta fueron documentados abundantemente en el 32

Informe Final de la CVR. Para más detalle ver el capítulo 2.12 del tomo VII: La desaparición del periodista Jaime Ayala (1984).

Page 97: El marcado digital de texto: una exploración con el

97

Se observa en este diagrama tipo treemap que el cuartel es el espacio de violencia más

frecuentemente mencionado, lo que se comunica con las referencias a los términos

“general”, “militar” y “ejército” hallados en otras partes del corpus. Casi en el mismo nivel

de importancia se hallan los espacios donde se registraron desapariciones [Quicapata,

Cangallo, Víctor Fajardo, entre otros ] y masacres [Cayara, Accomarca, Soccos o Callqui].

Esta información marcada puede ser aprovechada en una ampliación de este proyecto. Por

ejemplo, un camino de investigación bastante interesante es asociar el lenguaje XML con

georreferenciación digital para elaborar mapas interactivos sobre la violencia.

6.2.3 - <orgName>

El procesamiento de los elementos marcados como organizaciones (etiqueta <orgName>)

también refuerza el rol que jugaron las fuerzas armadas como protagonistas de las noticias

sobre desapariciones forzadas. De las 1.634 elementos que designaban a algún tipo de

organización estatal, civil, paramilitar, subversiva, privada o internacional, el mayor grupo

(335) pertenecían a las fuerzas armadas peruanas. El diagrama de flujo es el siguiente:

Page 98: El marcado digital de texto: una exploración con el

98

Gráfico 24: Diagrama aluvial de las organizaciones mencionadas en el corpus.

Las 147 notas de prensa analizadas mencionan, sobre todo, a organizaciones estatales

(entre fuerzas armadas, policía, congreso, universidades, Ministerio Público y órganos del

Poder Ejecutivo). Llama la atención también la cantidad proporcionalmente menor de

menciones a organizaciones subversivas como Sendero Luminoso y el MRTA. Asimismo,

todas las referencias a organizaciones privadas condujeron a medios de comunicación. Es

decir, no se mencionaron otros organismos particulares como empresas o cooperativas.

Un diagrama detallado de las organizaciones estatales mencionadas [ver página

siguiente] muestra que, además de las fuerzas armadas y policiales, otras entidades que

tuvieron atención mediática fueron el Congreso, la universidad y la fiscalía. Respecto al rol

del Congreso en las denuncias sobre desapariciones forzadas, el Informe Final de la CVR

detalla que este fue de indiferencia. “A pesar de existir miles de denuncias sobre

desapariciones forzadas en el país, el Congreso de la República no designó a ninguna

Page 99: El marcado digital de texto: una exploración con el

99

comisión especialmente encargada de investigar este tipo de prácticas. Las investigaciones

parlamentarias se concentraron en algunas ejecuciones y masacres, y en algunas

desapariciones forzadas conexas a esos hechos” (CVR, Tomo VI, 111). Precisamente, en

las notas de prensa marcadas para este experimento, se pueden seguir algunas discusiones

que se dieron en el Congreso frente a las denuncias por crímenes de lesa humanidad. Es

interesante notar, ya en una lectura más cercana del material, los matices dentro de este

organismo público: no todos los congresistas mantuvieron una actitud de desprecio hacia el

sufrimiento de los peruanos desaparecidos, también hubo voces firmes que se alzaron para

exigir a las fuerzas armadas y al gobierno que respetara los derechos humanos.

Gráfico 25: Tipos de organizaciones estatales mencionadas en el corpus.

Por último, dentro de las fuerzas armadas, ¿Qué organismos fueron los más

referenciados? En cantidad de menciones estos fueron “ejército” (107), “comando” (68) y

“marina” (57). Tal como con el estudio de voladas, titulares y bajadas, la extracción de

Page 100: El marcado digital de texto: una exploración con el

100

información marcada con el lenguaje XML permitiría verificar la evolución de las

menciones a estas organizaciones en el tiempo para determinar, por ejemplo, qué órganos

de las fuerzas armadas fueron más mencionados con el pasar de los años.

6.3 - Análisis de citas textuales: la voz de los protagonistas

En la nota periodística escrita, ya sean artículos cortos, reportajes o crónicas de más largo

aliento, las citas textuales son centrales. Citar a una persona es un acto que tiene

connotaciones éticas, estéticas e incluso legales. Cuando el redactor entrecomilla las

declaraciones de un entrevistado o una fuente, renuncia a explicar la noticia con sus propias

palabras y delega esa responsabilidad a otra persona. Los motivos para hacerlo son variados,

pero hay uno que merece resaltarse aquí: la declaración de la fuente es tan importante que

cualquier parafraseo empaña su impacto. El periodista cita a otra persona para resaltar no solo

el contenido sino la forma del enunciado. Siguiendo esta lógica, en este experimento se

marcaron todas las declaraciones textuales consignadas entre comillas en los 147 artículos

periodísticos. Tras clasificar las citas, el resultado global de la operación fue el siguiente:

Tabla 7: Tipos de citas textuales marcadas, según fuente y sexo.

Page 101: El marcado digital de texto: una exploración con el

101

En principio, se distinguieron dos tipos de orígenes para las citas textuales: fuentes orales y

fuentes escritas. La relación entre ambas fue del 82,8% y 17,2% respectivamente. Asimismo,

cuando se analiza la distribución por sexo queda confirmada la disparidad entre las veces en

las que los hombres proveyeron la información textual (68,71%) respecto a las mujeres

(8,32%). Es decir, la voz de la mujer fue puesta en menor relevancia que la de los hombres.

Nótese, incluso, que el porcentaje de citas textuales de sexo no aplicable (por tratarse de

informes, comunicados gubernamentales, pronunciamientos escritos o libros) es superior a la

participación femenina. Por último, hay un porcentaje considerable (6,34%) de citas textuales

de sexo desconocido. En la mayoría de casos se trató de fuentes o testigos cuyas identidades

(y sexos) fueron ocultados adrede en la redacción de las notas. Esto como medida de

protección en un contexto de extrema violencia y libertad de expresión limitada.

Ahora bien, hagamos un ejercicio de reivindicación y exploremos en primer lugar qué fue

lo que dijeron algunas de las mujeres citadas en las notas de prensa sobre desapariciones

forzadas. La participación femenina se resume a dos fuentes: familiares de las personas

desaparecidas y Leonor Zamora, ex alcaldesa de Huamanga (Ayacucho) entre 1983 y 1985,

quien apoyó activamente a quienes buscaban a sus seres queridos y denunció las ejecuciones

extrajudiciales que ocurrían en su localidad. Zamora fue asesinada el 21 de diciembre de 1991

en Huamanga, su muerte fue atribuida al suboficial del Ejército Fabio Urquizo, alias “Agente

Camión”. El caso fue documentado en el Informe Final de la CVR.

A continuación, unas pocas citas extraídas de las notas periodísticas.

Page 102: El marcado digital de texto: una exploración con el

102

Tabla 8: Selección de voces femeninas en el corpus periodístico.

Fuente: Leonor Zamora, ex alcaldesa de Huamanga Cita Publicado en:

“En Ayacucho siguen apareciendo cadáveres. En las últimas tres semanas se han encontrado 156

cadáveres en las urbanizaciones. Algunos han sido identificados: Son jóvenes estudiantes de

secundaria”.

Entrevista a Leonor Zamora: “Ayacucho sigue sumando sus

muertos y desaparecidos”. Publicado en el

diario “El Observador” el 19 de marzo de 1984.

“La actitud del general Huamán es llamar a los dirigentes de las diferentes organizaciones

laborales y profesionales. El caso es que busca tratar los problemas aisladamente y descarta

entrevistarse con el frente de organizaciones en su conjunto. Huamán trata en forma diferente por

ejemplo al Colegio de Abogados en relación con los pueblos jóvenes. Él trata de persuadir a los

dirigentes que llama que nada se conseguirá con la fuerza; les dice: “hay que trabajar”. En ningún

momento ha sido invitado el Concejo”.

“Efectivamente, yo le digo que socialmente Ayacucho está más postrado que antes. Fíjese

usted que a los problemas tradicionales de pobreza, falta de trabajo, indigencia, se han

sumado los provocados por la represión indiscriminada. Tenemos centenares de mujeres abandonadas, desprotegidas, cada una con un promedio de 5 a 8 hijos. Las familiares de los

desaparecidos nadie las atiende. Esos niños están librados a la buena de Dios. Las madres, que denunciaron desaparecidos a la Federación

Latinoamericana de Asociaciones de Familiares de Detenidos - Desaparecidos, fueron cerca de 200”.

“Puedo hablar de los niños huérfanos de la ciudad. Del campo se tienen pocos datos, pero se sabe que las incursiones policiales dejaron cientos de niños

en el más absoluto abandono. En Huamanga deben haber unos 500 niños huérfanos sin padre y

sin madre”.

“Hay un hecho que es cierto. Los familiares de las personas desaparecidas en Ayacucho, muchos, tiene la certeza que han sido asesinados. No es

fácil que una persona se exponga, por denunciar una desaparición, ser detenida. En Ayacucho de la detención a la desaparición no hay gran distancia”.

“En cuanto a torturas: Se cree que ya los detenidos no son llevados al cuartel Los Cabitos, pero se sabe de una nueva casa de torturas, camino al aeropuerto. Es una casa con vigilancia policial

permanente y con una gran antena de radio. Los vecinos han denunciado movimientos

sospechosos. Allí, en las noches, se escucha la radio a gran volumen”.

Leonor Zamora (fotografía:

Käthe Meentzen, 1985)

Page 103: El marcado digital de texto: una exploración con el

103

Esas son las voces. Permítaseme resaltar aquí no el potencial del marcado XML/TEI para

extraer y cuantificar la información, sino la posibilidad de recuperar los testimonios de

aquellas personas que sufrieron en carne propia el dolor y la injusticia de las desapariciones

Fuente: Familiar Cita Publicado en

Felícita Gaspar, esposa del dirigente sindical Hilario Alluque,

desaparecido en 1987

“Abrieron la puerta del dormitorio de una patada y ahí mismo comenzaron a

insultarnos. Me llevaron a otra habitación y ya no pude ver nada, solo oía que lo

golpeaban y lo insultaban. Después se fueron, rompiendo todo, rebuscando todo”

“Fueron 10 republicanos”, publicado en la revista “Sí” el 27 de

abril de 1987.“Fueron diez republicanos, yo los vi. Tenían

el rostro con pasamontañas negras y los reconocí por su uniforme verde oscuro”

Zenaida Fernández, hija de Nemesio Fernández Napa,

desaparecido en 1985.

Lo apresaron por el hecho de haber estado indagando por el paradero de otro de nuestros

familiares que figura como desaparecido"

“Familiares de los desaparecidos en Ayacucho apoyan

informe de Amnesty”, publicado en “La

República” el 26 de enero de 1985.

Georgina Quispe, esposa de Filomeno Cruzat Caroy, profesor

desaparecido en 1983.

“Yo, mi esposo, junto con mis dos hijitos estábamos haciendo compras en el

mercadillo de Hualla. Los soldados llegaron en una tanqueta y haciendo disparos al aire se

llevaron a mi esposo y a trece campesinos más. Los metieron al cuartel “Canarias” y no

me dejaron verlo hasta ahora. Varios días después me dijeron que lo habían trasladado a Ayacucho. He preguntado en todas partes y me dicen “aquí no está”. ¿Qué le han hecho a

mi esposo? ¿Dónde está?”

“Desaparece maestro en Víctor Fajardo”, publicado en “La

República” el 29 de septiembre de 1983.

Teófila Bermudo, cuyo hermano y primo fueron secuestrados en 1983.

“Con mucho sacrificio y gastando el poco dinero que pude conseguir con la venta de

mis animales viajé a la localidad de Mayocc donde pude informarme que mi hermano José y mi primo Artemio se encontraban recluidos

en el campamento de los sinchis. Traté de verlos suplicándoles a los guardias, pero estuve tres días sin lograr mi cometido.

Muchas personas allegadas a los policías me manifestaron que a los presos los tenían sin

comer y sometidos a crueles torturas”

“¿Huanta está destinada a cantar sólo el

ayataqui?”, publicado el “El Nuevo Diario” 28 de

diciembre de 1983

Rosa Pallqui de Ayala, esposa del periodista Jaime Ayala,

desaparecido en Huanta en 1984.“No debo resignarme a su desaparición… yo

sé que está vivo y debe aparecer”

“Mi corazón me dice que Jaime Ayala está vivo”,

publicado en “La República” el 3 de octubre de 1984.

Page 104: El marcado digital de texto: una exploración con el

104

forzadas. La facultad de activar, mediante la tecnología, un archivo periodístico, una

colección de recortes viejos que tocan fibras sensibles de lo humano. Las historias de los

familiares de los desaparecidos, con todo su espanto, con todo su amor, son documentos que

no merecen ser olvidados. Este experimento quiere ser un aporte a esa causa.

En el caso de estas citas seleccionadas, encontramos, por ejemplo, que es posible traer al

presente la voz de Leonor Zamora, quien siendo alcaldesa de Ayacucho en 1984 reclamó por

las continuas apariciones de cadáveres en las calles de la ciudad, la represión de las fuerzas

armadas y el abandono del Estado hacia su localidad. Resalta la funcionaria, por ejemplo, un

daño colateral de las desapariciones forzadas: el incremento de los huérfanos. Tenemos aquí

entonces una fuente que relaciona la desaparición con la orfandad, lo que debe ser tenido en

cuenta en una investigación posterior. Por su parte, Felícita Gaspar, Zenaida Fernández,

Georgina Quispe, Teófila Bermudo y Rosa Pallqui enfatizan la brutalidad de los crímenes, una

metodología del horror que no puede resumirse a solo unos casos aislados sino que habla de

sistematicidad. Los testimonios de estas mujeres apuntan también a la perseverancia, al acto

de desprenderse de lo material con la esperanza de hallar al desaparecido.

Por último, recordemos la convocatoria de algunos investigadores abordados en el marco

teórico de este documento a complementar el archivo histórico sobre el conflicto armado

interno con los testimonios de aquellas personas que provocaron la violencia o que, en pleno

ejercicio del poder, voltearon la mirada y minimizaron el horror. Como se mencionó, las

Fuerzas Armadas peruanas vieron con escepticismo la labor de la Comisión de la Verdad y

Reconciliación e impugnaron sus resultados. Ahí quedan, entonces, los testimonios recogidos

por la prensa de los militares encargados de la pacificación y de los políticos responsables.

Page 105: El marcado digital de texto: una exploración con el

105

Tabla 9: Selección de citas de militares y funcionarios públicos.

Fuente: militar Cita Publicado en:

Clemente Noel, primer jefe del Comando Político Militar de Ayacucho.

"todas las personas desaparecidas en el departamento de Ayacucho, sencillamente se han integrado a las filas de Sendero Luminoso para impulsar la llamada lucha armada senderista”.

“Noel dice que desaparecidos se han integrado a Sendero”,

publicado “El Diario” el 10 de septiembre de 1983.

"habría que preguntarle pues a Abimael Guzmán y a todos los que tienen la dirección de Sendero

Luminoso sobre el paradero de esas personas que se han pasado a las filas senderistas”.

"porque está integrado por delincuentes comunes que cometen asesinatos, raptos y violaciones.

Cómo podemos dialogar con gente que no razona. Yo creo que el diálogo está de más”.

Wilfredo Mori, tercer jefe del Comando Político Militar de Ayacucho.

“Yo como ser humano sólo sé que mi conciencia está tranquila, y no tengo nada que comentar de la desesperación de los familiares que han perdido a

sus seres queridos. Yo no soy Dios”.“No sólo con armas se

reprime a la subversión, dice Gral. Mori”,

publicado en diario “Hoy” el 15 de agosto de 1985

“Pero ustedes saben que los terroristas han matado a muchos miembros de las fuerzas del orden, de los

cuales se llevan sus armas y uniformes. Además ellos reclutan a jóvenes, hombres y mujeres para su ejército. En cuanto a que nunca se responde a las solicitudes, nosotros los pasamos al Ministerio

Público, para su estricto y urgente trámite, pero no sé qué pasa”.

Fuente: ministro Cita Publicado en:

Luis Pércovich, ministro de Pesquería, del Interior, de

Relaciones Exteriores y presidente del Consejo de Ministros del Perú durante el segundo gobierno de

Fernando Belaúnde (1980 - 1985)

“[hay desaparecidos] que poseen más de una libreta electoral, lo que podría

significar intencionalidad delictiva”

“Supuestos desaparecidos tienen hasta 5 libretas”,

publicado en “El Comercio” el 1 de febrero de 1985.

“La zona de emergencia se encuentra bajo el mando de las Fuerzas Armadas a

órdenes de la jefatura del Comando Político Militar, y en un área donde el

ministro del Interior no tiene el comando de las fuerzas, que están operando.

¿Cómo puedo tener la responsabilidad política de los sucesos?

“Titular del Interior responsabiliza a general

Huamán por el caso Ayala”, publicado en “La República”

el 21 de agosto de 1984.

“no se pueden señalar responsabilidades de las Fuerzas Armadas mientras no se profundicen las investigaciones y se establezca la realidad de los hechos"

“Ubicar a Ayala no compete a Interior”, publicado en

“Expreso” el 21 de agosto de 1984.

Page 106: El marcado digital de texto: una exploración con el

106

Así, queda demostrado que la recuperación automática de citas textuales puede servir para

examinar a detalle el lenguaje de los protagonistas de las noticias. Incluso, si el corpus es lo

suficientemente extenso, podrían realizarse análisis con eje temporal para advertir variaciones

en el discurso de los entrevistados y las fuentes, o en la forma en la que se abordaron las

desapariciones forzadas en los medios impresos. Es importante tener en cuenta que si una

entidad estatal como el Lugar de la Memoria pusiera a disposición del público un archivo de

prensa marcado con el estándar XML/TEI, los académicos interesados podrían realizar

múltiples manipulaciones con este, extraer datos con distinto nivel de profundidad de acuerdo

a sus necesidades y usar los textos como un repositorio casi inagotable de información.

Page 107: El marcado digital de texto: una exploración con el

107

7 - Conclusiones

Este ensayo quiso demostrar lo siguiente: la codificación de datos textuales a través del esquema

de marcado digital XML/TEI es útil para estructuración y procesamiento de documentos sobre

memoria histórica en Perú. En particular, se aplicó esta herramienta a un conjunto de 147

recortes periodísticos publicados por 23 medios de comunicación impresos y que documentaron

desapariciones forzadas ocurridas entre 1982 y 1993, durante el conflicto armado interno. El

ejercicio tuvo un carácter experimental y puede ser ampliado o mejorado en muchos aspectos.

Pero pese a todas sus imperfecciones, fue posible codificar la información para luego obtener

nuevos productos digitales de forma automática. Con estos documentos procesados, se realizaron

visualizaciones de carácter cuantitativo y cualitativo que arrojaron información sobre la

naturaleza de las desapariciones forzadas en ese país. Teniendo en cuenta esto, dejo a

continuación cinco breves consideraciones sobre este experimento a modo de conclusión.

1. El archivo digital puede enriquecerse con el sistema de marcado XML/TEI.

En este proyecto se transformaron 147 imágenes digitales de notas periodísticas en

sendos documentos XML con información manipulable a través de editores de código

y procesadores de texto. Es decir, se pasó de información en píxeles, similares a

fotografías, a datos estructurados, procesables mediante fórmulas sencillas de

programación XSLT. Puede afirmarse que en este experimento el archivo digital

disponible fue enriquecido y optimizado para la investigación académica. Los datos

textuales no solo fueron transcritos sino que se les añadió información semántica

codificada que identificó nombres de personas, de lugares, de organizaciones y citas.

No se trata, claro, de un proceso sencillo, aprender a manipular documentos XML

Page 108: El marcado digital de texto: una exploración con el

108

demanda habilidades informáticas al investigador, pero una vez que el obstáculo se

domina, las posibilidades de análisis son robustas y versátiles. En un país como el

Perú, donde ya se hacen esfuerzos para digitalizar el archivo histórico pero aún la

investigación en humanidades digitales es incipiente, una aproximación como la

propuesta aquí puede ser de interés para antropólogos, historiadores, politólogos y

otros académicos que exploran desde sus disciplinas el archivo del conflicto.

2. El procesamiento de los datos facilita el análisis cuantitativo y cualitativo.

Con las notas periodísticas marcadas fue relativamente sencillo obtener listas de

elementos en orden cronológico y luego procesar la información con otras

herramientas digitales (Voyant Tools, Excel, etc,). En buena cuenta, el objetivo de este

análisis fue encontrar cantidades, porcentajes, proporciones que dieran pistas sobre las

características de las desapariciones forzadas en el Perú y sobre el tratamiento que dio

la prensa escrita a este fenómeno. No obstante, los resultados no se limitan a una

dimensión cuantitativa. El marcado de texto también implica una reflexión teórica y

lingüística porque interpela al codificador en varios niveles. En principio, el acto de

marcar no es una operación mecánica sino que responde a una interpretación subjetiva

sobre el sentido del texto. En esa línea, cada codificador XML/TEI puede encontrar

nuevos sentidos e interpretaciones, de acuerdo a sus propias lectura del documento.

Asimismo, el análisis de lo resultados no tiene por qué limitarse a la construcción de

nuevas bases de datos. La recuperación, por ejemplo, de los testimonios textuales de

las personas que buscaban a sus seres queridos durante el conflicto armado puede dar

Page 109: El marcado digital de texto: una exploración con el

109

insumos a una (re)interpretación sociológica, lingüística, literaria o poética de los

textos. Los usos que se le pueden dar a los resultados son múltiples.

3. El marcado de un corpus considerable de textos demanda, necesariamente, la

colaboración de varios investigadores

En este ejercicio se marcaron 147 artículos periodísticos y, como se mencionó, estos

textos fueron apenas una porción del total de artículos disponibles en la plataforma del

Centro de Documentación e Información (CDI) del Lugar de la Memoria, la Tolerancia

y la Inclusión Social. Pese a esto, la codificación y el posterior procesamiento

demandaron abundante tiempo y esfuerzo. Por ello, concluyo aquí que el marcado de

un corpus significativo de textos demandará necesariamente la colaboración de

muchos investigadores. Esto, por lo menos, hasta que se desarrollen herramientas de

inteligencia artificial que reflejen fielmente las subjetividades de la mente humana. La

colaboración, desde luego, entra en sintonía con el espíritu de las humanidades

digitales que no tienen una vocación solitaria sino que están abiertas a la sabiduría de

la multitud. Asimismo, conviene que las decisiones semánticas del marcado sean

tomadas por grupos interdisciplinarios de investigadores, como ya ocurre en muchas

investigaciones de memoria histórica. Determinar qué es una desaparición forzada,

quién es una víctima o quién un agresor son operaciones tan delicadas que deberían

abrirse al debate e ir más allá del terreno académico e interpelar directamente a las

comunidades que sufrieron la violencia. Téngase en cuenta también que

visualizaciones como las de este ensayo cobran sentido cuando resumen miles de

Page 110: El marcado digital de texto: una exploración con el

110

documentos. Por ello, en este ensayo hemos evitado lanzar conclusiones generales

sobre las desapariciones forzadas y, en cambio, se reconoce la precariedad del corpus.

4. La experiencia cultural del codificador importa

Explorar notas periodísticas sobre un conflicto armado puede ser una actividad

especializada, tal como la paleografía o el análisis de mapas del siglo XVI. Pese a que

la prensa tiene una vocación masiva y popular y su lenguaje tiende a ser claro, muchos

de los referentes mencionados en los documentos tienen importancia ante los ojos de

una persona medianamente conocedora del tema. Por ejemplo, discernir las sutilezas

entre los topónimos de las regiones andinas del Perú, varios de ellos en quechua,

demanda alguna suficiencia geográfica y lingüística. Lo mismo ocurriría al explorar

archivos de otros contextos latinoamericanos. Tampoco es un tema menor la naturaleza

dolorosa del objeto de investigación. Sumergirse en archivos que exploran masacres,

desapariciones y torturas tiene un coste emocional que debe tenerse en cuenta.

5. El proceso de captura de información es crucial para un buen etiquetado

La digitalización de un archivo histórico, llámese una colección de notas periodísticas

o un repositorio de fotografías, no debe ser un fin en sí mismo. Este proceso de

transformación, de migración de un soporte analógico a otro numérico, debe ser guiado

por criterios académicos o sociales fundamentados. En este proyecto se advirtió que la

captura de información de las notas periodísticas donadas por la Asociación Pro

Derechos Humanos (APRODEH), el escaneo de los recortes, tiene varias

inconsistencias. Hay errores técnicos de catalogación, sectores de las notas donde

apenas se pueden reconocer los textos y, por último, hay una exhibición fragmentada

Page 111: El marcado digital de texto: una exploración con el

111

de las notas que están separadas de su contexto original de lectura. La posición de un

artículo en el contexto integral de un diario es una información significativa que debió

considerarse.

Dicho esto, volvamos al primer punto de esta sección y recordemos que la estructuración de la

información con el esquema XML/TEI puede ayudar a aliviar las imperfecciones que se han

dado en la digitalización del acervo documental del CDI. Estos errores, desde luego, deben ser

matizados con el esfuerzo que ha hecho el LUM por poner al alcance de cualquier internauta

documentación sobre el conflicto armado peruano (sin el cual este ensayo no hubiera sido

posible). De hecho, este proyecto considera que la experiencia peruana en torno a la construcción

de archivos sobre el pasado traumático, con sus aciertos y equivocaciones, puede servir de apoyo

al proceso social colombiano, donde aún está en operación la Comisión para el Esclarecimiento

de la Verdad, la Convivencia y la No Repetición.

Page 112: El marcado digital de texto: una exploración con el

112

Obras citadas

Aguirre, Carlos. “¿De quién son estas memorias? El archivo de la Comisión de la Verdad y

Reconciliación del Perú”. En Jahrbuch für Geschichte Lateinamerikas 46 (2009): 135 - 166.

Asociación Nacional de Familiares de Secuestrados, Detenidos y Desaparecidos del Perú. ¿Hasta cuándo

tu silencio? Testimonios de dolor y coraje. Ayacucho: ANFASEP y Cooperación Alemana,

implementada por la GIZ, 2015.

Comisión de la Verdad y Reconciliación. Informe Final. Lima: CVR, 2003.

Besser, Howard. “The Past, Present and Future of Digital Libraries”. En A Companion to Digital

Humanities, ed. Susan Schreibman, Ray Siemens, John Unsworth. Oxford: Blackwell, 2004.

Fuente: <https://www.digitalhumanities.org/companion/>

Bradley, John. “Text Tools”. En A Companion to Digital Humanities, ed. Susan Schreibman, Ray

Siemens, John Unsworth. Oxford: Blackwell, 2004. Fuente: <https://www.digitalhumanities.org/

companion/>

Burnard, Lou. What is the Text Encoding Initiative? How to add intelligent markup to digital

resources. Nueva edición [en línea]. Marsella: OpenEdition Press, 2014. Disponible en Internet:

<http://books.openedition.org/oep/426>

Degregori, Carlos Iván. Qué difícil es ser Dios. El Partido Comunista del Perú - Sendero Luminoso y el

conflicto armado interno en el Perú: 1980 - 1999 (Obras Escogidas I). Lima: IEP Instituto de

Estudios Peruanos, 2013.

Drucker, Johanna. Introduction to Digital Humanities. Course Book: Concepts, Methods, and Tutorials

for Students and Instructors. UCLA, 2014. Fuente digital: <http://dh101.humanities.ucla.edu/wp-

content/uploads/2014/09/IntroductionToDigitalHumanities_Textbook.pdf>

Franco, Marina. “Encuentros y desencuentros entre memoria e historiografía en el caso argentino”. En

Las luchas por la memoria en América Latina. Historia reciente y violencia política. Primera

Edición en Iberoamericana Vervuert (2016): 359 – 380.

Page 113: El marcado digital de texto: una exploración con el

113

Friedman, Rebekka. Competing Memories. Truth and Reconciliation in Sierra Leone and Peru.

Cambridge: Cambridge University Press, 2017.

Galina, Isabel et al. “Introducción”. En Humanidades digitales: recepción, institucionalización y crítica.

Ciudad de México: Bonilla Artiga Editores (2018).

Igue, José Luis. “Los silencios del gran relato”. En Histórica 29 Nº1 (2005): 151 - 161.

<http://revistas.pucp.edu.pe/index.php/historica/article/view/59>.

Laplante, Lisa. “The Peruvian Truth Commission´s Historical Memory Project: Empowering Truth -

Tellers to Confront Truth Deniers”. En Journal of Human Rights 6 (2007): 433 - 452.

Macher, Sofía. ¿Hemos avanzado? A 10 años de las recomendaciones de la Comisión de la Verdad y

Reconciliación. Lima: IEP Instituto de Estudios Peruanos, 2014.

Milton, Cynthia E. “La verdad después de 10 años de la Comisión de la Verdad y Reconciliación en

Perú”. En Las luchas por la memoria en América Latina. Historia reciente y violencia política.

Primera Edición en Iberoamericana Vervuert (2016): 221 – 245.

- - -. “Public spaces for the discussion of Peru´s recent past”. En Antípoda 5 (2007): 144 - 168.

Pons, Anaclet. “Guardar como. La historia y las fuentes digitales”. En Historia Crítica 43 (2011): 38 - 61.

Priani, Ernesto. “Biblioteca Digital del Pensamiento Novohispano”. En Humanidades digitales: lengua,

texto, patrimonio, datos. Ciudad de México: Bonilla Artiga Editores (2018).

Renear, Allen. “Text Encoding”. En A Companion to Digital Humanities, ed. Susan Schreibman, Ray

Siemens, John Unsworth. Oxford: Blackwell, 2004. Fuente: <https://www.digitalhumanities.org/

companion/>

Rojas Castro, Antonio. “La edición académica digital. De las teorías del texto a la visualización de la

información”. En Humanidades digitales: edición, literatura y arte. Ciudad de México: Bonilla

Artiga Editores (2018)

Rousso, Henry. La última catástrofe. La historia, el presente, lo contemporáneo. Santiago de Chile:

Editorial Universitaria, 2018.

Villasante, Mariella. “El contexto de los campos de internamiento de Sendero Luminoso y el derecho

humanitario internacional”. En Boletín del CDI 1 (2016): 4 - 5.

Page 114: El marcado digital de texto: una exploración con el

114

Vinck, Dominique. Humanidades digitales. La cultura frente a las nuevas tecnologías. Barcelona: Gedisa,

2018.

Páginas web

Archivo Virtual de los Derechos Humanos. Centro Nacional de Memoria Histórica. Web. 6 de mayo de

2020. <http://www.archivodelosddhh.gov.co/>

El Centro de Documentación e Investigación del LUM. Lugar de la Memoria, la Tolerancia y la Inclusión

Social. Web. 5 de mayo de 2020. <https://lum.cultura.pe/cdi/cdi>

TEI: Text Encoding Initiative. TEI Consortium. Web. 7 de mayo de 2020. <https://tei-c.org/>

Page 115: El marcado digital de texto: una exploración con el

115

ANEXOS

Cronología del conflicto armado interno peruano, de acuerdo al Informe Final de la CVR 33

Detalle

1.- El inicio de la violencia armada (mayo de 1980 - diciembre de 1982)

2.- La militarización del conflicto (enero de 1983 - junio de 1986)

3.- El despliegue nacional de la violencia (junio de 1986 - marzo de 1989)

4.- La crisis extrema: ofensiva subversiva y contraofensiva estatal (marzo de 1989 -

septiembre de 1992).

5.- Declive de la acción subversiva, autoritarismo y corrupción (septiembre 1992 - noviembre

2000)

Cronología establecida en el capítulo 1, sección primera, tomo I: “Los periodos de la violencia”.33

Page 116: El marcado digital de texto: una exploración con el

116

Comisiones de verdad en orden cronológico 34 35 36

País Año de elaboración País Año de elaboración

Uganda 1 1974 Panamá 2001 - 2002

Bolivia 1982 - 1984 Perú 2001 - 2003

Argentina 1983 - 1984 República Federal de Yugoslavia 2001 - 2003

Uruguay 1 1985 Ghana 2002 - 2004

Zimbabue 1985 Timor Oriental 2002 - 2005

Uganda 2 1986 - 1995 Sierra Leona 2002 - 2004

Filipinas 1986 - 1987 Chile 2 2003 - 2005

Chile 1 1990 - 1991 Paraguay 2004 - 2008

Nepal 1990 - 1991 Marruecos 2004 - 2006

Chad 1991 - 1992 Greensboro, Estados Unidos 2004 - 2006

Alemania 1992 - 1998 República Democrática del Congo 2004 - 2006

El Salvador 1992 - 1993 Indonesia y Timor Oriental 2005 - 2008

Sri Lanka 1994 - 1997 Corea del Sur 2 2005 - 2010

Haiti 1995 - 1996 Liberia 2006 - 2009

Sudáfrica 1995 - 2002 Ecuador 2 2008 - 2010

Ecuador 1 1996 - 1997 Mauritania 2009 - 2011

Guatemala 1997 - 1999 Islas Salomón 2009 - 2012

Nigeria 1999 - 2002 Togo 2009 - 2012

Uruguay 2 2000 - 2003 Canadá 2008 - 2015

Corea del Sur 1 2000 - 2004 Kenia 2008 - 2012

Tomado de “Unspeakable Truths. Transitional Justice and the Challenge of Truth Commissions” (2011) de Priscilla B. Hayner.34

Los valores en verde fueron recabados y añadidos en esta investigación para complementar la información de Hayner.35

En la tabla elaborada por Hayner no figura la Comisión para el Esclarecimiento de la Verdad, la Convivencia y la No 36

Repetición de Colombia, instalada en el 2017.

Page 117: El marcado digital de texto: una exploración con el

117

Artículos publicados por el LUM que formaron parte del análisis de referencias Publicación Artículo Autor

Revista +Memorias Nº1

Entre heridas y huellas el dolor crece: memoria en procesos de dolor y enfermedad en Ayacucho José Ramos López

Curandero, qanras y condenados en el tiempo de la violencia: la representación de una desaparición en Ayacucho

Nory Cóndor Alarcón / Nelson Pereyra Chávez

Crímenes de odio durante el conflicto armado interno del Perú (1980 - 2000) José Montalvo Cifuentes

Investigación antropológica forense y memoria en la búsqueda de personas desaparecidas en contextos de violaciones de derechos humanos en el Perú Carmen Rosa Cardoza

Las medidas de búsqueda de personas desaparecidas de Perú y Guatemala: retos para la implementación de la Ley de búsqueda de personas desaparecidas de Perú

Rafael Barrantes Segura / Mariana Chacón Lozano

Construyendo memorias para entender el presente. Currículum escolar, memoria y educación en derechos humanos: el caso del Taller Documental del Liceo de Aplicación en Chile

Isaac Gajardo Miranda / Macarena Alegría Granda

Del olvido a la memoria, de la memoria a la justicia: el caso de El Salvador Leonor Arteaga Rubio

Memorias del bosque humano: historias abismales de violencia colonial durante la época del caucho Wilton Martínez Carlevarino

Desencuentros durante tiempos violentos: el rock subterráneo y la ultra izquierda sanmarquina en los 80 Fabiola Bazo

¿Qué nos hacen y qué hacemos con las imágenes de violencia? Rainer Huhle

Reconciliación, reconocimiento y redistribución José Ignacio López Soria

Vích, Víctor (2015). Poéticas del duelo. Ensayos sobre arte, memoria y violencia política en el Perú Iván Ramírez Zapata

LUM (2017). Memorias del presente. Ensayos sobre juventud, violencia y el horizonte democrático Julio Abanto Chani

Revista +Memorias Nº2

De la guerra a la amnistía. MOVADEF y la reaparición de Sendero Luminoso: 1992 - 2012 Esteban Valle-Riestra Padró

Búsqueda y restitución de archivos indígenas: experiencia del trabajo con los archivos de la Confederación Campesina del Perú Ruth Borja Santa Cruz

Pensándonos entre viñetas: puentes entre el pasado y el presente creados en las historietas de la juventud peruana Angie Ariza Porras

Construcción de paz a través de las artes y la cultura en el caso de Colombia Greis Cifuentes Tarquino

Estrategias de empoderamiento en dos retablos de Edilberto Jiménez y en "Un retablo para el LUM" Andrea Cabel García

Recordar en palabras: la construcción del discurso de períodos de violencia política Rosela Millones Cabrera

Memorias urgentes de los desaparecidos en el Perú Carmen Rosa Cardoza

Avenida Larco (2017). Lo (no) político de Rancière en el rock subterráneo y la cumbia de los 80s - 90s Elizabeth Sotelo

Representando justicia: el teatro como medio para alcanzar la justicia transicional Javier Ormeño Castro

Normalización y vigencia de la violencia contra la mujer: Una lectura crítica al discurso de los personajes militares de Alonso Cueto Édgar Navarrete Corvera

Greene, Shane. Pank y revolución: siete interpretaciones de la realidad subterránea Fernando Nureña Cruz

Allier, Eugenia y Emilio Crenzel (Coords.) Las luchas por la memoria en América Latina: Historia reciente y violencia política. Renzo Aroni Sulca

Page 118: El marcado digital de texto: una exploración con el

118

Libro: Memorias del presente (Primer

concurso nacional de ensayos) - Compilación

de textos ganadores

"Sin terrucos no hay soldados". Percepción de los jóvenes acuartelados sobre Sendero Luminoso en la sociedad de posguerra José Ramos López

Educación moral para la prevención de la violencia Susana Frisancho Hidalgo

La conciencia del pecado Luis Fernando Díaz Cáceres

El que quiera oír, que oiga; el que quiera ver, que vea. El claroscuro de la época de la violencia política Abraham Calderón

Contra el olvido Harol Gastelú Palomino

Juventud, ciudadanía y violencia. Los caminos de la juventud peruana frente al conflicto armado interno y la crisis política Aldo Pecho Gonzáles

Nos habíamos odiado tanto: sentidos y significados de la experiencia social juvenil, una mirada desde la universidad Stefano Corzo

Entre esquemas juveniles y esquemas adultocéntricos. Un acercamiento a los provecos de desmovilización juvenil en el Perú posviolenica Daniel Guevara

"Hijos de la violencia, nietos de la utopía" Notas sobre la importancia de la literatura en la representación de la violencia en Perú Maria Emilia Artigas

Una discusión en torno a la frontera moral y los límites del mandato de "hacer memoria" Iván Ramírez Zapata

Una consulta sin deliberación. Análisis del proceso consultivo del lugar de la memoria desde la perspectiva deliberativa y una reflexión en torno a los jóvenes universitarios Gianfranco Silva Caillaux

El Movadef y la memoria ambivalente. El papel de la responsabilidad en la memoria de los jovenes del Movadef Rubén Merino Obregón

Libro: Juventud, Memoria e Identidad

(Miradas generacionales sobre un pasado de

violencia)

De la generación testigo a la generación memoria José de la Cruz Oriundo

Otros desaparecidos. Millennials, memoria y sueños Kevin Rodríguez Sánchez

Alias Alejandro y Sibila: narrativas familiares y memoria histórica a través del cine documental autobiográfico Fiorella López López

Los órdenes del conflicto armado interno. Memoria, Discursos e Identidad Alejandro Valdivieso Alvarado

"80 veces 80". La memoria desde el rock independiente (subte y postsubte) Diana Joseli Condori

La presencia de Sendero Luminoso en las universidades públicas entre las décadas de 1970 y 1980 Rodrigo Rivera Larco

Sendero Luminoso y la genealogía del poder. Una lectura desde el pensamiento de Foucault Jordy Huamán Guillén

Universidades privadas y nuevas identidades de la violencia política en los becarios de Beca 18 Modalidad Repared Junior Guerra Pallqui

Boletín del CDI Nº1

Profetas del Odio. Raíces culturales y líderes de Sendero Luminoso Gonzalo Portocarrero

El contecto de los campos de internamiento de Sendero Luminoso y el derecho humanitario internacional Mariella Villasante Cervello

Recursos socioculturales de los Asháninka para resistir al régimen totalitario de Sendero Luminoso y sus efectos Leslie Villapolo

Boletín del CDI Nº2 Algunas ideas (probablemente políticamente incorrectas) sobre la lucha contra la corrupción Ludwig Huber

Boletín del CDI Nº3

Desaparecidos y desapariciones en el Perú José Pablo Baraybar

Más allá de Umasi. Los archivos de Sendero Luminoso y la búsqueda de desaparecidos Ricardo Caro Cárdenas

¿Dónde están? Canciones que testimonian la desaparición forzada Renzo Aroni Sulca

Banco de Datos Genéticos para identificación de personas desaparecidas Carmen Rosa Cardoza

Page 119: El marcado digital de texto: una exploración con el

119

Colecciones ingresadas a la plataforma virtual del CDI / LUM (hasta agosto de 2019) 37

Nombre de la colección Nº de documentos ingresados Tipo de documento

Ángela Ponce Romero 12 Fotografías

Alejandro Olazo 3 Fotografías

Asociación Pro Derechos Humanos 1.593 Recortes periodísticos

Carlos Flores Lizana 3 Libros

Carlos Castillo Vargas 1 Tesis

Centro de Estudios y Publicaciones 277 Revista Páginas

Confederación General de Trabajadores del Perú 180 Afiches, documentos

Congreso de la República del Perú 107 Acusaciones constitucionales

Comisión Multisectorial de Alto Nivel 624 Caricaturas

Defensoría del Pueblo 3.701 Fotografías y videos

Documentos desclasificados 1.293 Documentos

DOCUPERÚ 36 Videos

DIRCOTE - PNP 11 Fotografías

Instituto de Defensa Legal 93 Bibliografía y documentos

Instituto de Derechos Humanos de la PUCP 20 Bibliografía y documentos

Karen Bernedo 9 Videos

Museo de Arte de San Marcos 1 Videos

Mariella Villasante Cervello 8 Documentos

Miguel Det 9 Caricaturas

Jesús Cossio 2 Historietas

Renzo Aroni Sulca 72 Música, videos

Sébastien Jallade 32 Videos

Servicios Educativos Rurales - SER 8 Libros digitalizados

Registro Único de Víctimas (RUV) 146.315 Base de datos

Fuentes tomadas por el LUM

Informe Final CVR: Anexo 4 33.892 Base de datos

Total 188.302

Información proporcionada a través de correo electrónico por Elena Príncipe, coordinadora del Centro de Documentación e 37

Investigación del Lugar de la Memoria, la Tolerancia y la Inclusión Social.

Page 120: El marcado digital de texto: una exploración con el

120

Entrevista a María del Rosario Narváez, directora ejecutiva de la Asociación Pro Derechos

Humanos (APRODEH) 38

Entrevistador [Luis García]: A la fecha [febrero de 2020], hay 1.432 recortes periodísticos

digitalizados en la plataforma del Centro de Documentación e Información (CDI) del Lugar de la

Memoria, la Tolerancia y la Inclusión Social (LUM). Todos fueron donados por la Asociación

Pro Derechos Humanos. En total, ¿cuántos documentos ustedes cedieron a esta entidad?

María del Rosario Narváez: Nosotros les hemos entregado [al LUM ] más de 400 mil registros.

Imagino que poco a poco están clasificándolos para poder subirlos, porque ya escanearon todo.

E: ¿Cómo fue el proceso de construcción del archivo de prensa?

MRN: La APRODEH, en el año 1985, inició un pequeño centro de documentación, primero con

elementos bibliográficos y luego decidimos empezar a procesar un archivo de prensa para lo cual

hicimos una base de datos. El trabajo consistía en revisar los periódicos, seleccionar noticias,

agruparlas por el hecho noticioso y luego los registrábamos como una unidad. Por ello, si es que

un hecho noticioso estaba en cinco periódicos, teníamos un registro con cinco fuentes. Entonces,

procedíamos a registrar la información de la [nota] que tenía más información relevante y se

complementaba con otras si había algún dato sustantivo. Y así fuimos acumulando desde, más o

menos, el año 1987 en este sistema. Ya con el sistema de la base de datos, con descriptores, con

código geográficos, con todo, se hizo desde el 1987. APRODEH tuvo un centro de

documentación bastante bueno, con información no solo bibliográfica sino archivística sobre

casos que APRODEH defendía, también si mandaban información de Naciones Unidas, toda

Entrevista realizada el 21 de febrero de 2020 para esta investigación.38

Page 121: El marcado digital de texto: una exploración con el

121

información que se requería en la defensa de los derechos humanos, no solo para el equipo de

APRODEH sino que se puso a disposición de cualquier persona interesada.

E: ¿El archivo de APRODEH tenía como objetivo servir de repositorio de información para los

casos legales de derechos humanos que eran asesorados por la asociación?

MRN: No necesariamente, era una información disponible para el equipo de APRODEH pero

también para cualquier persona que viniera. Dábamos un servicio gratuito de información a la

persona que estuviera interesada. Por un tiempo largo, empezamos [a recopilar] también la

información que salía en los medios sobre acciones de grupos alzados en armas. Y, con eso

hacíamos información estadística de cómo iba ocurriendo, incrementando, disminuyendo el

accionar de Sendero y del MRTA. Pero luego, decidimos parar porque en un momento ya se

naturalizaron esas acciones, salía la información solamente de grandes cosas. O salía

información tergiversada, por ejemplo, si habían 10 muertos eso ya no eran noticia, algunos

medios [de prensa] le aumentaban. Se distorsionaba la información.

E: ¿Entre qué años tuvieron un monitoreo constante de medios?

MRN: desde el 87 hasta el más o menos, el 2004.

E: Para el 2004 la Comisión de la Verdad ya había publicado su informe.

MRN: Sí, y toda esta información la pusimos al servicio de la Comisión de la Verdad, también

de otros investigadores, de otras fuentes de información. Para APRODEH en el tema de la

búsqueda de los desaparecidos, las notas de prensa siempre fueron una fuente secundaria.

E: ¿Cuántas personas trabajaron en su centro de documentación?

MRN: Al inicio era un centro de documentación pequeño pero, con el paso del tiempo, éramos

siete personas.

Page 122: El marcado digital de texto: una exploración con el

122

E: ¿Qué criterios tenían para comprar diarios? En el acervo digitalizado por el CDI, por ejemplo,

hay preponderancia de ciertos diarios sobre otros, ¿a qué se debía?

MRN: Probablemente a que no sacaban esa información [sobre desapariciones forzadas]. Sí

teníamos todos los diarios en circulación. El formato de estos diarios populares solamente tenían

notas muy cortitas de noticias, y lo que sí era un poquito más grande era el editorial.

E: ¿Quién tomaba la decisión respecto a qué era de interés y qué no?

MRN: Teníamos criterios establecidos sobre qué tipo de noticias, qué tipo de temas seguir. El

equipo estaba preparado para identificar, era como un criterio amplio de proveer la información a

cualquier tipo de usuario, posibles interesados. Elaboramos todos los días un reporte de noticias

virtual que se llamaba “Notiaprodeh”, y lo difundíamos al movimiento de derechos humanos, a

partir de esa difusión, algunas personas también lo incluíamos en nuestra web, y, algunas

personas nos solicitaban alguna noticia específica y, la escaneábamos y se la enviábamos. O

luego, venían ya a la oficina a fotocopiar lo que querían.

E: ¿Y cuál fue el destino de este repositorio? Estos artículos, ¿ustedes los entregaron a LUM

físicamente o ustedes los digitalizaron?

MRN: Nosotros le entregamos físicamente al LUM todo, cuando se estaba creando el centro de

documentación [CDI], donamos todos los archivos. Serían por lo menos dos camiones de

archivadores. Estaba físicamente organizado por un número correlativo que empezaba y

terminaba cada año. Todas las búsquedas se hacían por el sistema de información que teníamos.

E: ¿Y ese primer sistema era físico?, ¿eran bases de datos físicas?

Page 123: El marcado digital de texto: una exploración con el

123

MRN: En computadoras siempre. Debido a la magnitud de la información, era muy difícil que

pudieras hacerlo [manipularlas] de manera manual. Nosotros desde que empezamos, desde el 85,

teníamos una computadora. Éramos de las pocas ONG que teníamos computadora.

E: Luego de que ustedes donan su colección al LUM, ¿pierden el rastro de ese acervo?

MRN: Claro, no tenía sentido. Estamos hablando de papel, papel periódico que poco a poco se

va degradando. Nosotros ya no contamos con el personal suficiente y yo, que fui responsable del

centro de documentación, me preocupé de que los libros y de que todos nuestros materiales no se

quedaran en APRODEH a envejecerse, sino que donáramos nuestras colecciones, nuestra

colección bibliográfica al Centro de Memoria de la Defensoría del Pueblo y el archivo de prensa

al LUM.

E: ¿Aún conservan sus bases de datos originales?

MRN: El sistema de información todavía lo tenemos guardado, pero es difícil leerlo en las

máquinas [computadoras] actuales.

E: Lo último, en el tiempo en el que esta documentación estaba en sus manos, en sus oficinas,

¿qué tipo de personas iban a consultarlo?

MRN: Iban estudiantes universitarios que estaban haciendo alguna investigación, podían ser

sociólogos, abogados, periodistas, estudiantes. Y luego, venían también familiares a recoger

información , todo lo que había salido sobre sus casos, o si no nos pedían información y nosotros

se la mandábamos por fax. También iban escolares por tareas.

Page 124: El marcado digital de texto: una exploración con el

124

Enlace a repositorio digital GitHub con el código XML/TEI usado en esta investigación

Instrucciones:

1 - Haga clic en este enlace. https://github.com/lgarciabe/notas_periodisticas

2 - Una vez haya cargado la página de GitHub, halle el archivo “Notas Marcadas.xml”, dele clic.

3 - A continuación verá el documento completo (4.102 líneas de código) que contiene las 147 notas periodísticas marcadas en esta investigación.

Page 125: El marcado digital de texto: una exploración con el

125

Agradecimientos

Este trabajo contó con el apoyo de Elena Príncipe Yupanqui, coordinadora del Centro de

Documentación e Investigación del Lugar de la Memoria, la Tolerancia y la Inclusión Social; de

Gisela Ortiz Perea, del Equipo Peruano de Antropología Forense y de María del Rosario

Narváez, de la Asociación Pro Derechos Humanos del Perú (APRODEH). De igual forma,

agradezco a las madres de la Asociación Nacional de Familiares de Detenidos, Secuestrados y

Desaparecidos (ANFASEP) del Perú quienes fueron entrevistadas en Ayacucho en julio del 2019.

Al desarrollarse la Universidad de los Andes de Colombia, este ensayo tuvo la orientación

académica de Maria José Afanador-Llach y de Camilo Martínez Peñaloza. A ambos mi profundo

agradecimiento.

Por último, el demandante proceso de transcripción, marcado y procesamiento de la

información fue compartido y verificado por Laura Usme y Gabrielle Altamirano. Este trabajo no

hubiera sido posible sin su desinteresada ayuda y cariño.

Bogotá, mayo de 2020