Profª Dra. Chelo Vargas SierraUniversidad de [email protected]
Los Sistemas de Memoria de Traducción: conceptos clave, componentes y funciones
UPCUniversidad Peruana de Ciencias AplicadasLima, 13 de septiembre de 2013
@chelovargas
ÍNDICE: ROLES
PRIMER ROL
TRADUCTOR
SISTEMAS DE MEMORIA DE TRADUCCIÓN
Profª Dra. Chelo Vargas SierraSeptiembre de 2013
Índice
5
1. Introducción: Un poco de
historia
2. Conceptos clave
3. Sistemas de MT• Componentes• Funciones
5. Intercambio de datos Tendencias
Las primeras ideas sobre la estación de trabajo surgen cuando los ordenadores eran así
El informe ALPAC criticó la TA
1966
El amanuense del traductor
1980, M. Kay
Picture by miskan: http://www.flickr.com/photos/miskan
Traducción automática
Complementos: diccionarios, bd, sist. para marcar y propagar
Procesador de textos
Cambio de
Picture by Isaal Leedom: http://www.flickr.com/photos/risus_in_silva/
paradigma
La manera como interactuamos con las computadoras y
otros dispositivos ha cambiado de forma espectacular
Picture by Jencu: http://www.flickr.com/photos/jennycu/
Evolución/innovaciones de software y hardware
Más textos para traducir
Globalización
Presión para traducir rápido y
mejorTraducción =
entorno computerizado
GLOBALIZACIÓN SIMSHIP
Desarrollo espectacular de las TIC: RAZONES
Las tecnologías están para quedarse
Picture by Leeks: http://www.flickr.com/photos/observatoryleak/
CONCEPTOS CLAVE
. Estación de trabajo
• Conjunto integral compuesto por una serie de aplicaciones y recursos para la traducción
CONCEPTOS CLAVE
Estaciónde
Trabajo
Correctoresortográficos
Programas deconcordancias
Corpuselectrónicos
Internet BDT
Diccionarioselectrónicos
Sistemas delocalización
Sistemas deMemoria de Traducción
Sistemas deMemoria de Traducción
SGBDMSGBDTAlineadorFiltros
SGBDMSGBDTAlineadorFiltros
Recurso documentalRecurso lexicográficoRecurso enciclopédicoRepositorio de bases/bancos de datosMegacorpus
Recurso documentalRecurso lexicográficoRecurso enciclopédicoRepositorio de bases/bancos de datosMegacorpus
Programas TA
Programas deinteracción
(chat, correo-e, listas, foros, etc.)
Prg. de autoedición,
editores html,procesador de
texto, …
Traducción automática,TA
Traducción automática asistida por humanos, TAAH
Traducción asistida por
ordenador/computadora, TAO / TAC
CONCEPTOS CLAVE
Sistemas TA
• traducen términos o textos como conjuntos absolutos, de manera automática y sin que el usuario intervenga en el proceso propiamente dicho, aunque sí puede hacerlo en alguna fase anterior o posterior.
CONCEPTOS CLAVE
Sistema deTraducciónAutomática
TO TM
Intervenciónhumana
MODELO DE TA
CONCEPTOS CLAVE
CONCEPTOS CLAVE
Sistemas TAAH
• traducen términos o textos como conjuntos absolutos, de manera automática, pero el usuario interviene antes, durante y/o después del proceso.
Pre-edición
TOpre-editado
TOcon LenguajeControlado
TOsin editar
Sistema deTraducciónAutomática
interacciónhumana y
automática
TM
post-edición
MODELO DE TAAH
CONCEPTOS CLAVE
Herramientas TAO
• conjunto de programas informáticos que ayudan a realizar la traducción:• Memorias de traducción (SDL Trados, Transit, Déjà Vu, MemoQ)• Sistemas gestores de BDT (Multiterm, TermStar, TermBase, …)• Sistemas de localización (SDL Passolo, Alchemy Catalyst, …)• …
CONCEPTOS CLAVE
Herramientas TAO
• conjunto de programas informáticos que ayudan a realizar la traducción:• Sistemas de Memorias de Traducción (SDL Trados, Transit, Déjà Vu,
MemoQ)• Sistemas Gestores de BDT (Multiterm, TermStar, TermBase, …)• Sistemas de Localización (SDL Passolo, Alchemy Catalyst, …)• …
CONCEPTOS CLAVE
TO TM
TRADUCTOR HUMANO
HERRAMIENTA 1BD Memoria
HERRAMIENTA 2Glosarios, diccionarios
electrónicos
HERRAMIENTA 3Internet, corpus
electrónicos
HERRAMIENTA 4BD terminológicas
HERRAMIENTA 5Correctoresortográficos
post-edición
MODELO DE TAO
SISTEMA DE TRADUCCIÓN
Conceptos clave
Segmento• Unidad mínima de
traducción
Formatos• codificación del
archivo (doc, .html, .pdf, .xml, etc.)
Filtros• aplicaciones que
convierten el formato original del texto en uno intermedio
Flujo de trabajo• Aspectos
operacionales de la actividad de traducción.
Alineación• proceso de
reestructuración de dos textos dados de forma que se establezca una correspondencia entre párrafos, frases y/o palabras de ambos
Segmentación• proceso que divide
un texto en unidades más pequeñas.
CONCEPTOS CLAVE
3, SISTEMAS DE MEMORIA DE TRADUCCIÓN
Sistema de MT• Herramienta avanzada de TAO que permite al
usuario:– (1) almacenar frases o segmentos originales
junto con sus respectivas traducciones en BD especial (la memoria);
– (2) recuperar segmentos de texto en función de ciertas condiciones de búsqueda.
• Traducción humana: el traductor decide la idoneidad de un segmento o término recuperado por el sistema.
Sistema de MT
¿AVANZADA?• Se trata de un único programa, que contiene un
conjunto de aplicaciones que se combinan en un único entorno.
• Trabajan al mismo tiempo con:– El documento BILINGÜE (el archivo importado, filtrado y la
traducción)– Los RECURSOS del sistema:
• La MT• La BDT• (Diccionario Autosuggest, LiveDocs, ….)
Sistema de MT
¿Qué es lo que NO hacen los SMT?• No traducen. • Son diferentes de los traductores automáticos
Sistema de MT
¿Qué es lo que SI hacen los SMT?• Recuperan material previamente traducido:
– Correspondencia exacta (exact matching)– Correspondencia aproximada (fuzzy matching)
Sistema de MT
¿Qué distingue a los SMT de otras herramientas TAO?
• No necesita volver a traducir segmentos que haya traducido en ocasiones anteriores
Sistema de MT
¿Cómo funcionan?
Texto original MT
Texto original se encuentra en la MT Texto
meta
SISTEMA MT. FUNCIONAMIENTO BÁSICO
PRETRADUCCIÓNBDM
TEXTODE TRABAJO
BDT
OtrasBDM
Trad.previas
IMPORTACIÓN ALINEACIÓN
OtrasBDT
Glos.previos
IMPORTACIÓN
IMP
OR
TAC
IÓN
FILT
RO
S
EX
PO
RT.
FILT
RO
S
Flujo de trabajo con SMT
Flujo en SDL
Flujo en SDL
PREPRODUCCIÓN
Texto original MT
Texto original se encuentra en la MT
Texto meta
Texto original NO está en la MT TA
Texto meta
SISTEMA MT+ TA
Sistema de MT
¿Qué textos son adecuados?
1
Sistema de MT
¿Qué textos son adecuados?• Actualizaciones• Revisiones
Sistema de MT
¿Qué textos son adecuados?
2
Correspondencia Prensa/comunicación
comercial
marketing publicidad administrativo jurídicos
científico técnico cultural literario
económico
C
a
te
g
o
ria
s
Correspondencia Prensa/comunicación
comercial
marketing publicidad administrativo jurídico
científico técnico cultural literario
económico
C
a
te
g
o
ria
s
Sistema de MT
¿Qué textos son adecuados?• Patentes (Jurídicos, científico-técnicos)• Contratos (jurídico, económico, comercial)• Manuales de usuario (técnico)• Informes anuales (negocios, comercio)• Artículos de investigación• Certificados• …
T
iPo
s
COMPONENTES
EDITOR MEMORIA DE TRADUCCIÓN
BASE DE DATOS TERMINOLÓGICA ALINEADOR
1 2
3 4
EDITOR
EDITOR
EDITOR
EDITOR
Chelo Vargas - http://www.ua.es/personal/chelo.vargas/index.html
EDITOR
EDITOR
MEMORIA
MEMORIA
Conceptos importantes de las BDBASE DE DATOS
REGISTRO
CAMPOS
¿Qué campos contiene una MT?
CAMPOS
MEMORIA
Campos del sistema
Campos personalizados
Campos en Déjà Vu
SGBD terminológicas
FUNCIONES• Almacenamiento de datos terminológicos
(antes, durante o después de la traducción)• Reconocimiento de términos en el segmento
activo• Verificación de la terminología empleada
SGBD terminológicas
Almacenamiento
entrada
¿De qué campos se compone cada registro?
REGISTRO
CAMPOS
12
3
Cosas a tener en cuenta
O ¿Cuál es el mejor sistema?O Depende…
O Cómo trabaja (método)O Cómo se maneja con la computadoraO Cuánto tiempo desea dedicarle
Cosas a tener en cuenta
O Facilidad del almacenamiento mientras se trabajaO Elegir el método más sencillo según el
flujo de trabajo, PERO compatible con otros sistemas que empleemos en el futuro
O Facilidad de búsqueda terminológicaO Términos simples, complejos y
truncamientoO Portabilidad
Cosas a tener en cuenta
O ¿Qué información debo guardar?O Como mínimo:
O Termino originalO Termino meta (equivalente(s))O DominioO FuenteO Notas
FUNCIONES• Almacenamiento de datos terminológicos
(antes, durante o después de la traducción)• Reconocimiento de términos en el segmento
activo• Verificación de la terminología empleada
SGBD terminológicas
Reconocimiento de términos en el segmento activo
Chelo Vargas - http://www.ua.es/personal/chelo.vargas/index.html
TRAN
SIT
NXT
Reconocimiento de términos en el segmento activo
FUNCIONES• Almacenamiento de datos terminológicos
(antes, durante o después de la traducción)• Reconocimiento de términos en el segmento
activo• Verificación de la terminología empleada
SGBD terminológicas
Verificación de la terminología empleada
(IN)FLEXIBILIDAD DE LOS SISTEMAS• Básicos: 2 columnas• Poco flexibles• Flexibles: Multiterm y TermStar
SGBD terminológicas
ALINEADOR
ALINEADOR
ALINEADOR
EDITOR MEMORIA DE TRADUCCIÓN
BASE DE DATOS TERMINOLÓGICA ALINEADOR
1 2
3 4
Recapitulando…
Los SMT en línea
Algunos ejemplos• Ontram: SMT comercial para realizar la traducción y la revisión
en línea).• Wordfast Anywhere: SMT gratuito para crear la MT en línea y
conectarse a la VLTM (very large translation memory) creada con MT donadas y que es pública.
• Google Translator Toolkit: La traducción y la revisión se realiza en línea. Se suben los documentos y las MT. Si Google no encuentra coincidencias en la MT utiliza su TA.)
Formatos de archivos
De textoPDF
Memoria de traducción disponibles
Complementos (plug-in)
ARCHIVOS (TMX o paralelos para alinear)
Plataformas
1
3
2
Memoria de traducción disponibles
MyMemory
VLTM (Very Large Translation Memory)
1
Memoria de traducción disponibles
• DGT y European Medicine Agency
2
Memoria de traducción disponibles
• Linguee (http://www.linguee.es/), • Glosbe (http://es.glosbe.com/), • MyMemory (http://mymemory.translated.net/) • Taus Data (http://www.tausdata.org/)• Termacor. Terminology and Corpus (http://
goo.gl/a4mVNw)
• WebiText (http://webitext.com/bin/webitext.cgi)
3
TA en SMTWeb
Cambios y tendencias
1. TA en SMTAumento de la calidad en TA (lejos de la perfección)
Cambio de foco en su aplicación; los usuarios saben qué esperar
Cambios y tendencias
Una vieja tecnología cada vez
más popularPicture by digital_monkey: http://www.flickr.com/photos/rajkamalaich/
Traducciónautomática
¿Una amenaza?
• TA ha conquistado furtivamente algunas áreas:– Acceso rápido a la información en lenguas
desconocidas por el usuario; – Traducción de chat y mensajes instantáneos; y – Traducción rápida de documentos pequeños y
páginas web para uso particular o interno
¿O una verdadera alternativa?
• TA se está convirtiendo en: – Una alternativa real y parte integral del proceso de
traducción asistida por computadora (sistemas híbridos)
– Puede ayudar en el rendimiento de proyectos muy grandes y en situaciones en las que la traducción humana no es práctica
Aumenta su aceptación, motivada por:-Nuevos métodos y recursos-Su divulgación y acceso fácil a través de la web
“El ser humano puede soportar una semana de sed, dos semanas de hambre, muchos años sin techo, pero no puede soportar la soledad. Es la peor de las torturas, de todos los sufrimientos.” Paulo Coelho.
• Vargas y Ramírez, 2011:
Se han de enfrentar a muchas y variadas fuentes de información a las que tienen que encontrar el sentido
No han de ser únicamente consumidores de información, sino creadores y organizadores de contenido
‘sentido común en tecnología’: adaptarse continuamente a las diferentes tecnologías disponibles hoy y en el futuro
Implicaciones para el traductor en web 2.0
Web ubicua (4.0)
Acceso a la web para cualquiera, desde cualquier parte, en cualquier momento
Computación en la nube/ Tec. colaborativa
Web ubicua (4.0)
• Computación en la nube• Tecnología colaborativa“… both the applications delivered as services over the Internet and the hardware and systems software in the data centres that provide those services” (Armbrust et al. 2010). Permite a usuarios concurrentes que pueden estar en situaciones geográficas distintas trabajar en un proyecto común:-Cualquier tarea se realiza con la computadora y vía web-Se ha adaptado también a los procesos de traducción
Plataformas de traducción colaborativa entornos de
traducción y estaciones de trabajo colaborativo (software como servicio basado en la nube , Cloud-based SaaS )
MemoQ
Plataformas de traducción colaborativa• Nueva visión del proceso de trabajo:
– Los traductores y otros profesionales trabajan en un único documento al mismo tiempo
– Se lleva el control y la evolución de todo el proceso
SEGUNDO ROL
GESTOR DE PROYECTOS
Gestión de proyectos
101
Gestión del
proyecto
Preproducción
Traducción
Revisión CierreENTREG
A
Gestión de proyectos
Concepto de ‘proyecto’:• Sentido amplio: p. de ingeniería civil ≠ p. de documentación• DRAE:
4. m. Conjunto de escritos, cálculos y dibujos que se hacen para dar idea de cómo ha de ser y lo que ha de costar una obra de arquitectura o de ingeniería.
5. m. Primer esquema o plan de cualquier trabajo que se hace a veces como prueba antes de darle la forma definitiva. (+ Gral.)
102
Provisionalidad: en trad. un proyecto cubre tareas más o menos definitivas
Gestión de proyectos
Concepto de ‘proyecto’:• Sentido amplio: p. de ingeniería civil ≠ p. de documentación• WEBSTER:
A proposal of something to be done; plan; scheme An organized undertaking
– Idea de proyecto aplicada a cualquier actividad
103
Gestión de proyectos
Concepto de ‘proyecto’:
104
Un proyecto es un esfuerzo temporal, único y progresivo emprendido para crear un producto o un servicio también único
Gestión de proyectos
Naturaleza de los proyectos:• ¿Para qué?:
Para cubrir la distancia potencial entre lo que el cliente quiere y lo que el proveedor le entrega, sin que se dé la improvisación: calidad
Para racionalizar el tiempo, los recursos y los costes• ¿Por qué?
Porque garantiza la coherencia dentro del ciclo de desarrollo de un producto o servicio
Porque mejora la planificación, la comunicación, la coordinación y el trabajo en equipo
105
Gestión de proyectos
Si se aúnan esos esfuerzos evitamos:
106
Gestión de proyectos
108
¿Por qué son necesarios los proyectos de traducción?
Por la creciente complejidad técnica de algunas traducciones
Por la combinación de varios pares de idiomas en proyectos multilingües
Varios profesionales
112
CONCEPTO
• Viabilidad
ANÁLISIS
• Necesidades y definición de riesgos
DISEÑO
• Definición, diseño y especificaciones
DESARROLLO
• Construcción y puesta en marcha
REVISIÓN/INSTALACIÓN
• Entrega, instalación y aceptación
OPERACIÓN
• Garantía y mantenimiento
FASES
113
•Número de palabras•Plazo de realización•Tipo de texto•Posibilidad de realización
CONCEPTO
•Tipo de traducción•Riesgos•Plazos•Costes
ANÁLISIS
•Definición de programas•Adecuación•Formatos•Recomendaciones al cliente
DISEÑO
•Traducción
DESARROLLO
•Revisión•Comprobación formatos•Compilaciones
REVISIÓN/ INSTALACIÓN
•1ª revisión al cliente•Archivo de copias•Terminología•Memorias•Reunión final
OPERACIÓN
1 2 3
4 5 6
TAREAS
114
Recepción material Recuento Elaboración del
presupuestoFijación de los plazos
Adecuación de programas y herramientas
Análisis de la estrategia
terminológica y manual de estilo
Preparación del entorno
Asignación de tareas y recursos
Traducción Revisión y corrección
Maquetación y tareas
complementariasEntrega
Mantenimiento de la MT Facturación
Gestión de proyectos
Herramientas:• Usada para la gestión de proyectos en general • Diseñada específicamente para la gestión de proyectos de
traducción• No creadas específicamente para las tareas de gestión de
proyectos, pero que, sin embargo, se usan muy a menudo con este fin: Microsoft Office Excel y Microsoft Office Access
115
Gestión de proyectos
117
Figuras profesionales
Gestión de proyectos
Gestión de proyectos
Figuras profesionales en empresas de traducción:• Jefe de proyecto• Terminólogo• Traductor principal• Traductor(es)• Revisor(es)• Corrector(es)• Maquetador(es)• Responsable del control de calidad• Técnicos informáticos• Especialistas en programas específicos119
Gestión de proyectos
Ejemplos :
120
Traducción de 2 textos jurídicos (3.000 pal. c.u)
Traducción de 4.000 páginas de textos jurídicos en sólo 2 semanas
Traducción de pág. web 2.600 archivos html para una pág. en varios idiomas
Localización de un manual de videojuego
Traducción a 7 idiomas de un videojuego y su adaptación al mercado local respectivo (localización)
121
Intercambio de datos
Variedad de herramientas
Variedad de formatos
formatos propios
= problema
Para aprovechar una MT en formato propietario el traductor ha de:comprar la herramienta
comprar una herramienta compatible con otras
Problemas con formatos
ESTÁNDARES ABIERTOS
ESPECIFICACIÓN
DISPONIBLE
TAREA ESPECÍFICA
desarrollada en proceso abierto a toda la industria
garantizar que cualquiera la puede usar sin pago de regalías o con condiciones
PODER ACCEDER E IMPLEMENTAR EL ESTÁNDAR
PERMITE: COMPATIBILIDAD E INTEROPERATIBILIDAD ENTRE DISTINTOS
COMPONENTES DE HARDWARE Y SOFTWARE
• Definición: formato universal recomendado y aprobado por una organización internacional de normalización (ISO) o por una determinada industria.
• Objetivo: facilitar el intercambio de textos empleando un lenguaje de marcas común que define la estructura de cada documento (por ejemplo, HTML)
• Formatos estándar para – Intercambio de memorias de traducción (TMX –
Translation Memory Exchange format)– Intercambio de bases de datos terminológicas
(TBX – Termbase Exchange format)– Formato de archivo de intercambio de localización
XML (XLIFF – XML Localization Interchange File Format)
• No resuelven todos los problemas, pero sí los más urgentes
Extensible Markup LanguagePermite definir la gramática de lenguajes específicosEstándar para el intercambio de información estructura entre distintas plataformasSe puede usar en casi todo (BD, editores, hojas de cálculo, etc.)
(Translation Memory eXchange)TMX
LISA, 1998
Propósito: «permitir el intercambio de MT entre herramientas y agencias de traducción sin que exista pérdida […] de datos cruciales durante el proceso»
Resultado: Sistemas MT adaptados para poder I/E al formato TMX
• Motivación ética y solidaria– El traductor ha de tener la libertad de
utilizar todos los recursos que le hacen falta– Mi MT le puede ser útil a otro traductor,
¿por qué no hacer intercambios de MT o de recursos en general?
TMX
(Termbase eXchange)TBX
LISA
Intercambio terminológico: TBXSimilar al TMX; basado en XMLMarco terminológico proporcionado por la norma ISO 12200 y la 12620 (Data Categories)
TBX
(XML Localisation Interchange File Format)
XLIFF
OASIS, 2002-2008
Una especificaciónEvitar pérdida en el intercambio de datos
localizables e información relacionadaNo es específica de una herramienta concretaFormalizada en un vocabulario de XMLCaracterizada por un mecanismo de
extensibilidad
140
XLIFF
TERCER ROL
USUARIO DE INFORMÁTICA
Windows 7
Uso del teclado (Microsoft)
Todos los métodos abreviados del teclado
http://goo.gl/BSjjhF
Todos los métodos abreviados del teclado
Internet: aplicaciones
144
Aplicaciones
Teamviewer: acceso remoto al computador (gratuito)Dropbox, Box, Google Drive: almacenar y compartir en la nubeEvernote: organización de info. mediante notasScoop itSearch EverythingMailinator: cuenta de correo temporal: [email protected] Search & ReplaceSpyBot S&D (antivirus)
Aplicaciones
BabylonGT4T: Google Translate for Translators (60 $ al año)Xbench: ApSIC Xbench 2.9 gratuitoTraductor de Google
Aplicaciones: buscadores
2lingual Best Grammar & Plagiarism CheckerDocJax (busca documentos)Wolfram Alpha (buscador matemático)Archive.org Wayback Machine
Aplicaciones: redes sociales
Extensiones de Chrome: http://www.google.es/intl/es/chrome/webstore/extensions.html• Tweetdeck • Scoop it• Delicious• Buffer• Strict Workflow
CUARTO ROL
PROFESIONAL (AUTÓNOMO)
La tipología de las redes sociales y su uso específico en traducción
¿HAY QUE SOCIALIZAR?
¿ES NECESARIO ESTAR EN INTERNET?
“SI TU NEGOCIO NO ESTÁ EN INTERNET, TU NEGOCIO NO EXISTE”
BILL GATES
CON LO BIEN QUE TRABAJO SÓLO…¿PARA QUÉ QUIERO UTILIZAR LAS REDES SOCIALES?
A SOLAS NO SE CONSIGUE NADA IMPORTANTE
LAS REDES SOCIALES SON UNA PÉRDIDA DE TIEMPOY NO APORTAN NADA INTERESANTE
Lo que mostramosSIN Internet
Lo que podemosmostrar CON
Internet
NUESTRO POTENCIAL PROFESIONAL
VENTAJAS Y REQUISITOS
VENTAJA: ESTABLECER CONTACTOS Y COMUNICAR CON OTROS
VENTAJA: AMPLIAR NUESTRA RED PROFESIONAL
VENTAJA: ACCEDER A TODO TIPO DE INFORMACIÓN
VENTAJA: VISIBILIDAD Y POSICIONAMIENTO WEB
http://goo.gl/Gb5oS
REQUISITO: DEDICACIÓN DE TIEMPO
REQUISITO: SATURACIÓN DE INFORMACIÓN
REQUISITO: CUIDAR LOS CONTACTOS
REQUISITO: ACTUALIZACIÓN CONSTANTE
• ¿Para qué las voy a utilizar?• Uso profesional• Uso personal
• ¿A quién me quiero dirigir?• Clientes• Otros colegas
• ¿Qué imagen quiero transmitir?• Formal• Informal
REFLEXIONES ANTES DE EMPEZAR
TIPOS DE REDES
Verticales:
Centradas en una determinada temática, esencialmente ocio o
profesionales
Horizontales:
Sin temática definida y abierta a cualquier usuario
¿QUÉ REDES SOCIALES NOS INTERESAN?
DEPENDE DE CÓMO QUEREMOS QUE NOS VEAN
DESARROLLA TU MARCA PERSONAL EN INTERNET
Y HAZTE VISIBLE
DESTACA TU FACTOR DIFERENCIADOR
SUGERENCIAS DE REDES
Twitlistmanager
https://previous.delicious.com/chelovargashttps://previous.delicious.com/manuelsaavedra
• Consulta a otros traductores: Proz
Blogs, grupos de discusión, redes
¡TÚ PUEDES HACERLO!
QUINTO ROL
GESTOR DE LA INFORMACIÓN
BUSCA RECUPER
A
MANIPULA ALMACENA
Competencia documental
Habilidades y destrezas específicas del traductor para saber manejar con precisión y rapidez las fuentes de información de cualquier tipo y en cualquier formato necesarias para su quehacer traductor (Palomares y Pinto, 2000: 100)
Conocimiento relacionado con el uso de fuentes de documentación e información aplicadas a la traducción (PACTE, 2005: 610)
Uso de fuentes documentales de todo tipo, la búsqueda de terminología y la gestión de glosarios, bases de datos, etc., el manejo de las aplicaciones informáticas más útiles para el ejercicio de la profesión (tratamiento de textos, autoedición, Internet, correo electrónico), además de otras herramientas (Kelly, 2002: 14-15)
¿Qué busca?
much documentary research carried out by translators is essentially
terminological in purpose. (Kelly, 2005: 68)
Las _____________ y __________ que afectan a la potente _________ del ___________ están atravesadas por ___________ ________ posteriores a la primera fase del _______
Las estructuras anticlinales y sinclinales que afectan a la potente serie calco-dolomítica del Cretácico Superior están atravesadas por alineaciones diapíricas transversales (NO-SE) posteriores a la primera fase del plegamiento
Las estructuras anticlinales y sinclinales que afectan a la potente serie calco-dolomítica del Cretácico Superior están atravesadas por alineaciones diapíricas transversales (NO-SE) posteriores a la primera fase del plegamiento
Las estructuras anticlinales y sinclinales que afectan a la potente serie calco-dolomítica del Cretácico Superior están atravesadas por alineaciones diapíricas transversales (NO-SE) posteriores a la primera fase del plegamiento
PROBLEMAS QUE AFRONTA
si existe en la LM un término lexicalizado que exprese la idea del TermO: no se encuentra el equivalente
Estrategia de búsqueda conceptual
• Contexto:
"Thanks to stop signs, emergency vehicles and teacher's red pens, we associate red with danger, mistakes and caution. The avoidance motivation , or heightened state, that red activates makes us vigilant …”
Estrategia de búsqueda conceptual• PRIMERA INTUICIÓN
– Avoidance motivation -> ausencia de motivación / desmotivación. - Sin embargo, en inglés esto hubiera estado escrito de otra manera. - Necesito conocer una definición:• DEFINICIÓN: “avoidance motivation is” -> artículo que describe este tipo de
motivación frente al ‘approach motivation’. • RESULTADO
– Approach motivation is the energization of behavior by, or the direction of behavior toward, positive stimuli (objects, events, possibilities), whereas avoidance motivation is the energization of behavior by, or the direction of behavior away from, negative stimuli (objects, events, possibilities). In this article, I provide a brief overview of this distinction between approach and avoidance motivation. In addition, I provide a brief overview of a model of motivation in which this approach-avoidance distinction plays an integral role—the hierarchical model of approach-avoidance motivation.
Estrategia de búsqueda conceptual
• Deducción a partir del segmento anterior:– Hay varios tipos de motivación– Queremos que aparezca en un abstract por
calidad del contenido (puede que lo encontremos en bilingüe)
– Utilizamos palabras empleadas en la definición + estrategia híbrida:
• Google: <"tipos de motivación" abstract comportamiento estimulos approach avoidance>
Estrategia de búsqueda conceptual
• Revista Electrónica de Motivación y Emoción– “Aunque con nombres diversos, estos y otros autores (Elliot
y McGregor, 2001) proponen cuatro generales. Dos son expresión de la meta general (orientación al aprendizaje y evitación del no aprendizaje);
• En otro artículo, a partir del autor encuentro:– (…) cuyo objetivo es obtener juicios por parte de los demás
sobre la propia competencia; dentro de estas últimas, se distinguen dos posibles orientaciones, una de aproximacion (obtener juicios favorables sobre la propia competencia) y otra de evitacion (evitar juicios desfavorables sobre la propia competencia).
Estrategia de búsqueda conceptual
• Refuerzo: busco: <"de evitación" "de aproximación" motivación tipos>
Problemas que afronta
¿Es apropiada la unidad que ofrece el diccionario bilingüe?
Explotar los beneficios de Google
Recurso para búsquedas
Ejemplo Función Potencial para el traductor
Búsqueda en LIBROS
Google libros
Visualizar la palabra de búsqueda destacada en páginas de libros.
Observar el comportamiento de las palabras en contexto, lo que significan.
Explotar los beneficios de Google
• http://goo.gl/QOdB8H
Explotar los beneficios de GoogleRecurso para búsquedas
Ejemplo Función Potencial para el traductor
Búsqueda en SITIOS WEB concretos
Google, operador site:es, inurl:
Restringir la búsqueda de información a sitios web más especializados y concretos. Con la expresión en Google de site: más la página web concreta (por ejemplo, http://www.cancer.gov/espanol) haríamos las búsquedas exclusivamente en esta web. Si añadimos además el operador filetype: o ext: junto con la extensión concreta del archivo (pdf), obtendríamos toda la documentación en pdf disponible en la web de búsqueda.
Obtener mayor calidad en sus resultados al consultar páginas especializadas, construir un corpus ad hoc sobre un tema específico.
Explotar los beneficios de Google
• MUY ÚTIL cuando queremos asegurarnos de que hacemos una selección correcta de un término, de acuerdo con su uso y significado en la lengua meta– <"highly pathogenic avian influenza" inurl:eur-
lex.europa.eu>• http://goo.gl/qWKnvM
Problemas que afronta
¿Qué seleccionar en caso de varios equivalentes?
Concurrencia sinónimia
• Participaciones preferentes:– preference shares, preferred shares, preferential
shares, priority shares and privileged shares• Cliente de GB• En Google: busca por Lenguas o Países:
Resultados de frecuencia
Resultados de equivalentes en Google
GB EE.UU.
Preference shares 61.000 514.000
Preferred shares 740 2.430.000
Preferential shares 356 11.200
Priority shares 126 15.000
Privileged share 16 497
Problemas que afronta
¿Son las unidades léxicas equivalentes semánticos?
Explotar los beneficios de Google
Recurso para búsquedas
Ejemplo Función Potencial para el traductor
Búsqueda de IMÁGENES
Imágenes de GoogleStock.xchng, MorgueFile, etc
Buscar imágenes. Desvelar el concepto tras una unidad lingüística, un culturema, etc.
Explotar los beneficios de Google
• Por ejemplo: – Triffle: http://goo.gl/4SChTE– Ekeko: http://goo.gl/7biyDM
Explotar los beneficios de Google
• Por ejemplo: – Buscamos el equivalente de finger, incluimos en el
cuadro de búsqueda <finger airport>
Explotar los beneficios de Google
• Por ejemplo: – Cuando ya tenemos una idea de a qué se refiere el
equivalente al ES podría intentar hallarse con <embarque avión>
Explotar los beneficios de GoogleRecurso para búsquedas
Ejemplo Función Potencial para el traductor
Búsqueda de TIPOS DE ARCHIVOS
Google, operador filetype: o ext:
Buscar tipos de archivos concretos: pdf, doc, rtf, txt, etc.
Compilar un corpus ad hoc sobre un tema específico. En el caso de documentación multilingüe, podríamos construir una memoria de traducción mediante la alineación de textos paralelos.
Explotar los beneficios de Google
• Si escribimos en el cuadro de búsqueda <manual canon d450 filetype:pdf> nos aparecerán los manuales en los distintos idiomas en los que esté publicado
Ante los distintos problemas, el traductor
Rigor, método
Resolver según tipo de problema
¿qué establecen las instituciones de normalización?
Si NO existe el equivalente …
Si NO existe el equivalente …
La estructura general de la lengua (recursos naturales de formación de palabras de la LM)
Si NO existe el equivalente …
RECURSOS PARA NUEVAS PALABRAS
Si NO existe el equivalente …
VIABILIDAD LINGÜÍSTICA DE LA PROPUESTA
Si NO existe el equivalente …
ACEPTACIÓN SOCIAL
Si hay VARIOS equivalentes …
CONSIDERAR CONVENIENCIA DE VARIACIÓN DENOMINATIVA
• USB flash drive• flash drive• USB stick• USB memory key• memory stick• keydrive• pendrive• thumbdrive• jumpdrive
Si hay VARIOS equivalentes …
MEDIR LA IMPORTANCIA DE LA VARIANTE
Si hay VARIOS equivalentes …
COMPROBAR ALCANCE CONCEPTUAL
EJ.: SOFTWARE, APLICACIÓN INFORMÁTICA, PROGRAMA DE CÓMPUTO
¿Dónde busca?
EVALUAR
COMPROBAR
INDENTIFICAR
SELECCIONAR
Recursos terminológicos
disponibles
Recursos precisos y relevantes
Su accesibilidad y aplicabilidad
Los recursos en precisión y credibilidad
Las principales tareas de la minería terminológica requieren
• Sus métodos se basan en el uso de los motores de búsqueda
• Las herramientas basadas en web reflejan distintas tecnologías,
POR ELLO
DIFERENTES RESULTADOS MISMA SINTAXIS
≠ MOTOR DE BÚSQUEDA
Minería terminológica
¡INCLUSO CON EL MISMO!
• El primer lugar para encontrar:– definiciones– equivalentes
Motores
buscar recursos terminológicos en línea
ÍndicesPortales
proporcionanAcceso directo a
glosarios y diccionarios en línea
Información bibliográfica de colecciones en papel
Recursos de diccionarios y glosarios
• ATENCIÓN: No se han seguido las normas lexicográficas / terminográficas de documentación e investigación para su compilación – Usenlos de manera crítica– Manipulen la información para que se adecue a su
entorno concreto de trabajo– No corten y peguen la información de la web sin
comprobar su calidad – Siga directrices y listas que les aseguren dicha calidad
Retos de esta búsqueda
• Encontrar un término o conjunto de términos en un diccionario o glosario es fantástico
• PERO• Muchas veces se trabaja en materias sobre las que nadie antes
ha llevado a cabo una investigación terminológica
• Confirmen la información visualizando los términos en contexto en lugar de confiar exclusivamente en diccionarios y glosarios existentes.
Estrategias: términos en contexto
• Los términos en contexto es vital en entornos multilingües• E.j.: ‘diaphragm spring’ se encuentra en diccionarios en la web• PERO• No se encontraba el equivalente en español ¿“resorte de
diafragma”? en ningún glosario• Este término se encuentra ilustrado en páginas web:
Estrategias: términos en contexto
• La tarea más compleja en terminología multilingüe es:– Encontrar los equivalentes desconocidos que son
conocidos en la LO (especialmente, en inglés)Intente validar términos que parecen ser buenos candidatos para ser cognados o préstamos en la LM:
E.j. “diaphragm spring” “diafragma de”
Colabore con expertos del tema que le proporcionen el mecanismo de validación a través de listas de discusión
Busque conceptos que estén relacionados
1
2
3
Estrategias: términos en contexto
Estrategias: términos en contexto
• CORPUS PARALELOS– http://
personal.ua.es/es/chelo-vargas/enlaces/corpus-paralelos-en-linea.html
– LINGUEE: http://goo.gl/aEvnC9
Estrategias: por aproximación
Contexto: epilepsia“I am currently facing issue with the French equivalent of the term "hypermotor seizure". As a matter of fact, I can't find a proper equivalent. I found "crise hypertonique" but I have the feeling they are not quite the same. I think this is the case where an expert would be of help, but the one I consulted for another term is not of help this time (and I can't push him too much, unfortunately).What am I supposed to do in this case? “
Estrategias: por aproximación
¿Por qué no encuentro un equivalente?1. “ataque hipermotor” -> Sin resultados2. Conocer más: <epilepsia tipos de ataques
hipermotor>
Estrategias: por aproximación
¿Por qué no encuentro un equivalente?
Estrategias: por aproximación
¿Por qué no encuentro un equivalente?
http://www.ilae.org/Visitors/Centre/ctf/documents/NewConcepts-Classification_2011_000.pdf
http://www.ilae.org/Visitors/Centre/ctf/documents/SpanishTranslationILAEHandout.pdf
• Búsqueda: "the term" "hypermotor seizure““The term "hypermotor seizure" was proposed for this type of seizure(Luders et al 1998). These seizures are also termed "frontal lobe seizures with hypermotor automatisms," "frontal lobe seizures with frenetic automatisms," "complex partial seizures frontal lobe type," "frontal lobe seizures with agitated behavior," or "seizures with hyperactive automatisms" (Williamson and Jobst 2000). They were also termed “hyperkinetic seizures” or “focal motor seizures with hyperkinetic automatisms” in some classification publications (Engel 2006a; 2006b). In the latest report of the International League Against Epilepsy (ILAE) on revised terminology and concepts for organization of seizures and epilepsy, frontal lobe seizures are classified as “focal seizures” with further descriptors such as “with or without impairment of consciousness” or “with or without observable motor components” (Berg 2010).
Estrategias: por aproximación
• 1. Recursos lingüísticos generales• Diccionarios monolingües generales• Diccionarios bilingües generales
• 2. Recursos terminológicos• Portales• Catálogos con glosarios y diccionarios especializados• Diccionarios y glosarios temáticos • Bancos terminológicos• Bancos con neologismos• Bases de datos de conocimiento
• 3. Listas de discusión, foros y blogs
Clasificación de recursos por contenido
• 1. Recursos lingüísticos generales (monolingües)
• Diccionario de la Real Academia de la Lengua Española • Clave • Merriam Webster• Longman Dictionary• Cambridge Dictionary• Hyperdictionary
Clasificación de recursos por contenido
• 1. Recursos lingüísticos generales (bilingües)– Diccionarios.com– Periódico El Mundo– Wordreference
Clasificación de recursos por contenido
• 2. Recursos terminológicos• Portales
– TermScience
Clasificación de recursos por contenido
• 2. Recursos terminológicos• Catálogos con glosarios y diccionarios
– Your dictionary.com – Lexicool – OneLook– Visual Dictionary – Terminology Collection – Vademécum del traductor externo– Logos dictionary
Clasificación de recursos por contenido
EUTERM.ORG
• BDT– Base de Terminologie: http://www.cilf.org/bt.fr.html– TERMCAT. Cercaterm & Neoloteca: http://www.termcat.net/– Electropedia: The World's Online Electrotechnical Vocabulary: http://www.electropedia.org/– Eurovoc: http://eurovoc.europa.eu/– Faoterm: http://termportal.fao.org/faoterm/main/start.do– FRANCETERM: http://www.culture.fr/franceterme
– Grand Dictionnaire Terminologique: http://gdt.oqlf.gouv.qc.ca/
– IATE: http://iate.europa.eu/iatediff/SearchByQueryLoad.do?method=load– IMF Terminology: http://www.imf.org/external/np/term/eng/index.htm
– ITU Terms and Definitions: http://goo.gl/I6Ipq– Ivertext: http://www.invertext.com/en/index.html– Language of UN Resolutions: http://sattarsite.com/fawatih.asp– Meteoterm: http://www.wmo.int/pages/prog/lsp/meteoterm_wmo_en.html– Proz.Com term search: http://www.proz.com/search/– Silvaterm: http://goo.gl/ro7Bi5 – Terminologiedatenbank: http://goo.gl/k1iWn9 – Termite: http://www.itu.int/terminology/index.html
– Termium: http://www.termiumplus.gc.ca/– TErms and Definitions Database Interactive (TEDDI): http://webapp.etsi.org/Teddi/– TermSciences: http://www.termsciences.fr/-/Index/Rechercher/Rapide/– TSK: http://www.tsk.fi/tepa/netmot.exe?UI=engr– UNTERM: http://unterm.un.org/
Clasificación de recursos por contenido
Más recursos …
• http://www.iula.upf.edu/recurs02es.htm• Vocabularios Realiter:
http://unilat.org/DTIL/Terminologie/Reseaux/Realiter/es
Gane tiempo: ¡aprenda a
configurar los buscadores que use
frecuentemente!
1
2
1. Configurar las búsquedas en Chrome
2. Configurar las búsquedas en Chrome
3. Configurar las búsquedas en Chrome
Nombre largo
Nombre corto fácil de recordar
URL del buscador
1. Hacer una búsqueda2. Copiar URL de la búsqueda3. Quitar la palabra de búsqueda4. Añadir %s: Ejemplo con linguee.es:http://www.linguee.es/espanol-ingles/search?source=auto&query=%s
4. Configurar las búsquedas en Chrome
• Ctrl + T (abre una nueva pestaña en Chrome)• Escribo linguee.es (o el nombre corto que haya
elegido)• Espacio o tabulador• Escribo la palabra o expresión de búsqueda
4. Configurar las búsquedas en Chrome
• Ctrl + T (abre una nueva pestaña en Chrome)• Escribo linguee.es• Espacio o tabulador• Escribo la palabra o expresión de búsqueda
BÚSQUEDA DE INFORMACIÓN
Objetivos
Aprender a realizar búsquedas más efectivas.Conocer los tipos de recursos que podemos obtener y cómo localizarlos.Practicar el proceso de búsqueda, refinado y captura de información relevante.
Recuperación de información
Encontrar información en Internet NO es difícilperoEncontrar el equivalente, la información, el texto concreto que andamos buscando es comoPara extraer la aguja del pajar, el traductor debe emplear el motor de búsqueda a modo de
Advantages and disadvantages of the Internet
Recuperación de información
Advantages and disadvantages of the Internet
Recuperación de información
Implicaciones:• (1) Conocer las funcionalidades del motor de búsqueda
que vamos a emplear.• (2) Aplicar el lenguaje de interrogación que entiende el
motor.• (3) Planificar varias estrategias de búsqueda.
Más posibilidades de obtener respuesta fructífera
Recuperación de información
Internet ofrece información y datos de alcance mundial
PERO Hay mucha información. Anonimato de la fuente.
POR LO TANTO Desarrollar estrategias de evaluación de la información.
Recuperación de información
El objetivo del proceso de localización y recuperación de información es:• Obtener los documentos que cumplen mejor con la
necesidad de información
Recuperar información carente
de
RUIDO SILENCIO
Documentos RECUPERADOS por SRI pero NO RELEVANTES para necesidad de info.
Doc. NO RECUPERADOS por SRI pero RELEVANTES
Ventajas de Internet.La Red es un recurso….
gratuitorápidoinagotabledocumentalcomunicativo y de interacciónenciclopédicolexicográfico
Inconvenientes de Internet…
Cantidad masiva de datosDificultad de evaluar la información que recuperamosEl carácter efímero de las páginas• Wayback Machine: http://www.archive.org/web/web.php
Tipos de buscadores
Directorios: http://goo.gl/Un8FTr Motores de búsqueda: http://goo.gl/t88A2 Metabuscadores: http://goo.gl/4H8hsI Buscadores especializadosLa web invisible: http://goo.gl/LlMxM
Los directorios…
Definición: guías o listas agrupadas y ordenadas sistemáticamente por categorías y subcategorías. El acceso a la información es por NAVEGACIÓNSitios definidos manualmente; la actualización no es automáticaApropiados para:• Temas amplios y generales• Sitios web conocidos
Los directorios…Ventajas:
Fáciles de usar. Vínculos a páginas de calidad.Agrupan páginas similares.
Los directorios…Desventajas:
Bases de datos pequeñas.No se actualizan rápidamente.Contienen descripciones generales sobre los sitios.
Los motores de búsqueda…
Definición: SRILa búsqueda es mediante recuperaciónIndexan decenas de millones de páginas web Directorios: miles o decenas de milesFuncionamiento:• Crean listados automáticamente• Rastrean la red recopilando cualquier palabra a partir
de Cuerpo de los textos Títulos de las páginas Metacategorías html
• Examinan su propia bd
Los metabuscadores
Los metabuscadores…
SRI que buscan simultáneamente las bd de directorios y motores de búsquedasVentaja: ahorro de tiempoDesventaja: • Recuperación no exhaustiva de datos.• No existe una estrategia de búsqueda común.
Los metabuscadores…Ejemplos:
Ixquick http://www.ixquick.com
Metacrawler http://www.metacrawler.com
SurfWax http://www.surfwax.com
Los buscadores especializados
Los buscadores especializados
Son motores de búsqueda, o directorios, o una combinación de ambos que únicamente abordan un área específica del conocimientoUtilidad: • Conocer principales recursos en Internet en un área
especializada del conocimiento• Restringir la búsqueda• Buscar por la terminología técnica de un tema particular
Ventajas:• Ahorro de tiempo• Mayor calidad y especificidad de los resultados
Desventajas: Muy específicos
Los buscadores especializados…Ejemplos:
Scirus ciencia HHUUhttp: / /www.scirus.comUUHH
Economics search engine
Economía UUhttp: / /ese.rfe.org/
Tipos de búsquedas: las simples
¿Qué es una búsqueda simple?• 1 única palabra en el cuadro de búsqueda
Tipos de búsquedas: las simples
¿Qué es una búsqueda simple?• Una única palabra en la casilla del buscador
Fases a seguir si la necesidad de información es impuestos• (1) Surge la necesidad de información• (2) Pensamos en una palabra que representa la información
que necesitamos• (3) Escribimos la palabra en el buscador• (4) Realizamos la petición de búsqueda
Tipos de búsquedas: las avanzadas
¿Qué podemos escribir en un SRI?• Palabras• Operadores básicos (+, -, *, “ “)• Expresiones booleanas (AND, OR, AND NOT,
NEAR)• Operadores filtro (site:es, filetype:pdf)
Tipos de búsquedas: las avanzadas
Operadores básicos (+, -, *, “ “) impuesto + glosario impuesto –acción –participación glos* “Office for Harmonization in the International
Market”
Tipos de búsquedas: las avanzadas
Expresiones booleanas liability AND partnership AND shareholders “private limited company” OR “public limited
company” “private limited company” AND NOT “public
limited company” DLS NEAR connect
Tipos de búsquedas: avanzadas
Operadores filtro o que limitan el campo (Google)
related: busca páginas similares a la página tecleadaintitle: busca en el título (intitle:glosario economía)allintitle: todas las palabras de la consulta se encuentran en el títuloinurl: busca en la URLallinurl: todas las palabras de la consulta se encuentran en la URL link: páginas vinculadas a la página tecleadasite: busca en un sitio (p.ej., ua.es [buscaría en la Universidad de Alicante ubicada en España]) o dominio particular (.es; .com; .edu; .org, etc.)filetype: busca un documento con una extensión de archivo determinada (.pdf; .doc; .ppt, etc.)
Tipos de búsquedas: avanzadas
Materialización de la consulta avanzada• ¿Se pueden utilizar varios operadores de forma
combinada? Ej.: deseo recuperar documentos con la
extensión.pdf sobre el tema “checking account” o en su versión británica (“current account”) y en los que aparezca también el término “saving account”:
“saving account” ”checking account” OR “current account” filetype:pdf
Tipos de búsquedas: avanzadas
Desde el principio….• Necesidad de información en lenguaje natural
«quiero conseguir algún documento en formato textual (me valen los .pdf, y los .doc) que traten el tema de "checking account" o “current account” (que es la versión del término en inglés británico) y que este término esté contenido tanto en el título del documento, como en el cuerpo del texto. Me interesa también que en el documento aparezca el término "saving account". También sería interesante que estuviera alojado en algún sitio gestionado por alguna universidad u organismo para que el documento proporcione ciertas garantias de calidad»
Tipos de búsquedas: avanzadas
Desglose en tres niveles:• (1) tema de la búsqueda; • (2) tipo de documento; • (3) lugar donde se encuentra el
documento.
Tipos de búsquedas: avanzadas
1. Tema de la búsqueda: “checking account” o “current account” y “saving account”• Términos, operadores básicos y/o
boleanos en la ecuación de búsqueda: “saving account” “checking account” OR “current account”
Tipos de búsquedas: avanzadas
2. Tipo de documento: textual (extensión del archivo: .pdf o .doc)• Términos, operadores
básicos y/o boleanos en la ecuación de búsqueda: filetype:pdf OR filetype:doc
Tipos de búsquedas: avanzadas
3. Alojados en: universidad (.edu), organismo (.org) • Términos, operadores básicos y/o
boleanos en la ecuación de búsqueda: site:edu OR site:org
Tipos de búsquedas: avanzadas
Ecuación de búsqueda resultante:saving account” “checking account” OR
“current account” filetype:pdf OR filetype:doc site:edu OR site:org
Conclusiones
Muchas gracias