Herramientas digitales para el análisis lingüístico

Preview:

DESCRIPTION

Material de apoyo empleado en la ponencia del "Seminari Italianisti in Spagna e ispanisti in Italia: la traduzione" de la Università di Roma Tre en octubre de 2007

Citation preview

1

Herramientas digitales para el análisis lingüístico:nuevos agentes de la traducción, nueva traducción

Patricia Fernández CarreloAutomaticTrans – Univ. de Deusto

Italianisti in SpagnaIspanisti in Italia

La traduzione

Universitá degli Studi Roma Trè – Instituto CervantesRoma, 30 e 31 ottobre 2007

2

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Punto de partida doble: Tratamiento automático de la lengua / análisis lingüístico

computacional Perspectiva interlingüística (traducción) e interdisciplinar

Innovación en: Conceptos: disciplinas, teorías, procedimientos,

herramientas, productos, resultados Recursos: herramientas que permiten llevar a cabo tareas

lingüísticas Productos: objetos (académicos/comerciales) que realizan

tareas lingüísticas Resultados: resultado humano vs. resultado automático

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

3

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Nuevos conceptos:

Ingeniería lingüística o informática aplicada a la lingüística Lingüística computacional: lexicografía computacional,

morfología computacional, sintaxis computacional, semántica y pragmática computacionales

Lingüística de corpus (concepto más antiguo, cobra un sentido especial al entrar en juego las herramientas informáticas)

Tecnologías lingüísticas o del lenguaje.Portal de tecnologías lingüísticas (TL) del Instituto

Cervantes en España: http://oesi.cervantes.es/

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

4

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Nuevos recursos: Lematizadores Analizadores morfosintácticos Bases de datos léxicas con información semántica Corpus

Nuevos productos (académicos y empresariales): Diccionarios electrónicos Buscadores Sistemas de recuperación de información Sistemas de Question Answering Herramientas de generación de resúmenes automáticos Herramientas de traducción asistida y automática

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

5

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Nuevos resultados:

Concepto de “diccionario” Fórmulas de búsqueda de información y/o de respuestas Resúmenes automáticos Traducción automática / Traducción asistida por

ordenador

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

6

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

La traducción como tarea computacional:(Página personal de Joseba Abaitua: http://paginaspersonales.deusto.es/abaitua/konzeptu/ta.htm)

Traducción automática (TA): ejercicio de traducción propiamente dicho aplicaciones informáticas que intentan simular la labor humana de la

traducción técnicas diversas para la obtención de traducciones de forma

mecánica y automatizada

Traducción asistida por ordenador (TAO): ayuda al humano que realiza una traducción aplicaciones informáticas que agilizan la tarea del traductor y le

sirven como apoyo para mejorar la calidad de su trabajo herramientas que posibilitan incrementar el ritmo de producción y

crear traducciones de mayor calidad

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

7

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Dimensiones de la TA:

Tipología de textos que van a ser traducidos Tipo de lenguaje: lenguaje común vs. lenguaje de especialidad

(densidad léxica) Distancia lingüística y cultural exitente entre la lengua origen y la

lengua meta Grado de desarrollo lingüístico y recursos de que dispone una

lengua o el ámbito geográfico en el que se habla para invertir en tecnologías lingüísticas

Medio y modo de traducción (medio oral -interpretación- / medio escrito -traducción- y medio electrónico -localización-)

Fines / ámbito de uso perseguidos con el diseño de la herramienta de TA

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

8

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Métodos de TA:

Traducción basada en reglas (Rule-based Machine Translation, RBMT)

método de transferencia sintáctica método de interlingua

Traducción basada en analogías (o datos contenidos en corpus) (Analogy-based Machine Translation, ABMT)

memorias de traducción técnicas estadísticas

Método híbrido, combinación de los anteriores

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

9

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Necesidades de la TA:

En función del método de TA...

Glosarios bilingües con información lingüística añadida (estándares de marcación)

Lematización y análisis morfosintáctico Reglas de formalización de comportamientos

morfosintácticos (gramáticas transformacionales) Corpus bilingües alineados (concepto de “unidad de

traducción”: Procesos de lexicalización y reconocimiento multilingüe de UTs. Proyecto de tesis)

Sistemas de desambiguación léxica (Word Sense Desambiguation)

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

10

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Algunas consideraciones sobre TA:

Traducción automática: dirigida a la traducción de textos rutinarios y estereotipados, no literarios

Resultado imperfecto. Calidad en función de la cercanía tipológica entre las lenguas que se traducen. Necesidad de corrección (post-edición). Cambio en el rol del traductor

Complejo proceso que requiere de análisis lingüístico a varios niveles

Necesidad de traductores y lingüistas para la formalización lingüística

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

11

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Empresas y herramientas de TA:

Systran (http://www.systran.co.uk/) // Babel Fish, del buscador Altavista (http://babelfish.altavista.com/)

Softissimo (http://www.softissimo.com/): Reverso, servicio de traducción de los diarios españoles El mundo y El País

Google (http://www.google.es/language_tools?hl=es) AutomaticTrans (http://www.automatictrans.es/): ATS,

traductor del Instituto Cervantes (http://oesi.cervantes.es/traduccion.jsp)

Y en el mundo académico: OpenTrad (http://www.opentrad.org/demo/), sistema de software libre

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

12

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Otras empresas y herramientas de TA:

Foreign Word (http://www.foreignword.com/Tools/transnow.htm) Wordlingo (http://www.worldlingo.com/en/products_services/

worldlingo_translator.html) Babylon: (http://www.babylon.com/spa/index.php) Dictionary.com (http://dictionary.reference.com/translate/) SDL international (http://www.sdl.com/es/Default.asp) Translation Experts Ltd.(http://www.tranexp.com/) Gist in time (http://www.alis.com/en/index.html) Word Magic (http://wordmagicsoft.com/index_es.shtml) Ilanguage (http://www.ilanguage.com/)

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

13

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Empresas y herramientas de TAO:

Trados (http://www.trados.com/en/) Atril (http://www.atril.com/), con Déjà Vu Star (http://www.star-group.net/) Transit (http://www.transit.es/index.html)

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

14

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Otros recursos digitales para la traducción: Diccionarios / lexicones (mono y multilingües)

Diccionarios italiano<->español Diccionarios.com: http://www.diccionarios.com/ Logos: http://www.logos.it/lang/transl_es.html (y otros

recursos) IATE: http://iate.europa.eu/iatediff/ (a nivel europeo) TV5MONDE:

http://www.tv5.org/TV5Site/alexandria/definition.php AllWords: http://www.allwords.com/ LangToLang: http://www.langtolang.com/ Windi: http://www.windi7.com/

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

15

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Bibliotecas y corpus (mono y multilingües) Bibliotecas:

Biblioteca italiana: http://www.bibliotecaitaliana.it/ Biblioteca virtual Miguel de Cervantes:

http://www.cervantesvirtual.com/ Corpus:

Portal Andrés de Poza (Carmen Isasi, Universidad de Deusto): http://www.andresdepoza.com/

Otros recursos lingüísticos: European Language Resorces Association (ELRA):

http://www.elra.info/

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

16

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Aplicaciones ad hoc de ayuda al análisis de la traducción: Proyecto de investigación “Preparación de una edición digital

bilingüe de Il Romulo de Virgilio Malvezzi tradudido por Teodoro dell'Aula para su análisis sintáctico-retórico”, Universidad de Deusto, 2004

Edición y estudio sintáctico-retórico en paralelo de las traducciones de Francisco de Quevedo (1632) y Teodoro dell'Aula (1632) de la obra de Virgilio Malvezzi Il Romulo (ed. de Clemente Ferroni, Bologna, 1629)

Anotación de los fenómenos lingüísticos y retóricos observados por medio del estándar de marcación TEI y desarrollo de sofware para el análisis de la información lingüística anotada

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

17

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Visualización de los textos en paralelo:

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

18

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Visualización de la estructura sintáctica del texto:

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

19

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Visualización de estadísticas de estructuras sintácticas:

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

20

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Visualización de fenómenos retóricos anotados:

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

21

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Desajustes entre estructuras sintácticas de las versiones:

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

22

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Otros recursos digitales de ayuda al traductor y su labor (accesibilidad a la información):

Páginas web de recursos generales para la traducción: Cuidada selección de recursos y servicios relacionados con

el mundo de la traducción: http://www.ampersand.es/es/vinculos.htm

Internet Resources for Translators: http://www.deraaij.com/irt/

Compendium of Translation Software: http://www.hutchinsweb.me.uk/Compendium.htm

European Association for MT: http://www.eamt.org/ Machine Translation Archive, por John Hutchins:

http://www.mt-archive.info/

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

23

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Bibliografía en línea: Google Académico: http://scholar.google.es/ CiteSeer: http://citeseer.ist.psu.edu/

Revistas digitales: Revista Tradumàtica:

http://www.fti.uab.es/tradumatica/revista/ La Linterna del traductor: http://traduccion.rediris.es/

Listas de distribución para traductores: “Traducción en España”:

http://www.rediris.es/list/info/traduccion.es.html)

Blogs y planetas sobre traducción

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

24

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Conclusiones:

Desarrollo tecnológico automatización de tareas lingüísticas

Innovación en teorías, herramientas y resultados Traducción: tarea computacional / asistencia

computacional Otros recursos digitales de ayuda a la traducción y al

traductor Nuevos agentes, nuevos roles, nuevas necesidades,

nueva traducción

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

25

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Un par de referencias bibliográficas: Abaitua, Joseba 2002.

http://paginaspersonales.deusto.es/abaitua/konzeptu/ta.htm Hutchins, John & Somers, Harold 1992. An introduction to

Machine Translation, CUP, Cambridge Martí, María Antonia (coord) 2003. Tecnologías del lenguaje, Ed.

UOC, Barcelona Melby, A. K. 1995. The possibility of language. A discussion of

the nature of language with implications for human and machine translation. John Benjamins

Y para más información… pfernandez@automatictrans.es

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007

26

Herramientas digitales para el análisis lingüístico. Nuevos agentes de la traducción, nueva traducción

Muchas gracias… Grazie mille…

¿Alguna pregunta?Alcune domande?

Patricia Fernández Carrelo. AutomaticTrans – Universidad de DeustoItalianisti in Spagna. Ispanisti in Italia. La traduzione - - - Roma, 30 e 31 ottobre 2007