Documente Academic
Documente Profesional
Documente Cultură
Memorias de
Traduccin.
Memorias de Traduccin
Estndares
TMX
Translation Memory eXchange
Formato estndar de intercambio de datos para Memorias de Traduccin,
desarrollado por OSCAR
OSCAR
Open Standards for Container/Content Allowing Reuse,
es un grupo de LISA
LISA
Localization Industry Standards Association
5
Historia de las TM
Antiguamente la mayora de los traductores no
guardaban los archivos de traducciones previas en
formato electrnico.
Historia de las TM
(Dcada de los 80)
Existan herramientas muy rudimentarias.
Las traducciones estaban en formato electrnico (se escriban
con procesadores de textos), pero era bastante complicado y
tedioso encontrar un determinado segmento de traduccin, ya
que para reutilizar una traduccin deberamos:
Localizar el archivo fuente.
Abrir el archivo fuente y buscar el texto a reutilizar.
Abrir el archivo con la traduccin.
Buscar en ese archivo el segmento traducido.
Copiar el segmento y pegarlo en la nueva traduccin.
Editar el segmento.
10
10
Historia de las TM
(dcada de los 90)
Los primeros programas que incluan memorias de
traduccin empezaron a ver la luz a principios de los
aos 90 en las grandes multinacionales informticas.
La primera herramienta que ms se asemeja al modelo
actual fue el IBM TranslationManager.
11
11
12
12
Unidades de traduccin
A la alineacin entre un segmento de texto origen y su texto
destino (traducido) se le denomina Unidad de Traduccin.
13
13
Resumiendo
Una Memoria de Traduccin consta de una Base de
Datos que memoriza los textos traducidos.
Los textos se dividen en pequeos segmentos que
corresponden normalmente a frases; aunque es
posible segmentar por prrafos.
Los segmentos se graban junto con su traduccin a
medida que se traducen, en la memoria de
traduccin, y forman las unidades de traduccin.
14
14
15
15
Qu es una red?
Una red de computadoras se establece
cuando dos o ms computadoras se
conectan entre s de forma permanente
para compartir recursos e intercambiar
informacin.
16
Tipos de Redes
LAN o Red de rea Local (Local Area Network)
MAN o
INTERNET
17
18
El servidor (server).
El sistema operativo.
RJ-45
19
20
21
Equipos de traduccin
Los equipos de traduccin suelen estar formados por:
Jefe de proyecto
Terminlogos
R
PO LINA
I
U P
EQ ISCI
ID
LT
U
M
Traductor principal
Traductores
Revisores
Maquetadores
...
Nota. La eleccin de un buen equipo traduccin
es fundamental para el xito del proyecto.
22
23
Equipos de traduccin
Importancia de la comunicacin del equipo.
Herramientas de trabajo colaborativas.
Intranets.
Correo electrnico, FTP, etc
encia
r
e
h
Co
Reut
ilizac
in
24
El sistema de
MT consulta si
se ha traducido
anteriormente
5
Acepta la traduccin
El nombre de fichero
Eles
nom
bredefichero
no
vlido
3
Busca en la BD
y localiza el
segmento
noesvlido
25
25
26
26
27
28
28
Alineacin post-traduccin
TMs de peor calidad y mayor tamao.
Traduccin interactiva
TMs de mejor calidad y menor tamao inicial.
29
29
Alineacin post-traduccin
La alineacin es el proceso de comparar un texto con su
traduccin y emparejar los segmentos correspondientes
reunindolos en unidades de traduccin.
30
30
32
Alineacin
La alineacin es el proceso en el que secciones de un texto
origen se asocian con sus correspondientes traducciones.
La alineacin se puede realizar:
a nivel de texto (confuso).
a nivel de prrafo.
a nivel de oracin o frase.
a nivel de palabra (pobre).
33
2.
3.
4.
5.
6.
34
35
35
36
Traduccin interactiva
37
Modo interactivo
38
38
Traduccin interactiva
39
40
.;:!?
41
41
Tipos de segmentacin
Encabezado
IN: Warning:
ES: Aviso
Una frase
traducida por
una frase
Una frase
traducida por
dos frases
Dos frases
traducidas por
una frase
42
IN: This computer program is protected by copyright law and international treaties
ES: Este programa de ordenador est protegido por las leyes de copyright y por
tratados internacionales
IN: Unauthorized reproduction or distribution of this program, or any portion of it,
may result in severe civil and criminal penalties, and will be prosecuted to the
maximum extent possible under the law
ES: Toda la reproduccin y distribucin parcial o total de este programa, est
estrictamente prohibida. Toda persona que no respete estas disposiciones ser
culpable de un delito de falsificacin y condenable a las sanciones previstas por la
ley.
IN: The 0 button and the 1 option affect the current application. The other options
affect all applications.
ES: Las modificaciones aportadas por el botn 0 y la opcin 1 afectan a la
aplicacin en curso mientras que las otras opciones repercuten sobre todas las
aplicaciones.
42
Revisiones.
Textos reciclados.
Actualizaciones.
43
43
Textos repetitivos
Normalmente los textos tcnicos, cientficos y legales tienen contenido
repetitivo y es aconsejable utilizar memorias de traduccin.
Por el contrario los textos literarios y de publicidad (brochures,
panfletos) contienen menos estructuras repetitivas y son menos
apropiados para memorias de traduccin.
Revisiones
- Versiones corregidas de un texto previo.
- Nuevas versiones de manuales tcnicos que incorporan nuevas
caractersticas (en lugar de traducir el manual entero, el traductor
puede reutilizar las traducciones previas que no hayan sido alteradas en la
nueva versin).
44
44
Textos reciclados
Algunos traductores trabajan en campos especializados donde tanto el
formato como la temtica del texto no varan mucho.
Este tipo de traductores suelen trabajar para los mismos clientes que
tienen una terminologa y estilo parecidos en todos los textos que quieren
que se traduzcan.
Actualizaciones
- Las actualizaciones tienen lugar cuando el cliente hace cambios en el texto
original mientras todava se est realizando la traduccin.
- Una actualizacin puede poner en serias dificultades al traductor si el
texto es extenso y se han realizado muchos cambios en el documento.
- Sin una memoria de traduccin el traductor tendra que comparar el texto
original y el actualizado para ver los cambios (con un procesador de textos).
- Con una memoria de traduccin el traductor puede identificar fcilmente
segmentos nuevos o aquellos que han sufrido alguna variacin.
45
45
46
47
47
Coincidencia exacta
(exact match)
48
48
Coincidencia exacta
Ejemplos de segmentos que no detectara una correspondencia exacta
Ortografa diferente
Puntuacin diferente
Nmero o gnero diferente
Formato diferente
49
49
Coincidencia exacta
El traductor no est obligado a aceptar la traduccin propuesta
por el sistema. Debemos garantizar que la traduccin es la
apropiada y adems se ajusta a las preferencias del cliente en
cuanto al estilo y uso de trminos.
Cul es el problema?
La homonimia
Homnimo:
2. adj. Ling. Dicho de una palabra: Que, siendo igual que otra en la
forma, tiene distinta significacin; p. ej., Tarifa, ciudad, y tarifa de
50
precios. U. t. c. s. m.
50
Coincidencia exacta
Un segmento podra traducirse errneamente ya que su traduccin
depende del contexto en donde aparece. Por tanto el traductor debe
editar la traduccin sugerida si fuera necesario.
Por ejemplo la palabra inglesa pipe tiene varios significados y segn
el contexto puede traducirse por tubera o pipa.
Unidad de traduccin
almacenada
51
51
Coincidencia completa
(full match)
La coincidencia completa se da cuando el segmento
a traducir slo difiere del almacenado previamente
en alguna unidad de traduccin en elementos
variables.
52
52
53
53
54
54
Coincidencia Fuzzy
La coincidencia fuzzy, tambin conocida como aproximada o parcial,
recupera de la Memoria de Traduccin segmentos similares, pero no
idnticos al segmento origen (el sehmento a traducir).
55
55
Coincidencia Fuzzy
Si el porcentaje mnimo establecido es alto (95%), hay riesgo
de que el sistema de memoria de traduccin no encuentre
ningn segmento que pueda ser reutilizado.
SILENCIO
56
56
Coincidencia Fuzzy
Ejemplo de una coincidencia utilizando un
porcentaje de similitud alto
57
57
Coincidencia Fuzzy
Ejemplo de una coincidencia utilizando un
porcentaje de similitud bajo
58
58
Coincidencia Fuzzy
Las coincidencias fuzzy pueden mostrarse ordenadas de mejor a
peor coincidencia. El traductor puede verlas todas y elegir aquella
cuya adaptacin requiera menos tiempo.
59
59
Coincidencia de trminos
(term match)
La mayora de sistemas de memoria de traduccin funcionan
conjuntamente con bases de datos terminolgicas y el
reconocimiento activo de terminologa incluido en ellos
permite, cuando no se haya producido una correspondencia
exacta o fuzzy entre segmentos, obtener traducciones de
los trminos contenidos en esas bases
Coincidencia en subsegmentos
La coincidencia en subsegmentos permite obtener
sugerencias de partes de una frase o prrafo, comparando
dichos subsegmentos mediante tcnicas de coincidencia.
60
60
Coincidencia en subsegmentos
La combinacin de coincidencias en subsegmentos proporciona
sugerencias de cmo traducir un nuevo segmento.
61
61
Derivaciones.
Aadir sufijos o prefijos a una palabra existente.
62
62
63
63
64
www.ibm.com
www.trados.com
MultiTrans
WordFast
http://www.multicorpora.ca/multitrans.html
Atril Dj-Vu
www.wordfast.org
Star transit
www.star-transit.com
65
www.atril.com
65
66
66
IBM TranslationManager
Es el programa de memorias de traduccin ms antiguo, diseado
inicialmente por IBM para sus grupos internos de traduccin.
Todas sus funciones estn integradas en el sistema y no dispone
de mdulos externos al programa.
Combina su sistema de traduccin asistida con funciones de
memoria de traduccin y consulta de diccionarios.
Integra su propio procesador de textos e incluye un mdulo de
alineacin de memorias.
Admite diversos formatos sin limitarse a un procesador de
textos especfico.
Presenta un alto grado de personalizacin y flexibilidad.
Dispone de una potente funcin de fusin de segmentos.
67
67
Start transit
Permite abrir varios archivos de modo simultneo.
Se vincula a una aplicacin de gestin terminolgica externa
denominada Star TermStar.
Los filtros de formatos presentan un alto grado de
personalizacin.
Permite almacenar un gran nmero de segmentos en menos
espacio que los tradicionales sistemas de memorias de
traduccin.
Contiene un editor integrado de traduccin que puede emular
la navegacin de mens de Microsoft Word.
68
68
Atril Dj-Vu
Contiene diversos mdulos para creacin de proyectos,
mantenimiento de base de datos y terminologa, conversin y
alineacin de bases de datos y gestin terminolgica
(TermWatch), todos ellos integrados en el producto.
Incluye la funcin de propagacin de texto por todo el
documento de forma automtica o manual sin incluir la
traduccin en la memoria si as se desea.
Combina la memoria de traduccin y la base de datos
terminolgica para generar una propuesta de traduccin
cuando el sistema no encuentra una coincidencia al 100% o
parcial.
Tiene una excelente asistencia postventa.
Es un producto espaol.
69
69
70
EURAMIS
- Actualmente, la memoria central de traduccin Euramis
contiene ms de 88 millones de unidades de traduccin en
todos los idiomas oficiales de la UE.
Los idiomas origen ms comunes son: Ingls, Francs y Alemn.
No se utiliza directamente durante el proceso de traduccin:
es una base de datos accedida para obtener o guardar los
datos procesados localmente con TRADOS Translators
Workbench.
71
71
72
72
73
73
74
74
75
75
TRADOS TagEditor
TRADOS TagEditor es el editor de traduccin que proporciona
TRADOS especialmente para traducir documentos XML.
76
76
77
Calidad
Si las traducciones introducidas en la memoria de traduccin
son de calidad y gracias a la integracin con sistemas gestores
de terminologa, los nuevos textos a traducir sern de mayor
calidad.
Permite a traductores inexpertos reutilizar segmentos de
traducciones realizadas por traductores con experiencia.
78
78
Mejora de productividad.
79
Las memorias de traduccin son la base sobre la que giran todos los
programas de traduccin asistida actuales.
80