Sunteți pe pagina 1din 7

Aplicaii informatice de asistare a traductorilor

Sanda Cherata
Universitatea Babe-Bolyai Cluj-Napoca
Facultatea de Litere
1. Introducere
Rolul traductorilor n societatea modern este n continu cretere. Dac n
trecut se ocupau cu precdere cu traduceri literare i de documente legale, n
momentul de fa ei sunt confruntai cu sarcini mult mai complexe.
n procesul globalizrii la care asistm n prezent, transferurile internaionale
(att n ce privete importurile, ct i exporturile) genereaz, pe lng schimbul de
produse, procese, tehnologii etc. i schimb de documentaie. Din ce n ce mai mult,
produsele vndute ntr-o alt ar dect cea de origine sunt localizate, adic
adaptate la specificul rii importatoare; aceasta nu se rezum numai la traducerea i
adaptarea documentaiei n limba rii primitoare, ci implic i aspectele culturale i
de coninut, adic adaptarea aspectelor non-textuale ale produsului (culori, simboluri,
uniti de msur etc.). LISA (The Localization Industries Standard Association)
definete localizarea ca fiind procesul de modificare a produselor i/sau serviciilor n
scopul de a rspunde diferenelor existente n diferite piee. Un exemplu edificator
este localizarea aplicaiilor informatice (sisteme-program, pagini web etc.).
Localizarea lor nseamn, pe lng traducerea documentaiei (manuale, ghiduri de
utilizare etc.), traducerea interfeei cu utilizatorul n limba rii importatoare (meniuri,
casete de dialog, ajutor etc.), adaptarea setului de caractere, a unitilor de msur
etc.
Dinamica schimburilor care au loc n prezent a generat o adevrat industrie a
localizrii. Aceasta cuprinde trei aspecte principale: vnzarea produselor, oferta de
servicii de localizare i dezvoltarea instrumentelor care servesc localizrii. Industria
localizrii este o parte a ceea ce constituie n momentul de fa industria limbilor.
Industria limbilor cuprinde1:
a) scrierea documentelor tehnice (prin opoziie cu scrierile literare);
b) managementul documentelor (care include utilizarea procesoarelor de texte,
indexarea automat, regsirea automat a informaiei etc.);
c) managementul terminologiei;
d) localizarea (care include traducerea);
e) publicarea (care include, pe lng publicarea tradiional pe suport hrtie, i
publicarea pe suport electronic i pe Internet).
Cele cinci aspecte ale industriei limbilor nu sunt independente, ci se
ntreptrund. De exemplu, managementul terminologiei multilingve joac un rol foarte
important n documentele domeniilor de specialitate. Dac ntr-o traducere literar
varietatea de stil este de dorit, atunci cnd e vorba de un termen dintr-un limbaj
specializat, acesta trebuie tradus consecvent cu termenul echivalent corespunztor.
Publicarea documentelor implic existena unui sistem de management al
documentelor, care, la rndul lui, s fie aplicat n procesul de localizare, astfel nct
aceeai terminologie s fie utilizat de la producerea iniial a documentului (n limba
surs) n toate traducerile documentului.
1

Cf. Melby 2000

Mai mult dect att, pentru produsele i tehnologiile scoase pe pia apar
mbuntiri i modificri (n cazul sistemelor informatice, versiuni noi), iar
documentaia aferent trebuie s reflecte aceast dinamic. Rezult c apar
documente cu coninut nrudit, care trebuie traduse ntr-un timp ct mai scurt. n
aceste situaii, e de dorit ca tot ceea ce a fost tradus pentru o versiune anterioar a
unui document s poat fi folosit la traducerea versiunii actualizate; acest lucru se
impune nu numai din raiuni de cretere a eficienei muncii traductorului, ci i pentru
a asigura consecvena terminologiei din documentele respective.
Fiind vorba, deci, de o adevrat industrie a limbilor, se impune ca ea s fie
nsoit i de tehnologiile corespunztoare. Au aprut instrumente informatice
(sisteme-program complexe) care asist traductorul pe tot parcursul procesului de
traducere, astfel nct, n momentul de fa, se vorbete de traducerea asistat de
calculator (n englez, Computer-Assisted Translation CAT).

2. Categorii de instrumentele pentru asistarea traductorilor


Traducerea asistat de calculator este o procesul n care traductorul uman
traduce textele folosind instrumente informatice concepute s-l ajute i s-i faciliteze
activitatea.
Termenul de traducere asistat de calculator este destul de larg, deoarece
instrumentele informatice de asistare a traductorului, pe care le implic, sunt dintre
cele mai variate. Astfel, ele cuprind verificatoare ortografice i gramaticale, sisteme
de management al terminologiei, dicionare uni- sau multilingve n format electronic
(pe CD sau consultabile on-line), baze de date terminologice uni- sau multilingve (pe
CD sau consultabile pe Internet), instrumente de indexare automat a documentelor
i de regsire a informaiei, concordane (care permit gsirea tuturor ocurenelor unui
cuvnt dat, ntr-un text sau un corpus de texte, mpreun cu contextele lor de
utilizare), memorii de traducere (care memoreaz segmentele dintr-un text scris ntro limb surs mpreun cu traducerea segmentelor respective ntr-o limb int i
reutilizarea acestor traduceri), sistemele de traducere automat.
Aceste instrumente pot fi grupate n trei categorii mari:
a) aplicaii de traducere automat [en: Machine Translation (MT)]
b) sisteme de management al terminologiei [en: Terminology Management
Systems]
c) aplicaii de asistare a traductorului uman [en: Machine Assisted Human
Translation (MAHT)]
Cnd s-a pus problema utilizrii calculatoarelor n procesul de traducere,
primele ncercri care s-au fcut (n anii 60) au fost acelea de a crea programe care
s realizeze traducerea automat a unui text din limba surs n limba int. Desigur,
la vremea respectiv nici echipamentele de calcul, nici sistemele de operare i
limbajele de programare, nici teoriile lingvistice nu erau suficient de dezvoltate pentru
a realiza o aplicaie de asemenea complexitate, astfel nct aceste tentative au
euat. S-a dovedit c sarcina realizrii unor sisteme de traducere automat este mult
prea complex pentru a produce aplicaii eficiente. Din pcate, nici astzi, cnd
exist astfel de sisteme, nu se poate spune c ele rspund pe deplin cerinelor
traductorilor.
De aceea, s-a cutat s se implementeze aplicaii de complexitate mai redus,
dar care s ajute efectiv traductorul s realizeze o traducere de nalt calitate i cu
o eficien maxim. Astfel, s-a ajuns la crearea aplicaiilor de asistare a
traductorului uman, care sunt folosite din ce n ce mai mult de traductori. Acesta

este motivul pentru care n prezentare ne vom referi pe larg la sistemele din aceast
categorie.
2.1 Sisteme de traducere automat
Sistemele de traducere automat sunt aplicaii complexe n care rolul central n
procesul de traducere revine sistemului de calcul. Textul surs este tradus automat
n limba int de ctre sistem.
Procesul de traducere poate fi schiat n felul urmtor:
- Se face o analiz morfo-lexical, sintactic i semantic a textului surs,
obinndu-se o reprezentare intern a fiecrei propoziii sau fraze, de obicei
sub form de arbore sintactic, cu noduri care conin informaii de natur
lexical, sintactic i semantic; acest proces se numete analiz.
- Se face apoi un transfer de la forma de reprezentare intern a textului
surs n forma de reprezentare intern corespunztoare limbii int.
- Ultima etap este realizarea substituiei lexicale, n care se face nlocuirea
(n noua reprezentare intern obinut) a cuvintelor sau expresiilor cu cele
corespunztoare limbii int i generarea textului n limba int; acest
proces este numit generare sau sintez.
Procesul de traducere descris astfel pare simplu, dar n realitate necesit teorii
lingvistice care s permit descrierea gramaticii limbilor, sisteme de calcul cu resurse
suficient de puternice i elaborarea aplicaiilor care s implementeze algoritmii de
analiz, transfer i generare. Pentru realizarea aplicaiilor de traducere automat
trebuie s conlucreze lingviti, informaticieni i matematicieni.
Msura n care este necesar intervenia uman n timpul procesului de
traducere zis automat variaz de la un sistem la altul.
Astfel, exist sisteme (puine, e drept, i care conin multe restricii) care realizeaz
traducere automat complet [en: Fully Automatic Machine Translation], fr nici o
intervenie a traductorului uman. Aceste aplicaii sunt dedicate, de obicei, traducerii
unor texte dintr-un domeniu specializat i foarte bine delimitat, n care lexicul este
mai mult sau mai puin restrns, dar fr ambiguiti, iar construciile sintactice sunt
relativ simple. Un exemplu de aplicaii din aceast categorie sunt sistemele de
traducere automat a buletinelor meteorologice (cum este METEO utilizat de
Canadian Meteorological Office2 pentru traducerea buletinelor meteorologice ntre
cele dou limbi oficiale ale Canadei, engleza i franceza).
Majoritatea sistemelor de traducere automat necesit, ns, intervenia
utilizatorului fie numai nainte i dup traducerea automat, fie i n timpul acesteia.
Aplicaiile de acest gen (care sunt cele mai rspndite) se numesc aplicaii de
traducere automat asistat de utilizator [en: human-aided machine translation).
De obicei, asupra textului n limba surs trebuie efectuat o prelucrare prealabil a
traducerii (o pre-editare) pentru a se asigura consistena lexical i terminologic, n
scopul de a se evita ambiguitile, i pentru a se utiliza acele construcii sintactice
care se preteaz mai bine la prelucrarea automat. Dup obinerea textului tradus
este necesar revizuirea traducerii i post-editarea textului pentru a se obine textul
tradus n limba int. Unele sisteme din aceast categorie necesit intervenia
interactiv a traductorului uman, acestuia cerndu-i-se, n timpul procesului de
traducere, s selecteze un anumit termen sau cuvnt n caz de polisemie, s rezolve
problemele stilistice sau s selecteze, dintre mai multe traduceri posibile ale unei
sintagme sau fraze, pe cea corect.
Exist n momentul de fa sisteme de traducere automat i traducere asistat
de utilizator, unele dintre ele destul de performante: METEO, Systran, PROjectMT,
2

Cf. Dennett 1995

MuST, PeTra i altele. Din pcate, aa cum am mai menionat, ele nu sunt folosite
pe scar foarte larg.
2.2 Aplicaii de management terminologic
n cadrul unui proiect de traducere este absolut necesar gestiunea
terminologiei. Se tie c un termen desemneaz, ntr-o limb dat, un concept dintrun domeniu de cunotine. Termenii fac parte dintr-un limbaj specializat. De aceea,
indiferent de natura textului pe care l traduce, de cte ori ntlnete un termen,
traductorul trebuie s-l trateze ca atare. Mai mult dect att, atunci cnd se traduc
documente cu coninut nrudit, termenii trebuie utilizai cu consecven.
Managementul terminologic n procesul de traducere implic faptul c traductorul
trebuie s consulte dicionare de specialitate, baze de date terminologice i chiar si creeze propriile glosare i baze de date. n sprijinul acestor cerine vin dicionarele
i glosarele n format electronic, pe CD sau consultabile pe Internet, i diferite
instrumente informatice pe care traductorul le are la dispoziie, integrate n
procesoarele de texte sau apelabile ca aplicaii separate.
Trebuie tiut c informaiile dintr-o baz de date terminologic difer de cele
dintr-un dicionar (general sau specializat). O intrare dintr-o baz terminologic
conine informaiile referitoare la un singur concept; pentru fiecare termen se
specific, pe lng informaii gramaticale (clasa lexico-gramatical, genul pentru
substantive etc.), i informaii de natur terminologic: definiia cu surs i,
eventual, not contexte de utilizare, registrul termenului, statutul termenului,
relaiile lui cu termenii care desemneaz concepte super- sau subordonate, informaii
administrative etc.
Un traductor individual i poate crea propriile glosare i terminologii, fie
folosind un sistem general de baze de date (Access sau FoxPro, de exemplu), fie
un sistem dedicat bazelor de date terminologice (de exemplu, MultiTerm). n acest
caz, el i poate defini propria structur a bazei terminologice. ntr-un proiect de
traducere, ns, la care particip mai muli traductori i n cadrul cruia se traduc
mai multe documente, este de dorit ca managementul terminologic s se fac n mod
unitar, iar informaiile terminologice s poat fi mbogite i consultate de toat
echipa. n acest scop trebuie utilizate mijloace informatice de tratare a bazelor de
date terminologice fie elaborate de specialiti informaticieni, fie pachete de programe
dedicate acestui scop (de exemplu, LogiTerm, MultiTerm, Termex).
Trebuie s menionm c n unele sisteme integrate de asistare a traductorilor
exist componente de extragere a termenilor dintr-un corpus [en: term extraction].
Acestea sunt foarte utile celor care se ocup cu gestiunea terminologiei.
Instrumentele din aceast categorie identific i propun ca termeni-candidai
sintagmele ocurente n corpus i ofer mijloace uor de utilizat pentru ca informaiile
terminologice s fie introduse ntr-o baz de date specificat. Utilizatorul decide care
dintre candidai constituie termeni i i poate introduce n baza de date, mpreun cu
informaii utile (definiie, contexte de utilizare, sinonime i forme prescurtate etc.).
Instrumentele din aceast categorie cresc foarte mult eficiena muncii de gestiune
terminologic, mai ales n cazul corpusurilor mari, deoarece prin extragerea asistat
de calculator a termenilor informaiile terminologice pot fi obinute rapid i pot fi puse
la dispoziia echipei de traductori.

2.3 Aplicaii de asistare a traductorului uman


Deoarece, aa cum am artat, traducerea automat nu a reuit s rspund
exigenelor traductorilor, s-au creat aplicaii mai puin sofisticate care s-i asiste pe
acetia pe tot parcursul procesului de traducere.
Aplicaiile cele mai importante din aceast categorie sunt cele care se bazeaz
pe principiul memoriilor de traducere.
n esen, o memorie de traducere este o baz de date format din perechi de
segmente de text; o astfel de pereche este format dintr-o unitate de text n limba
surs i unitatea corespunztoare tradus n limba int. Memoria de traducere este
creat fie de un traductor uman, fie prin aplicaii informatice de aliniere a textelor.
Ulterior, dac se folosete memoria de traducere la traducerea unui document cu
coninut nrudit, pentru toate segmentele identice [exact matching] sau care sunt
foarte apropiate [fuzzy matching]) cu cele gsite n memorie se furnizeaz
traducerea existent n memorie, pe care utilizatorul o poate accepta sau modifica
dup dorin. Un segment poate fi constituit dintr-o propoziie sau fraz, dintr-un
paragraf sau poate fi stabilit de utilizator.
Expert Advisory Group on Language Engineering Standards (EAGLES)
definete memoria de traducere ca fiind o arhiv de texte multilingve care conine
texte (segmentate, aliniate, analizate i clasificate) i care permite memorarea i
regsirea segmentelor de texte multilingve aliniate, conform unor criterii de cutare
variate.
Dou texte aliniate se obin lund segmentele corespunztoare dintr-un text
scris ntr-o limb surs i traducerea acelui text ntr-o limb int:
Surs

int

1. ***********
1. - - - - - - - - - - - - - - - - - - - - 2. ************************
---*****
2. - - - - - - - - - - - - - - - - - - - - 3. ************************
--------------------************************
-----****
3. - - - - - - - - - - - - - - - - - - - - 4. ************************
- - -ntre
- - - - -memorii
- - - - - - - de
- - - traducere
--Atragem
atenia c adesea se face confuzia
i
*****
---------traducerea automat. n general, memoria de traducere se poate obine nregistrnd
4. - - - - - - - - - - - - - - - - - - - - pur i simplu perechi de segmente din textul surs -i- -traducerea
n
- - - - - - - - - corespunztoare
-

limba int, fr a fi necesar analiza lexico-morfologic sau sintactic a nici unui


text.
O memorie de traducere poate fi schiat grafic astfel:
Surs
1. ***********
2. *************
*************
***
3. *************
*************
*************
*************
4. *************
*************
***

Memoria de traducere
1. ********
***
2. ********
********
********
*****
3. ********
********
********
********
********
********
****
4. ********
********
********

1. - - - - - - - - - -----------2. - - - - - - - - - --------------------------------3. - - - - - - - - - ------------------------------------5


4. - - - - - - - - - -------------------

int
1. - - - - - - - - - - - - ----------2. - - - - - - - - - - - - -------------------------- -----3. - - - - - - - - - - - - -----------------------------------4. - - - - - - - - - - - - -------------------

Pe lng perechile de segmente de texte, ntr-o memorie de traducere se


memoreaz i aa-numite atribute interne, cum sunt: data crerii, numele
utilizatorului sau al creatorului, clientul, identificatorul proiectului, domeniul cruia i
aparine documentul etc. Aceste atribute pot fi folosite ulterior la filtrarea segmentelor
traduse sau a grupelor de documente.
De multe ori, estimarea efortului depus pentru realizarea unei traduceri nu este
o sarcin uoar; un sistem bun de memorii de traducere ofer i posibilitatea de a
analiza un text nou, pentru a vedea msura n care conine fragmente repetabile sau
pentru a-l compara cu documente deja traduse i a lua decizia dac s se foloseasc
o memorie de traducere sau nu.
Dup natura textelor pe care le proceseaz, astfel de aplicaii se pot clasifica
n:
a) aplicaii orientate pe texte (sau paragrafe), care prelucreaz documente
create cu editoare de texte (Word, WordPerfect etc.) n format document
sau format text mbogit (Rich Text Format);
b) aplicaii de localizare, care prelucreaz texte scrise ntr-un limbaj cu
marcaje (XML, HTML etc.).
n general, un sistem de memorii de traducere const dintr-un procesor de
texte, o fereastr de afiare a coninutului memoriei de traducere i, opional, dintro aplicaie de gestiune terminologic.
Desigur, memoria de traducere este un instrument util oricrui traductor. Chiar
dac efectueaz o traducere individual, un astfel de sistem i permite s gestioneze
terminologia, s gseasc traducerile fragmentelor de text din textul surs i s
reutilizeze memoria de traducere i baza terminologic pentru lucrri ulterioare.
Sunt ns situaii3 cnd utilizarea memoriilor de traducere crete substanial
eficiena activitii:
a)
modificri ale textului de tradus fcute de client chiar n timpul procesului
de traducere;
b)
revizii ale textului surs fcute de client, care constituie obiectul unui nou
proiect de traducere;
c)
reciclarea unei munci deja efectuate n cazul cnd translatorul
primete spre traducere un text foarte asemntor cu un text deja tradus.
Categoriile de documente care se preteaz la utilizarea memoriilor de
traducere sunt cele care au un coninut repetitiv. n Web 1998 se arat c majoritatea
textelor de tradus aparin uneia din urmtoarele domenii:

Coresponden
Jurnalism/Comunicare
Afaceri/Comer
Marketing
Publicitate
Administraie
Juridic/Legal
tiinific
Tehnic
Cultur
Literatur

unde prin s-au marcat domeniile care se preteaz cel mai bine la utilizarea
memoriilor de traducere. Tipurile de texte pentru care memoriile de traducere cresc
spectaculos eficiena activitii sunt:

Cf. Web 1998

brevete (Juridic/Legal)
contracte (Juridic/Legal, Afaceri/Comer)
manuale de utilizare (Tehnic)
rapoarte (Afaceri/Comer)

De asemenea, utilizarea memoriei de traducere este mai eficient cnd se


lucreaz n echip.
Dintre cele mai cunoscute sisteme de memorii de traducere sunt: Deja Vu
(Atril); MetaTexis; MultiTrans TransCorpora (MultiCorpora); ProMemoria; Sakhr
Computer Aided Translation System; SDLX (SDL International); TransIt (Star);
Translator's WorkBench (Trados); Translation Manager (IBM); TransSearch
(University of Montreal); Trans Suite 2000; WordFast.
3. Concluzii
n momentul de fa traductorii profesioniti sunt pui n faa unor exigene din
ce n ce mai mari. Pentru a rspunde cerinelor de profesionalism n procesul de
traducere, ei sunt pui n situaia de a utiliza toate mijloacele informatice care le pot
veni n ajutor.
Traductorii trebuie s cunoasc, n primul rnd, gama de instrumentele de
asistare a traductorilor (n continu cretere i diversificare), apoi, pentru fiecare
dintre acestea, care sunt situaiile n care utilizarea lor conduce la maxima eficien
i, n consecin, s recurg la acele instrumente care sunt cele mai adevcate
proiectului concret de traducere.

Referine bibliografice
*** The Free Dictionary by Farlex: http://encyclopedia.thefreedictionary.com/
*** Trados Tm 6.5 Training Guide
TRADOS www.Trados.com
Dennett, Gerald 1995 Translation Memory:Concept, products, impact and
prospects, Project Report, MSc ISE Part-Time Year 2, South Bank University,
School of Electrical, Electronic and Information Engineering, London, 1995
Melby, Alan K. & Sue Ellen Wright. 1999. Leveraging Terminological Data for Use
in Conjunction with Lexicographical Resources. (A paper delivered at the
TKE-99 conference). Via Internet: http://www.ttt.org/TKE-99.pdf
Melby, Alan K. 2000 Globalization and the Need for International Language
Standards. Via Internet: http://www.ttt.org/g11n_xml.zip
Webb, Lynn E. 1998 Advantages And Disadvantages Of Translation Memory: A
Cost/Benefit Analysis, Monterey Institute of International Studies, Monterey,
California, 1998-2001, http://www.webbsnet.com/translation/thesis.html

S-ar putea să vă placă și