Sunteți pe pagina 1din 7

Aplicaii informatice de asistare a traductorilor

Sanda Cherata
Universitatea Babe-Bolyai Cluj-Napoca Facultatea de Litere
1. Introducere Rolul traductorilor n societatea modern este n continu cretere. Dac n trecut se ocupau cu precdere cu traduceri literare i de documente legale, n momentul de fa ei sunt confruntai cu sarcini mult mai complexe. n procesul globalizrii la care asistm n prezent, transferurile internaionale (att n ce privete importurile, ct i exporturile) genereaz, pe lng schimbul de produse, procese, tehnologii etc. i schimb de documentaie. Din ce n ce mai mult, produsele vndute ntr-o alt ar dect cea de origine sunt localizate, adic adaptate la specificul rii importatoare; aceasta nu se rezum numai la traducerea i adaptarea documentaiei n limba rii primitoare, ci implic i aspectele culturale i de coninut, adic adaptarea aspectelor non-textuale ale produsului (culori, simboluri, uniti de msur etc.). LISA (The Localization Industries Standard Association) definete localizarea ca fiind procesul de modificare a produselor i/sau serviciilor n scopul de a rspunde diferenelor existente n diferite piee. Un exemplu edificator este localizarea aplicaiilor informatice (sisteme-program, pagini web etc.). Localizarea lor nseamn, pe lng traducerea documentaiei (manuale, ghiduri de utilizare etc.), traducerea interfeei cu utilizatorul n limba rii importatoare (meniuri, casete de dialog, ajutor etc.), adaptarea setului de caractere, a unitilor de msur etc. Dinamica schimburilor care au loc n prezent a generat o adevrat industrie a localizrii. Aceasta cuprinde trei aspecte principale: vnzarea produselor, oferta de servicii de localizare i dezvoltarea instrumentelor care servesc localizrii. Industria localizrii este o parte a ceea ce constituie n momentul de fa industria limbilor. Industria limbilor cuprinde1: a) scrierea documentelor tehnice (prin opoziie cu scrierile literare); b) managementul documentelor (care include utilizarea procesoarelor de texte, indexarea automat, regsirea automat a informaiei etc.); c) managementul terminologiei; d) localizarea (care include traducerea); e) publicarea (care include, pe lng publicarea tradiional pe suport hrtie, i publicarea pe suport electronic i pe Internet). Cele cinci aspecte ale industriei limbilor nu sunt independente, ci se ntreptrund. De exemplu, managementul terminologiei multilingve joac un rol foarte important n documentele domeniilor de specialitate. Dac ntr-o traducere literar varietatea de stil este de dorit, atunci cnd e vorba de un termen dintr-un limbaj specializat, acesta trebuie tradus consecvent cu termenul echivalent corespunztor. Publicarea documentelor implic existena unui sistem de management al documentelor, care, la rndul lui, s fie aplicat n procesul de localizare, astfel nct aceeai terminologie s fie utilizat de la producerea iniial a documentului (n limba surs) n toate traducerile documentului.
1

Cf. Melby 2000

Mai mult dect att, pentru produsele i tehnologiile scoase pe pia apar mbuntiri i modificri (n cazul sistemelor informatice, versiuni noi), iar documentaia aferent trebuie s reflecte aceast dinamic. Rezult c apar documente cu coninut nrudit, care trebuie traduse ntr-un timp ct mai scurt. n aceste situaii, e de dorit ca tot ceea ce a fost tradus pentru o versiune anterioar a unui document s poat fi folosit la traducerea versiunii actualizate; acest lucru se impune nu numai din raiuni de cretere a eficienei muncii traductorului, ci i pentru a asigura consecvena terminologiei din documentele respective. Fiind vorba, deci, de o adevrat industrie a limbilor, se impune ca ea s fie nsoit i de tehnologiile corespunztoare. Au aprut instrumente informatice (sisteme-program complexe) care asist traductorul pe tot parcursul procesului de traducere, astfel nct, n momentul de fa, se vorbete de traducerea asistat de calculator (n englez, Computer-Assisted Translation CAT).

2. Categorii de instrumentele pentru asistarea traductorilor Traducerea asistat de calculator este o procesul n care traductorul uman traduce textele folosind instrumente informatice concepute s-l ajute i s-i faciliteze activitatea. Termenul de traducere asistat de calculator este destul de larg, deoarece instrumentele informatice de asistare a traductorului, pe care le implic, sunt dintre cele mai variate. Astfel, ele cuprind verificatoare ortografice i gramaticale, sisteme de management al terminologiei, dicionare uni- sau multilingve n format electronic (pe CD sau consultabile on-line), baze de date terminologice uni- sau multilingve (pe CD sau consultabile pe Internet), instrumente de indexare automat a documentelor i de regsire a informaiei, concordane (care permit gsirea tuturor ocurenelor unui cuvnt dat, ntr-un text sau un corpus de texte, mpreun cu contextele lor de utilizare), memorii de traducere (care memoreaz segmentele dintr-un text scris ntro limb surs mpreun cu traducerea segmentelor respective ntr-o limb int i reutilizarea acestor traduceri), sistemele de traducere automat. Aceste instrumente pot fi grupate n trei categorii mari: a) aplicaii de traducere automat [en: Machine Translation (MT)] b) sisteme de management al terminologiei [en: Terminology Management Systems] c) aplicaii de asistare a traductorului uman [en: Machine Assisted Human Translation (MAHT)] Cnd s-a pus problema utilizrii calculatoarelor n procesul de traducere, primele ncercri care s-au fcut (n anii 60) au fost acelea de a crea programe care s realizeze traducerea automat a unui text din limba surs n limba int. Desigur, la vremea respectiv nici echipamentele de calcul, nici sistemele de operare i limbajele de programare, nici teoriile lingvistice nu erau suficient de dezvoltate pentru a realiza o aplicaie de asemenea complexitate, astfel nct aceste tentative au euat. S-a dovedit c sarcina realizrii unor sisteme de traducere automat este mult prea complex pentru a produce aplicaii eficiente. Din pcate, nici astzi, cnd exist astfel de sisteme, nu se poate spune c ele rspund pe deplin cerinelor traductorilor. De aceea, s-a cutat s se implementeze aplicaii de complexitate mai redus, dar care s ajute efectiv traductorul s realizeze o traducere de nalt calitate i cu o eficien maxim. Astfel, s-a ajuns la crearea aplicaiilor de asistare a traductorului uman, care sunt folosite din ce n ce mai mult de traductori. Acesta

este motivul pentru care n prezentare ne vom referi pe larg la sistemele din aceast categorie. 2.1 Sisteme de traducere automat Sistemele de traducere automat sunt aplicaii complexe n care rolul central n procesul de traducere revine sistemului de calcul. Textul surs este tradus automat n limba int de ctre sistem. Procesul de traducere poate fi schiat n felul urmtor: - Se face o analiz morfo-lexical, sintactic i semantic a textului surs, obinndu-se o reprezentare intern a fiecrei propoziii sau fraze, de obicei sub form de arbore sintactic, cu noduri care conin informaii de natur lexical, sintactic i semantic; acest proces se numete analiz. - Se face apoi un transfer de la forma de reprezentare intern a textului surs n forma de reprezentare intern corespunztoare limbii int. - Ultima etap este realizarea substituiei lexicale, n care se face nlocuirea (n noua reprezentare intern obinut) a cuvintelor sau expresiilor cu cele corespunztoare limbii int i generarea textului n limba int; acest proces este numit generare sau sintez. Procesul de traducere descris astfel pare simplu, dar n realitate necesit teorii lingvistice care s permit descrierea gramaticii limbilor, sisteme de calcul cu resurse suficient de puternice i elaborarea aplicaiilor care s implementeze algoritmii de analiz, transfer i generare. Pentru realizarea aplicaiilor de traducere automat trebuie s conlucreze lingviti, informaticieni i matematicieni. Msura n care este necesar intervenia uman n timpul procesului de traducere zis automat variaz de la un sistem la altul. Astfel, exist sisteme (puine, e drept, i care conin multe restricii) care realizeaz traducere automat complet [en: Fully Automatic Machine Translation], fr nici o intervenie a traductorului uman. Aceste aplicaii sunt dedicate, de obicei, traducerii unor texte dintr-un domeniu specializat i foarte bine delimitat, n care lexicul este mai mult sau mai puin restrns, dar fr ambiguiti, iar construciile sintactice sunt relativ simple. Un exemplu de aplicaii din aceast categorie sunt sistemele de traducere automat a buletinelor meteorologice (cum este METEO utilizat de Canadian Meteorological Office2 pentru traducerea buletinelor meteorologice ntre cele dou limbi oficiale ale Canadei, engleza i franceza). Majoritatea sistemelor de traducere automat necesit, ns, intervenia utilizatorului fie numai nainte i dup traducerea automat, fie i n timpul acesteia. Aplicaiile de acest gen (care sunt cele mai rspndite) se numesc aplicaii de traducere automat asistat de utilizator [en: human-aided machine translation). De obicei, asupra textului n limba surs trebuie efectuat o prelucrare prealabil a traducerii (o pre-editare) pentru a se asigura consistena lexical i terminologic, n scopul de a se evita ambiguitile, i pentru a se utiliza acele construcii sintactice care se preteaz mai bine la prelucrarea automat. Dup obinerea textului tradus este necesar revizuirea traducerii i post-editarea textului pentru a se obine textul tradus n limba int. Unele sisteme din aceast categorie necesit intervenia interactiv a traductorului uman, acestuia cerndu-i-se, n timpul procesului de traducere, s selecteze un anumit termen sau cuvnt n caz de polisemie, s rezolve problemele stilistice sau s selecteze, dintre mai multe traduceri posibile ale unei sintagme sau fraze, pe cea corect. Exist n momentul de fa sisteme de traducere automat i traducere asistat de utilizator, unele dintre ele destul de performante: METEO, Systran, PROjectMT,
2

Cf. Dennett 1995

MuST, PeTra i altele. Din pcate, aa cum am mai menionat, ele nu sunt folosite pe scar foarte larg. 2.2 Aplicaii de management terminologic n cadrul unui proiect de traducere este absolut necesar gestiunea terminologiei. Se tie c un termen desemneaz, ntr-o limb dat, un concept dintrun domeniu de cunotine. Termenii fac parte dintr-un limbaj specializat. De aceea, indiferent de natura textului pe care l traduce, de cte ori ntlnete un termen, traductorul trebuie s-l trateze ca atare. Mai mult dect att, atunci cnd se traduc documente cu coninut nrudit, termenii trebuie utilizai cu consecven. Managementul terminologic n procesul de traducere implic faptul c traductorul trebuie s consulte dicionare de specialitate, baze de date terminologice i chiar si creeze propriile glosare i baze de date. n sprijinul acestor cerine vin dicionarele i glosarele n format electronic, pe CD sau consultabile pe Internet, i diferite instrumente informatice pe care traductorul le are la dispoziie, integrate n procesoarele de texte sau apelabile ca aplicaii separate. Trebuie tiut c informaiile dintr-o baz de date terminologic difer de cele dintr-un dicionar (general sau specializat). O intrare dintr-o baz terminologic conine informaiile referitoare la un singur concept; pentru fiecare termen se specific, pe lng informaii gramaticale (clasa lexico-gramatical, genul pentru substantive etc.), i informaii de natur terminologic: definiia cu surs i, eventual, not contexte de utilizare, registrul termenului, statutul termenului, relaiile lui cu termenii care desemneaz concepte super- sau subordonate, informaii administrative etc. Un traductor individual i poate crea propriile glosare i terminologii, fie folosind un sistem general de baze de date (Access sau FoxPro, de exemplu), fie un sistem dedicat bazelor de date terminologice (de exemplu, MultiTerm). n acest caz, el i poate defini propria structur a bazei terminologice. ntr-un proiect de traducere, ns, la care particip mai muli traductori i n cadrul cruia se traduc mai multe documente, este de dorit ca managementul terminologic s se fac n mod unitar, iar informaiile terminologice s poat fi mbogite i consultate de toat echipa. n acest scop trebuie utilizate mijloace informatice de tratare a bazelor de date terminologice fie elaborate de specialiti informaticieni, fie pachete de programe dedicate acestui scop (de exemplu, LogiTerm, MultiTerm, Termex). Trebuie s menionm c n unele sisteme integrate de asistare a traductorilor exist componente de extragere a termenilor dintr-un corpus [en: term extraction]. Acestea sunt foarte utile celor care se ocup cu gestiunea terminologiei. Instrumentele din aceast categorie identific i propun ca termeni-candidai sintagmele ocurente n corpus i ofer mijloace uor de utilizat pentru ca informaiile terminologice s fie introduse ntr-o baz de date specificat. Utilizatorul decide care dintre candidai constituie termeni i i poate introduce n baza de date, mpreun cu informaii utile (definiie, contexte de utilizare, sinonime i forme prescurtate etc.). Instrumentele din aceast categorie cresc foarte mult eficiena muncii de gestiune terminologic, mai ales n cazul corpusurilor mari, deoarece prin extragerea asistat de calculator a termenilor informaiile terminologice pot fi obinute rapid i pot fi puse la dispoziia echipei de traductori.

2.3 Aplicaii de asistare a traductorului uman Deoarece, aa cum am artat, traducerea automat nu a reuit s rspund exigenelor traductorilor, s-au creat aplicaii mai puin sofisticate care s-i asiste pe acetia pe tot parcursul procesului de traducere. Aplicaiile cele mai importante din aceast categorie sunt cele care se bazeaz pe principiul memoriilor de traducere. n esen, o memorie de traducere este o baz de date format din perechi de segmente de text; o astfel de pereche este format dintr-o unitate de text n limba surs i unitatea corespunztoare tradus n limba int. Memoria de traducere este creat fie de un traductor uman, fie prin aplicaii informatice de aliniere a textelor. Ulterior, dac se folosete memoria de traducere la traducerea unui document cu coninut nrudit, pentru toate segmentele identice [exact matching] sau care sunt foarte apropiate [fuzzy matching]) cu cele gsite n memorie se furnizeaz traducerea existent n memorie, pe care utilizatorul o poate accepta sau modifica dup dorin. Un segment poate fi constituit dintr-o propoziie sau fraz, dintr-un paragraf sau poate fi stabilit de utilizator. Expert Advisory Group on Language Engineering Standards (EAGLES) definete memoria de traducere ca fiind o arhiv de texte multilingve care conine texte (segmentate, aliniate, analizate i clasificate) i care permite memorarea i regsirea segmentelor de texte multilingve aliniate, conform unor criterii de cutare variate. Dou texte aliniate se obin lund segmentele corespunztoare dintr-un text scris ntr-o limb surs i traducerea acelui text ntr-o limb int:
Surs int

1. *********** 1. - - - - - - - - - - - - - - - - - - - - 2. ************************ ---***** 2. - - - - - - - - - - - - - - - - - - - - 3. ************************ --------------------************************ -----**** 3. - - - - - - - - - - - - - - - - - - - - 4. ************************ - - -ntre ----- - - - - - - de - - - traducere --Atragem atenia c adesea se face confuzia memorii i ***** ---------traducerea automat. n general, memoria de traducere se poate obine nregistrnd 4. - - - - - - - - - - - - - - - - - - - - pur i simplu perechi de segmente din textul surs --i -traducerea toare n - - - - - - - - - corespunz -

limba int, fr a fi necesar analiza lexico-morfologic sau sintactic a nici unui text. O memorie de traducere poate fi schiat grafic astfel:
Surs 1. *********** 2. ************* ************* *** 3. ************* ************* ************* ************* 4. ************* ************* *** Memoria de traducere 1. ******** *** 2. ******** ******** ******** ***** 3. ******** ******** ******** ******** ******** ******** **** 4. ******** ******** ******** 1. - - - - - - - - - -----------2. - - - - - - - - - --------------------------------3. - - - - - - - - - ------------------------------------5 4. - - - - - - - - - ------------------int 1. - - - - - - - - - - - - ----------2. - - - - - - - - - - - - -------------------------- -----3. - - - - - - - - - - - - -----------------------------------4. - - - - - - - - - - - - -------------------

Pe lng perechile de segmente de texte, ntr-o memorie de traducere se memoreaz i aa-numite atribute interne, cum sunt: data crerii, numele utilizatorului sau al creatorului, clientul, identificatorul proiectului, domeniul cruia i aparine documentul etc. Aceste atribute pot fi folosite ulterior la filtrarea segmentelor traduse sau a grupelor de documente. De multe ori, estimarea efortului depus pentru realizarea unei traduceri nu este o sarcin uoar; un sistem bun de memorii de traducere ofer i posibilitatea de a analiza un text nou, pentru a vedea msura n care conine fragmente repetabile sau pentru a-l compara cu documente deja traduse i a lua decizia dac s se foloseasc o memorie de traducere sau nu. Dup natura textelor pe care le proceseaz, astfel de aplicaii se pot clasifica n: a) aplicaii orientate pe texte (sau paragrafe), care prelucreaz documente create cu editoare de texte (Word, WordPerfect etc.) n format document sau format text mbogit (Rich Text Format); b) aplicaii de localizare, care prelucreaz texte scrise ntr-un limbaj cu marcaje (XML, HTML etc.). n general, un sistem de memorii de traducere const dintr-un procesor de texte, o fereastr de afiare a coninutului memoriei de traducere i, opional, dintro aplicaie de gestiune terminologic. Desigur, memoria de traducere este un instrument util oricrui traductor. Chiar dac efectueaz o traducere individual, un astfel de sistem i permite s gestioneze terminologia, s gseasc traducerile fragmentelor de text din textul surs i s reutilizeze memoria de traducere i baza terminologic pentru lucrri ulterioare. Sunt ns situaii3 cnd utilizarea memoriilor de traducere crete substanial eficiena activitii: a) modificri ale textului de tradus fcute de client chiar n timpul procesului de traducere; b) revizii ale textului surs fcute de client, care constituie obiectul unui nou proiect de traducere; c) reciclarea unei munci deja efectuate n cazul cnd translatorul primete spre traducere un text foarte asemntor cu un text deja tradus. Categoriile de documente care se preteaz la utilizarea memoriilor de traducere sunt cele care au un coninut repetitiv. n Web 1998 se arat c majoritatea textelor de tradus aparin uneia din urmtoarele domenii: Coresponden Jurnalism/Comunicare Afaceri/Comer Marketing Publicitate Administraie Juridic/Legal tiinific Tehnic Cultur Literatur

unde prin s-au marcat domeniile care se preteaz cel mai bine la utilizarea memoriilor de traducere. Tipurile de texte pentru care memoriile de traducere cresc spectaculos eficiena activitii sunt:

Cf. Web 1998

brevete (Juridic/Legal) contracte (Juridic/Legal, Afaceri/Comer) manuale de utilizare (Tehnic) rapoarte (Afaceri/Comer)

De asemenea, utilizarea memoriei de traducere este mai eficient cnd se lucreaz n echip. Dintre cele mai cunoscute sisteme de memorii de traducere sunt: Deja Vu (Atril); MetaTexis; MultiTrans TransCorpora (MultiCorpora); ProMemoria; Sakhr Computer Aided Translation System; SDLX (SDL International); TransIt (Star); Translator's WorkBench (Trados); Translation Manager (IBM); TransSearch (University of Montreal); Trans Suite 2000; WordFast. 3. Concluzii n momentul de fa traductorii profesioniti sunt pui n faa unor exigene din ce n ce mai mari. Pentru a rspunde cerinelor de profesionalism n procesul de traducere, ei sunt pui n situaia de a utiliza toate mijloacele informatice care le pot veni n ajutor. Traductorii trebuie s cunoasc, n primul rnd, gama de instrumentele de asistare a traductorilor (n continu cretere i diversificare), apoi, pentru fiecare dintre acestea, care sunt situaiile n care utilizarea lor conduce la maxima eficien i, n consecin, s recurg la acele instrumente care sunt cele mai adevcate proiectului concret de traducere.

Referine bibliografice *** The Free Dictionary by Farlex: http://encyclopedia.thefreedictionary.com/ *** Trados Tm 6.5 Training Guide TRADOS www.Trados.com Dennett, Gerald 1995 Translation Memory:Concept, products, impact and prospects, Project Report, MSc ISE Part-Time Year 2, South Bank University, School of Electrical, Electronic and Information Engineering, London, 1995 Melby, Alan K. & Sue Ellen Wright. 1999. Leveraging Terminological Data for Use in Conjunction with Lexicographical Resources. (A paper delivered at the TKE-99 conference). Via Internet: http://www.ttt.org/TKE-99.pdf Melby, Alan K. 2000 Globalization and the Need for International Language Standards. Via Internet: http://www.ttt.org/g11n_xml.zip Webb, Lynn E. 1998 Advantages And Disadvantages Of Translation Memory: A Cost/Benefit Analysis, Monterey Institute of International Studies, Monterey, California, 1998-2001, http://www.webbsnet.com/translation/thesis.html

S-ar putea să vă placă și