Sunteți pe pagina 1din 12

Romanoslavica XLJ

!


1


UNIVERSITATEA DIN BUCURE!TI
FACULTATEA DE LIMBI !I LITERATURI STR"INE
ASOCIA#IA SLAVI!TILOR DIN ROMANIA

Catedra de limbi slave Catedra de filologie rus$


ROMANOSLAVICA
XLV


Volumul cuprinde lucr$rile prezentate la sesiunea %tiin&ific$ interna&ional$
,Slavistica romneasc$. Tradi&ii %i perspective, dedicat$ centenarului
na%terii profesorilor I.C. Chi&imia %i Pandele Olteanu
Bucure%ti, 3-5 octombrie 2008

Editura Universit$&ii din Bucure%ti
2009

Romanoslavica XLJ


!

179
CULEGEREA TEXTELOR VECHI SLAVE N FORMAT ELECTRONIC


Sorin PALIGAIntroducere

La nceputul anilor `90 ai secolului trecut am asistat la abandonarea treptat! a
tipograIiei ,clasice Gutenberg, bazat! pe culegerea textelor cu plumb "i adoptarea
Iormatelor electronice ale textelor. Avantajele sunt evidente: textul este ,cules
(respectiv ,introdus) n calculator, i se Iac toate modiIic!rile necesare, apoi este ,adus
n pagin! "i preg!tit pentru tipar. n mod uzual, acum tipograIiile accept! doar Iormate
,gata de tipar sau, Iolosind un termen englez, camera-readv copv.
Consecin#ele sunt evidente: r!spunderea privind acuratea#ea "i corectitudinea
textului revine integral autorului/autorilor, respectiv celor care au n grij! textul, cu tot
ceea ce implic! acest lucru, de la banala eroare de scriere (litere ,s!rite, litere lips!,
neglijen#! n redactare) pn! la erori de paginare, n limba romn! sau n limba str!in!,
dac! e cazul.
n aIara acestor chestiuni generale, o problem! nc! "i mai mare o pun ntre
altele textele slave vechi
1
. De ce? Pentru a r!spunde aceste ntreb!ri, trebuie mai
nti s! clariIic!m unele chestiuni generale ori de detaliu.


Ce este !"#$%&'? Unicode 'i limba romn$

,Democratizarea de dup! anul 1989 a nsemnat, ntre altele, "i ,dreptul de
cetate, respectiv ,dreptul de a Ii Iolosite pe calculator, al unor ,limbi noi, cum ar Ii
limbile vorbite n #!rile Ioste comuniste. Dar nu numai: limbile clasice (greaca veche,
ebraica), limbile moderne (care Iolosesc alIabetul chirilic, dar "i alte limbi ale globului,
cum ar Ii limbile orientale, chineza, japoneza, coreeana, dar "i limbile care se scriu de la
dreapta la stnga, a"a numitele limbi RTL right-to-left cum ar Ii araba "i ebraica) etc.
etc. Aceast! avalan"! de limbi, Iiecare cu speciIicul s!u, a I!cut presiuni asupra

1
. Nu este n orizontul acestui succint articol s! ia n discu#ie problemele ridicate de textele scrise
n alte limbi, precum limbile orientale ori limbile antice ,moarte (akkadiana, sumeriana etc.) Ne
vom opri aici numai acelor chestiuni legate de culegerea textelor vechi slave "i nu de toate
problemele care se pun sau se pot pune n cazul altor limbi.


Romanoslavica XLJ


!

180
produc!torilor de soItware. Dac!, ini#ial, se lua un Iont anume, i se eliminau unele
caractere "i i se ad!ugau altele, de exemplu, caracterele Iolosite n chirilic, pentru a se
ob#ine un Iont rezonabil pentru nevoi curente, curnd aceast! metod! "i-a dovedit
limitele: s-a ajuns la sute "i la mii de variante posibile, cnd Iiecare creator de Iont
punea aleator caracterele necesare unde i se p!rea mai potrivit. Consecin#a era
inevitabil!: au ap!rut sute "i mii de variante posibile, astIel c!, dac! un text chirilic era
scris Iolosind un anume Iont, s!-i spunem Iontul A, el trebuia citit tot Iolosind acel Iont
A. Curnd, autorii n"i"i au r!t!cit Iontul Iolosit ini#ial, astIel c!, la ora actual!, sunt mii
"i mii de pagini indesciIrabile, autorii uitnd s!-"i noteze ce Iont/Ionturi au Iolosit n
urm! cu 15-20 de ani. n Iapt, aceste texte au devenit inutilizabile!
Era "i normal astIel ca Unicode, un consor#iu chemat s! pun! ordine n acest
haos lingvistic, s!-"i impun! treptat regulile:
Iiec!rui caracter i se aloc! un cod numeric sau un cod numeric "i alIabetic;
acest cod trebuie supus discu#iei "i apoi aprob!rii unui grup de speciali"ti;
odat! aprobat, acea codiIicare trebuie urmat! de to#i creatorii de Ionturi.
nu se admit variante graIice ale aceluia"i graIem istoric, acestea Iiind permise
doar ca variante ale Ionturilor, nu ca variante ale unor caractere n cadrul aceluia"i Iont;
cu alte cuvinte, un Iont va con#ine n limitele astIel deIinite un singur caracter astIel
deIinit.
La ora actual!, majoritatea Ionturilor care vin instalate odat! cu sistemele de
operare, indiIerent care sunt acestea (MAC OS, Linux ori Windows), respect! aceste
norme. Este ns! posibil ca un astIel de Iont s! nu cuprind!, spre exemplu, caracterele
necesare scrierii chirilice. Fonturile care cuprind ns! aceste caractere trebuie s! respecte
normele Unicode "i, n unele cazuri, le respect!. La ora la care scriem aceste rnduri,
exist! relativ pu#ine Ionturi care au implementat deja noile norme, dar de"i pu#ine
sunt suIiciente nevoilor curente ale slavi"tilor. Este evident c!, pe m!sura trecerii
timpului, noi "i noi Ionturi vor veni s! completeze lista actual!. Sunt de men#ionat aici
Ionturile create de doi dintre participan#ii la discu#ii, respectiv de Ralph Cleminson
(Marea Britanie), creatorul Iontului Dilyana (cu varianta mai nou! Neon); "i Aleksei
Kriukov, autorul seriei reprezentate de Ionturile Old Standard, Tempora "i Theano
1
.
Nu intr!m n detalii ,istorice, totu"i dorim a nota cteva situa#ii neIire"ti,
pentru a n#elege diIicultatea "i complexitatea problemei. Limba romn! a cunoscut "i ea
anomalii de codiIicare. Cauza principal! a Iost c!, la inceputul anilor 90, Romania nu
avea un standard na!ional privind folosirea caracterelor specifice limbii romane,
respectiv " a i # !, c!rora li se adaug! semnele de punctua#ie speciIice. De"i acestea sunt
Iolosite "i n alte limbi, not!m Iie "i n treac!t c!, n conIormitate cu normele
academice, semnele cit!rii sunt ,citat (nu ,citat'), de"i nc! "i azi, mai ales n
subtitrarea Iilmelor, se ntlnesc Iorme speciIice limbii engleze (de exemplu citat` ori
'citat'). De asemenea, pe atunci, Academia prin lucr!rile de reIerin#! speciIice,

1
Acest Ionturi sunt gratuite "i disponibile spre desc!rcare de pe paginile autorilor.


Romanoslavica XLJ


!

181

ndreptarul ortograIic, DEX etc. nu deIinea clar ce semne diacritice TREBUIE Iolosite
pentru a culege corect un text romnesc. Precizarea a venit Ioarte trziu, abia odat! cu
DOOM 2, la pagina XXVI: ,|...| c!ciula ! desupra lui a. "
1
; circumIlexul ` deasupra lui
a "i i. a "i i; virguli#a sub s "i t. # "i !, cu precizarea din nota 9 la aceea"i pagin!: !$i nu
sedila, care se Iolose"te sub c n alte limbi: . In programele de calculator, #, spre
deosebire de !, apare in mod gre#it cu sedil".
Ar Ii de precizat c! s cu sedil! (s cedilla) apare al!turi de t cu sedil! (t cedilla) n
unele Ionturi, n alte Ionturi lipsind complet "i s cu virgul! dedesubt (s comma below
sau, cum scriu autorii DOOM 2, cu virguli#!) "i t cu virgul! dedesubt. Acest lucru s-a
datorat, cum spuneam, n primul rnd Iaptului c! Romnia nu avea, la nceputul anilor
`90, un standard, iar ulterior deIinirea diacriticelor s-a I!cut conIuz, neclar, iar principala
companie creatoare de soItware, MicrosoIt, a introdus eronat s/t cu sedil! pentru limba
romn!. n Iapt, s cu sedil! este norma pentru limba turc!, iar t cu sedil! nu exist! ca
atare n niciun standard
2
.
n lipsa unor deIini#ii clare, marile companii produc!toare de soItware,
preponderent MicrosoIt "i Apple, ulterior "i tot mai numerosele distribu#ii Linux, au
adoptat (a se citi ,improvizat) norme deduse din documentele accesibile la ora aceea.
De exemplu, naintea clariIic!rilor aduse de ASRO (Asocia#ia romn! de Standardizare)
n anul 2004, nu era clar dac! semnul diacritic de sub literele s "i t era virgula (,) ori
sedila (), era a"adar # "i ! ori $ "i %? De"i detaliul poate p!rea irelevant, cele dou!
caractere Iiind asem!n!toare, n realitate, n sistemul Unicode, au codiIic!ri diIerite:


s cu virgul! dedesubt (s comma below) ", $ U0219 U0218
s cu sedil! (s cedilla) %, & U015F U015E
t cu virgul! #, ' U021B U021A
t cu sedil! (, ) U0163 U01621
De Iapt, n text apare semnul caron, ceh ha&ek ("), nu semnul scurtimii, breve (!), cum deIine"te
textul, dovad! clar! a Iaptului c! autorii s-au lovit de aceea"i problem! a red!rii corecte a
caracterelor n Iormat electronic, chiar n cazul unei limbi care Iolose"te alIabetul latin "i chiar
dac!, Ia#! de alte limbi (ceha, polona, lituaniana etc.), romna are relativ pu#ine semne diacritice.
2
Nu intr!m aici n detalii privind discu#iile interminabile privitoare la deIinirea lui t cu sedil! ca
Iolosit n transcrierea unor semne ebraice. Textul Unicode era ambiguu, se reIerea probabil la
graIemul TZAV, de"i, dup! "tiin#a noastr!, nic!ieri nu este deIinit ca Iiind transcris prin t cu
sedil!.


Romanoslavica XLJ


!


182


Locul lui s/S cu sedil! "i res-
pecttiv locul lui t/T cu sedil!
n cadrul a"a-numitei liste La-
tin Extended A. Codurile alo-
cate secven#iei &%)( sunt res-
pecttiv U015E U015F
U0162 U0163
Locul lui s/S cu virgul! "i res-
pectiv locul lui t/T cu virgul!
n cadrul listei Latin Extended
B. Codurile alocate secven#ei
$"'# sunt respectiv U0218
U0219 U021A U021B.

Din dorin#a de a simpliIica, probabil, inventarul de caractere, la nceputul anilor
`90, MicrosoIt a ales s "i t cu virgul! pentru limba romn! (incorect), n timp ce Apple,

Romanoslavica XLJ


!

183

corect, a ales s "i t cu virgul!. Aceast! anomalie a persistat pn! recent, Iiind corectat!
de compania MicrosoIt abia odat! cu lansarea sistemului de operare Vista, deocamdat!
pu#in r!spndit. Ca atare, Iolosirea limbii romne nc! pune probleme utilizatorilor de
Windows, care v!d ,p!tr!#ele n loc de s/t cu virgul! dedesubt. De"i exist! "i un a"a-zis
update care rezolv! chestiunea n sistemul Windows XP (European Union Bulgarian and
Romanian Update, identiIicabil drept EUUpdate.exe pe site-ul MicrosoIt), acesta este, se
pare, pu#in cunoscut, astIel c! majoritatea utilizatorilor continu! s! aib! probleme. Nici
nu exist! o precupare ,na#ional! n acest sens, majoritatea utilizatorilor preIernd Iie s!
nu Ioloseasc! diacritice (mai ales n po"ta electronic!), Iie s! le Ioloseasc! eronat,
l!snd-se pe seama companiilor pruduc!toare de soItware.
Cum problema Iolosirii corecte a semnelor diacritice n limba romn!, conIorm
normelor academice, este teoretic rezolvat!, nu insist!m asupra altor probleme conexe.
ntrzirea n luarea unor decizii "i-a I!cut sim#it eIectul "i aici.


Unicode 'i alfabetul chirilic

De"i alIabetul chirilic a Iost ntre primele codiIicate de Unicode, lista
caracterelor era ini#ial incomplet!, abia Ioarte recent, n cursul anului 2008, Iiind
corectate unele erori mai vechi "i Iiind completat! lista caracterelor lips!. La nceputul
anilor `90, alIabetul chirilic era ntre primele alIabete nelatine adoptate "i codiIicate de
consor#iul Unicode. S-a pornit, cum era Iiresc, de la caracterele Iolosite n limbile slave
moderne care Iolosesc chirilicul, apoi s-a completat lista cu acele caractere chirilice
Iolosite n limbile neslave vorbite "i Iolosite n diverse republici Ioste sovietice. Ulterior,
li s-a ad!ugat o list! minimal! de ,semne chirilice arhaice (Archaic Cyrillic), adic!
semnele slave vechi.
Lista nu era totu"i complet!. Lipseau, pe de o parte, unele caractere Iolosite n
unele limbi moderne neslave din spa#iul Iost sovietice, dar lipseau "i unele caractere
vechi slave, iar cteva erau deIinite incorect. Ca atare, de"i cu mare ntrziere, n cursul
anilor 2005-2006 s-a ini#iat, sub coordonarea lui Michael Everson
1
, un proces de
revizuire "i de completare a listei de caractere deIinibile ca ,vechi slave ori ,chirilice,
incluznd aici att caractere speciIice textelor medievale, ct "i textelor moderne. 'elul
era ca, n decurs de circa un an, s! se ajung! la consens n ceea ce prive"te lista de
caractere lips! ce trebuie deIinite drept ,chirilice, vechi ori moderne precum "i lista de
caractere ini#ial eronat deIinite ("i, implicit, eronat desenate n diverse Ionturi). Autorul
acestor rnduri a I!cut de asemenea parte din acest colectiv.

1
American de origine, Michael Everson s-a stabilit de mul#i ani n Irlanda, de unde coordoneaz!
ample lucr!ri de implementare a unor standarde IT ce au ca scop principal Iolosirea unor
caractere speciIice limbilor rare.


Romanoslavica XLJ


!


184Prima schi#!, datat! 26 decembrie 2006, ntocmit! de Michael Everson n urma discu#iilor purtate
privind corectarea unor erori "i privind mbog!#irea caracterelor deIinite ori deIinibile drept chiri-
lice (Cyrillic). Se poate vedea lista participan#ilor precum "i rezumatul lucr!rii.


Rezultatele Iinale au Iost puse pe hrtie "i apoi naintate consor#iului Unicode de
Michael Everson. Spre bucuria colectivului de lucru, aproape toate propunerile au Iost
aprobate, inclusiv mult a"teptatele caractere speciIice chirilicului romnesc, nazala n
(graIiat! yn n documentele Unicode): !! " (a"a apare n Ionturile Dilyana "i Neon,
create de Ralph Cleminson), cu unele variante graIice ce ncep s! apar! deja n unele
Ionturi, cum ar Ii cele create de Aleksei Kriukov !!" sau n Everson Mono, creat de
Michael Everson: !!".

Romanoslavica XLJ


!


185
Rezolvarea acestor probleme legate de culegerea textelor slave vechi este
beneIic! "i lumii "tiin#iIice de la noi, deschiznd astIel drumul public!rii n condi#ii
superioare textelor slave vechi, inclusiv prin reeditarea unor lucr!ri azi epuizate.
!Pagina reIeritoare la unele caractere ini#ial lips! "i care au Iost introduse "i deIinite n noua list!


Romanoslavica XLJ


!


186


Pagina reIeritoare la semnele
de punctua#ie
O pagin! din Iorma Iinal!
adoptat! de Consor#iul
Unicode n versiunea 5.


Trebuie precizat c!, n esen#!, mai trebuie rezolvat! o singur! problem! pentru a
se putea redacta relativ u"or "i rapid un text slav vechi: elaborarea unor tastaturi

Romanoslavica XLJ


!


187
(kevboard lavouts) care s! permit! accesarea caracterelor slave vechi. Deocamdat!,
nicio companie produc!toare de soItware, preponderent Apple "i MicrosoIt, nu oIer!
tastaturi care s! acopere aceste nevoi. Pentru glagolitic, autorul acestor rnduri a
publicat, pe paginile sale (vezi reIerin#ele), o tastatur! perIect Iunc#ional! pentru MAC
OS X. Cum timpul nu este prea generos, nu am putut crea "i o variant! pentru Windows,
dar suntem bucuro"i s! mp!rt!"im din experien#a noastr! tuturor celor dornici s! Iac!
acest lucru. Opera#iunea, preciz!m, nu este att diIicil!, din punct de vedere tehnic, ci
mig!loas!. Iat! aici o propunere de tastatur! pentru slava veche "i propunerea de
tastatur! pentru glagolitic. Ultima dintre acestea este, sper!m, Iorma Iinal! "i perIect
utilizabil! pentru editarea oric!rui text glagolitic.O propunere a autorului de tastatur! pentru slava veche, nc! neIinalizat!
Tastatura autorului pentru glagolitic, Iorma Iinal!
Romanoslavica XLJ


!


188
Concluzii

La ora actual!, procesul de deIinire "i de implementare a tuturor caracterelor
Iolosite n textele slave vechi s-a ncheiat. R!mne ns! relativ limitat! lista Ionturilor
disponibile "i, mai ales, lipsa unor tastaturi (kevboard lavouts), absolut necesare pentru a
lucra rapid "i comod cu asemenea texte. Pentru glagolitic, autorul acestor rnduri a
Iinalizat tastatura glagolitic!, Iiind n Iaz! relativ avansat! tastatura pentru ceea ce se
nume"te chirilic. Date Iiind problemele ridicate de un repertoriu relativ mare de
caractere, rezolvarea nu poate Ii rapid!.


Tabula Gratulatoria

Aducem aici calde mul#umiri tuturor celor care, de-a lungul anilor, ne-au
sprijinit n elaborarea unor lucr!ri "i n clariIicarea unor chestiuni de detaliu. Lista ar Ii
prea lung!, citez aici doar cteva nume: Ralph Cleminson, Alex Eulenberg, Michael
Everson, membri ai echipei Apple din Cupertino, CaliIornia.Referin(e

Cleminson, Ralph, http://web.ceu.hu/medstud/ralph.htm; Autor a numeroase studii
privind culegerea textelor slave vechi. Autorul Ionturilor Dilyana "i Neon
Everson, Michael, http://www.evertype.com/; http://evertype.com/mailman/ listinIo/
cyrillicevertype.com. Probleme generale legate de Ionturi, unicode, Ionturi cu repertoriu bogat
pentru culegerea textelor n limbi arhaice "i moderne
Linguistic List, http://linguistlist.org/
Medieval Unicode Font Initiative, http://helmer.aksis.uib.no/muIi/
Paliga, Sorin, Despre Macintosh #i sistemul de operare MAC OS X, Bucure"ti, Meteor
Press, 2008
Paliga, Sorin, http://www.unibuc.ro/ro/cdsorpaligaro. Desc!rcare gratuit! de tastaturi
pentru glagolitic "i limbi vechi italice, discu#ii privind standardele n era IT
SIL International, http://scripts.sil.org/cms/scripts/page.php?siteidnrsi&idinput-
resources
Unicode Consortium, http://www.unicode.org/. Pagini de reIerin#! pentru tot ce nseam-
n! codiIicarea Unicode "i solu#iile adoptate
Vintil!-R!dulescu, Ioana (coordonator), DOOM. Dic!ionarul ortografic, ortoepic #i
morfologic al limbii romane, ed. a II-a rev!zut! "i ad!ugit!, Bucure"ti, Univers Enciclopedic,
2005Romanoslavica XLJ


!


189
Old Church Slavonic Texts in Electronic Format


The paper brieIly presents the current situation with Unicode Consortium, resumes the situation
speciIic to Romanian in the wake oI the recent changes brought by the Romanian Academy and
the implementation oI the Academic norms in the operating systems (Linux, MAC OS,
Windows).
The paper Iocuses on the speciIic problems raised by Old Church Slavonic documents. The
author presents his experience within a quite large group who, in 20062007 put together all the
Iacts and arguments in order to enhance the Unicode Cyrillic characters, and also correct Iormer
errors.
Finally, the author suggests practic ways to set Mediaeval Cyrillic and Glagolitic documents in
electronic Iorm, and exempliIies with some speciIic data.