Sunteți pe pagina 1din 42

ROMÂNIA

MINISTERUL EDUCAŢIEI, CERCETĂRII ŞI INOVĂRII


UNIVERSITATEA ―DUNĂREA DE JOS‖ din GALAŢI
Str. Domnească Nr.47 Tel: (+40) 36 - 414112/3/4; 413602
800008 GALAŢI ROMÂNIA Fax: (+40) 36 - 461353; 460904; 460426

SECŢIUNEA 1

RAPORTUL ŞTIINŢIFIC ŞI TEHNIC


(RST)

la contractul cu tema

Sistem integrat pentru indexarea şi partajarea on-line a


documentelor tehnice digitizate
- SIPTEH -

ETAPA DE EXECUŢIE NR. II an 2009

CU TITLUL:

“ Elaborarea soluţiei tehnice a sistemului integrat”

Director proiect
Prof.dr.ing. Mînzu Viorel

Galaţi-2009
CUPRINS-ETAPA II
“ Elaborarea soluţiei tehnice a sistemului integrat”
Obiective generale 3
Obiective specifice etapei II 3
Rezumat 4
DESCRIEREA ŞTIINŢIFICĂ ŞI TEHNICĂ 6
-DST-
1. Introducere 6
Activitatea II.1 11
Analiza şi elaborarea structurilor de indexare şi regăsire a informaţiilor digitizate
A.II.1. Realizarea algoritmului de indexare a documentelor şi regăsire rapidă a 11
informaţiei într-un sistem integrat
11
A.II.1.1. Particularităţi ale depozitelor de informaţii digitizate. Cerinţe impuse proceselor de
culegere, indexare, stocare şi regăsire a informaţiei digitizate
A.II.1.2. Scheme structurale (organigrame) utilizate pentru indexarea documentelor şi 56
regăsirea rapidă a informaţiei într-un sistem integrat
A.II.1.3. Analiza comparativă a schemelor structurale. Definirea algoritmului adecvat 60
aplicaţiei particulare din cadrul proiectului
Activitatea II.2 84
Elaborarea soluţiilor optime pentru realizarea sistemelor autonome de indexare şi
stocare a documentelor digitizate şi a sistemului central de procesare în paralel
A.II.2. Analiza comparativă a sistemelor integrate de indexare, stocare şi regăsire a 84
documentelor digitizate. Elaborarea soluţiei optime
A.II.2.1. Particularităţi arhitecturale ale sistemelor integrate de procesare a informaţiilor 84
digitizate
A.II.2.2. Analiza comparativă a sistemelor integrate de procesare a informaţiilor digitizate – 131
pentru diferite arhitecturi – şi precizarea soluţiilor viabile pentru aplicaţia particulară din
cadrul proiectului
A.II.2.3. Elaborarea soluţiei optime – din punct de vedere tehnic şi economic – pentru 135
aplicaţia particulară din cadrul proiectului. Rezolvarea unor probleme specifice
sistemului
2. Concluzii finale 167
Activitatea II.3 169
Stabilirea specificaţiei echipamentelor tehnice necesare realizării sistemului integrat
propus. Elaborarea caietului de sarcini

2
OBIECTIV GENERAL
Subordonând activităţile etapei II a proiectului – în primul rând – obiectivelor generale –
Og 1 – „Realizarea unui sistem cu grad ridicat de integrare necesar pre-indexării, indexării,
stocării şi regăsirii informaţiei on-line” – respectiv, Og 2 – „Crearea unei reţele de depozite
instituţionale de documente digitizate şi a unui depozit central de informaţie indexată care să
permită regăsirea rapidă din orice punct de acces” – căutarea s-a axat pe definirea criteriilor pe
care trebuie să le îndeplinească sistemul integrat de procesare a informaţiilor, pe vizualizarea
algoritmilor ce pot asigura implementarea unui astfel de sistem, pe alegerea – în urma unor
analize comparative – a soluţiei optime de realizare a depozitului digital atât la parteneri (sisteme
autonome) cât şi la coordonator (sistemul integrat). Scopul final al căutării este de atingere al Og
2, respectiv de creare a unui depozit central de informaţie digitizată – de natură tehnico-ştiinţifică
– în cadrul proiectului, pentru consorţiul angrenat în materializarea acestei idei, depozit care să
se constituie într-un nucleu pentru dezvoltări viitoare pe plan naţional, culminând cu realizarea
unui depozit naţional de informaţie digitizată. Materializarea acestei idei reclamă – aşa cum a
rezultat la finalul primei etape – crearea unei sinergii, atât în cadrul sistemului informatic
integrat cât şi la nivel social, între membrii comunităţilor academice ale universităţilor partenere
din cadrul consorţiului. Într-o primă etapă, această sinergie trebuie să se manifeste la nivelul
specialiştilor din cadrul bibliotecilor universitare ale membrilor consorţiului.

OBIECTIVE SPECIFICE ALE ETAPEI


Etapa a II-a a proiectului SIPTEH şi-a propus să atingă două din obiectivele specifice ale
acestuia: Os 2 – „Optimizarea sistemelor autonome de pre-indexare, indexare şi stocarea a
informaţiei‖, respectiv Os 3 „Analiza şi sinteza structurilor de preindexare‖. Un loc aparte în
cadrul prezentului proiect îl ocupă Os 2 – „Optimizarea sistemelor autonome de pre-indexare,
indexare şi stocare a informaţiei‖ pentru a cărui atingere etapa a II-a defineşte algoritmii
specifici de implementare a unui astfel de sistem integrat şi stabileşte, totodată, arhitecturile
particulare care se pretează – unei implementări rapide, simple şi eficiente - în condiţiile
specifice din România. Scopul final, ce defineşte specificitatea acestei etape a proiectului, este
reprezentat, tocmai, de găsire – pe baza studiului implementărilor existente, la ora actuală, în
lume şi a cercetărilor proprii - a soluţiei tehnice specifice condiţiilor particulare din România -
de materializare a unui sistem integrat de procesare a informaţiilor digitizate.

3
A. Principalele probleme abordate şi soluţiile găsite

REZUMAT

Etapa a II - a a proiectului „Sistem integrat pentru indexarea şi partajarea on-line a


documentelor tehnice digitizate – SIPTEH‖ a abordat trei clase de activităţi fără materializarea
cărora nu este posibilă implementarea unui depozit instituţional (IR): realizarea unui algoritm de
indexare a documentelor digitizate şi regăsire rapidă a informaţiei în cadrul sistemului integrat;
precizarea arhitecturilor particulare de dezvoltare a unor astfel de sisteme integrate de procesare
a documentelor digitizate, cu scopul declarat de găsire a soluţiei optime (un optim global care să
permită sistemului integrat o funcţionare stabilă, armonioasă şi economică, în condiţiile
existenţei unui optim funcţional la nivelul fiecărui subsistem component); stabilirea, după fixarea
arhitecturii optime a specificaţiei tehnice a echipamentelor cu ajutorul cărora să se poată realiza
efectiv sistemul integrat ce constituie ţelul major al proiectului.
Pentru atingerea obiectivelor generale şi specifice ale etapei, întreaga căutare – a
principiilor şi modelelor - a fost organizată sub forma unui amplu studiu comparativ între
implementările existente pe plan european şi mondial, la nivelul bibliotecilor digitale - în general
- şi a depozitelor instituţionale (IR), în particular.
Căutarea soluţiilor şi, totodată, elementele pe baza cărora să se poată efectua analiza
comparativă şi un posibil studiu critic, a demarat cu trecerea în revistă a particularităţilor
funcţionale şi de performanţă ale depozitelor de informaţii digitizate. Vizualizarea acestor
particularităţi are un dublu scop: pe de o parte fixarea unor soluţii utilizate – oriunde pe plan
mondial – dar în afara României, respectiv, fixarea nevoilor proprii utilizatorilor din România
(ce are, totuşi, condiţii specifice, de cultură şi sociale), cu scopul, în subsidiar, a definirii
cerinţelor reclamate (pe baza nevoilor identificate) acestor sisteme la nivelul proceselor de
culegere, indexare, stocare şi regăsire a informaţiei digitizate.
Odată identificate nevoile şi stabilite cerinţele fundamentale ale sistemelor integrate de
procesare a informaţiilor digitizate s-a trecut la definirea unor scheme logice (organigrame) pe
baza cărora să se poată realiza ulterior depozitul instituţional (IR) şi, bineînţeles, toate
subsistemele ce vor ajuta la funcţionarea stabilă a acestuia. Scopul final al primei activităţi a
etapei a II-a l-a reprezentat definirea algoritmului adecvat aplicaţiei particulare din cadrul
proiectului. Acest lucru s-a realizat în urma unei ample analize comparative (prin studii de caz
efectuate atât pentru sisteme performante, existente pe plan mondial, cât şi pentru sisteme de mai
mică amploare şi performanţe, apărute, deja, în România) a logicii de implementare a unor astfel
de aplicaţii.
Un loc aparte îl ocupă, în continuare, prezentarea particularităţilor arhitecturale ale
sistemelor integrate de procesare a informaţiilor digitizate. Vizualizarea arhitecturilor ce permit
implementarea schemelor logice – definite în cadrul primei activităţi – a reclamat demararea
unui nou maraton pentru compararea structurilor hardware - în primul rând – şi a platformelor
software – în al doilea rând – cu cea mai largă utilizare pe plan mondial. Prin introducerea
conceptelor de „Open Source‖ şi „Open Acces‖, limita stadiului actual, în acest subdomeniu –
din largul domeniu al Tehnologiei informaţiei – este într-o continuă mişcare (cu o dinamică
deosebită). Pentru compararea – atât a structurilor hardware cât şi a platformelor software – s-au
trecut în revistă două nivele de integrare: o integrare la scară mare, reprezentată de
implementarea bibliotecilor digitale, respectiv, o integrare la scară mică, reprezentată de
realizarea depozitelor digitale (ce constituie „inima‖ unei biblioteci digitale moderne). Plecând
de la ideea, în ceea ce priveşte depozitele digitale, că acestea nu sunt, în ultimă instanţă, decât
uriaşe baze de date, analiza comparativă (desfăşurată special, în cadrul celei de-a doua

4
activităţi) – pentru acest nivel de integrare - s-a axat pe vizualizarea particularităţilor
sistemelor de gestiune a bazelor de date (SGBD-uri). Obiectivele principale, ale acestor analize
comparative, l-au constituit atât găsirea unei arhitecturi adecvate (structuri hardware) – pentru
aplicaţia particulară din proiect – cât şi alegerea unei platforme software care să permită
satisfacerea cerinţelor impuse, deja, pe baza de chestionar (de identificare a nevoilor
utilizatorilor) acestor sisteme integrate de procesare a informaţiilor digitizate.
Din multitudinea de arhitecturi posibile, alegerea – pentru modul particular de
implementare - s-a oprit asupra a două dintre acestea. Caracteristica principală a sistemului ce
trebuie implementat o constituie „diversitatea în unitate‖. Datorită integrării unor sisteme
autonome într-un mare sistem interregional, arhitectura este specifică unor sisteme distribuite
(una dintre soluţii). Pe de altă parte integratorul de sisteme distribuite trebuie să ofere o
localizare spaţială mult mai restrânsă. Asfel încât arhitectura distribuită trebuie să se regăsească
într-un concept de unitate spaţială. Ieşirea dintr-o astfel de dilemă s-a realizat, în cadrul
proiectului prin propunerea unei arhitecturi noi, biomimetice, generată prin utilizarea
principiilor teoriei constructale, o arhitectură ce respectă conceptul „diversitate în unitate”,
prin realizarea unui optim global (soluţia a doua, aleasă, de altfel, pentru implementare).
Scopul final al întregului studiu – din cea de-a doua activitate – l-a constituit elaborarea
soluţiei optime a sistemului propus pentru implementare. Arhitectura biomimetică constituie o
astfel de soluţie optimă (optim global) care asigură performanţe tehnice, eficienţă economică,
impact redus asupra mediului etc..
Optimul global al sistemului integrat reclamă şi optimizarea subsistemelor componente
(sistemelor autonome de procesare a informaţiilor digitizate, aflate la parteneri). Arhitectura
propusă, în cadrul proiectului rezolvă şi acest aspect. Totuşi, multiplele particularităţile
funcţionale ale subsistemelor adiacente depozitului instituţional (IR) – particularităţi legate atât
de procesele de indexare cât şi de procesele de regăsire a informaţiei digitizate de către utilizatori
– a reclamat o abordare distinctă, în cadrul etapei, a acestei problematici specifice. S-au abordat,
astfel, atât metodele specifice de indexare a informaţiei cât, mai ales, multitudinea de interfeţe
ce permit interacţiunea entităţilor creator-utilizator de informaţie digitizată cu depozitul
instituţional (IR).
În finalul raportului, dispunând de majoritatea elementelor necesare, s-a abordat
problematica specificaţiei tehnice a echipamentelor necesare implementării soluţiei optime
propuse (activitatea a treia din această etapă). Concret, această activitate s-a finalizat prin
elaborarea caietelor de sarcini – de fiecare membru al consorţiului – caiete ce sunt prezentate ca
anexe la RST-ul etapei a II –a a proiectului „Sistem integrat pentru indexarea şi partajarea on-
line a documentelor tehnice digitizate – SIPTEH‖.
Pe baza tuturor analizelor comparative efectuate şi a soluţiilor propuse s-au definit în
subcapitolul de „Concluzii finale‖ - ca un corolar - învăţămintele desprinse în urma unui astfel
de studiu. O parte din aceste învăţăminte au fost propuse drept căi de urmat, în viitorul
apropiat, căi ce vor permite încheierea, cu bine, a proiectului şi, cu siguranţă, vor genera noi
deschideri.

5
B. Principalele rezultate obţinute în cadrul etapei

Analiza şi elaborarea structurilor de indexare şi regăsire a


informaţiilor digitizate
A.II.1. Realizarea algoritmului de indexare a documentelor şi regăsire rapidă a
informaţiei într-un sistem integrat

A.II.1.1. Particularităţi ale depozitelor de informaţii digitizate. Cerinţe impuse proceselor


de culegere, indexare, stocare şi regăsire a informaţiei digitizate

Cel mai important aspect, în cadrul acestei activităţi, l-a constituit stabilirea cerinţelor
impuse proceselor de culegere, indexare, stocare şi regăsire a informaţiei digitizate. Această
acţiune a fost pusă în undă prin realizarea unui chestionar, adresat întregii comunităţi academice
– la nivelul universităţilor partenere în cadrul consorţiului de implementare a proiectului – pe
baza căruia s-au putut defini cele mai importante cerinţe.
La nivelul coordonatorului, chestionarul a cuprins următorii paşi:

a) Chestionar privind definirea unui model de serviciu de depozit digital:


Care este misiunea serviciului?
 Creşterea impactului asupra cercetării academice;
 Creşterea vizibilităţii/prestigiului instituţiei;
 Crearea unui rol de conducere la nivelul instituţiei pentru bibliotecă;
 Indicarea randamentului la nivelul cercetării universităţii;
 Organizarea costurilor legate de tehnologia informaţiei de la nivelul instituţiei;
 Captarea înregistrării instituţionale;
 Furnizează servicii vitale comunităţii academice;
 Ajută bibliotecile să întâlnească provocările realităţii digitale;
 Găzduieşte colecţiile digitale;
 Administrează materiale de învăţare;
 Încurajează accesul deschis;
 Altele.
Ce tipuri de conţinut aţi accepta?
 Publicat, literatură ştiinţifică;
 Pre-tipărituri;
 Seturi de date;
 Materiale de cercetare;
 Materiale de învăţare;
 Înregistrări instituţionale;
 Teze;
 Lucrări ale conferinţelor;
 Reviste electronice;
 Altele.
Cine sunt utilizatorii?
 profesorii;
 personalul bibliotecii;
 studenţii;
6
 administratorii;
 cercetătorii interni;
 cercetătorii externi;
 alţii.
Care sunt părţile interesate?
 profesorii;
 personalul bibliotecii;
 studenţii;
 administratorii;
 cercetătorii interni;
 cercetătorii externi;
 alţii.
Ce servicii aţi oferi dacă aţi avea resurse nelimitate?
...................................................................................
Ce îţi permiţi să oferi?
...................................................................................
Ai plăti pentru acel serviciu?
...................................................................................
Care responsabilităţi vor fi exercitate de bibliotecă în raport cu conţinutul comunităţii?
...................................................................................
Care sunt priorităţile cele mai importanţe ale serviciului?
...................................................................................
Care sunt priorităţile programate pe termen scurt şi cele pe termen lung?
...................................................................................
Concluzii suplimentare relevante pentru instituţia ta:
...................................................................................

Desigur că nevoile comunităţii academice vor fi definitorii. De aceea este necesară o


imaginea detaliată a practicilor curente ale profesorilor şi care sunt aşteptările în legătură cu
publicarea şi distribuirea cercetării lor.

Chestionar privind evaluarea nevoilor utilizatorilor:


La ce facultate din universitate eşti angajat?

De cât timp eşti la universitate?

Eşti pe post de profesor?

Cât de importante sunt pentru tine următoarele afirmaţii legate de avantajele unui depozit digital
: ―Un depozit digital ar fi un instrument valoros dacă...‖
 ar face ca versiunile pre-tipărite ale cercetării mele să fie valabile audienţei din toată
lumea;
 ar face ca cercetarea mea să fie valabilă într-un timp mai rapid decât procesul de
publicare tradiţional;
 ar face valabile tipuri de materiale care nu erau accesibile prin procesul tradiţional de
publicare, acest lucru incluzând seturi de date şi formate bogate pe diverse suporturi cum
ar fi: audio, video, imagini grafice;
 ar face ca cercetarea mea să fie accesibilă cu un minimum de efort din partea mea şi fără
să întreţin o pagină web proprie;
 ar permite prezervarea pe termen lung a materialelelor digitale de cercetare proprii;

7
 ar face pentru oameni să fie mai uşor să-mi caute şi să-mi localizeze munca;
 mi-ar permite să caut cele mai noi descoperiri ale colegilor din universitate;
 ar prezerva cercetarea din universitate într-un loc sigur şi central.
Ce formate digitale foloseşti pentru a crea materialele tale de cercetare, materialele pentru
conferinţe sau comunicarea altor materiale şcolare?
 Formate de date;
 Coduri sursă;
 Formate binare;
 Formate Postscript;
 Formate video;
 Formate imagini grafice;
 Formate audio;
 Formate text;
 Formate descriere pagină;
 Formate compatibile Microsoft Office;
 Altele.

Ce tip de formate ţi-ar plăcea să depui într-un depozit digital?


 Formate de date;
 Coduri sursă;
 Formate binare;
 Formate Postscript;
 Formate video;
 Formate imagini grafice;
 Formate audio;
 Formate text;
 Formate descriere pagină;
 Formate compatibile Microsoft Office;
 Altele.

Dacă ai distribui articole pretipărite, cum ai face-o?


 le-aş afişa pe pagina Internet personală;
 le-aş afişa pe pagina Internet a departamentului meu;
 le-aş afişa pe o pagină Internet pentru pretipărituri specifică unei discipline;
 le-aş transmite prin e-mail;
 aş transmite copii prin poştă;
 altele: .............

Câte articole ştiinţifice, lucrări ale conferinţelor, seturi de date sau alte variante de comunicare
ştiinţifică publici anual ca autor sau coautor?
1. 0-1/an;
2. 2-4/an;
3. 5-7/an;
4. 8-10/an;
5. mai multe de 10/an.

Care dintre metodele tipice de depunere foloseşti pentru publicarea unui articol sau alt tip de
material? (Selectează până la 3 dintre cele mai obişnuite cerinţe pe care le ai.)
 Cedez drepturile de copyright asupra tuturor materialelor depuse editurii;
 Plătesc o sumă mică pentru depunerea materialelor;
 Mi se solicită să plătesc/pagină;
 Nici un articol sau orice parte esenţială a acestuia, tabele sau figuri nu pot fi publicate sau

8
depuse în altă parte înainte de a fi depuse la editură;
 Pretipăriturile pot fi afişate pe servere dedicate pentru acest lucru, dacă serverul este
semnalat editorului după depunerea lucrării sau cu alte mici restricţii;
 Păstrez dreptul de a afişa lucrările mele pe Internet;
 Păstrez dreptul de a folosi materialele publicate la cursurile pe care le predau;
 Nu mă angajez în mod obişnuit la procese de depunere, aşa că nu sunt familiar cu aceste
cerinţe;
 Altele.

În general, cât eşti de interesat în folosirea unui depozit digital dacă devine accesibil la
universitate?
 Foarte interesat;
 Cât de cât interesat;
 Nici interesat, dar nici dezinteresat;
 Nu prea interesat;
 Deloc interesat.

Ceea ce mă îngrijorează în legătura cu depunerea într-un depozit digital include: (Selectează


trei!)
 Mă îngrijorează că ar putea constitui modalitatea de publicare prioritară şi m-ar împiedica
să public lucrările mele în reviste;
 Ezit să depun lucrările mele într-un depozit digital deoarece nu are o politică categorică
de control sau alt proces de control al calităţii;
 Prefer ca doar lucrările publicate în mod oficial să fie valabile pentru utilizarea de către
public;
 Ezit să cedez universităţii drepturile de distribuire pentru lucrările mele ştiinţifice;
 Aş fi îngrijorat de riscul legat de noutatea adusă de ideile mele;
 Sunt îngrijorat că lucrările depuse în depozitul digital nu ar avea valoare pentru a fi citate
şi nu ar conta pentru ascensiunea mea profesională;
 Nu mă simt în siguranţă folosind resursele electronice cum ar fi: procesoare word,
procesoare Excel, Internet sau e-mail;
 Depun deja materiale la un server ce gestionează pretipărituri;
 Altele.

Biblioteca universităţii ia în calcul extinderea serviciului de bază al unui depozit digital


incluzând unele servicii personale şi consultative. Vă rog să indicaţi interesul dvs. pentru
folosirea unuia din următoarele servicii:

Servicii de informare personalizate  Nu ar folosi


 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Servicii de notificare personalizate  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Servicii de publicare  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi

9
 Probabil ar folosi
 Categoric nu folosesc
Servicii de conversie digitală  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Servicii de reformatare  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Consultanţa în vederea reformatării  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Servicii de administrare a colecţiei  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Consultanţa metadate  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Servicii metadate  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc
Servicii import pe loturi  Nu ar folosi
 Probabil nu ar folosi
 Ar putea sau nu folosi
 Probabil ar folosi
 Categoric nu folosesc

Cine din departamentul tău ia în mod obişnuit decizii de achiziţionare a unor servicii ca cele
indicate în lista de mai sus?
 Fiecare profesor;
 Şeful de laborator, centru sau departament;
 Şeful administrativ de departament;
 Altul.

Cum intri în posesia celei mai mari părţi din informaţiile despre planurile sau iniţiativele din
universitate?
 Buletinele informative ale universităţii;
 Buletinele informative ale studenţilor;

10
 Pagina de Internet a universităţii;
 Informaţiile transmise de facultate;
 Informaţiile transmise de departament;
 Presa locală;
Altele: ......1

Sintetizând ideile cuprinse în chestionarul adresat utilizatorilor, se poate spune că nevoile


ce apar în procesele de interacţiune reclamate de crearea şi exploatarea depozitelor instituţionale
cuprind următoarele aspecte:

 Documentele:
 tipul;
 condiţia;
 atributele metadatelor;
 criteriul de selecţie;
 restricţii de utilizare;
 relaţia cu alte colecţii.
 Utilizatorii:
 serviciile;
 tipul de utilizare;
 frecvenţa utilizării;
 modul de utilizare.
 Resursele:
 personalul şi abilităţi;
 sisteme, hardware, software;
 părţile interesate;
 liniile directoare şi politicile organizaţiei;
 planuri principale şi strategii.
Pe baza nevoilor se pot specifica, acum, cerinţele pe care trebuie să le satisfacă
aceste depozite insituţionale.
În cele ce urmează sunt sintetizate principalele cerinţe reclamate de realizarea şi
exploatarea unui depozit intituţional de documente digitizate:

Cerinţe reclamate de/pentru depozitele instituţionale de documente digitizate:

 stabilirea designului:
 cui se adresează?
 care sunt nevoile utilizatorilor?
 care este contextul în care vor folosi site-ul?
 legate de navigare:
 uşurinţa navigării conţinutului;
 posibilitatea întoarcerii la homepage-ul depozitului;
 găsirea rapidă a informaţiilor (din câteva click-uri).
 legate de alegerea softului:
 interfaţă simplă şi intuitivă;
 vizibilitatea colecţiei digitale;
 accesibilitatea colecţiei – să permită partajarea;
 flexibilitatea:
■ să permită expansiunea serviciilor;

1
Creating an Institutional Repository : LEADIRS Workbook. [online]. Disponibil pe Internet:
http://hdl.handle.net/1721.1/26698
11
■ configurarea serviciilor astfel încât să poată fi adăugate noi tipuri de obiecte,
formate de metadate şi să suporte noi utilizări;
 legate de alegerea documentelor de digitizat:
 conţinutul;
 unicitatea;
 cererea;
 legate de digitizare:
 care sunt materialele supuse digitizării?
 care sunt cerinţele pentru digitizarea materialelor?;
 care este algoritmul de lucru pentru prezervarea materialelor originale înainte, în
timpul şi după digitizare?;
 care sunt standardele valabile si care sunt nevoile utilizatorilor?;
 care este structura proiectului de digitizare (pe fişiere)?;
 care sunt setările necesare pentru scanarea materialelor?;
 cum se procedează în cazul notiţelor scrise de mână?;
 există program de editare imagini pentru editarea şi corectarea fişierelor imagine?;
 există un program bun de OCR-izare?;
 au fost fişierele corectate şi verificate de cel puţin 2 ori, de cel puţin 2 persoane
diferite?;
 s-a stabilit şi menţinut un sistem bun de numire pentru fişierele din cadrul unui
anumit proiect?;
 s-a stabilit si dezvoltat un flux de lucru?;
2
 s-au descărcat fişierele pe serverul web folosind un program FTP client? ;
 legate de metadate:
 legate de stocare:
■ diversitate – sursele să nu fie limitate doar la text, imagini etc.;
■ securitatea informaţiei;
 legate de descriere:
■ să nu necesite pregătirea suplimentară a celor care procesează (cataloghează)
informaţiile digitale;
■ interoperabilitatea (utilizarea unor metadate standard);
■ stocare centrală şi distribuită;
■ vocabulare controlate;
■ câmpuri căutabile;
 legate de indexare:
■ acurateţe;
■ specificitate – cu cât apar mai multe date asociate unei componente digitale cu
atât relevanţa va fi mai mare3;
■ exhaustivitate - în raport cu cererea formulată de utilizator – cu cât termenii din
interogare introduşi de utilizator se potrivesc mai bine cu cei atribuiţi
componentei digitale, cu atât relevanţa este mai mare4;
 legate de căutarea informaţiilor:
■ cine poate face căutarea?
■ cum se face căutarea: cu text liber sau câmpuri; după o limbă sau încrucişat?
 legate de regăsirea informaţiilor:
■ afişarea să se facă în ordinea relevanţei;
■ afişarea să se facă în toate tipurile de documente;
■ relevanţa informaţiei să rezulte şi din conţinutul documentului nu numai din titlul

2
ANDERSON, Cokie G., MAXWELL, David C. Starting a Digitization Center. Oxford : Chandos Publishing
Limited, 2004. p. 105
3
www.emeraldinsight.com/0033-0337.htm
4
Ibid.

12
acestuia;
 legate de accesul la informaţie;
 legate de prezervarea materialelor:
■ evitarea scanării acelor materiale care atrag deteriorarea lor;
■ scanarea acelor materiale care ajung greu la utilizatori sau se deteriorează foarte
repede;
■ alegerea materialelor pentru digitizare se face de departamentul de dezvoltare a
colecţiilor;
 legate de costuri:
 resurse umane şi tehnice;
 prezervarea obiectelor digitale.
 legate de legislaţie:
 dreptul de proprietate intelectuală;
 ce este permis pentru acces;
 care este legătura cu editurile;
 problema licenţelor pentru utilizarea materialelor digitale;
 consecinţele juridice privind drepturile sistemelor de gestionare digitală;
 colectarea de date personale în e-arhive şi consecinţele legislaţiei privind protecţia
datelor.
Merită a fi menţionaţi, în acest context, şi factorii ce intervin în alegerea modelului
depozitului instituţional de documente digitizate. Ei pot fi sintetizaţi după cum este prezentat mai
jos.

Factori ce intervin în alegerea modelului depozitului digital:

 caracteristicile de dezvoltare;
 durabilitatea;
 infrastructura bibliotecii digitale;
 caracteristicile legate de conţinut:
 formatele de fişiere suportate;
 metadatele suportate;
 cerinţele legate de legalitatea datelor;
 utilitatea;
 interfaţa utilizatorului şi uşurinţa în exploatare;
 facilităţi de căutare, răsfoire şi acces etc.
 politicile şi practicile instituţiei.5

A.II.1.2. Scheme structurale (organigrame) utilizate pentru indexarea documentelor şi


regăsirea rapidă a informaţiei într-un sistem integrat
Indexarea documentelor digitizate şi regăsirea lor în cadrul depozitului reprezintă
probleme cheie fundamentale în realizarea şi exploatarea acestor sisteme integrate de procesare a
informaţiilor. Problema cea mai simplă, în aparenţă, o reprezintă stocarea – în cadrul depozitului
instituţional (IR) – a multitudinii de date, deoarece, structurile hardware pot accepta dezvoltări
pentru arhivarea unei cantităţi imense de informaţii digitizate. Este adevărat, în acelaşi timp, că
tocmai problema regăsirii rapide a informaţiilor digitizate – în cadrul depozitului, limitează
realizarea unei arhitecturi arborescente stufoase şi utilizarea unui număr mare de colecţii, dar
fără interconexiuni notabile între ele. Deşi, ideea unităţii ştiinţei este din ce în ce mai puţin
utilizată, la ora actuală, pentru mulţimile complexe de date – din cadrul depozitelor digitale –
folosirea principiului similarităţii în organizarea internă a colecţiilor de date, ar fi benefică atât

5
http://www.dlib.org/dlib/july07/rieger/07rieger.html
13
pentru utilizatori cât şi pentru generatorii de informaţie (desigur, prin utilizarea unor criterii clare
care să permită definirea mulţimilor similare de date).
Pentru modul de lucru în ceea ce priveşte procesele de indexare, stocare şi regăsire rapidă
a informaţiilor, în cadrul depozitului digital, în această secţiune se vor prezenta trei scheme
structurale (organigrame) care definesc tot atâţia algoritmi de lucru pentru procesarea informaţiei
în cadrul sistemului integrat. În fig. A.II.1.1 este prezentată o primă schemă structurală. Acest
algoritm poate fi utilizat în cazul în care informaţiile ce trebuie arhivate în cadrul depozitului
digital sunt livrate direct – de autori – în format electronic. Este o schema structurală ce respectă
o mare parte din criteriile fundamentale stabilite pentru realizarea unui depozit instituţional dar
care poate fi utilizată, cu succes, după crearea acestui depozit şi impunerea, într-un viitor
apropiat, autorilor (creatorilor de informaţie) de a livra documente numai în format electronic
(digital). Unul din dezavantajele schemei structurale este reprezentat de lipsa unor subrutine care
să permită o învăţare treptată a creării de sistemul de gestiune a bazelor de date a unor noi căi
care să permită găsirea rapidă a informaţiei, pe măsură ce depozitul înglobează o cantitate tot
mai mare de date (prin utilizarea de algoritmi genetici, reţele neuronale etc.).

Fig. A.II.1.2 prezintă o a doua schemă structurală care este mai adaptată condiţiilor
actuale de realizare a depozitului digital.

În fig. A.II.1.3 este prezentată schema structurală valabilă pentru prelucrarea


documentelor aflate atât în format tipărit cât şi în format electronic.

14
START

Culegere de date tehnice documente digitizate

Preindexare documente tehnice digitizate

Sortare şi realizare colecţii conform unei scheme predefinite

Preindexare documente tehnice digitizate (formate standard)

Există documente ce nu pot fi clasificate pe


DA scheme standard? NU

Indexarea documentelor tehnice digitizate

Definirea formatelor de arhivare a documentelor tehnice digitizate

Arhivarea documentelor tehnice digitizate indexate în formate standard

Există documente ce nu pot fi arhivate pe formate


DA standard? NU

Definirea protocoalelor de căutare şi regăsire a documentelor în depozitul digital

Partajarea şi optimizarea locaţiilor de arhivare ale documentelor digitizate

Crearea de căi paralele de procesare a documentelor digitizate (pentru stocare şi regăsire rapidă)

DA Există documente ce nu pot fi regăsite rapid? NU

Optimizarea interfeţelor de interacţiune cu procesul de prelucrare a informaţiilor specifice depozitului digital

Precizarea rutinelor ce permit întreruperea accesului în depozitul digital în cazul nerespectării procedurilor
de către utilizatori

Tratarea întreruperilor din sistemul integrat

DA Există o densitate mare de întreruperi? NU

Realizare subrutine testare periodică a integrităţii sistemului de procesare a informaţiilor

STOP

Fig. A.II.1.1. Schema structurală de procesare a informaţiilor pentru documente livrate, deja, în
format electronic

15
START

Pregătirea documentelor tehnice pentru digitizare

Predefenirea schemelor de realizare a colecţiilor specifice depozitului digital

Preindexarea documentelor tehnice digitizate (formate standard)

Există documente ce nu pot fi clasificate pe


DA scheme standard? NU

Indexarea documentelor tehnice digitizate

Definirea formatelor de arhivare a documentelor tehnice digitizate

Arhivarea documentelor tehnice digitizate indexate în formate standard

Există documente ce nu pot fi arhivate pe formate


DA standard? NU

Definirea protocoalelor de căutare şi regăsire a documentelor în depozitul digital

Partajarea şi optimizarea locaţiilor de arhivare ale documentelor digitizate

Crearea de locaţii speciale pentru realizarea de arhive de siguranţă pentru documentele tehnice cu valoare
teoretică şi practică ridicată (principiul holografic)

Crearea de căi paralele de procesare a documentelor digitizate (pentru stocare şi regăsire rapidă)

DA Există documente ce nu pot fi regăsite rapid? NU

Optimizarea interfeţelor de interacţiune cu procesul de prelucrare a informaţiilor specifice depozitului digital

Precizarea rutinelor ce permit întreruperea accesului în depozitul digital în cazul nerespectării procedurilor
de către utilizatori

Tratarea întreruperilor din sistemul integrat

DA Există o densitate mare de întreruperi? NU

Realizare subrutine pentru verificarea periodică a arhivei de siguranţă

Realizare subrutine testare periodică a integrităţii sistemului de procesare a informaţiilor

STOP

Fig. A.II.1.2. Schema structurală de procesare a informaţiilor pentru documente aflate, la


momentul iniţial, în format tipărit

16
17
Fig. A.II.1.3. Schema structurală de procesare a informaţiilor pentru documente aflate, la
momentul iniţial, fie în format tipărit fie în format electronic cu subrutine de învăţare

18
Spre deosebire de schemele prezentate anterior, noua organigramă (Fig. A.II.1.3) conţine
subrutine ce permit „învăţarea‖ sistemului de procesare a informaţiilor să găsească, pe criterii
clare, predefinite, lucrările cele mai valoroase din baza de date, lucrări ce reflectă acum şi peste
timp adevărata identitate a universităţii. Aceste lucrări definesc valoarea (excelenţa) membrilor
comunităţii academice în anumite domenii, domenii specifice arealului în care s-a dezvoltat, de-a
lungul timpului respectiva universitate. Desigur, în viitor, aceste proceduri de învăţare, pe
măsura dezvoltării tehnologiilor informatice, vor putea fi dezvoltate, extinse asupra altor aspecte
definitorii ale depozitelor digitale. Posibilitatea de dezvoltare continuă a tuturor procedurilor ce
contribuie la menţinerea integrităţii depozitului digital este una din caracteristicile cele mai
importante ce trebuie avute în vedere, în acest moment, al creării respectivului depozit.

Unul din aspectele importante abordate, de asemenea, în această activitate l-a constituit
analiza comparativă a platformelor software ce urmează a rezolva, cu eficienţă ridicată, toate
cerinţele reclamate de depozitele digitale. Aceste platforme software, implementate pe o
structură hardware dată, trebuie să îndeplinească, practic, majoritatea criteriilor impuse
sistemelor integrate de indexare, socare şi regăsire rapidă a documentelor digitizate. Integrarea
este o problemă de scară, iar modificarea acestui factor de scară se poate realiza, deocamdată, pe
două căi: hardware, respectiv, software. Limitările fizice, vor reclama, cu siguranţă, în viitor,
dezvoltarea unor metode specifice software care să ducă la micşorarea factorului de scară (un
principiu holografic de lucru) în condiţiile în care miniaturizarea hardware nu va mai fi posibilă
decât printr-un nou salt tehnologic şi ştiinţific în intimitatea materiei (nanotehnologiile şi
nanomaterialele).
În tabelele A.II.1.1, respectiv, A.II.1.2 este făcută o analiză comparativă a platformelor
software cu cea mai mare aplicabilitate în dezvoltarea şi gestionarea depozitelor digitale. Dacă,
în tabelul A.II.1.1, sunt analizate comparativ – la nivelul caracteristicilor fundamentale -
platformele software Open Source, în tabelul A.II.1.2 sunt puse în balanţă – la nivelul
indicatorilor de performanţă – softurile cu cea mai largă utilizare în cadrul depozitelor digitale,
cu scopul declarat de a identifica acei indicatori pe care îi reclamă, conform analizei pe bază de
chestionar, aplicaţia ce urmează a fi implementată în cadrul proiectului.

19
Compararea softurilor Open Source
Tabelul A.II.1.1
Caracteristica DSpace Fedora Greenstone EPrints
Entitatea de bază (modelul de Item-ul (elementul) – conţine: Obiectul digital – conţine: Documentul - caracteristici: Obiect de date – înregistrare
obiect) metadate; metadate; - în format XML; conţinând metadate;
conţinut digital. conţinut digital, - este legat de unul sau mai - unul sau mai multe
- câmpurile de metadate DC ambele tratate ca fluxuri de multe resurse care reprezintă documente (fişiere) pot fi
sunt stocate în item-uri; date; conţinutul digital al unui legate la un obiect de date;
- alte seturi de metadate şi legături către modurile de obiect; - fiecare obiect de date are un
conţinutul digital sunt definite comportare care îl - identificator unic de identificator unic.
ca fluxuri de biţi şi sunt definesc. document;
categorisite ca ―mănunchiuri - structura internă este bazată - nu există identificatori
de item-uri‖; pe metadate METS şi este persistenţi pentru resurse.
- structura internă a unui item determinată de Obiectul
este reprezentată de Fedora XML (FOXML);
metadatele structurale, care - un indentificator unic
definesc relaţia dintre părţile permanent pentru fiecare
constituente ale unui item; obiect digital;
- identificatori unici pentru - identificatori unici pentru
item-uri; fluxurile de date.
- identificatori persistenţi
pentru fluxurile de biţi ale
fiecărui item.
Colecţiile (şi legăturile dintre - colecţii de item-uri; - colecţii folosind fluxuri de Colecţia = un set de - nu sunt definite nişte
ele) - colecţii de comunităţi care date RELS-EXT având în caracteristici care descriu colecţii;
deţin una sau mai multe vedere o ontologie de bază funcţionalitatea sa: - obiectele de date sunt
colecţii; specifică privind relaţionarea; capacităţile de indexare, grupate funcţie de câmpuri
- un item poate aparţine uneia - relaţiile dintre obiectele căutare şi răsfoire; specifice (subiect, an, titlu
sau mai multor colecţii, dar digitale sunt exprimate în formatele fişierelor; etc.);
are doar un proprietar de cadrul descrierii resursei conversia; - nu este o definiţie legată de
colecţii; (RDF) (W3C); punctele de intrare pentru relaţiile dintre documente,

20
- metadatele descriptive dintr- - nu este furnizat un importul de conţinut exceptând folosirea de adrese
o colecţie: titlul şi descrierea; mecanism de manipulare a digital; URL din câmpurile specifice
- nu există suport pentru acestor relaţii. caracteristici legate de de metadate.
relaţiile între diferite item-uri. prezentarea colecţiei;
- reprezentarea structurii
ierarhice în documentele text:
 capitole, secţiuni şi
paragrafe.
- definirea unor secţiuni
specifice în cadrul unui
document text este realizată
prin etichete XML;
- X-legăturile din document
sunt folosite pentru a
relaţiona cu alte documente
sau resurse.
Stocarea (metadatelor şi a - metadate DC în baza de date - metadatele şi conţinutul - documentele şi resursele - câmpurile de metadate sunt
conţinutului digital) relaţionale PostgreSQL sau digital, considerate fluxuri de sunt stocate într-un fişier definite de utilizatori;
Oracle; date sunt stocate fie: sistem; - obiectele de date, conţinând
- fluxurile de biţi sunt stocate  intern, într-un fişier - metadatele sunt definite de metadate sunt stocate într-o
în fişiere sistem; XML al obiectului utilizatori şi sunt stocate în bază de date MySQL;
- fiecare flux de biţi are digital; documente utilizând un - documentele (conţinutul
asociat un format specific;  în fişierul sistem al format intern XML. digital) sunt stocate într-un
- pentru fiecare format flux conţinutului gestionat; fişier sistem.
biţi este definit nivelul de  de o sursă externă.
prezervare pentru formatul - unul sau mai multe seturi de
fişierului specificat. metadate pot fi folosite în
mod simultan, în timp ce
formate de fişiere diferite pot
fi stocate separat ca fluxuri de
date într-un obiect digital;
- pentru fiecare flux de date
sunt stocate metadatele

21
tehnice de bază: tipul MIME
(multipurpose Internet mail
extensions), mărimea
fişierului şi checksum în
scopul prezervării
conţinutului;
- suportă versiuni ale
anumitor fluxuri de date,
permiţând utilizatorilor să
acceseze exemple de fluxuri
de date mai vechi.
Căutarea şi răsfoirea - permite indexarea pentru - indexarea se face utilizând - indexarea este permisă - indexarea este permisă
setul de bază de metadate setul de metadate DC şi documentelor text şi pentru orice câmp de
(DC), utilizând o bază de date sistemul de metadate ale câmpurilor de metadate metadată, utilizând baza de
relaţională; obiectelor digitale: specifice; date MySQL;
- indexarea altor seturi identificator persistent, dată - căutarea este permisă în - indexarea full text este
definite de metadate este creare/modificare, etichetă, secţiuni din cadrul unui suportată pentru câmpurile
permisă utilizând Lucene model conţinut); document (titlu, capitol, selectate;
API; - indexarea şi căutarea se face paragraf) sau în tot - sunt permise utilizatorilor
- căutarea se poate face în prin intermediul unei baze de documentul; finali căutarea combinată pe
colecţie sau comunitate; date relaţionale (MySQL, - răsfoirea poate fi definită câmpuri şi căutarea text liber;
- răsfoirea se poate face prin Oracle sau PostgreSQL); pentru anumite câmpuri - răsfoirea se poate face
intermediul câmpurile - căutarea se poate face în folosind structura ierahică. utilizând anumite câmpuri:
predefinite: titlu, autor, dată. toate câmpurile indexate; titlu, autor, subiect).
- relaţiile dintre obiectele
digitale sunt indexate şi pot fi
căutate prin intermediul unui
index Fedora;
- nu este furnizat un
mecanism de răsfoire.
Managementul obiectelor - obiectele sunt create prin - crearea obiectelor digitale - colecţii noi şi documentele - este furnizată o interfaţă web
intermediul depunerii sau este posibilă folosind interfaţa conţinute în acestea sunt utilizator implicită pentru

22
importării pe loturi; Client Administrator sau construite prin intermediul crearea şi editarea de obiecte;
- colecţiile şi comunitătile importarea pe loturi (fişiere interfeţei bibliotecarului - autorizarea poate ajuta la
sunt create prin intermediul XML în formate METS sau Greenstone sau folosind un completarea unor anumite
interfeţei Web a utilizatorului; FOXML); program pe bază de linie de câmpuri (autori, titlu etc.)
- este configurat fluxul de - adăugarea de metadate sau comandă. - obiectele pot fi importate din
lucru care poate conţine între editarea este posibilă prin fişiere text folosind mai multe
1-3 paşi unde diferiţi intermediul unui editor text - formate: METS, DC, MODS.
utilizatori sau grupuri pot interfaţa Client
interveni pentru a depune Administrator;
item-uri. - adăugarea sau ştergerea de
conţinut digital - interfaţa
Client Administrator.
Interfeţele cu utilizatorii - este furnizată o interfaţă - interfaţa web Fedora - interfaţa web implicită cu - permite răsfoirea prin
web utilizator implicită pentru permite utilizatorilor finali utilizatorul final permite intermediul câmpurilor
ca utilizatorii finali să căutarea după cuvinte cheie răsfoirea şi căutarea în selectate de metadate (de
răsfoiască colecţia, să sau câmpuri; colecţii, navigarea în structura obicei, subiect, titlu sau dată);
vizualizeze metadatele DC ale - vizualizarea obiectelor ierarhică a obiectelor (cum ar - răsfoirea poate fie ierarhică
unui item şi să navigheze digitale se rezumă la fi cărţile) folosind tabela de pentru câmpurile subiect;
către fluxurile sale de biţi prezentarea sistemului de conţinut. - mediul de căutare permite
(prin intermediul metadatelor metadate şi la fluxurile de utilizatorului să restricţioneze
structurale); date. cererea de căutare folosind
- o interfaţă de căutare mai multe câmpuri şi prin
permite utilizatorilor căutarea selectarea valorilor din liste.
după cuvinte cheie.
Controlul accesului - utilizatorii si grupurile deţin - permite utilizatorilor şi - un utilizator Greenstone - utilizatorii înregistraţi pot
drepturi diferite; grupurilor autorizate să poate să aparţină 1-2 grupuri crea şi edita obiecte;
- autentificarea se poate face acceseze anumite obiecte predefinite de utilizatori; - înregistrarea se face pe bază
pe bază de parolă, certificate digitale folosind politicile poate fi administrator sau de nume utilizator şi parolă.
X509 sau protocoale LDAP; XACML; creator de colecţie;
- drepturile legate de - autentificarea este permisă - grupul de utilizator
controlul accesului este ţinut prin intermediul protocoalelor Administrator are drepturi de
pentru fiecare item şi LDAP sau Internet (IP). a crea şi a şterge utilizatori;

23
defineşte acţiunile pe care le - grupul de utilizator Creator
poate realiza utilizatorul: de colecţie are drepturi de
citire/scriere fluxuri biţi itemi, creare şi actualizare colecţii;
adăugare/ştergere - utilizatorii finali au acces la
mănunchiuri de item-uri toate colecţiile şi
dintr-o colecţie; documentele.
- drepturile se bazează pe o
politică default-deny.
Suportul multilingv Unicode Character Encoding Unicode Character Encoding Unicode Character Encoding Unicode Character Encoding
– suportă mai multe limbi atât – suportă mai multe limbi atât – suportă mai multe limbi atât – suportă mai multe limbi atât
în câmpurile de metadate cât în câmpurile de metadate cât în câmpurile de metadate cât în câmpurile de metadate cât
şi în conţinutul digital. şi în conţinutul digital; şi în conţinutul digital; şi în conţinutul digital;
- permit folosirea de interfeţe - are un atribut XML pe
multilingve, fiind deja traduse câmpurile de metadate pentru
în mai multe limbi. a defini limba folosită în
valoarea câmpului.
Interoperabilitatea - suportă OAI-PMH, putând - suportă OAI-PMH, putând - suportă OAI-PMH, putând - suportă protocolul Z39.50
partaja metadatele BD cu alte partaja metadatele BD cu alte partaja metadatele BD cu alte pentru a răspunde cererilor în
depozite digitale; depozite digitale; depozite digitale; legătură cu anumite seturi de
- pot exporta obiecte digitale - pot exporta obiecte digitale metadate;
ca fişiere METS XML; ca fişiere METS XML; - exportă obiectele de date în
-suportă protocolul OpenURL formate METS şi MPEG-21
(NISO) furnizând legături DIDL (digital item
pentru pagina fiecărui item. declaration language).
Nivelul de adaptare - deşi flexibil, nu este atât de - fiecare obiect digital poate - se poate adapta prezentarea - obiectele de date conţin
deschis construirii de obiecte urmări un model diferit de unei colecţii pe baza XLTs şi metadate definite de
diferite cu seturi independente conţinut care descrie formatul a agenţilor care controlează utilizatori;
de metadate datorită său; anumite acţiuni ale BD; - pot fi scrise plugin-uri
arhitecturii sale database- - e posibil să furnizeze mai - arhitectura furnizează: pentru a facilita exportul
oriented; multe moduri de comportare  un back end care obiectelor de date în diferite
- interfaţa cu utilizatorul este care să determine metodele de conţine colecţii, formate text;
fixă şi permite numai acces şi manipulare a documente şi - un nucleu API în Perl este

24
intervenţii minore de obiectului digital; serviciile care le furnizat dezvoltatorilor care
prezentare; - interfaţa implicită cu gestionează; preferă să acceseze
- permite suport complet doar utilizatorul deşi este săracă  un web-based front- funcţionalitatea de bază a BD.
pentru anumite formate de poate fi complet adaptată end responsabil pentru
fişiere ca şi conţinut digital. folosind cele două API (API prezentarea
acces şi API management). colecţiilor,
documentelor şi
mediului lor de
căutare.

Entitatea de bază (obiectul) = structura internă a unui obiect digital, care include metadate şi conţinut digital; existenţa unor identificatori unici ai
obiectului digital şi a fiecărei părţi componente a acestuia este foarte importantă pentru asigurarea prezervării şi uşurinţei de accesare.

Colecţiile şi legăturile dintre acestea = colecţiile de metadate descriptive, definirea subcolecţiilor şi a şabloanelor care descriu formatul obiectelor
digitale, prezentarea colecţiilor; relaţiile dintre obiectele de acelaşi tip sau tipuri diferite.

Stocarea metadatelor şi a conţinutului digital = capacităţile de stocare sunt determinate de condiţiile de prezervare; este important ca un sistem de
bibliotecă digitală (BD) să asigure standarde la fel de bine ca şi seturile de metadate şi multiplele formate de conţinut digital definite de utilizator.

Căutarea şi răsfoirea = mecanisme folosite pentru indexarea şi căutarea metadatelor; este important ca un sistem de BD să permită indexarea nu numai
pentru un set limitat de metadate ci şi pentru câmpuri de metadate selectate.

Managementul obiectelor = metode şi interfeţe cu utilizatorul furnizate de sistemul BD în ideea manipulării metadatelor şi a conţinutului digital (ex.:
inserare, actualizare şi ştergere).

Interfeţele cu utilizatorii = interfeţele furnizate utilizatorilor finali în ideea accesării unei BD, a colecţiilor şi obiectelor digitale ale acesteia.

Controlul accesului = se referă la întreţinerea utilizatorilor şi a grupurilor şi la metodele de autorizare şi autentificare; permite accesul şi actualizarea
restricţionată a colecţiei BD, a obiectelor digitale, a conţinutului acesteia etc.

Suportul multilingv = pentru ca sistemul BD să fie complet multilingv trebuie să fie permisă în interfaţa cu utilizatorii, în câmpurile de metadate şi în
conţinutul digital mai multe limbi de circulaţie internaţională.

25
Interoperabilitatea = standarde pe care le permite sistemul BD pentru a asigura interoperabilitatea cu alte sisteme (ex.: exportul obiectelor digitale în
formate standard deschise).

Nivelul de adaptare = se referă la adaptarea sistemului unei BD la nivelul colecţiilor, formatului obiectelor digitale şi a serviciilor furnizate; sunt
incluse calitatea şi metodele furnizate de interfeţele de programare a aplicaţiei (API) ale sistemelor BD.

Concluzii şi sugestii

Este dificil de propus un anumit sistem de bibliotecă digitală. Analizând principalele trăsături şi caracteristici ale sistemelor de biblioteci digitale,
fiecare are avantaje şi dezavantaje. Acest lucru ar putea folosi, însă, ca linii directoare în alegerea deciziei asupra acelui sistem care să găzduiască
colecţia digitală. Nevoile variază de la o organizaţie la alta funcţie de numărul colecţiilor, tipurile de obiecte, natura materialului, frecvenţa de
actualizare, distribuirea conţinutului şi limitele de timp pentru dezvolatrea unei biblioteci digitale.
În acest sens, iată câteva linii directoare:
 Cazul unei instituţii care este interesată în crearea unui depozit digital care să conţină lucrări de cercetare şi disertaţii produse de studenţi şi
comunitatea academică. În acest caz, cel mai indicat sistem este DSpace, deoarece acesta reprezintă în mod implicit comunităţi (departamente
ale universităţii, de exemplu) şi colecţii (ex. lucrări şi disertaţii), fluxul de lucru legat de depunere este suportat de utilizator.
 Cazul unei instituţii care este interesată în publicarea conţinutului său digital într-o formă simplă şi în limite stricte de timp. În plus, instituţia
intenţionează să integreze interfeţele web ale BD la un portal tip pagină web. În acest caz, cel mai indicat sistem este EPrints, deoarece separă
prezentarea de stocare, acestea nu depind de anumite standarde de metadate si furnizează interfeţe web simple pentru depunere şi prezentare de
documente şi metadate.
 Cazul unei instituţii care este interesată în digitizarea colecţiilor din biblioteci, arhive, muzee şi găzduirea acestora într-un singur sistem de
bibliotecă digitală. Instituţia are resurse umane, timpul necesar pentru adaptarea sistemului şi dezvoltarea suplimentară de module. Cea mai
mare prioritate o constituie suportul pentru prezervarea publicaţiilor, folosirea de multiple standarde de metadate şi diferite formate de conţinut
digital. În acest caz, cel mai indicat sistem este Fedora, deoarece furnizează o arhitectură modulară care poate fi foarte uşor adaptată. Deşi nu
furnizează interfeţe web uşor de utilizat şi nici funcţionalitatea nu e uşor de construit, totuşi este cea mai bună alegere pentru a găzdui multe
colecţii şi diferite materiale.
 Cazul unei instituţii care este interesată în publicarea electronică a cărţilor într-un sistem de bibliotecă digitală adaptabilă şi simplu de folosit. În
acest caz, cel mai indicat sistem este Greenstone, deoarece este simplu să reprezinţi cărţile în mod ierarhic, utilizând tabla de conţinut, în timp
ce este posibilă căutarea full text pe capitole.6

6
Pyrounakis, George, Nikolaidou, Mara. Comparing Open Source Digital Library System. În: Handbook of Research on Digital Libraries : Design, Development and Impact.
[online]. Disponibil pe Internet: http://www.torrentdownloads.net/torrent/1311967/Handbook+of+Research+on+Digital+Libraries+Design,+Development,+and+Impact

26
Analiza comparativă a sistemelor de depozitare

Tabelul de mai jos însumează aspecte ale diferitelor sisteme de depozitare care au fost
analizate. Acele aspecte pentru care nu s-a gasit nici o descriere în literatură au fost lăsate
necompletate.
Tabelul A.II.1.3
Fedora DSpace aDORe

Utilizator

Identificator Utilizator Da Da Nu

Profil Utilizator No Da Nu

Rol No Da Nu

Politica Nu Nu

Grup Nu Comunităţi Nu

Spaţiu Informativ

Information Object FOXML (suportă Baze de date MPEG-21 DID


METS) relaţionate

Identificator pentru FEDORA Persistent CNR Handle System Identifier Locator


Information Object Identifier (PID)

Conţinut

- Metadata Da Da Da

- Text Da Da Da

- Imagine Da Da Da

- Audio Da Da Da

- Video Da Da Da

- Combinate Da Da Da

Versiune Versiuni ale unui ABC Harmony Da


individual datastreams Datamodel
(linear)

Manifestare Datastream Bitstream Datastream

Adnotare

Metadata MPEG21 DIDL

- Format Descriptiv DC (căutabil), orice alt DC calificat


Metadata format ne-căutabil

27
Fedora DSpace aDORe

-Format Structural FOXML Baze de date


Metadata relaţionate

-Format Administrativ FOXML Date de baze


Metadata relaţionate

- Format Conservare FOXML, conservarea Baze de date


Metadata funcţională este relaţionate,
implementată de grupuri(Bundles) şi
utilizator prin Bitstream.
Conservarea
funcţională prin
formate suportate,
conservare bitstream,
altele

Colecţie RDF bazată pe relaţia Suport nativ pentru OAI-PMH seturi


tip obiect la obiect colecţii în cadrul unei
scheme relaţionale

Funţionalitate

Acces OAI-PMH

- Căutare Da Da Nu

- Full text Nu Nu Nu

- Metadata Da Da Nu

- Imagine Nu Nu Nu

- Audio Nu Nu Nu

- Video Nu Nu Nu

- Convorbire Nu Nu Nu

- Obiect singular Nu Nu Nu
- Aspect singular

- Obiect multiplu Nu Nu Nu
- Aspecte multiple

-Compound Document Nu Nu Nu
Match

- Predicate Nu Nu Nu

- Întrebări ample Nu Nu Nu

 Limbaj încrucişat UTF-8 UTF-8 Nu

28
Fedora DSpace aDORe

 Feedback relevant Nu Nu Nu

 Răsfoire Foarte simplă Da, construită în Nu


suport în Web UI

 Vizualizare Foarte simplă Da, construită în Nu


suport în Web UI

 Traducere Nu Nu Nu

Aspecte de Management

Submit Numai de către Da


Administrator, poate
în varianta FEDORA
2.1 model adaptat de
Autorizare poate
permite şi alte statuturi

Updatare Numai de către Da


Administrator

Adnotare

Analiză Numai de către Da


Administrator

DL Management

 Adnotare

 Updatare Da Da

 Retragere Da Da

 Descriere Da Da

 Diseminare Da Da

 Conservare Da Da

 Managementul
utilizatorului

- Înregistrare Nu Da

- Role Management Nu Da

 Politica de Da
Management

Personalizare

29
Fedora DSpace aDORe

 Managementul Nu Da, foarte simplă Nu


colecţiilor

 Acces personalizat Nu Da Nu

 Notificare Nu Da Nu

 Altele Înregistrare on-line Nu

Permitere (acces)

 Autentificare Da Da

 Autorizare Da (XACML-based Da (Baza de date


Politica de acces) relaţionate)

 Codare Nu Nu

 Abonare Nu Da

 Notificare Nu Da

 Procedeu de realizare Nu, doar diseminarea Da, (un flux de lucru


of behaviors on alcătuit din 3 paşi)
datastreams

Altele -OAI-PMH harvesting -OAI-PMH -OAI-PMH


-Multe funcţii sunt harvesting Federator
prezentate ca SOAP- -Suport pentru LDAP -Open URL
based Web Services Resolver
-Suport pentru LDAP,
bazată pe identificarea
de IP, Autentificare
bazată pe HTPP şi
autentificare bazată pe
SSL

Calitatea serviciilor

Securitate

Economics

Disponibilitate

Fiabilitate

Performanţă

Timp de răspuns

Securitate

30
Fedora DSpace aDORe

Autentificare

Integritate

Protecţia datelor

Protecţia mesajelor

Robusteţe

Capacitate

Gradul de încărcare

Gradul de recuperare

Mesagerie

Consistenţă

Scalabilitate

Arhitectură

Caracteristici Serviciile de pierdere Arhitectura tip Componentele de


cuplate actionează etichetă a bază şi
înaintea serviciilor de componentelor standardele de
depozitare interacţionează prin bază a arhitecturii
API unde interacţiunea

După cum se constată – în ceea ce priveşte software-le Open Source – există indicatori de
performanţă care pot fi îmbunătăţiţi cu fiecare nouă aplicaţie (nespecificaţi, încă, de literatura de
specialitate). Este, acesta, şi unul din obiectivele prezentului proiect, care încearcă, spre
exemplu, fluidizarea fluxurilor informaţionale – în cadrul unui sistem integrat de bibliotecă
digitală – prin adoptarea unor arhitecturi particulare (bazate pe teoria constructală); ţelul final îl
constituie minimizarea timpilor de răspuns şi realizarea unei anumite robusteţi (înţelegând, prin
aceasta, menţinerea stabilităţii funcţionale a sistemului la un nivel ridicat de perturbaţii).

Concluzii privind alegerea algoritmului optim ce poate fi implementat în cadrul


aplicaţiei din cadrul proiectului
În urma întregului studiu efectuat, pe baza atât a cerinţelor reclamate sistemului integrat
de potenţialii utilizatori cât şi a criteriilor de performanţă propuse de entitatea globală creatori (şi
gestionari) de informaţie – utilizatori de informaţie, se pot formula următoarele concluzii:
 Algoritmul optim trebuie să conţină un număr minim de subrutine, pentru a putea
obţine timpi minimi de răspuns în căutarea informaţiei din depozitul digital;
 Algoritmul optim trebuie să aibă capacitatea de adaptare – la modificarea
numărului de utilizatori – obţinută printr-un proces de „învăţare‖, de a găsi şi utiliza noi căi de
procesare a informaţiei, astfel încât să nu fie afectată stabilitatea funcţională a acestuia; soluţiile
pentru creşterea flexibilităţii şi fluidizarea traficului informaţional pot fi atât hardware (noi
arhitecturi) cât şi software (noi conexiuni între subsistemele marelui sistem integrat);

31
 Algoritmul optim trebuie să permită o funcţionare multipartiţională a depozitului
digital, şi să utilizeze principiul holografic în prelucrarea şi stocarea informaţiei; prin utilizarea
acestui principiu, algoritmul trebuie să permită (pe cale software, la arhitectură hardware dată)
realizarea de partiţii (iată de ce este necesară utilizarea unor structuri hardware paralele,
redundante la prima vedere) care să reproducă imaginea depozitului digital, ca o copie de
siguranţă. Dacă acest lucru nu este necesar la nivelul întregului depozit digital, se pot realiza
subrutine (pe baza unor criterii, definite în prealabil) care să permită găsirea celor mai valoroase
lucrări din depozit şi, doar, pentru acestea, să se realizeze, apoi, copii de siguranţă, în partiţii
protejate, neaccesibile utilizatorilor;
 Algoritmul optim – pentru sistemul integrat propus – trebuie să permită o
concatenare uşoară cu sistemele autonome ale partenerilor (membri ai consorţiului);
 Algoritmul optim trebuie să permită o dezvoltare continuă a sistemului integrat;
adăugarea unui nou membru nu trebuie să pericliteze stabilitatea funcţională a sistemului obţinut
prin integrarea la o nouă scară.
Aceste concluzii – ca şi altele care vor rezulta în procesul efectiv de implementare a
algoritmului propus pentru sistem – reduc alegerea algoritmului ce merită a fi implementat, la
nivelul consorţiului (pe baza unei acţiuni sinergice a tuturor membrilor), la două aspecte:
 O schemă logică care să reunească toate aspectele de mai sus;
 O platformă software care să aibă un caracter deschis, perfectibil.
Deoarece, unul din parteneri (Universitatea „Transilvania‖ din Braşov) a optat,
deja, pentru o anumită platformă software (DSpace), pentru dezvoltarea depozitului digital, în
urma medierii cu toţi ceilalţi parteneri (membri ai consorţiului) şi, ca urmare, a întregii analize
comparative – realizată în această etapă a proiectului – s-a hotărât alegerea pentru
implementarea sistemului integrat pe baza platformei software DSpace. În ceea ce priveşte
schema logică, cea mai adecvată este cea prezentată în figura A.II.1.3 care întruneşte majoritatea
particularităţilor reclamate de algoritmul optim, specificate mai sus.

Activitatea II.2
Elaborarea soluţiilor optime pentru realizarea sistemelor autonome de indexare şi stocare
a documentelor digitizate şi a sistemului central de procesare în paralel

În cadrul acestei activităţi, pe lângă studiile întreprinse, cel mai important aspect l-a
constituit precizarea, în final, a arhitecturii sistemului integrat de procesare a informaţiilor
tehnice digitizate, pe baza unei analize comparative a unor astfel de sisteme – pentru diferite
arhitecturi – şi găsirea soluţiilor viabile pentru aplicaţia particulară din cadrul proiectului.
Arhitecturile utilizate pentru realizarea sistemelor integrate de procesare a
informaţiilor digitizate – după cum a rezultat din amplul studiu întreprins atât la nivelul
bibliotecilor digitale (ca sisteme integrate macro) cât şi la nivelul SGBD –urilor (ca sisteme
integrate micro) – sunt de tip arborescent. Arborele este conceptul care oferă două mari avantaje
în structurarea sistemelor complexe:
 posibilitatea unei dezvoltări continue a oricărui sistem (având drept fundament un
trunchi comun puternic şi posibilitatea de a obţine multe ramificaţii);
 o capacitate superioară de organizare a haosului inerent unor sisteme cu o dinamică
deosebită;
Totuşi, arborele oferă şi un mare dezavantaj şi anume, acela că, o creştere continuă a
numărului de ramificaţii poate duce la apariţia unui sistem global puternic neliniar, greu de
controlat. Soluţia constă într-un artificiu, sugerat de conceptul dezvoltării continue a arborelui,
dar utilizând – în tehnică – un principiu constructal. Noua arhitectură obţinută, ce oferă per
global tot o funcţionare neliniară, are avantajul unei modelări şi, implicit, a realizării – în
comandă – a unei anticipări funcţionale. Modelarea este posibilă – pe baza principiului

32
constructal (derivat dintr-un principiu natural, de altfel) – deoarece construcţia geometrică, în
sine, respectă o legitate: legea similarităţii (fiecare subdiviziune, la o anumită scară, este
similară, cu întregul în care este integrată).
Datorită particularităţilor şi cerinţelor pe care trebuie să le îndeplinească – din punct
de vedere funcţional – sistemele integrate de procesare a informaţiilor, utilizarea principiului
constructal, în dezvoltarea arhitecturii (structurii hardware, în primul rând) acestora, este
deosebit de benefică, permiţând acestor sisteme să atingă performanţe deosebite, în ceea ce
priveşte:
o stabilitatea funcţională;
o viteza de prelucrare a informaţiilor digitizate;
o capacitatea de stocare;
o flexibilitatea în dezvoltări viitoare;
o interoperabilitatea şi interschimbabilitatea.
Toate aceste caracteristici reclamă – pentru sistemul integrat ce urmează a fi realizat –
dezvoltatea unei arhitecturi specifice, care să aibă la bază principiile teoriei constructale şi ale
teoriei fractale. Deşi, etimologic, cele două teorii sunt antagoniste (constructal – a construi;
fractal – a rupe) în realizarea sistemelor integrate se regăsesc idei, principii, din amândouă, astfel
încât, putem spune că aceste sisteme obţin şi o integrare a două principii antagoniste. O astfel de
integrare generează, paradoxal, sisteme unitare, deosebit de stabile şi cu o funcţionare net
superioară altor metode reducţioniste.
Sistemul integrat – ca unitate de contrarii – reclamă „ruperea‖, mai întâi, în
subsisteme foarte mici, optimizate, de fapt, la cea mai mică scară posibilă, şi, apoi, integrarea pe
principii constructale, la o scară foarte mare. Nu numai că un astfel de sistem este optimizat - din
punct de vedere constructiv şi funcţional - dar, poate avea şi calităţi noi, emergente, pe care
niciunul din subsistemele componente – optimizate, la scară mică – nu le are, într-o funcţionare
de sine stătătoare. Este, acesta, tocmai meritul integrării. Este necesar, deci, ca un sistem
complex de procesare a informaţiilor digitizate să adopte o astfel de arhitectură, deoarece, numai
unitatea contrariilor reuşeşte să menţină coerenţa, stabilitatea şi să asigure un flux de lucru de
viteza şi densitatea dorită.
Ca urmare, a arhitecturilor analizate şi pe baza consideraţiilor făcute mai sus,
propunem ca arhitectura sistemului integrat de indexare, stocare şi regăsire a documentelor
digitizate să se facă pe o structură arborescentă, la care crearea arborescenţelor să respecte
principiul constructal (fig. A.II.2.1).

Fig. A.II.2.1. Exemplu de arhitectură bazată pe principiile teoriei constructale (analogie cu


structura arborescentă a plămânilor)

33
Organizarea sistemului integrat de procesare a informaţiilor pe arhitectura bazată pe
principiile teoriei constructale se poate face ca în fig.A.II.2.2.

Fig. A.II.2.2. Arhitectura – bazată pe principiul constructal – a sistemului integrat de procesare a


informaţiilor digitizate
1,2,3,4 – căi (magistrale) de interacţiune între parteneri şi coordonator, respectiv, între toţi
membrii consorţiului şi depozitul central de informaţii digitizate, implementat la coordonator

Această propunere de organizare a sistemului integrat în interacţiune continuă cu


subsistemele sale constitutive este deosebit de utilă pentru dezvoltările ulterioare ale acestuia.
Deoarece o parte din concluziile micilor analize comparative a sistemelor integrate de
biblioteci digitale şi a sistemelor integrate de gestionare a bazelor de date (SGBD-uri) au fost
formulate, chiar, la locul analizelor, în acest capitol se vor trece în revistă, doar, alte câteva
aspecte rezultate din definirea unui nou principiu de integrare şi realizarea, practic, a unei noi
arhitecturi. Astfel:
 Sistemul integrat de procesare a informaţiilor digitizate trebuie să aibă o dublă
integrare: una în cadrul sistemului local dezvoltat la coordonator (unde se află şi depozitul
digital) şi o alta la nivel interregional (geografic vorbind) care să reunească toate sistemele
autonome ale partenerilor (membrilor consorţiului) implicaţi în cadrul proiectului;
 Realizarea dublei integrări se poate face numai cu ajutorul unei noi arhitecturi.
Această arhitectură specifică trebuie să se bazeze pe principii de optimizare globală, cum este
principiul constructal;
 Noua arhitectură trebuie să ofere o viteză mare de lucru şi, totodată, un flux ridicat
de transfer al informaţiilor digitizate;
 Noua arhitectură trebuie să permită o dezvoltare continuă (în primul rând,

34
hardware) a sistemului integrat atât local cât şi la nivel interregional;
 Noua arhitectură trebuie să fie permisibilă pentru implementarea unor soft-uri
federative (Open Source) şi să permită, totodată, folosirea conceptului Open Acces, deosebit de
benefic în exploatarea potenţialului creativ al utilizatorilor.
Toate aceste caracteristici considerăm că pot fi obţinute prin utilizarea
arhitecturii din fig. A.II.2.2. Mai mult, o astfel de arhitectură fiind bazată pe consideraţii din
sistemele integrate biologice - care sunt sisteme de excelenţă, în lumea reală – ne oferă
certitudinea unei funcţionări stabile, de lungă durată şi cu eficienţă ridicată.
O altă soluţie arhitecturală a sistemului integrat la nivel interregional este prezentată
în figura A.II.2.3.

Fig. A.II.2.3. Sistem integrat local şi interregional de procesare a documentelor tehnice digitizate

Pentru funcţionarea sistemului integrat pentru indexarea şi partajarea on-line a


documentelor se propune - în fig. A.II.2.3 - o infrastructură de resurse pentru stocare şi
prelucrare precum şi o infrastructură de comunicaţie.
Sistemul de programe de aplicaţii urmează să fie specificat în etapele viitoare
ale proiectului, infrastructura hardware şi de comunicaţii asigurând resursele necesare oricărei
soluţii software.
Sistemul integrat pentru indexarea şi partajarea on-line a documentelor
digitizate se bazează din punct de vedere al arhitecturii sistemului, modului de comunicaţie şi a
echipamentelor tehnice pe o structură de tip sistem distribuit.
Astfel fiecare universitate va dispune de următoarele echipamente:
- staţii de lucru;
- laptop-uri;
- acces point-uri;
- switch layer 3;
- server de acces;
- spaţiu de stocare;
- imprimantă multifuncţională (copiator, scanner şi fax).
În ceea ce priveşte utilizarea sistemului acesta presupune o conexiune de mare viteză la
Internet pentru interconectarea centrelor universitare şi o bună utilizare a resurselor.
Staţiile de lucru şi laptop-urile se conectează prin intermediul unui switch de nivel 3 la
server-ul central în vederea accesării bazei de date pentru indexarea sau utilizarea documentelor.
Aceste operaţii se vor face dintr-o locaţie rezervată persoanelor care indexează
documente folosind atât staţiile de lucru cât şi de la laptop-urile existente. Folosirea laptop-urilor
facilitează munca celor care se ocupă cu indexarea documentelor.

35
Utilizatorii care doresc accesarea documentelor, deja, indexate vor avea la dispoziţie o
sală dedicată, interconectată cu serverul de acces şi sistemul de stocare prin intermediul
switchului de nivel 3. Reţeaua wireless va facilita accesul la documente utilizatorilor care doresc
să folosească propriile sisteme de calcul portabile.
În ceea ce priveşte sala de lectură, prin intermediul staţiilor de lucru existente se vor
putea accesa documentele indexate în vederea utilizării acestora.
Serverul central va avea rolul de a garanta accesul, în bune condiţii, a utilizatorilor şi de a
le permite acestora, în funcţie de drepturile pe care aceştia le au, să utilizeze sistemul fie pentru
indexare fie pentru citirea documentelor, deja, indexate.

Activitatea II.3
Stabilirea specificaţiei echipamentelor tehnice necesare realizării sistemului integrat
propus. Elaborarea caietului de sarcini

În cadrul acestei activităţi, ca urmare a rezultatelor şi concluziilor formulate în activităţile


anterioare (atât în etapa I cât mai ales în etapa II a proiectului), s-au finalizat specificaţiile
tehnice ale echipamentelor necesare realizării sistemului integrat şi s-au elaborat caietele de
sarcini.

2. Concluzii finale
Prezentul raport prezintă amplul studiu efectuat cu privire la elaborarea soluţiei tehnice a
sistemului integrat de procesare a documentelor tehnice digitizate.
Comunităţile academice, implicate în cadrul proiectului, au fost invitate să-şi spună
părerea cu privire la necesitatea şi oportunitatea dezvoltării unui astfel de sistem – prin
precizarea expresă a nevoilor impuse de desfăşurarea activităţii didactice şi de cercetare în
societatea contemporană şi definirea caracteristicilor fundamentale pe care acesta ar trebui să le
aibă pentru a putea satisface aceste nevoi.
În spiritul acestor idei s-au abordat particularităţile constructive şi funcţionale ale
depozitelor instituţionale (IR).
S-au vizualizat, în primul rând, schemele structurale (logice) fundamentale ce permit
implementarea, în practică, a unui astfel de depozit instituţional (depozit de documente
digitizate), cu scopul declarat de a alege – pe baza unei analize comparative – organigrama
(algoritmul) ce reuşeşte satisfacerea celor mai multe cerinţe ale potenţialilor utilizatori ai
depozitului (o entitate complexă ce reuneşte atât creatori de informaţie cât şi consumatori de
informaţie).
S-au studiat, apoi, particularităţile arhitecturale ale structurilor hard şi soft ce permit
implementarea stabilă şi cu eficienţă ridicată a schemelor logice. Noile analize comparative
pentru diverse arhitecturi – utilizate pe plan mondial – au avut drept obiectiv principal găsirea
unei soluţii optime – din punct de vedere tehnico-economic – pentru sistemul integrat a cărui
implementare este ţelul major al acestui proiect.
Studiile întreprinse în privinţa elaborării soluţiei tehnice optime a sistemului integrat –
referitor la bibliotecile digitale, în general şi la depozitele instituţionale (IR), în particular - au
reliefat următoarele:
 Depozitele instituţionale (IR) trebuie privite ca fiind inima unei biblioteci digitale.
De buna realizare şi exploatare a acestui depozit depinde însăşi existenţa bibliotecii digitale a
viitorului;
 Structurile hardware moderne ce utilizează - la nivelul fundamental, deja –
procesarea în paralel, oferă posibilitatea dezvoltării, cu succes, a unor astfel de depozite
instituţionale şi, implicit, a unui întreg lanţ, cum este biblioteca digitală;
36
 Platformele software existente la ora actuală ce, am putea spune, utilizează
conceptul „diversitate în unitate‖ oferă garanţia procesării rapide a informaţiilor digitizate atât în
ceea ce priveşte indexarea şi stocarea acestora cât şi a regăsirii rapide, în cadrul depozitului
instituţional (IR);
 Depozitul instituţional este o uriaşă bază de date şi, ca urmare, multiplele
protocoale existente, pe plan mondial, pentru gestionarea acestor baze de date oferă, de
asemenea, căi uşoare de implementare a depozitelor, la orice scară. La toate acestea se adaugă şi
facilităţile oferite de multitudinea de motoare de căutare a informaţiilor digitizate care reprezintă
tot atâtea soluţii pentru căutarea şi găsirea rapidă a documentelor digitizate, în cadrul depozitului
instituţional;
 Un loc aparte, în procesarea rapidă, cu păstrarea stabilităţii sistemului şi satisfacţie
maximă pentru clienţi, îl ocupă interfeţele ce mediază intereacţiunea dintre clasa largă a
utilizatorilor şi depozitul instituţional. Alături de calitatea informaţiilor găsite în cadrul
depozitului, calitatea prezentării prin intermediul interfeţelor de căutare reprezintă cert o sursă de
mulţumire suplimentară pentru toţi clienţii depozitului instituţional (IR).
Cerinţele impuse pe baza amplelor studii întreprinse, în prima etapă a proiectului, au dat
un imbold puternic găsirii unei soluţii de implementare rapidă a unui astfel de depozit
instituţional, membrii consorţiului fiind convinşi că realizarea unui astfel de obiectiv este o
necesitate prioritară la nivelul comunităţilor academice din România.
Una din ideile vitale, rezultată în prima etapă, consta în „realizarea unei viziuni unitare
– a membrilor consorţiului – pentru obţinerea sistemului integrat de digitizare, a unei
efervescenţe creatoare bine canalizate în obţinerea soluţiei, a unei coeziuni puternice în
realizarea finală a sistemului‖. Găsirea unei soluţii optime pentru sistemul integrat – pe fondul
optimizării, în acelaşi timp, a sistemelor autonome, de la fiecare partener – certifică apariţia
acelei sinergii, atât de necesare realizării unui lucru deosebit şi la o scară relativ mare.
Propunerea unei soluţii arhitecturale biomimetice – pentru sistemul integrat – reprezintă
mica contribuţie a acestui proiect la dezvoltarea unor biblioteci digitale cu eficienţă ridicată în
procesarea unui volum tot mai mare de informaţii.
Amplul studiu comparativ, întreprins şi în această etapă, pentru găsirea unor principii noi,
a unor noi metode şi noi modele de structurare a sistemelor materiale şi informaţionale, permite
şi formularea altor concluzii, ce se constituie în tot atâtea căi de abordat în viitorul apropiat:
Dezvoltarea sistemului propus – bazat pe criterii simple şi clare – va reclama, cu
siguranţă, găsirea şi, mai ales, utilizarea unor noi paradigme, în viitorul apropiat. Aceste căutări
de paradigme sunt reclamate de particularitatea soluţiei propuse care este biomimetică (sistemele
biologice fiind sisteme de excelenţă în procesarea informaţiilor);
Utilizarea, în continuare, a principiilor teoriilor integratoare (metaştiinţelor) - cum
sunt teoria fractalilor, sinergetica, teoria constructală etc. – reprezintă o certitudine în
structurarea unor sisteme integrate complexe, multifuncţionale şi, cu siguranţă, neliniare.
Utilizarea unor teorii tributare viziunii liniare şi unilaterale asupra lumii (specifice secolelor
XVII, XVIII, şi XIX) nu mai permite vizualizarea interconexiunilor multiple, cu o dinamică
deosebită şi, bineînţeles, neliniare, atât de întâlnite în lumea modernă;
Noile soluţii propuse a fi implementate au drept scop, în subsidiar, şi formarea unui
nucleu de specialişti care să contribuie – prin activitatea de zi cu zi – la crearea unei noi şcoli
româneşti, la crearea unei comunităţi, cu adevărat academice, nu atât prin volumul informaţiilor
create sau deţinute (aceasta fiind tocmai sarcina acestui depozit instituţional) cât mai ales prin
calitatea informaţiilor livrate şi printr-o morală deosebită;
Soluţiile găsite pentru implementarea practică a sistemului integrat de documente tehnice
digitizate – la Universitatea „Dunărea de Jos‖ din Galaţi – reprezintă o provocare pentru toţi
membrii consorţiului, implicaţi în această acţiune. De păstrarea coeziunii acestui nucleu de
specialişti în formare – în domeniul fascinant al depozitelor instituţionale, în particular şi al
bibliotecilor digitale, în general – depinde reuşita viitoare a acestui proiect.

37
Bibliografie

1. A. Schaefer, M. Jordan, C.-P. Klas, and N. Fuhr. Active Support For Query Formulation in
Virtual Digital Libraries: A case study with DAFFODIL. In: Research and Advanced
Technology for Digital Libraries. 9 th European Conference, ECDL 2005, Springer.
2. An integrated system for managing the Andalusian Parliament’s digital library. Luis M. de
Campos, Juan M. Fernandez-Luna, Juan F. Huete, Carlos J. Martın-Dancausa. [online].
Disponibil pe Internet la adresa: www.emeraldinsight.com/0033-0337.htm
3. HUGHES, Carol Ann. Escholarship at the University of California: a case study in sustainable
innovation for open access. [online]. Disponibil pe Internet la adresa:
www.emeraldinsight.com/0307-4803.htm
4. Anderson, Cokie G., Maxwell, David C. Starting a Digitization Center. Oxford: Chandos
Publishing Limited, 2004. p. 105 www.emeraldinsight.com/0033-0337.htm
5. arXiv e-print service. http://arxiv.org/
6. Ashworth, Susan; Mackie, Morag; Nixon, William J. The DAEDALUS Project, developing
institutional repositories at Galsgow University : the story so far. [online]. Disponibil pe Internet
la adresa: www.emeraldinsight.com/0024-2535.htm
7. Barwick, Joanna. Building an institutional repository at Loughborough University: some
experiences. [online]. Disponibil pe Internet la adresa: www.emeraldinsight.com/0033-0337.htm
8. Berners-Lee, T., Weaving the Web, Orion Business Book, 1999.
9. Brasov, U. T. (2008-2012). Plan strategic. Brasov.
10. C. Lagoze, S. Payette, E. Shin, and C. Wilper. Fedora: An Architecture for Complex Objects
and their Relationships. Journal on Digital Libraries, Special Issue on Complex Objects, 2005.
11. C. Schuler, H. Schuldt, C. Türker, R. Weber, and H.-J. Schek. Peer-To-Peer Execution of
(Transactional) Processes. In: International Journal on Cooperative Information Systems (IJCIS).
Vol. 14, No. 4 (2005) 377-405.
12. C. Schuler, R. Weber, H. Schuldt, and H.-J. Schek. Scalable Peer–to–Peer Process
Management – The OSIRIS Approach. In Proc. of ICWS Conf., pages 26–34, San Diego, CA,
USA, 2004. [41]
13. Coravu, R. (2008). Bibliotecile universitare si accesul deschis la informatia stiintifică. (A. B.
România, Ed.) Revista română de biblioteconomie si stiinta informării , 4 (3-4).
14. Creating an Institutional Repository : LEADIRS Workbook. [online]. Disponibil pe Internet:
http://hdl.handle.net/1721.1/26698
15. Cristea, L., & Repanovici, A. (2007). Tehnologia informatiei-motorul trecerii la biblioteca
digitală. În R. Angela (Ed.), BIBLIO Brasov 2007. 2007, pg. 317-318. Brasov: Editura
universitătii Transilvania.
16. Current Digital Library Systems : User Requirements vs Provided Functionality. [online].
Disponibil pe Internet:
http://146.48.87.21/OLP/UI/1.0/Disseminate/1255929273i6FYPHVygf/a221255929273L0ZLO
mxM
17. Daffodil. Distributed Agents for User-Friendly Access of Digital Libraries.
http://www.daffodil.de
18. DRIVER. (2009). Networking European Scientific Repositories. Preluat pe iulie 24, 2009, de
pe http://www.driver-repository.eu/
19. DSpace. (2009). Dspace home federation. Preluat pe septembrie 1, 2009, de pe Dspace
Federation home page, <http://www.dspace.org>.
20. ePrints Supporting Open Access. http://www.eprints.org
21. Fedora Flexible Extensible Digital Object and Repository Architecture.
http://www.fedora.info.
22. Forman, George, A Pitfall and Solution în Multi-Class Feature Selection for Text
Classification, Proceedings of the 21st International Conference on Machine Learning, Banff,
Canada, 2004.

38
23. Gadd, E., Oppenheim, C., & Probetts, S. (Acceptat spre publicare). How academics expect to
use open-access research papers. Journal of librarianship and Information Science .
24. Gibbons, S. (2005). Faculty staff do not always understand the jargon used by librarians. The
assurance of their work being found on the Web is better understood than the need for consistent
metadata, and an unbreakable link better than a persistent URL. Preluat pe Iulie 29, 2009, de pe
http://docushare.lib.rochester.edu/docushare/dsweb/Get/Document- 19725/amsterdam.ppt
25. Greenstone Digital Library Software. http://www.greenstone.org
26. Guide d’ indexation. Biblioteca Natională Franceză, 2002.
27. H. Schuldt, G. Alonso, C. Beeri, and H.-J. Schek. Atomicity and Isolation for Transactional
Processes. ACM Transactions on Database Systems, 27(1):63–116, 2002.
28. Hajjem, C. H. (2006). The Self-Archiving Impact Advantage: Quality Advantage or Quality
Bias? University of Southampton,Department of Electronics and Computer Science.
29. Handbook of Research on Digital Libraries : Design, Development and Impact. [online].
Disponibil pe Internet:
http://www.torrentdownloads.net/torrent/1311967/Handbook+of+Research+on+Digital+Librarie
s+Design,+Development,+and+Impact
30. http://aspeckt.unitbv.ro/dspace/
31. http://en.wikipedia.org/wiki/Elements_of_graphical_user_interfaces
32. http://en.wikipedia.org/wiki/Graphical_user_interface
33. http://eprints.gla.ac.uk/cgi/search/advanced
34. http://eprints.gla.ac.uk/cgi/search/simple
35. http://libraries.theeuropeanlibrary.org/contactus_en.html
36. http://maps.repository66.org/
37. http://moodle.org/
38. http://roar.eprints.org/
39. http://www.ambysoft.com/essays/utilizatorinterfaceDesign.html
40. http://www.dlib.org/dlib/july07/rieger/07rieger.html
41. http://www.dspace.org
42. http://www.gla.ac.uk/
43. http://www.kb.nl/gabriel/
44. http://www.kb.nl/hrd/netwerk/gab-en.html
45. http://www.lib.gla.ac.uk/enlighten/
46. http://www.opendlib.com
47. https://dspace.gla.ac.uk/index.jsp
48. https://dspace.ucalgary.ca/
49. IEEE P1484.12 Learning Object Metadata Working Group. http://ltsc.ieee.org/wg12/
50. IFLA Guidelines for Digital Libraries, draft. Chapter 4. Metadata
51. Ignat, T. (2008). Biblioteca digitală si rolul său în activitătile de cercetare ale institutiei pe
care le deserveste. (A. B. România, Ed.) Revista română de biblioteconomie si stiinta informării,
4 (3-4).
52. Ignat, T., & Repanovici, A. (2009). Institutional repository marketing: from research to
knowledge transfer. Advances in Marketing, Management and Finances, Proceedings of the 3rd
International Conference in Management, Marketing and Finances, (MMF’09) (pg. 107-110).
Houston,USA: WSEAS.
53. Initiative, B. O. (2002). Preluat pe Mai 23, 2009, de pe
http://www.soros.org/openaccess/read.shtml
54. J. Krause. Das WOB-Modell. In: Vages Information Retrieval und graphische
Benutzeroberflächen: Beispiel Werkstoffinformation. Konstanz: Universitätsverlag, Konstanz
(1997) 59—88
55. K. Böhm, M. Mlivoncic, and R. Weber. Quality-Aware and Load-Sensitive Planning of
Image Similarity Queries. In Proceedings of the 17th Intl. Conf. on Data Engineering, pages
401–410, Washington, DC, USA, 2001.

39
56. Kosson. (2009). Depozite digitale. Preluat pe septembrie 20, 2009, de pe Kosson comunitate
virtuală: www.kosson.ro
57. Library of Congress Subject Headings. Library of Congress, 1999
58. Linch, C. A. (2008, Februarie). Institutional Repositories: Essential Infrastructure for
Scholarship in the Digital Age. Preluat pe Februarie 26, 2009, de pe ARL:
http://www.arl.org/newsltr/226/ir.html
59. M. J. Bates. Idea tactics. Journal of the American Society for Information Science, 30(5):280-
289, 1979.
60. M. J. Bates. Information search tactics. Journal of the American Society for Information
Science, 30(4):205-214, 1979.
61. M. J. Bates. Where should the person stop and the information search interface start?
Information Processing and Management, 26(5):575-591, 1990.
62. M. Mlivoncic, C. Schuler, and C. Türker. Hyperdatabase Infrastructure for Management and
Search of Multimedia Collections. In DELOS Workshop: Digital Library Architectures, pages
25–36, S. Margherita di Pula, Cagliari, Italy, 2004.
63. M. Springmann. A Novel Approach for Compound Document Matching. Bulletin of the
IEEE Technical Committee on Digital Libraries (TCDL), 3, 2006. To appear.
64. Manual UNIMARC: Format des notices d'Autorite. Biblioteca Natională Franceză, 2004
65. Metadata Encoding and Transmission Standard (METS). http://www.loc.gov/standards/mets/
66. Metadata Workflow (Dublin Core in practice): http://dublincore.org/resources/training/dc-
2008/T4-DC_in_practice.pdf
67. Misha Wolf and Charles Wicksteed- Reuters Corpus:
http://www.reuters.com/researchandstandards/corpus/ Lansat în Noiembrie 2000 accesat în Iunie
2005
68. Morariu, D., Vintan, L., Tresp, V., Evaluating some Feature Selection Methods for an
Improved SVM Classifier, International Journal of Intelligent Technology, Volume 1, no. 4,
ISSN 1305-6417, pag. 288-298, Decembrie 2006
69. N. Fuhr, C.-P. Klas, A. Schaefer, and P. Mutschke. Daffodil: An integrated desktop for
supporting high-level search activities in federated digital libraries. In Research and Advanced
Technology for Digital Libraries. 6th European Conference, ECDL 2002, pages 597-612,
Heidelberg et al., 2002. Springer.
70. N. Fuhr. Information Retrieval in Digitalen Bibliotheken. In: 21. DGI-Online-Tagung -
Aufbruch ins Wissensmanagement. 1999.
71. OpenDOAR. (2008). The Directory of Open Access Repositorie. Preluat pe Iulie 18, 2009,
de pe http://www.opendoar.org/
72. Pyrounakis, George, Nikolaidou, Mara. Comparing Open Source Digital Library System. În:
Handbook of Research on Digital Libraries: Design, Development and Impact. [online].
Disponibil pe Internet:
http://www.torrentdownloads.net/torrent/1311967/Handbook+of+Research+on+Digital+Libraris
+Design,+Development,+and+Impact
73. R. Tansley, M. Bass, and MacKenzie Smith. DSpace as an Open Archival Information
System: Current Status and Future Directions. In Proceedings of the 7th European Conference
on Research and Advanced Technologiey for Digital Libraries, ECDL 2003, pages 17-22,
Trondheim, Norway, August 2003.
74. R. Tansley, M. Bass, D. Stuve, M. Branschofsky, D. Chudnov, G. McClellan, and
MacKenzie Smith. The DSpace Institutional Digital Repository System: Current Functionality.
In Proceedings of the 3rd Joint Conference on Digital Libraries, JCDL 2003, pages 87-97, IEEE
Computer Society, 2003.
75. R. Weber and H-J. Schek. A Distributed Image-Database Architecture for Efficient Insertion
and Retrieval Tasks. In 5th Intl. Workshop on Multimedia Information Systems (MIS’99), pages
48–55, 1999.

40
76. R. Weber, C. Schuler, P. Neukomm, H. Schuldt, and H.-J. Schek. Web Service Composition
with OGrape and OSIRIS. In Proc. of VLDB Conf., Berlin, Germany, 2003.
77. R. Weber, H-J. Schek, and S. Blott. A Quantitative Analysis and Performance Study for
Similarity-Search Methods in High-Dimensional Spaces. In VLDB ’98: Proc. VLDB’98, pages
194–205, San Francisco, CA, USA, 1998.
78. R. Weber, J. Bolliger, T.R. Gross, and H.-J. Schek. Architecture of a Networked Image
Search and Retrieval System. In Proc. of CIKM Conf., pages 430–441, Kansas City, Missouri,
USA, 1999.
79. RAMEA U-Repertoire d 'Autorite-Matiere Encyclopedique et Alfabetique Unifie. Biblioteca
Natională Franceză, 2002
80. Rankink Web of World Repositories Site topul celor 400 depozite institutionale – lista
depozitelor / tări / http://repositories.webometrics.info
81. Repanovici, A. (2009). Marketing Research about Attitudes, Difficulties and interest of
academic Community about Institutional Repository, PLENARY LECTURE. Advances in
Marketing, Management and Finances, Proceedings of the 3rd International Conference in
Management, Marketing and Finances, (MMF’09), Houston,USA,April 30-May 2, 2009, ISSN
1790-2769, ISBN 978-960-474-073-4,pag.88-95 (pg. 88-95). Houston,USA: WSEAS.
82. Repanovici, A., & Turcanu, D. (2009). Qualitative and quantitative measures in marketing
research for university library resourse assesment. Books of abstracts, Qualitative and
quantitative methods in libraries QQML 2009, (p. 73). Chania, Greece.
83. RoMEO, S. (2006). RoMEO News. Preluat pe Iulie 18, 2009, de pe
http://www.sherpa.ac.uk/romeo/
84. S. Kriewel, C.-P. Klas, A. Schaefer, N. Fuhr. Daffodil - Strategic Support for User - Oriented
Access to Heterogeneous Digital Libraries. D-Lib Magazine, 10(6), June 2004.
85. S. Payette and S. Thornton. The Mellon Fedora Project: Digital Library Architecture Meets
XML and Web Services. In Proceedings of 6th European Conference on Research and Advanced
Technologiey for Digital Libraries, ECDL 2002, pages 406-421, Rome, Italy, September 2002.
86. Scott Ambler, „The Object Primer. Third edition‖, 2004
87. Sherpa. (2006). University of Nottingen. Preluat pe Iulie 20, 2009, de pe
http://www.sherpa.ac.uk/
88. SOROS. (2009). Open access software. Preluat pe Noiembrie 14, 2008, de pe
http://www.soros.org/openaccess/software
89. STAS 10711-89-Reguli generale pentru elaborarea si dezvoltarea tezaurelor monolingve
90. Suber, P. (2005). Overview iin Open access- Unrestricted access to published research. 93rd
Indian Science Congress , 7-13.
91. T. Staples, R. Wayland, and S. Payette. The Fedora Project: An Open-source Digital Object
Repository Management System. DLib Magazine, 9 (4), April 2003.
92. T. van Veen and B. Oldroyd. Search and Retrieval in The European Library. D-Lib
Magazine, 10(2), February 2004
93. TEL The European Library. http://www.theeuropeanlibrary.org/
94. Transilvania, U. (2009). Institut de cercetare-dezvoltare-inovare:produse high-tech pentru
dezvoltare durabilă. Preluat pe septembrie 3, 2009, de pe
http://www.unitbv.ro/institut_prodd/index.php?id=8
95. Transilvania, U. (2009). Pagina web a universitătii Transilvania. Preluat pe Septembrie 1,
2009, de pe Departamentul Informatizare:
http://www.unitbv.ro/Default.aspx?tabid=1222&language=en-US
96. Understanding Metadata. [online]. Disponibil pe Internet:
www.niso.org/standards/resources/UnderstandingMetadata.pdf
97. UNIMARC Manual: Bibliographic Format 1994, Concise version
98. V. Iverson, Y.-W. Song, R. Van de Walle, M. Rowe, C. Doim, E. Santos, and T. Schwartz.
MPEG-21 Digital Item Declaration. ISO/IEC JTC 1/SC 29/WG 11 N397,
http://xml.coverpages.org/MPEG21-WG-11-N3971-200103.pdf

41
99. Wikipedia- User interface (http://en.wikipedia.org/wiki/User_interface )
100. Woldering, B., 2004, Presentation on TEL, Online Information and Education Conference
2004, Bangkok
101. Yiotis, Kristin. Electronic theses and dissertation (ETD) repositories: What are they? Where
do they come from? How do they work? [online]. Disponibil pe Internet la adresa:
www.emeraldinsight.com/1065-075X.htm
102. Zeng, Marcia L. Dublin Core in Practice. [online]. Disponibil pe Internet:
dublincore.org/resources/training/dc.../T4-DC_in_practice.pdf.

42

S-ar putea să vă placă și