UNIVERSITATEA DUNREA DE JOS din GALAI Str. Domneasc Nr.47 Tel: (+40) 36 - 414112/3/4; 413602 800008 GALAI ROMNIA Fax: (+40) 36 - 461353; 460904; 460426
SECIUNEA 1
RAPORTUL TIINIFIC I TEHNIC (RST)
la contractul cu tema Sistem integrat pentru indexarea i partajarea on-line a documentelor tehnice digitizate - SIPTEH -
ETAPA DE EXECUIE NR. II an 2009
CU TITLUL:
Elaborarea soluiei tehnice a sistemului integrat
Director proiect Prof.dr.ing. Mnzu Viorel
Galai-2009
2 CUPRINS-ETAPA II Elaborarea soluiei tehnice a sistemului integrat
Obiective generale 3 Obiective specifice etapei II 3 Rezumat 4 DESCRIEREA TIINIFIC I TEHNIC -DST- 6 1. Introducere 6 Activitatea II.1 Analiza i elaborarea structurilor de indexare i regsire a informaiilor digitizate 11 A.I I .1. Realizarea algoritmului de indexare a documentelor i regsire rapid a informaiei ntr-un sistem integrat 11 A.II.1.1. Particulariti ale depozitelor de informaii digitizate. Cerine impuse proceselor de culegere, indexare, stocare i regsire a informaiei digitizate 11 A.II.1.2. Scheme structurale (organigrame) utilizate pentru indexarea documentelor i regsirea rapid a informaiei ntr-un sistem integrat 56 A.II.1.3. Analiza comparativ a schemelor structurale. Definirea algoritmului adecvat aplicaiei particulare din cadrul proiectului 60 Activitatea II.2 Elaborarea soluiilor optime pentru realizarea sistemelor autonome de indexare i stocare a documentelor digitizate i a sistemului central de procesare n paralel 84 A.I I .2. Analiza comparativ a sistemelor integrate de indexare, stocare i regsire a documentelor digitizate. Elaborarea soluiei optime 84 A.II.2.1. Particulariti arhitecturale ale sistemelor integrate de procesare a informaiilor digitizate 84 A.II.2.2. Analiza comparativ a sistemelor integrate de procesare a informaiilor digitizate pentru diferite arhitecturi i precizarea soluiilor viabile pentru aplicaia particular din cadrul proiectului 131 A.II.2.3. Elaborarea soluiei optime din punct de vedere tehnic i economic pentru aplicaia particular din cadrul proiectului. Rezolvarea unor probleme specifice sistemului 135 2. Concluzii finale 167 Activitatea II.3 Stabilirea specificaiei echipamentelor tehnice necesare realizrii sistemului integrat propus. Elaborarea caietului de sarcini 169
3
OBIECTIV GENERAL
Subordonnd activitile etapei II a proiectului n primul rnd obiectivelor generale Og 1 Realizarea unui sistem cu grad ridicat de integrare necesar pre-indexrii, indexrii, stocrii i regsirii informaiei on-line respectiv, Og 2 Crearea unei reele de depozite instituionale de documente digitizate i a unui depozit central de informaie indexat care s permit regsirea rapid din orice punct de acces cutarea s-a axat pe definirea criteriilor pe care trebuie s le ndeplineasc sistemul integrat de procesare a informaiilor, pe vizualizarea algoritmilor ce pot asigura implementarea unui astfel de sistem, pe alegerea n urma unor analize comparative a soluiei optime de realizare a depozitului digital att la parteneri (sisteme autonome) ct i la coordonator (sistemul integrat). Scopul final al cutrii este de atingere al Og 2, respectiv de creare a unui depozit central de informaie digitizat de natur tehnico-tiinific n cadrul proiectului, pentru consoriul angrenat n materializarea acestei idei, depozit care s se constituie ntr-un nucleu pentru dezvoltri viitoare pe plan naional, culminnd cu realizarea unui depozit naional de informaie digitizat. Materializarea acestei idei reclam aa cum a rezultat la finalul primei etape crearea unei sinergii, att n cadrul sistemului informatic integrat ct i la nivel social, ntre membrii comunitilor academice ale universitilor partenere din cadrul consoriului. ntr-o prim etap, aceast sinergie trebuie s se manifeste la nivelul specialitilor din cadrul bibliotecilor universitare ale membrilor consoriului.
OBIECTIVE SPECIFICE ALE ETAPEI
Etapa a II-a a proiectului SIPTEH i-a propus s ating dou din obiectivele specifice ale acestuia: Os 2 Optimizarea sistemelor autonome de pre-indexare, indexare i stocarea a informaiei, respectiv Os 3 Analiza i sinteza structurilor de preindexare. Un loc aparte n cadrul prezentului proiect l ocup Os 2 Optimizarea sistemelor autonome de pre-indexare, indexare i stocare a informaiei pentru a crui atingere etapa a II-a definete algoritmii specifici de implementare a unui astfel de sistem integrat i stabilete, totodat, arhitecturile particulare care se preteaz unei implementri rapide, simple i eficiente - n condiiile specifice din Romnia. Scopul final, ce definete specificitatea acestei etape a proiectului, este reprezentat, tocmai, de gsire pe baza studiului implementrilor existente, la ora actual, n lume i a cercetrilor proprii - a soluiei tehnice specifice condiiilor particulare din Romnia - de materializare a unui sistem integrat de procesare a informaiilor digitizate.
4 A. Principalele probleme abordate i soluiile gsite
REZUMAT
Etapa a II - a a proiectului Sistem integrat pentru indexarea i partajarea on-line a documentelor tehnice digitizate SIPTEH a abordat trei clase de activiti fr materializarea crora nu este posibil implementarea unui depozit instituional (IR): realizarea unui algoritm de indexare a documentelor digitizate i regsire rapid a informaiei n cadrul sistemului integrat; precizarea arhitecturilor particulare de dezvoltare a unor astfel de sisteme integrate de procesare a documentelor digitizate, cu scopul declarat de gsire a soluiei optime (un optim global care s permit sistemului integrat o funcionare stabil, armonioas i economic, n condiiile existenei unui optim funcional la nivelul fiecrui subsistem component); stabilirea, dup fixarea arhitecturii optime a specificaiei tehnice a echipamentelor cu ajutorul crora s se poat realiza efectiv sistemul integrat ce constituie elul major al proiectului. Pentru atingerea obiectivelor generale i specifice ale etapei, ntreaga cutare a principiilor i modelelor - a fost organizat sub forma unui amplu studiu comparativ ntre implementrile existente pe plan european i mondial, la nivelul bibliotecilor digitale - n general - i a depozitelor instituionale (IR), n particular. Cutarea soluiilor i, totodat, elementele pe baza crora s se poat efectua analiza comparativ i un posibil studiu critic, a demarat cu trecerea n revist a particularitilor funcionale i de performan ale depozitelor de informaii digitizate. Vizualizarea acestor particulariti are un dublu scop: pe de o parte fixarea unor soluii utilizate oriunde pe plan mondial dar n afara Romniei, respectiv, fixarea nevoilor proprii utilizatorilor din Romnia (ce are, totui, condiii specifice, de cultur i sociale), cu scopul, n subsidiar, a definirii cerinelor reclamate (pe baza nevoilor identificate) acestor sisteme la nivelul proceselor de culegere, indexare, stocare i regsire a informaiei digitizate. Odat identificate nevoile i stabilite cerinele fundamentale ale sistemelor integrate de procesare a informaiilor digitizate s-a trecut la definirea unor scheme logice (organigrame) pe baza crora s se poat realiza ulterior depozitul instituional (I R) i, bineneles, toate subsistemele ce vor ajuta la funcionarea stabil a acestuia. Scopul final al primei activiti a etapei a II-a l-a reprezentat definirea algoritmului adecvat aplicaiei particulare din cadrul proiectului. Acest lucru s-a realizat n urma unei ample analize comparative (prin studii de caz efectuate att pentru sisteme performante, existente pe plan mondial, ct i pentru sisteme de mai mic amploare i performane, aprute, deja, n Romnia) a logicii de implementare a unor astfel de aplicaii. Un loc aparte l ocup, n continuare, prezentarea particularitilor arhitecturale ale sistemelor integrate de procesare a informaiilor digitizate. Vizualizarea arhitecturilor ce permit implementarea schemelor logice definite n cadrul primei activiti a reclamat demararea unui nou maraton pentru compararea structurilor hardware - n primul rnd i a platformelor software n al doilea rnd cu cea mai larg utilizare pe plan mondial. Prin introducerea conceptelor de Open Source i Open Acces, limita stadiului actual, n acest subdomeniu din largul domeniu al Tehnologiei informaiei este ntr-o continu micare (cu o dinamic deosebit). Pentru compararea att a structurilor hardware ct i a platformelor software s-au trecut n revist dou nivele de integrare: o integrare la scar mare, reprezentat de implementarea bibliotecilor digitale, respectiv, o integrare la scar mic, reprezentat de realizarea depozitelor digitale (ce constituie inima unei biblioteci digitale moderne). Plecnd de la ideea, n ceea ce privete depozitele digitale, c acestea nu sunt, n ultim instan, dect uriae baze de date, analiza comparativ (desfurat special, n cadrul celei de-a doua 5 activiti) pentru acest nivel de integrare - s-a axat pe vizualizarea particularitilor sistemelor de gestiune a bazelor de date (SGBD-uri). Obiectivele principale, ale acestor analize comparative, l-au constituit att gsirea unei arhitecturi adecvate (structuri hardware) pentru aplicaia particular din proiect ct i alegerea unei platforme software care s permit satisfacerea cerinelor impuse, deja, pe baza de chestionar (de identificare a nevoilor utilizatorilor) acestor sisteme integrate de procesare a informaiilor digitizate. Din multitudinea de arhitecturi posibile, alegerea pentru modul particular de implementare - s-a oprit asupra a dou dintre acestea. Caracteristica principal a sistemului ce trebuie implementat o constituie diversitatea n unitate. Datorit integrrii unor sisteme autonome ntr-un mare sistem interregional, arhitectura este specific unor sisteme distribuite (una dintre soluii). Pe de alt parte integratorul de sisteme distribuite trebuie s ofere o localizare spaial mult mai restrns. Asfel nct arhitectura distribuit trebuie s se regseasc ntr-un concept de unitate spaial. Ieirea dintr-o astfel de dilem s-a realizat, n cadrul proiectului prin propunerea unei arhitecturi noi, biomimetice, generat prin utilizarea principiilor teoriei constructale, o arhitectur ce respect conceptul diversitate n unitate, prin realizarea unui optim global (soluia a doua, aleas, de altfel, pentru implementare). Scopul final al ntregului studiu din cea de-a doua activitate l-a constituit elaborarea soluiei optime a sistemului propus pentru implementare. Arhitectura biomimetic constituie o astfel de soluie optim (optim global) care asigur performane tehnice, eficien economic, impact redus asupra mediului etc.. Optimul global al sistemului integrat reclam i optimizarea subsistemelor componente (sistemelor autonome de procesare a informaiilor digitizate, aflate la parteneri). Arhitectura propus, n cadrul proiectului rezolv i acest aspect. Totui, multiplele particularitile funcionale ale subsistemelor adiacente depozitului instituional (IR) particulariti legate att de procesele de indexare ct i de procesele de regsire a informaiei digitizate de ctre utilizatori a reclamat o abordare distinct, n cadrul etapei, a acestei problematici specifice. S-au abordat, astfel, att metodele specifice de indexare a informaiei ct, mai ales, multitudinea de interfee ce permit interaciunea entitilor creator-utilizator de informaie digitizat cu depozitul instituional (IR). n finalul raportului, dispunnd de majoritatea elementelor necesare, s-a abordat problematica specificaiei tehnice a echipamentelor necesare implementrii soluiei optime propuse (activitatea a treia din aceast etap). Concret, aceast activitate s-a finalizat prin elaborarea caietelor de sarcini de fiecare membru al consoriului caiete ce sunt prezentate ca anexe la RST-ul etapei a II a a proiectului Sistem integrat pentru indexarea i partajarea on- line a documentelor tehnice digitizate SIPTEH. Pe baza tuturor analizelor comparative efectuate i a soluiilor propuse s-au definit n subcapitolul de Concluzii finale - ca un corolar - nvmintele desprinse n urma unui astfel de studiu. O parte din aceste nvminte au fost propuse drept ci de urmat, n viitorul apropiat, ci ce vor permite ncheierea, cu bine, a proiectului i, cu siguran, vor genera noi deschideri.
6 B. Principalele rezultate obinute n cadrul etapei
Analiza i elaborarea structurilor de indexare i regsire a informaiilor digitizate
A.II.1. Realizarea algoritmului de indexare a documentelor i regsire rapid a informaiei ntr-un sistem integrat A.II.1.1. Particulariti ale depozitelor de informaii digitizate. Cerine impuse proceselor de culegere, indexare, stocare i regsire a informaiei digitizate
Cel mai important aspect, n cadrul acestei activiti, l-a constituit stabilirea cerinelor impuse proceselor de culegere, indexare, stocare i regsire a informaiei digitizate. Aceast aciune a fost pus n und prin realizarea unui chestionar, adresat ntregii comuniti academice la nivelul universitilor partenere n cadrul consoriului de implementare a proiectului pe baza cruia s-au putut defini cele mai importante cerine. La nivelul coordonatorului, chestionarul a cuprins urmtorii pai:
a) Chestionar privind definirea unui model de serviciu de depozit digital:
Care este misiunea serviciului? Creterea impactului asupra cercetrii academice; Creterea vizibilitii/prestigiului instituiei; Crearea unui rol de conducere la nivelul instituiei pentru bibliotec; Indicarea randamentului la nivelul cercetrii universitii; Organizarea costurilor legate de tehnologia informaiei de la nivelul instituiei; Captarea nregistrrii instituionale; Furnizeaz servicii vitale comunitii academice; Ajut bibliotecile s ntlneasc provocrile realitii digitale; Gzduiete coleciile digitale; Administreaz materiale de nvare; ncurajeaz accesul deschis; Altele. Ce tipuri de coninut ai accepta? Publicat, literatur tiinific; Pre-tiprituri; Seturi de date; Materiale de cercetare; Materiale de nvare; nregistrri instituionale; Teze; Lucrri ale conferinelor; Reviste electronice; Altele. Cine sunt utilizatorii? profesorii; personalul bibliotecii; studenii; 7 administratorii; cercettorii interni; cercettorii externi; alii. Care sunt prile interesate? profesorii; personalul bibliotecii; studenii; administratorii; cercettorii interni; cercettorii externi; alii. Ce servicii ai oferi dac ai avea resurse nelimitate? ................................................................................... Ce i permii s oferi? ................................................................................... Ai plti pentru acel serviciu? ................................................................................... Care responsabiliti vor fi exercitate de bibliotec n raport cu coninutul comunitii? ................................................................................... Care sunt prioritile cele mai importane ale serviciului? ................................................................................... Care sunt prioritile programate pe termen scurt i cele pe termen lung? ................................................................................... Concluzii suplimentare relevante pentru instituia ta: ...................................................................................
Desigur c nevoile comunitii academice vor fi definitorii. De aceea este necesar o imaginea detaliat a practicilor curente ale profesorilor i care sunt ateptrile n legtur cu publicarea i distribuirea cercetrii lor.
Chestionar privind evaluarea nevoilor utilizatorilor:
La ce facultate din universitate eti angajat?
De ct timp eti la universitate?
Eti pe post de profesor?
Ct de importante sunt pentru tine urmtoarele afirmaii legate de avantajele unui depozit digital : Un depozit digital ar fi un instrument valoros dac... ar face ca versiunile pre-tiprite ale cercetrii mele s fie valabile audienei din toat lumea; ar face ca cercetarea mea s fie valabil ntr-un timp mai rapid dect procesul de publicare tradiional; ar face valabile tipuri de materiale care nu erau accesibile prin procesul tradiional de publicare, acest lucru incluznd seturi de date i formate bogate pe diverse suporturi cum ar fi: audio, video, imagini grafice; ar face ca cercetarea mea s fie accesibil cu un minimum de efort din partea mea i fr s ntrein o pagin web proprie; ar permite prezervarea pe termen lung a materialelelor digitale de cercetare proprii; 8 ar face pentru oameni s fie mai uor s-mi caute i s-mi localizeze munca; mi-ar permite s caut cele mai noi descoperiri ale colegilor din universitate; ar prezerva cercetarea din universitate ntr-un loc sigur i central. Ce formate digitale foloseti pentru a crea materialele tale de cercetare, materialele pentru conferine sau comunicarea altor materiale colare? Formate de date; Coduri surs; Formate binare; Formate Postscript; Formate video; Formate imagini grafice; Formate audio; Formate text; Formate descriere pagin; Formate compatibile Microsoft Office; Altele.
Ce tip de formate i-ar plcea s depui ntr-un depozit digital? Formate de date; Coduri surs; Formate binare; Formate Postscript; Formate video; Formate imagini grafice; Formate audio; Formate text; Formate descriere pagin; Formate compatibile Microsoft Office; Altele.
Dac ai distribui articole pretiprite, cum ai face-o? le-a afia pe pagina Internet personal; le-a afia pe pagina Internet a departamentului meu; le-a afia pe o pagin Internet pentru pretiprituri specific unei discipline; le-a transmite prin e-mail; a transmite copii prin pot; altele: .............
Cte articole tiinifice, lucrri ale conferinelor, seturi de date sau alte variante de comunicare tiinific publici anual ca autor sau coautor? 1. 0-1/an; 2. 2-4/an; 3. 5-7/an; 4. 8-10/an; 5. mai multe de 10/an.
Care dintre metodele tipice de depunere foloseti pentru publicarea unui articol sau alt tip de material? (Selecteaz pn la 3 dintre cele mai obinuite cerine pe care le ai.) Cedez drepturile de copyright asupra tuturor materialelor depuse editurii; Pltesc o sum mic pentru depunerea materialelor; Mi se solicit s pltesc/pagin; Nici un articol sau orice parte esenial a acestuia, tabele sau figuri nu pot fi publicate sau 9 depuse n alt parte nainte de a fi depuse la editur; Pretipriturile pot fi afiate pe servere dedicate pentru acest lucru, dac serverul este semnalat editorului dup depunerea lucrrii sau cu alte mici restricii; Pstrez dreptul de a afia lucrrile mele pe Internet; Pstrez dreptul de a folosi materialele publicate la cursurile pe care le predau; Nu m angajez n mod obinuit la procese de depunere, aa c nu sunt familiar cu aceste cerine; Altele.
n general, ct eti de interesat n folosirea unui depozit digital dac devine accesibil la universitate? Foarte interesat; Ct de ct interesat; Nici interesat, dar nici dezinteresat; Nu prea interesat; Deloc interesat.
Ceea ce m ngrijoreaz n legtura cu depunerea ntr-un depozit digital include: (Selecteaz trei!) M ngrijoreaz c ar putea constitui modalitatea de publicare prioritar i m-ar mpiedica s public lucrrile mele n reviste; Ezit s depun lucrrile mele ntr-un depozit digital deoarece nu are o politic categoric de control sau alt proces de control al calitii; Prefer ca doar lucrrile publicate n mod oficial s fie valabile pentru utilizarea de ctre public; Ezit s cedez universitii drepturile de distribuire pentru lucrrile mele tiinifice; A fi ngrijorat de riscul legat de noutatea adus de ideile mele; Sunt ngrijorat c lucrrile depuse n depozitul digital nu ar avea valoare pentru a fi citate i nu ar conta pentru ascensiunea mea profesional; Nu m simt n siguran folosind resursele electronice cum ar fi: procesoare word, procesoare Excel, Internet sau e-mail; Depun deja materiale la un server ce gestioneaz pretiprituri; Altele.
Biblioteca universitii ia n calcul extinderea serviciului de baz al unui depozit digital incluznd unele servicii personale i consultative. V rog s indicai interesul dvs. pentru folosirea unuia din urmtoarele servicii:
Servicii de informare personalizate Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Servicii de notificare personalizate Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Servicii de publicare Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi 10 Probabil ar folosi Categoric nu folosesc Servicii de conversie digital Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Servicii de reformatare Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Consultana n vederea reformatrii Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Servicii de administrare a coleciei Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Consultana metadate Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Servicii metadate Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc Servicii import pe loturi Nu ar folosi Probabil nu ar folosi Ar putea sau nu folosi Probabil ar folosi Categoric nu folosesc
Cine din departamentul tu ia n mod obinuit decizii de achiziionare a unor servicii ca cele indicate n lista de mai sus? Fiecare profesor; eful de laborator, centru sau departament; eful administrativ de departament; Altul.
Cum intri n posesia celei mai mari pri din informaiile despre planurile sau iniiativele din universitate? Buletinele informative ale universitii; Buletinele informative ale studenilor; 11 Pagina de Internet a universitii; Informaiile transmise de facultate; Informaiile transmise de departament; Presa local; Altele: ...... 1
Sintetiznd ideile cuprinse n chestionarul adresat utilizatorilor, se poate spune c nevoile ce apar n procesele de interaciune reclamate de crearea i exploatarea depozitelor instituionale cuprind urmtoarele aspecte:
Documentele: tipul; condiia; atributele metadatelor; criteriul de selecie; restricii de utilizare; relaia cu alte colecii. Utilizatorii: serviciile; tipul de utilizare; frecvena utilizrii; modul de utilizare. Resursele: personalul i abiliti; sisteme, hardware, software; prile interesate; liniile directoare i politicile organizaiei; planuri principale i strategii. Pe baza nevoilor se pot specifica, acum, cerinele pe care trebuie s le satisfac aceste depozite insituionale. n cele ce urmeaz sunt sintetizate principalele cerine reclamate de realizarea i exploatarea unui depozit intituional de documente digitizate:
Cerine reclamate de/pentru depozitele instituionale de documente digitizate:
stabilirea designului: cui se adreseaz? care sunt nevoile utilizatorilor? care este contextul n care vor folosi site-ul? legate de navigare: uurina navigrii coninutului; posibilitatea ntoarcerii la homepage-ul depozitului; gsirea rapid a informaiilor (din cteva click-uri). legate de alegerea softului: interfa simpl i intuitiv; vizibilitatea coleciei digitale; accesibilitatea coleciei s permit partajarea; flexibilitatea: s permit expansiunea serviciilor;
1 Creating an Institutional Repository : LEADIRS Workbook. [online]. Disponibil pe Internet: http://hdl.handle.net/1721.1/26698 12 configurarea serviciilor astfel nct s poat fi adugate noi tipuri de obiecte, formate de metadate i s suporte noi utilizri; legate de alegerea documentelor de digitizat: coninutul; unicitatea; cererea; legate de digitizare: care sunt materialele supuse digitizrii? care sunt cerinele pentru digitizarea materialelor?; care este algoritmul de lucru pentru prezervarea materialelor originale nainte, n timpul i dup digitizare?; care sunt standardele valabile si care sunt nevoile utilizatorilor?; care este structura proiectului de digitizare (pe fiiere)?; care sunt setrile necesare pentru scanarea materialelor?; cum se procedeaz n cazul notielor scrise de mn?; exist program de editare imagini pentru editarea i corectarea fiierelor imagine?; exist un program bun de OCR-izare?; au fost fiierele corectate i verificate de cel puin 2 ori, de cel puin 2 persoane diferite?; s-a stabilit i meninut un sistem bun de numire pentru fiierele din cadrul unui anumit proiect?; s-a stabilit si dezvoltat un flux de lucru?; s-au descrcat fiierele pe serverul web folosind un program FTP client? 2 ; legate de metadate: legate de stocare: diversitate sursele s nu fie limitate doar la text, imagini etc.; securitatea informaiei; legate de descriere: s nu necesite pregtirea suplimentar a celor care proceseaz (catalogheaz) informaiile digitale; interoperabilitatea (utilizarea unor metadate standard); stocare central i distribuit; vocabulare controlate; cmpuri cutabile; legate de indexare: acuratee; specificitate cu ct apar mai multe date asociate unei componente digitale cu att relevana va fi mai mare 3 ; exhaustivitate - n raport cu cererea formulat de utilizator cu ct termenii din interogare introdui de utilizator se potrivesc mai bine cu cei atribuii componentei digitale, cu att relevana este mai mare 4 ; legate de cutarea informaiilor: cine poate face cutarea? cum se face cutarea: cu text liber sau cmpuri; dup o limb sau ncruciat? legate de regsirea informaiilor: afiarea s se fac n ordinea relevanei; afiarea s se fac n toate tipurile de documente; relevana informaiei s rezulte i din coninutul documentului nu numai din titlul
2 ANDERSON, Cokie G., MAXWELL, David C. Starting a Digitization Center. Oxford : Chandos Publishing Limited, 2004. p. 105 3 www.emeraldinsight.com/0033-0337.htm 4 Ibid. 13 acestuia; legate de accesul la informaie; legate de prezervarea materialelor: evitarea scanrii acelor materiale care atrag deteriorarea lor; scanarea acelor materiale care ajung greu la utilizatori sau se deterioreaz foarte repede; alegerea materialelor pentru digitizare se face de departamentul de dezvoltare a coleciilor; legate de costuri: resurse umane i tehnice; prezervarea obiectelor digitale. legate de legislaie: dreptul de proprietate intelectual; ce este permis pentru acces; care este legtura cu editurile; problema licenelor pentru utilizarea materialelor digitale; consecinele juridice privind drepturile sistemelor de gestionare digital; colectarea de date personale n e-arhive i consecinele legislaiei privind protecia datelor. Merit a fi menionai, n acest context, i factorii ce intervin n alegerea modelului depozitului instituional de documente digitizate. Ei pot fi sintetizai dup cum este prezentat mai jos.
Factori ce intervin n alegerea modelului depozitului digital:
caracteristicile de dezvoltare; durabilitatea; infrastructura bibliotecii digitale; caracteristicile legate de coninut: formatele de fiiere suportate; metadatele suportate; cerinele legate de legalitatea datelor; utilitatea; interfaa utilizatorului i uurina n exploatare; faciliti de cutare, rsfoire i acces etc. politicile i practicile instituiei. 5
A.II.1.2. Scheme structurale (organigrame) utilizate pentru indexarea documentelor i regsirea rapid a informaiei ntr-un sistem integrat
Indexarea documentelor digitizate i regsirea lor n cadrul depozitului reprezint probleme cheie fundamentale n realizarea i exploatarea acestor sisteme integrate de procesare a informaiilor. Problema cea mai simpl, n aparen, o reprezint stocarea n cadrul depozitului instituional (IR) a multitudinii de date, deoarece, structurile hardware pot accepta dezvoltri pentru arhivarea unei cantiti imense de informaii digitizate. Este adevrat, n acelai timp, c tocmai problema regsirii rapide a informaiilor digitizate n cadrul depozitului, limiteaz realizarea unei arhitecturi arborescente stufoase i utilizarea unui numr mare de colecii, dar fr interconexiuni notabile ntre ele. Dei, ideea unitii tiinei este din ce n ce mai puin utilizat, la ora actual, pentru mulimile complexe de date din cadrul depozitelor digitale folosirea principiului similaritii n organizarea intern a coleciilor de date, ar fi benefic att
5 http://www.dlib.org/dlib/july07/rieger/07rieger.html 14 pentru utilizatori ct i pentru generatorii de informaie (desigur, prin utilizarea unor criterii clare care s permit definirea mulimilor similare de date). Pentru modul de lucru n ceea ce privete procesele de indexare, stocare i regsire rapid a informaiilor, n cadrul depozitului digital, n aceast seciune se vor prezenta trei scheme structurale (organigrame) care definesc tot atia algoritmi de lucru pentru procesarea informaiei n cadrul sistemului integrat. n fig. A.II.1.1 este prezentat o prim schem structural. Acest algoritm poate fi utilizat n cazul n care informaiile ce trebuie arhivate n cadrul depozitului digital sunt livrate direct de autori n format electronic. Este o schema structural ce respect o mare parte din criteriile fundamentale stabilite pentru realizarea unui depozit instituional dar care poate fi utilizat, cu succes, dup crearea acestui depozit i impunerea, ntr-un viitor apropiat, autorilor (creatorilor de informaie) de a livra documente numai n format electronic (digital). Unul din dezavantajele schemei structurale este reprezentat de lipsa unor subrutine care s permit o nvare treptat a crerii de sistemul de gestiune a bazelor de date a unor noi ci care s permit gsirea rapid a informaiei, pe msur ce depozitul nglobeaz o cantitate tot mai mare de date (prin utilizarea de algoritmi genetici, reele neuronale etc.).
Fig. A.II.1.2 prezint o a doua schem structural care este mai adaptat condiiilor actuale de realizare a depozitului digital.
n fig. A.II.1.3 este prezentat schema structural valabil pentru prelucrarea documentelor aflate att n format tiprit ct i n format electronic.
15
Fig. A.II.1.1. Schema structural de procesare a informaiilor pentru documente livrate, deja, n format electronic
START Culegere de date tehnice documente digitizate Preindexare documente tehnice digitizate Sortare i realizare colecii conform unei scheme predefinite Preindexare documente tehnice digitizate (formate standard) Exist documente ce nu pot fi clasificate pe scheme standard? Indexarea documentelor tehnice digitizate DA NU Definirea formatelor de arhivare a documentelor tehnice digitizate Arhivarea documentelor tehnice digitizate indexate n formate standard Exist documente ce nu pot fi arhivate pe formate standard? DA NU Definirea protocoalelor de cutare i regsire a documentelor n depozitul digital Partajarea i optimizarea locaiilor de arhivare ale documentelor digitizate Crearea de ci paralele de procesare a documentelor digitizate (pentru stocare i regsire rapid) Exist documente ce nu pot fi regsite rapid? DA NU Optimizarea interfeelor de interaciune cu procesul de prelucrare a informaiilor specifice depozitului digital Precizarea rutinelor ce permit ntreruperea accesului n depozitul digital n cazul nerespectrii procedurilor de ctre utilizatori Tratarea ntreruperilor din sistemul integrat Exist o densitate mare de ntreruperi? DA NU Realizare subrutine testare periodic a integritii sistemului de procesare a informaiilor STOP 16
Fig. A.II.1.2. Schema structural de procesare a informaiilor pentru documente aflate, la momentul iniial, n format tiprit START Crearea de locaii speciale pentru realizarea de arhive de siguran pentru documentele tehnice cu valoare teoretic i practic ridicat (principiul holografic) Precizarea rutinelor ce permit ntreruperea accesului n depozitul digital n cazul nerespectrii procedurilor de ctre utilizatori Pregtirea documentelor tehnice pentru digitizare Predefenirea schemelor de realizare a coleciilor specifice depozitului digital Preindexarea documentelor tehnice digitizate (formate standard) Exist documente ce nu pot fi clasificate pe scheme standard? Indexarea documentelor tehnice digitizate DA NU Definirea formatelor de arhivare a documentelor tehnice digitizate Arhivarea documentelor tehnice digitizate indexate n formate standard Exist documente ce nu pot fi arhivate pe formate standard? DA NU Definirea protocoalelor de cutare i regsire a documentelor n depozitul digital Partajarea i optimizarea locaiilor de arhivare ale documentelor digitizate Crearea de ci paralele de procesare a documentelor digitizate (pentru stocare i regsire rapid) Exist documente ce nu pot fi regsite rapid? DA NU Optimizarea interfeelor de interaciune cu procesul de prelucrare a informaiilor specifice depozitului digital Tratarea ntreruperilor din sistemul integrat Exist o densitate mare de ntreruperi? DA NU Realizare subrutine pentru verificarea periodic a arhivei de siguran Realizare subrutine testare periodic a integritii sistemului de procesare a informaiilor STOP 17
18
Fig. A.II.1.3. Schema structural de procesare a informaiilor pentru documente aflate, la momentul iniial, fie n format tiprit fie n format electronic cu subrutine de nvare
19 Spre deosebire de schemele prezentate anterior, noua organigram (Fig. A.II.1.3) conine subrutine ce permit nvarea sistemului de procesare a informaiilor s gseasc, pe criterii clare, predefinite, lucrrile cele mai valoroase din baza de date, lucrri ce reflect acum i peste timp adevrata identitate a universitii. Aceste lucrri definesc valoarea (excelena) membrilor comunitii academice n anumite domenii, domenii specifice arealului n care s-a dezvoltat, de-a lungul timpului respectiva universitate. Desigur, n viitor, aceste proceduri de nvare, pe msura dezvoltrii tehnologiilor informatice, vor putea fi dezvoltate, extinse asupra altor aspecte definitorii ale depozitelor digitale. Posibilitatea de dezvoltare continu a tuturor procedurilor ce contribuie la meninerea integritii depozitului digital este una din caracteristicile cele mai importante ce trebuie avute n vedere, n acest moment, al crerii respectivului depozit.
Unul din aspectele importante abordate, de asemenea, n aceast activitate l-a constituit analiza comparativ a platformelor software ce urmeaz a rezolva, cu eficien ridicat, toate cerinele reclamate de depozitele digitale. Aceste platforme software, implementate pe o structur hardware dat, trebuie s ndeplineasc, practic, majoritatea criteriilor impuse sistemelor integrate de indexare, socare i regsire rapid a documentelor digitizate. Integrarea este o problem de scar, iar modificarea acestui factor de scar se poate realiza, deocamdat, pe dou ci: hardware, respectiv, software. Limitrile fizice, vor reclama, cu siguran, n viitor, dezvoltarea unor metode specifice software care s duc la micorarea factorului de scar (un principiu holografic de lucru) n condiiile n care miniaturizarea hardware nu va mai fi posibil dect printr-un nou salt tehnologic i tiinific n intimitatea materiei (nanotehnologiile i nanomaterialele). n tabelele A.II.1.1, respectiv, A.II.1.2 este fcut o analiz comparativ a platformelor software cu cea mai mare aplicabilitate n dezvoltarea i gestionarea depozitelor digitale. Dac, n tabelul A.II.1.1, sunt analizate comparativ la nivelul caracteristicilor fundamentale - platformele software Open Source, n tabelul A.II.1.2 sunt puse n balan la nivelul indicatorilor de performan softurile cu cea mai larg utilizare n cadrul depozitelor digitale, cu scopul declarat de a identifica acei indicatori pe care i reclam, conform analizei pe baz de chestionar, aplicaia ce urmeaz a fi implementat n cadrul proiectului.
20
Compararea softurilor Open Source Tabelul A.II.1.1 Caracteristica DSpace Fedora Greenstone EPrints Entitatea de baz (modelul de obiect) Item-ul (elementul) conine: metadate; coninut digital. - cmpurile de metadate DC sunt stocate n item-uri; - alte seturi de metadate i coninutul digital sunt definite ca fluxuri de bii i sunt categorisite ca mnunchiuri de item-uri; - structura intern a unui item este reprezentat de metadatele structurale, care definesc relaia dintre prile constituente ale unui item; - identificatori unici pentru item-uri; - identificatori persisteni pentru fluxurile de bii ale fiecrui item. Obiectul digital conine: metadate; coninut digital, ambele tratate ca fluxuri de date; legturi ctre modurile de comportare care l definesc. - structura intern este bazat pe metadate METS i este determinat de Obiectul Fedora XML (FOXML); - un indentificator unic permanent pentru fiecare obiect digital; - identificatori unici pentru fluxurile de date. Documentul - caracteristici: - n format XML; - este legat de unul sau mai multe resurse care reprezint coninutul digital al unui obiect; - identificator unic de document; - nu exist identificatori persisteni pentru resurse.
Obiect de date nregistrare coninnd metadate; - unul sau mai multe documente (fiiere) pot fi legate la un obiect de date; - fiecare obiect de date are un identificator unic.
Coleciile (i legturile dintre ele) - colecii de item-uri; - colecii de comuniti care dein una sau mai multe colecii; - un item poate aparine uneia sau mai multor colecii, dar are doar un proprietar de colecii; - colecii folosind fluxuri de date RELS-EXT avnd n vedere o ontologie de baz specific privind relaionarea; - relaiile dintre obiectele digitale sunt exprimate n cadrul descrierii resursei (RDF) (W3C); Colecia = un set de caracteristici care descriu funcionalitatea sa: capacitile de indexare, cutare i rsfoire; formatele fiierelor; conversia; punctele de intrare pentru - nu sunt definite nite colecii; - obiectele de date sunt grupate funcie de cmpuri specifice (subiect, an, titlu etc.); - nu este o definiie legat de relaiile dintre documente, 21 - metadatele descriptive dintr- o colecie: titlul i descrierea; - nu exist suport pentru relaiile ntre diferite item-uri. - nu este furnizat un mecanism de manipulare a acestor relaii. importul de coninut digital; caracteristici legate de prezentarea coleciei; - reprezentarea structurii ierarhice n documentele text: capitole, seciuni i paragrafe. - definirea unor seciuni specifice n cadrul unui document text este realizat prin etichete XML; - X-legturile din document sunt folosite pentru a relaiona cu alte documente sau resurse. exceptnd folosirea de adrese URL din cmpurile specifice de metadate. Stocarea (metadatelor i a coninutului digital) - metadate DC n baza de date relaionale PostgreSQL sau Oracle; - fluxurile de bii sunt stocate n fiiere sistem; - fiecare flux de bii are asociat un format specific; - pentru fiecare format flux bii este definit nivelul de prezervare pentru formatul fiierului specificat. - metadatele i coninutul digital, considerate fluxuri de date sunt stocate fie: intern, ntr-un fiier XML al obiectului digital; n fiierul sistem al coninutului gestionat; de o surs extern. - unul sau mai multe seturi de metadate pot fi folosite n mod simultan, n timp ce formate de fiiere diferite pot fi stocate separat ca fluxuri de date ntr-un obiect digital; - pentru fiecare flux de date sunt stocate metadatele - documentele i resursele sunt stocate ntr-un fiier sistem; - metadatele sunt definite de utilizatori i sunt stocate n documente utiliznd un format intern XML. - cmpurile de metadate sunt definite de utilizatori; - obiectele de date, coninnd metadate sunt stocate ntr-o baz de date MySQL; - documentele (coninutul digital) sunt stocate ntr-un fiier sistem. 22 tehnice de baz: tipul MIME (multipurpose Internet mail extensions), mrimea fiierului i checksum n scopul prezervrii coninutului; - suport versiuni ale anumitor fluxuri de date, permind utilizatorilor s acceseze exemple de fluxuri de date mai vechi. Cutarea i rsfoirea - permite indexarea pentru setul de baz de metadate (DC), utiliznd o baz de date relaional; - indexarea altor seturi definite de metadate este permis utiliznd Lucene API; - cutarea se poate face n colecie sau comunitate; - rsfoirea se poate face prin intermediul cmpurile predefinite: titlu, autor, dat. - indexarea se face utiliznd setul de metadate DC i sistemul de metadate ale obiectelor digitale: identificator persistent, dat creare/modificare, etichet, model coninut); - indexarea i cutarea se face prin intermediul unei baze de date relaionale (MySQL, Oracle sau PostgreSQL); - cutarea se poate face n toate cmpurile indexate; - relaiile dintre obiectele digitale sunt indexate i pot fi cutate prin intermediul unui index Fedora; - nu este furnizat un mecanism de rsfoire. - indexarea este permis documentelor text i cmpurilor de metadate specifice; - cutarea este permis n seciuni din cadrul unui document (titlu, capitol, paragraf) sau n tot documentul; - rsfoirea poate fi definit pentru anumite cmpuri folosind structura ierahic. - indexarea este permis pentru orice cmp de metadat, utiliznd baza de date MySQL; - indexarea full text este suportat pentru cmpurile selectate; - sunt permise utilizatorilor finali cutarea combinat pe cmpuri i cutarea text liber; - rsfoirea se poate face utiliznd anumite cmpuri: titlu, autor, subiect). Managementul obiectelor - obiectele sunt create prin intermediul depunerii sau - crearea obiectelor digitale este posibil folosind interfaa - colecii noi i documentele coninute n acestea sunt - este furnizat o interfa web utilizator implicit pentru 23 importrii pe loturi; - coleciile i comunittile sunt create prin intermediul interfeei Web a utilizatorului; - este configurat fluxul de lucru care poate conine ntre 1-3 pai unde diferii utilizatori sau grupuri pot interveni pentru a depune item-uri. Client Administrator sau importarea pe loturi (fiiere XML n formate METS sau FOXML); - adugarea de metadate sau editarea este posibil prin intermediul unui editor text - interfaa Client Administrator; - adugarea sau tergerea de coninut digital - interfaa Client Administrator. construite prin intermediul interfeei bibliotecarului Greenstone sau folosind un program pe baz de linie de comand. crearea i editarea de obiecte; - autorizarea poate ajuta la completarea unor anumite cmpuri (autori, titlu etc.) - obiectele pot fi importate din fiiere text folosind mai multe formate: METS, DC, MODS. Interfeele cu utilizatorii - este furnizat o interfa web utilizator implicit pentru ca utilizatorii finali s rsfoiasc colecia, s vizualizeze metadatele DC ale unui item i s navigheze ctre fluxurile sale de bii (prin intermediul metadatelor structurale); - o interfa de cutare permite utilizatorilor cutarea dup cuvinte cheie. - interfaa web Fedora permite utilizatorilor finali cutarea dup cuvinte cheie sau cmpuri; - vizualizarea obiectelor digitale se rezum la prezentarea sistemului de metadate i la fluxurile de date. - interfaa web implicit cu utilizatorul final permite rsfoirea i cutarea n colecii, navigarea n structura ierarhic a obiectelor (cum ar fi crile) folosind tabela de coninut. - permite rsfoirea prin intermediul cmpurilor selectate de metadate (de obicei, subiect, titlu sau dat); - rsfoirea poate fie ierarhic pentru cmpurile subiect; - mediul de cutare permite utilizatorului s restricioneze cererea de cutare folosind mai multe cmpuri i prin selectarea valorilor din liste. Controlul accesului - utilizatorii si grupurile dein drepturi diferite; - autentificarea se poate face pe baz de parol, certificate X509 sau protocoale LDAP; - drepturile legate de controlul accesului este inut pentru fiecare item i - permite utilizatorilor i grupurilor autorizate s acceseze anumite obiecte digitale folosind politicile XACML; - autentificarea este permis prin intermediul protocoalelor LDAP sau Internet (IP). - un utilizator Greenstone poate s aparin 1-2 grupuri predefinite de utilizatori; poate fi administrator sau creator de colecie; - grupul de utilizator Administrator are drepturi de a crea i a terge utilizatori; - utilizatorii nregistrai pot crea i edita obiecte; - nregistrarea se face pe baz de nume utilizator i parol. 24 definete aciunile pe care le poate realiza utilizatorul: citire/scriere fluxuri bii itemi, adugare/tergere mnunchiuri de item-uri dintr-o colecie; - drepturile se bazeaz pe o politic default-deny. - grupul de utilizator Creator de colecie are drepturi de creare i actualizare colecii; - utilizatorii finali au acces la toate coleciile i documentele. Suportul multilingv Unicode Character Encoding suport mai multe limbi att n cmpurile de metadate ct i n coninutul digital. Unicode Character Encoding suport mai multe limbi att n cmpurile de metadate ct i n coninutul digital;
Unicode Character Encoding suport mai multe limbi att n cmpurile de metadate ct i n coninutul digital; - permit folosirea de interfee multilingve, fiind deja traduse n mai multe limbi. Unicode Character Encoding suport mai multe limbi att n cmpurile de metadate ct i n coninutul digital; - are un atribut XML pe cmpurile de metadate pentru a defini limba folosit n valoarea cmpului. Interoperabilitatea - suport OAI-PMH, putnd partaja metadatele BD cu alte depozite digitale; - pot exporta obiecte digitale ca fiiere METS XML; -suport protocolul OpenURL (NISO) furniznd legturi pentru pagina fiecrui item. - suport OAI-PMH, putnd partaja metadatele BD cu alte depozite digitale; - pot exporta obiecte digitale ca fiiere METS XML;
- suport OAI-PMH, putnd partaja metadatele BD cu alte depozite digitale; - suport protocolul Z39.50 pentru a rspunde cererilor n legtur cu anumite seturi de metadate; - export obiectele de date n formate METS i MPEG-21 DIDL (digital item declaration language). Nivelul de adaptare - dei flexibil, nu este att de deschis construirii de obiecte diferite cu seturi independente de metadate datorit arhitecturii sale database- oriented; - interfaa cu utilizatorul este fix i permite numai - fiecare obiect digital poate urmri un model diferit de coninut care descrie formatul su; - e posibil s furnizeze mai multe moduri de comportare care s determine metodele de acces i manipulare a - se poate adapta prezentarea unei colecii pe baza XLTs i a agenilor care controleaz anumite aciuni ale BD; - arhitectura furnizeaz: un back end care conine colecii, documente i - obiectele de date conin metadate definite de utilizatori; - pot fi scrise plugin-uri pentru a facilita exportul obiectelor de date n diferite formate text; - un nucleu API n Perl este 25 intervenii minore de prezentare; - permite suport complet doar pentru anumite formate de fiiere ca i coninut digital. obiectului digital; - interfaa implicit cu utilizatorul dei este srac poate fi complet adaptat folosind cele dou API (API acces i API management).
serviciile care le gestioneaz; un web-based front- end responsabil pentru prezentarea coleciilor, documentelor i mediului lor de cutare. furnizat dezvoltatorilor care prefer s acceseze funcionalitatea de baz a BD.
Entitatea de baz (obiectul) = structura intern a unui obiect digital, care include metadate i coninut digital; existena unor identificatori unici ai obiectului digital i a fiecrei pri componente a acestuia este foarte important pentru asigurarea prezervrii i uurinei de accesare.
Coleciile i legturile dintre acestea = coleciile de metadate descriptive, definirea subcoleciilor i a abloanelor care descriu formatul obiectelor digitale, prezentarea coleciilor; relaiile dintre obiectele de acelai tip sau tipuri diferite.
Stocarea metadatelor i a coninutului digital = capacitile de stocare sunt determinate de condiiile de prezervare; este important ca un sistem de bibliotec digital (BD) s asigure standarde la fel de bine ca i seturile de metadate i multiplele formate de coninut digital definite de utilizator.
Cutarea i rsfoirea = mecanisme folosite pentru indexarea i cutarea metadatelor; este important ca un sistem de BD s permit indexarea nu numai pentru un set limitat de metadate ci i pentru cmpuri de metadate selectate.
Managementul obiectelor = metode i interfee cu utilizatorul furnizate de sistemul BD n ideea manipulrii metadatelor i a coninutului digital (ex.: inserare, actualizare i tergere).
Interfeele cu utilizatorii = interfeele furnizate utilizatorilor finali n ideea accesrii unei BD, a coleciilor i obiectelor digitale ale acesteia.
Controlul accesului = se refer la ntreinerea utilizatorilor i a grupurilor i la metodele de autorizare i autentificare; permite accesul i actualizarea restricionat a coleciei BD, a obiectelor digitale, a coninutului acesteia etc.
Suportul multilingv = pentru ca sistemul BD s fie complet multilingv trebuie s fie permis n interfaa cu utilizatorii, n cmpurile de metadate i n coninutul digital mai multe limbi de circulaie internaional.
26 Interoperabilitatea = standarde pe care le permite sistemul BD pentru a asigura interoperabilitatea cu alte sisteme (ex.: exportul obiectelor digitale n formate standard deschise).
Nivelul de adaptare = se refer la adaptarea sistemului unei BD la nivelul coleciilor, formatului obiectelor digitale i a serviciilor furnizate; sunt incluse calitatea i metodele furnizate de interfeele de programare a aplicaiei (API) ale sistemelor BD.
Concluzii i sugestii
Este dificil de propus un anumit sistem de bibliotec digital. Analiznd principalele trsturi i caracteristici ale sistemelor de biblioteci digitale, fiecare are avantaje i dezavantaje. Acest lucru ar putea folosi, ns, ca linii directoare n alegerea deciziei asupra acelui sistem care s gzduiasc colecia digital. Nevoile variaz de la o organizaie la alta funcie de numrul coleciilor, tipurile de obiecte, natura materialului, frecvena de actualizare, distribuirea coninutului i limitele de timp pentru dezvolatrea unei biblioteci digitale. n acest sens, iat cteva linii directoare: Cazul unei instituii care este interesat n crearea unui depozit digital care s conin lucrri de cercetare i disertaii produse de studeni i comunitatea academic. n acest caz, cel mai indicat sistem este DSpace, deoarece acesta reprezint n mod implicit comuniti (departamente ale universitii, de exemplu) i colecii (ex. lucrri i disertaii), fluxul de lucru legat de depunere este suportat de utilizator. Cazul unei instituii care este interesat n publicarea coninutului su digital ntr-o form simpl i n limite stricte de timp. n plus, instituia intenioneaz s integreze interfeele web ale BD la un portal tip pagin web. n acest caz, cel mai indicat sistem este EPrints, deoarece separ prezentarea de stocare, acestea nu depind de anumite standarde de metadate si furnizeaz interfee web simple pentru depunere i prezentare de documente i metadate. Cazul unei instituii care este interesat n digitizarea coleciilor din biblioteci, arhive, muzee i gzduirea acestora ntr-un singur sistem de bibliotec digital. Instituia are resurse umane, timpul necesar pentru adaptarea sistemului i dezvoltarea suplimentar de module. Cea mai mare prioritate o constituie suportul pentru prezervarea publicaiilor, folosirea de multiple standarde de metadate i diferite formate de coninut digital. n acest caz, cel mai indicat sistem este Fedora, deoarece furnizeaz o arhitectur modular care poate fi foarte uor adaptat. Dei nu furnizeaz interfee web uor de utilizat i nici funcionalitatea nu e uor de construit, totui este cea mai bun alegere pentru a gzdui multe colecii i diferite materiale. Cazul unei instituii care este interesat n publicarea electronic a crilor ntr-un sistem de bibliotec digital adaptabil i simplu de folosit. n acest caz, cel mai indicat sistem este Greenstone, deoarece este simplu s reprezini crile n mod ierarhic, utiliznd tabla de coninut, n timp ce este posibil cutarea full text pe capitole. 6
6 Pyrounakis, George, Nikolaidou, Mara. Comparing Open Source Digital Library System. n: Handbook of Research on Digital Libraries : Design, Development and Impact. [online]. Disponibil pe Internet: http://www.torrentdownloads.net/torrent/1311967/Handbook+of+Research+on+Digital+Libraries+Design,+Development,+and+Impact 27 Analiza comparativ a sistemelor de depozitare
Tabelul de mai jos nsumeaz aspecte ale diferitelor sisteme de depozitare care au fost analizate. Acele aspecte pentru care nu s-a gasit nici o descriere n literatur au fost lsate necompletate. Tabelul A.II.1.3 Fedora DSpace aDORe Utilizator Identificator Utilizator Da Da Nu Profil Utilizator No Da Nu Rol No Da Nu Politica Nu Nu Grup Nu Comuniti Nu Spaiu Informativ Information Object FOXML (suport METS) Baze de date relaionate MPEG-21 DID Identificator pentru Information Object FEDORA Persistent Identifier (PID) CNR Handle System Identifier Locator Coninut - Metadata Da Da Da - Text Da Da Da - Imagine Da Da Da - Audio Da Da Da - Video Da Da Da - Combinate Da Da Da Versiune Versiuni ale unui individual datastreams (linear) ABC Harmony Datamodel Da Manifestare Datastream Bitstream Datastream Adnotare Metadata MPEG21 DIDL - Format Descriptiv Metadata DC (cutabil), orice alt format ne-cutabil DC calificat 28 Fedora DSpace aDORe -Format Structural Metadata FOXML Baze de date relaionate
-Format Administrativ Metadata FOXML Date de baze relaionate
- Format Conservare Metadata FOXML, conservarea funcional este implementat de utilizator prin Baze de date relaionate, grupuri(Bundles) i Bitstream. Conservarea funcional prin formate suportate, conservare bitstream, altele
Colecie RDF bazat pe relaia tip obiect la obiect Suport nativ pentru colecii n cadrul unei scheme relaionale OAI-PMH seturi Funionalitate Acces OAI-PMH - Cutare Da Da Nu - Full text Nu Nu Nu - Metadata Da Da Nu - Imagine Nu Nu Nu - Audio Nu Nu Nu - Video Nu Nu Nu - Convorbire Nu Nu Nu - Obiect singular - Aspect singular Nu Nu Nu - Obiect multiplu - Aspecte multiple Nu Nu Nu -Compound Document Match Nu Nu Nu - Predicate Nu Nu Nu - ntrebri ample Nu Nu Nu Limbaj ncruciat UTF-8 UTF-8 Nu 29 Fedora DSpace aDORe Feedback relevant Nu Nu Nu Rsfoire Foarte simpl Da, construit n suport n Web UI Nu Vizualizare Foarte simpl Da, construit n suport n Web UI Nu Traducere Nu Nu Nu Aspecte de Management Submit Numai de ctre Administrator, poate n varianta FEDORA 2.1 model adaptat de Autorizare poate permite i alte statuturi Da Updatare Numai de ctre Administrator Da Adnotare Analiz Numai de ctre Administrator Da DL Management Adnotare Updatare Da Da Retragere Da Da Descriere Da Da Diseminare Da Da Conservare Da Da Managementul utilizatorului
- nregistrare Nu Da - Role Management Nu Da Politica de Management Da Personalizare 30 Fedora DSpace aDORe Managementul coleciilor Nu Da, foarte simpl Nu Acces personalizat Nu Da Nu Notificare Nu Da Nu Altele nregistrare on-line Nu Permitere (acces) Autentificare Da Da Autorizare Da (XACML-based Politica de acces) Da (Baza de date relaionate)
Codare Nu Nu Abonare Nu Da Notificare Nu Da Procedeu de realizare Nu, doar diseminarea of behaviors on datastreams Da, (un flux de lucru alctuit din 3 pai)
Altele -OAI-PMH harvesting -Multe funcii sunt prezentate ca SOAP- based Web Services -Suport pentru LDAP, bazat pe identificarea de IP, Autentificare bazat pe HTPP i autentificare bazat pe SSL -OAI-PMH harvesting -Suport pentru LDAP -OAI-PMH Federator -Open URL Resolver Calitatea serviciilor Securitate Economics Disponibilitate Fiabilitate Performan Timp de rspuns Securitate 31 Fedora DSpace aDORe Autentificare Integritate Protecia datelor Protecia mesajelor Robustee Capacitate Gradul de ncrcare Gradul de recuperare Mesagerie Consisten Scalabilitate Arhitectur Caracteristici Serviciile de pierdere cuplate actioneaz naintea serviciilor de depozitare Arhitectura tip etichet a componentelor interacioneaz prin API Componentele de baz i standardele de baz a arhitecturii unde interaciunea
Dup cum se constat n ceea ce privete software-le Open Source exist indicatori de performan care pot fi mbuntii cu fiecare nou aplicaie (nespecificai, nc, de literatura de specialitate). Este, acesta, i unul din obiectivele prezentului proiect, care ncearc, spre exemplu, fluidizarea fluxurilor informaionale n cadrul unui sistem integrat de bibliotec digital prin adoptarea unor arhitecturi particulare (bazate pe teoria constructal); elul final l constituie minimizarea timpilor de rspuns i realizarea unei anumite robustei (nelegnd, prin aceasta, meninerea stabilitii funcionale a sistemului la un nivel ridicat de perturbaii).
Concluzii privind alegerea algoritmului optim ce poate fi implementat n cadrul aplicaiei din cadrul proiectului
n urma ntregului studiu efectuat, pe baza att a cerinelor reclamate sistemului integrat de potenialii utilizatori ct i a criteriilor de performan propuse de entitatea global creatori (i gestionari) de informaie utilizatori de informaie, se pot formula urmtoarele concluzii: Algoritmul optim trebuie s conin un numr minim de subrutine, pentru a putea obine timpi minimi de rspuns n cutarea informaiei din depozitul digital; Algoritmul optim trebuie s aib capacitatea de adaptare la modificarea numrului de utilizatori obinut printr-un proces de nvare, de a gsi i utiliza noi ci de procesare a informaiei, astfel nct s nu fie afectat stabilitatea funcional a acestuia; soluiile pentru creterea flexibilitii i fluidizarea traficului informaional pot fi att hardware (noi arhitecturi) ct i software (noi conexiuni ntre subsistemele marelui sistem integrat); 32 Algoritmul optim trebuie s permit o funcionare multipartiional a depozitului digital, i s utilizeze principiul holografic n prelucrarea i stocarea informaiei; prin utilizarea acestui principiu, algoritmul trebuie s permit (pe cale software, la arhitectur hardware dat) realizarea de partiii (iat de ce este necesar utilizarea unor structuri hardware paralele, redundante la prima vedere) care s reproduc imaginea depozitului digital, ca o copie de siguran. Dac acest lucru nu este necesar la nivelul ntregului depozit digital, se pot realiza subrutine (pe baza unor criterii, definite n prealabil) care s permit gsirea celor mai valoroase lucrri din depozit i, doar, pentru acestea, s se realizeze, apoi, copii de siguran, n partiii protejate, neaccesibile utilizatorilor; Algoritmul optim pentru sistemul integrat propus trebuie s permit o concatenare uoar cu sistemele autonome ale partenerilor (membri ai consoriului); Algoritmul optim trebuie s permit o dezvoltare continu a sistemului integrat; adugarea unui nou membru nu trebuie s pericliteze stabilitatea funcional a sistemului obinut prin integrarea la o nou scar. Aceste concluzii ca i altele care vor rezulta n procesul efectiv de implementare a algoritmului propus pentru sistem reduc alegerea algoritmului ce merit a fi implementat, la nivelul consoriului (pe baza unei aciuni sinergice a tuturor membrilor), la dou aspecte: O schem logic care s reuneasc toate aspectele de mai sus; O platform software care s aib un caracter deschis, perfectibil. Deoarece, unul din parteneri (Universitatea Transilvania din Braov) a optat, deja, pentru o anumit platform software (DSpace), pentru dezvoltarea depozitului digital, n urma medierii cu toi ceilali parteneri (membri ai consoriului) i, ca urmare, a ntregii analize comparative realizat n aceast etap a proiectului s-a hotrt alegerea pentru implementarea sistemului integrat pe baza platformei software DSpace. n ceea ce privete schema logic, cea mai adecvat este cea prezentat n figura A.II.1.3 care ntrunete majoritatea particularitilor reclamate de algoritmul optim, specificate mai sus.
Activitatea II.2 Elaborarea soluiilor optime pentru realizarea sistemelor autonome de indexare i stocare a documentelor digitizate i a sistemului central de procesare n paralel
n cadrul acestei activiti, pe lng studiile ntreprinse, cel mai important aspect l-a constituit precizarea, n final, a arhitecturii sistemului integrat de procesare a informaiilor tehnice digitizate, pe baza unei analize comparative a unor astfel de sisteme pentru diferite arhitecturi i gsirea soluiilor viabile pentru aplicaia particular din cadrul proiectului.
Arhitecturile utilizate pentru realizarea sistemelor integrate de procesare a informaiilor digitizate dup cum a rezultat din amplul studiu ntreprins att la nivelul bibliotecilor digitale (ca sisteme integrate macro) ct i la nivelul SGBD urilor (ca sisteme integrate micro) sunt de tip arborescent. Arborele este conceptul care ofer dou mari avantaje n structurarea sistemelor complexe: posibilitatea unei dezvoltri continue a oricrui sistem (avnd drept fundament un trunchi comun puternic i posibilitatea de a obine multe ramificaii); o capacitate superioar de organizare a haosului inerent unor sisteme cu o dinamic deosebit; Totui, arborele ofer i un mare dezavantaj i anume, acela c, o cretere continu a numrului de ramificaii poate duce la apariia unui sistem global puternic neliniar, greu de controlat. Soluia const ntr-un artificiu, sugerat de conceptul dezvoltrii continue a arborelui, dar utiliznd n tehnic un principiu constructal. Noua arhitectur obinut, ce ofer per global tot o funcionare neliniar, are avantajul unei modelri i, implicit, a realizrii n comand a unei anticipri funcionale. Modelarea este posibil pe baza principiului 33 constructal (derivat dintr-un principiu natural, de altfel) deoarece construcia geometric, n sine, respect o legitate: legea similaritii (fiecare subdiviziune, la o anumit scar, este similar, cu ntregul n care este integrat). Datorit particularitilor i cerinelor pe care trebuie s le ndeplineasc din punct de vedere funcional sistemele integrate de procesare a informaiilor, utilizarea principiului constructal, n dezvoltarea arhitecturii (structurii hardware, n primul rnd) acestora, este deosebit de benefic, permind acestor sisteme s ating performane deosebite, n ceea ce privete: o stabilitatea funcional; o viteza de prelucrare a informaiilor digitizate; o capacitatea de stocare; o flexibilitatea n dezvoltri viitoare; o interoperabilitatea i interschimbabilitatea. Toate aceste caracteristici reclam pentru sistemul integrat ce urmeaz a fi realizat dezvoltatea unei arhitecturi specifice, care s aib la baz principiile teoriei constructale i ale teoriei fractale. Dei, etimologic, cele dou teorii sunt antagoniste (constructal a construi; fractal a rupe) n realizarea sistemelor integrate se regsesc idei, principii, din amndou, astfel nct, putem spune c aceste sisteme obin i o integrare a dou principii antagoniste. O astfel de integrare genereaz, paradoxal, sisteme unitare, deosebit de stabile i cu o funcionare net superioar altor metode reducioniste. Sistemul integrat ca unitate de contrarii reclam ruperea, mai nti, n subsisteme foarte mici, optimizate, de fapt, la cea mai mic scar posibil, i, apoi, integrarea pe principii constructale, la o scar foarte mare. Nu numai c un astfel de sistem este optimizat - din punct de vedere constructiv i funcional - dar, poate avea i caliti noi, emergente, pe care niciunul din subsistemele componente optimizate, la scar mic nu le are, ntr-o funcionare de sine stttoare. Este, acesta, tocmai meritul integrrii. Este necesar, deci, ca un sistem complex de procesare a informaiilor digitizate s adopte o astfel de arhitectur, deoarece, numai unitatea contrariilor reuete s menin coerena, stabilitatea i s asigure un flux de lucru de viteza i densitatea dorit. Ca urmare, a arhitecturilor analizate i pe baza consideraiilor fcute mai sus, propunem ca arhitectura sistemului integrat de indexare, stocare i regsire a documentelor digitizate s se fac pe o structur arborescent, la care crearea arborescenelor s respecte principiul constructal (fig. A.II.2.1).
Fig. A.II.2.1. Exemplu de arhitectur bazat pe principiile teoriei constructale (analogie cu structura arborescent a plmnilor)
34 Organizarea sistemului integrat de procesare a informaiilor pe arhitectura bazat pe principiile teoriei constructale se poate face ca n fig.A.II.2.2.
Fig. A.II.2.2. Arhitectura bazat pe principiul constructal a sistemului integrat de procesare a informaiilor digitizate 1,2,3,4 ci (magistrale) de interaciune ntre parteneri i coordonator, respectiv, ntre toi membrii consoriului i depozitul central de informaii digitizate, implementat la coordonator
Aceast propunere de organizare a sistemului integrat n interaciune continu cu subsistemele sale constitutive este deosebit de util pentru dezvoltrile ulterioare ale acestuia. Deoarece o parte din concluziile micilor analize comparative a sistemelor integrate de biblioteci digitale i a sistemelor integrate de gestionare a bazelor de date (SGBD-uri) au fost formulate, chiar, la locul analizelor, n acest capitol se vor trece n revist, doar, alte cteva aspecte rezultate din definirea unui nou principiu de integrare i realizarea, practic, a unei noi arhitecturi. Astfel: Sistemul integrat de procesare a informaiilor digitizate trebuie s aib o dubl integrare: una n cadrul sistemului local dezvoltat la coordonator (unde se afl i depozitul digital) i o alta la nivel interregional (geografic vorbind) care s reuneasc toate sistemele autonome ale partenerilor (membrilor consoriului) implicai n cadrul proiectului; Realizarea dublei integrri se poate face numai cu ajutorul unei noi arhitecturi. Aceast arhitectur specific trebuie s se bazeze pe principii de optimizare global, cum este principiul constructal; Noua arhitectur trebuie s ofere o vitez mare de lucru i, totodat, un flux ridicat de transfer al informaiilor digitizate; Noua arhitectur trebuie s permit o dezvoltare continu (n primul rnd, 35 hardware) a sistemului integrat att local ct i la nivel interregional; Noua arhitectur trebuie s fie permisibil pentru implementarea unor soft-uri federative (Open Source) i s permit, totodat, folosirea conceptului Open Acces, deosebit de benefic n exploatarea potenialului creativ al utilizatorilor. Toate aceste caracteristici considerm c pot fi obinute prin utilizarea arhitecturii din fig. A.II.2.2. Mai mult, o astfel de arhitectur fiind bazat pe consideraii din sistemele integrate biologice - care sunt sisteme de excelen, n lumea real ne ofer certitudinea unei funcionri stabile, de lung durat i cu eficien ridicat. O alt soluie arhitectural a sistemului integrat la nivel interregional este prezentat n figura A.II.2.3.
Fig. A.II.2.3. Sistem integrat local i interregional de procesare a documentelor tehnice digitizate
Pentru funcionarea sistemului integrat pentru indexarea i partajarea on-line a documentelor se propune - n fig. A.II.2.3 - o infrastructur de resurse pentru stocare i prelucrare precum i o infrastructur de comunicaie. Sistemul de programe de aplicaii urmeaz s fie specificat n etapele viitoare ale proiectului, infrastructura hardware i de comunicaii asigurnd resursele necesare oricrei soluii software. Sistemul integrat pentru indexarea i partajarea on-line a documentelor digitizate se bazeaz din punct de vedere al arhitecturii sistemului, modului de comunicaie i a echipamentelor tehnice pe o structur de tip sistem distribuit. Astfel fiecare universitate va dispune de urmtoarele echipamente: - staii de lucru; - laptop-uri; - acces point-uri; - switch layer 3; - server de acces; - spaiu de stocare; - imprimant multifuncional (copiator, scanner i fax). n ceea ce privete utilizarea sistemului acesta presupune o conexiune de mare vitez la Internet pentru interconectarea centrelor universitare i o bun utilizare a resurselor. Staiile de lucru i laptop-urile se conecteaz prin intermediul unui switch de nivel 3 la server-ul central n vederea accesrii bazei de date pentru indexarea sau utilizarea documentelor. Aceste operaii se vor face dintr-o locaie rezervat persoanelor care indexeaz documente folosind att staiile de lucru ct i de la laptop-urile existente. Folosirea laptop-urilor faciliteaz munca celor care se ocup cu indexarea documentelor. 36 Utilizatorii care doresc accesarea documentelor, deja, indexate vor avea la dispoziie o sal dedicat, interconectat cu serverul de acces i sistemul de stocare prin intermediul switchului de nivel 3. Reeaua wireless va facilita accesul la documente utilizatorilor care doresc s foloseasc propriile sisteme de calcul portabile. n ceea ce privete sala de lectur, prin intermediul staiilor de lucru existente se vor putea accesa documentele indexate n vederea utilizrii acestora. Serverul central va avea rolul de a garanta accesul, n bune condiii, a utilizatorilor i de a le permite acestora, n funcie de drepturile pe care acetia le au, s utilizeze sistemul fie pentru indexare fie pentru citirea documentelor, deja, indexate.
Activitatea II.3 Stabilirea specificaiei echipamentelor tehnice necesare realizrii sistemului integrat propus. Elaborarea caietului de sarcini
n cadrul acestei activiti, ca urmare a rezultatelor i concluziilor formulate n activitile anterioare (att n etapa I ct mai ales n etapa II a proiectului), s-au finalizat specificaiile tehnice ale echipamentelor necesare realizrii sistemului integrat i s-au elaborat caietele de sarcini.
2. Concluzii finale
Prezentul raport prezint amplul studiu efectuat cu privire la elaborarea soluiei tehnice a sistemului integrat de procesare a documentelor tehnice digitizate. Comunitile academice, implicate n cadrul proiectului, au fost invitate s-i spun prerea cu privire la necesitatea i oportunitatea dezvoltrii unui astfel de sistem prin precizarea expres a nevoilor impuse de desfurarea activitii didactice i de cercetare n societatea contemporan i definirea caracteristicilor fundamentale pe care acesta ar trebui s le aib pentru a putea satisface aceste nevoi. n spiritul acestor idei s-au abordat particularitile constructive i funcionale ale depozitelor instituionale (IR). S-au vizualizat, n primul rnd, schemele structurale (logice) fundamentale ce permit implementarea, n practic, a unui astfel de depozit instituional (depozit de documente digitizate), cu scopul declarat de a alege pe baza unei analize comparative organigrama (algoritmul) ce reuete satisfacerea celor mai multe cerine ale potenialilor utilizatori ai depozitului (o entitate complex ce reunete att creatori de informaie ct i consumatori de informaie). S-au studiat, apoi, particularitile arhitecturale ale structurilor hard i soft ce permit implementarea stabil i cu eficien ridicat a schemelor logice. Noile analize comparative pentru diverse arhitecturi utilizate pe plan mondial au avut drept obiectiv principal gsirea unei soluii optime din punct de vedere tehnico-economic pentru sistemul integrat a crui implementare este elul major al acestui proiect. Studiile ntreprinse n privina elaborrii soluiei tehnice optime a sistemului integrat referitor la bibliotecile digitale, n general i la depozitele instituionale (IR), n particular - au reliefat urmtoarele: Depozitele instituionale (IR) trebuie privite ca fiind inima unei biblioteci digitale. De buna realizare i exploatare a acestui depozit depinde nsi existena bibliotecii digitale a viitorului; Structurile hardware moderne ce utilizeaz - la nivelul fundamental, deja procesarea n paralel, ofer posibilitatea dezvoltrii, cu succes, a unor astfel de depozite instituionale i, implicit, a unui ntreg lan, cum este biblioteca digital; 37 Platformele software existente la ora actual ce, am putea spune, utilizeaz conceptul diversitate n unitate ofer garania procesrii rapide a informaiilor digitizate att n ceea ce privete indexarea i stocarea acestora ct i a regsirii rapide, n cadrul depozitului instituional (IR); Depozitul instituional este o uria baz de date i, ca urmare, multiplele protocoale existente, pe plan mondial, pentru gestionarea acestor baze de date ofer, de asemenea, ci uoare de implementare a depozitelor, la orice scar. La toate acestea se adaug i facilitile oferite de multitudinea de motoare de cutare a informaiilor digitizate care reprezint tot attea soluii pentru cutarea i gsirea rapid a documentelor digitizate, n cadrul depozitului instituional; Un loc aparte, n procesarea rapid, cu pstrarea stabilitii sistemului i satisfacie maxim pentru clieni, l ocup interfeele ce mediaz intereaciunea dintre clasa larg a utilizatorilor i depozitul instituional. Alturi de calitatea informaiilor gsite n cadrul depozitului, calitatea prezentrii prin intermediul interfeelor de cutare reprezint cert o surs de mulumire suplimentar pentru toi clienii depozitului instituional (IR). Cerinele impuse pe baza amplelor studii ntreprinse, n prima etap a proiectului, au dat un imbold puternic gsirii unei soluii de implementare rapid a unui astfel de depozit instituional, membrii consoriului fiind convini c realizarea unui astfel de obiectiv este o necesitate prioritar la nivelul comunitilor academice din Romnia. Una din ideile vitale, rezultat n prima etap, consta n realizarea unei viziuni unitare a membrilor consoriului pentru obinerea sistemului integrat de digitizare, a unei efervescene creatoare bine canalizate n obinerea soluiei, a unei coeziuni puternice n realizarea final a sistemului. Gsirea unei soluii optime pentru sistemul integrat pe fondul optimizrii, n acelai timp, a sistemelor autonome, de la fiecare partener certific apariia acelei sinergii, att de necesare realizrii unui lucru deosebit i la o scar relativ mare. Propunerea unei soluii arhitecturale biomimetice pentru sistemul integrat reprezint mica contribuie a acestui proiect la dezvoltarea unor biblioteci digitale cu eficien ridicat n procesarea unui volum tot mai mare de informaii. Amplul studiu comparativ, ntreprins i n aceast etap, pentru gsirea unor principii noi, a unor noi metode i noi modele de structurare a sistemelor materiale i informaionale, permite i formularea altor concluzii, ce se constituie n tot attea ci de abordat n viitorul apropiat: Dezvoltarea sistemului propus bazat pe criterii simple i clare va reclama, cu siguran, gsirea i, mai ales, utilizarea unor noi paradigme, n viitorul apropiat. Aceste cutri de paradigme sunt reclamate de particularitatea soluiei propuse care este biomimetic (sistemele biologice fiind sisteme de excelen n procesarea informaiilor); Utilizarea, n continuare, a principiilor teoriilor integratoare (metatiinelor) - cum sunt teoria fractalilor, sinergetica, teoria constructal etc. reprezint o certitudine n structurarea unor sisteme integrate complexe, multifuncionale i, cu siguran, neliniare. Utilizarea unor teorii tributare viziunii liniare i unilaterale asupra lumii (specifice secolelor XVII, XVIII, i XIX) nu mai permite vizualizarea interconexiunilor multiple, cu o dinamic deosebit i, bineneles, neliniare, att de ntlnite n lumea modern; Noile soluii propuse a fi implementate au drept scop, n subsidiar, i formarea unui nucleu de specialiti care s contribuie prin activitatea de zi cu zi la crearea unei noi coli romneti, la crearea unei comuniti, cu adevrat academice, nu att prin volumul informaiilor create sau deinute (aceasta fiind tocmai sarcina acestui depozit instituional) ct mai ales prin calitatea informaiilor livrate i printr-o moral deosebit; Soluiile gsite pentru implementarea practic a sistemului integrat de documente tehnice digitizate la Universitatea Dunrea de Jos din Galai reprezint o provocare pentru toi membrii consoriului, implicai n aceast aciune. De pstrarea coeziunii acestui nucleu de specialiti n formare n domeniul fascinant al depozitelor instituionale, n particular i al bibliotecilor digitale, n general depinde reuita viitoare a acestui proiect.
38 Bibliografie
1. A. Schaefer, M. Jordan, C.-P. Klas, and N. Fuhr. Active Support For Query Formulation in Virtual Digital Libraries: A case study with DAFFODIL. In: Research and Advanced Technology for Digital Libraries. 9 th European Conference, ECDL 2005, Springer. 2. An integrated system for managing the Andalusian Parliaments digital library. Luis M. de Campos, Juan M. Fernandez-Luna, Juan F. Huete, Carlos J. Martn-Dancausa. [online]. Disponibil pe Internet la adresa: www.emeraldinsight.com/0033-0337.htm 3. HUGHES, Carol Ann. Escholarship at the University of California: a case study in sustainable innovation for open access. [online]. Disponibil pe Internet la adresa: www.emeraldinsight.com/0307-4803.htm 4. Anderson, Cokie G., Maxwell, David C. Starting a Digitization Center. Oxford: Chandos Publishing Limited, 2004. p. 105 www.emeraldinsight.com/0033-0337.htm 5. arXiv e-print service. http://arxiv.org/ 6. Ashworth, Susan; Mackie, Morag; Nixon, William J. The DAEDALUS Project, developing institutional repositories at Galsgow University : the story so far. [online]. Disponibil pe Internet la adresa: www.emeraldinsight.com/0024-2535.htm 7. Barwick, Joanna. Building an institutional repository at Loughborough University: some experiences. [online]. Disponibil pe Internet la adresa: www.emeraldinsight.com/0033-0337.htm 8. Berners-Lee, T., Weaving the Web, Orion Business Book, 1999. 9. Brasov, U. T. (2008-2012). Plan strategic. Brasov. 10. C. Lagoze, S. Payette, E. Shin, and C. Wilper. Fedora: An Architecture for Complex Objects and their Relationships. Journal on Digital Libraries, Special Issue on Complex Objects, 2005. 11. C. Schuler, H. Schuldt, C. Trker, R. Weber, and H.-J. Schek. Peer-To-Peer Execution of (Transactional) Processes. In: International Journal on Cooperative Information Systems (IJCIS). Vol. 14, No. 4 (2005) 377-405. 12. C. Schuler, R. Weber, H. Schuldt, and H.-J. Schek. Scalable PeertoPeer Process Management The OSIRIS Approach. In Proc. of ICWS Conf., pages 2634, San Diego, CA, USA, 2004. [41] 13. Coravu, R. (2008). Bibliotecile universitare si accesul deschis la informatia stiintific. (A. B. Romnia, Ed.) Revista romn de biblioteconomie si stiinta informrii , 4 (3-4). 14. Creating an Institutional Repository : LEADIRS Workbook. [online]. Disponibil pe Internet: http://hdl.handle.net/1721.1/26698 15. Cristea, L., & Repanovici, A. (2007). Tehnologia informatiei-motorul trecerii la biblioteca digital. n R. Angela (Ed.), BIBLIO Brasov 2007. 2007, pg. 317-318. Brasov: Editura universittii Transilvania. 16. Current Digital Library Systems : User Requirements vs Provided Functionality. [online]. Disponibil pe Internet: http://146.48.87.21/OLP/UI/1.0/Disseminate/1255929273i6FYPHVygf/a221255929273L0ZLO mxM 17. Daffodil. Distributed Agents for User-Friendly Access of Digital Libraries. http://www.daffodil.de 18. DRIVER. (2009). Networking European Scientific Repositories. Preluat pe iulie 24, 2009, de pe http://www.driver-repository.eu/ 19. DSpace. (2009). Dspace home federation. Preluat pe septembrie 1, 2009, de pe Dspace Federation home page, <http://www.dspace.org>. 20. ePrints Supporting Open Access. http://www.eprints.org 21. Fedora Flexible Extensible Digital Object and Repository Architecture. http://www.fedora.info. 22. Forman, George, A Pitfall and Solution n Multi-Class Feature Selection for Text Classification, Proceedings of the 21st International Conference on Machine Learning, Banff, Canada, 2004. 39 23. Gadd, E., Oppenheim, C., & Probetts, S. (Acceptat spre publicare). How academics expect to use open-access research papers. Journal of librarianship and Information Science . 24. Gibbons, S. (2005). Faculty staff do not always understand the jargon used by librarians. The assurance of their work being found on the Web is better understood than the need for consistent metadata, and an unbreakable link better than a persistent URL. Preluat pe Iulie 29, 2009, de pe http://docushare.lib.rochester.edu/docushare/dsweb/Get/Document- 19725/amsterdam.ppt 25. Greenstone Digital Library Software. http://www.greenstone.org 26. Guide d indexation. Biblioteca National Francez, 2002. 27. H. Schuldt, G. Alonso, C. Beeri, and H.-J. Schek. Atomicity and Isolation for Transactional Processes. ACM Transactions on Database Systems, 27(1):63116, 2002. 28. Hajjem, C. H. (2006). The Self-Archiving Impact Advantage: Quality Advantage or Quality Bias? University of Southampton,Department of Electronics and Computer Science. 29. Handbook of Research on Digital Libraries : Design, Development and Impact. [online]. Disponibil pe Internet: http://www.torrentdownloads.net/torrent/1311967/Handbook+of+Research+on+Digital+Librarie s+Design,+Development,+and+Impact 30. http://aspeckt.unitbv.ro/dspace/ 31. http://en.wikipedia.org/wiki/Elements_of_graphical_user_interfaces 32. http://en.wikipedia.org/wiki/Graphical_user_interface 33. http://eprints.gla.ac.uk/cgi/search/advanced 34. http://eprints.gla.ac.uk/cgi/search/simple 35. http://libraries.theeuropeanlibrary.org/contactus_en.html 36. http://maps.repository66.org/ 37. http://moodle.org/ 38. http://roar.eprints.org/ 39. http://www.ambysoft.com/essays/utilizatorinterfaceDesign.html 40. http://www.dlib.org/dlib/july07/rieger/07rieger.html 41. http://www.dspace.org 42. http://www.gla.ac.uk/ 43. http://www.kb.nl/gabriel/ 44. http://www.kb.nl/hrd/netwerk/gab-en.html 45. http://www.lib.gla.ac.uk/enlighten/ 46. http://www.opendlib.com 47. https://dspace.gla.ac.uk/index.jsp 48. https://dspace.ucalgary.ca/ 49. IEEE P1484.12 Learning Object Metadata Working Group. http://ltsc.ieee.org/wg12/ 50. IFLA Guidelines for Digital Libraries, draft. Chapter 4. Metadata 51. Ignat, T. (2008). Biblioteca digital si rolul su n activittile de cercetare ale institutiei pe care le deserveste. (A. B. Romnia, Ed.) Revista romn de biblioteconomie si stiinta informrii, 4 (3-4). 52. Ignat, T., & Repanovici, A. (2009). Institutional repository marketing: from research to knowledge transfer. Advances in Marketing, Management and Finances, Proceedings of the 3rd International Conference in Management, Marketing and Finances, (MMF09) (pg. 107-110). Houston,USA: WSEAS. 53. Initiative, B. O. (2002). Preluat pe Mai 23, 2009, de pe http://www.soros.org/openaccess/read.shtml 54. J. Krause. Das WOB-Modell. In: Vages Information Retrieval und graphische Benutzeroberflchen: Beispiel Werkstoffinformation. Konstanz: Universittsverlag, Konstanz (1997) 5988 55. K. Bhm, M. Mlivoncic, and R. Weber. Quality-Aware and Load-Sensitive Planning of Image Similarity Queries. In Proceedings of the 17th Intl. Conf. on Data Engineering, pages 401410, Washington, DC, USA, 2001. 40 56. Kosson. (2009). Depozite digitale. Preluat pe septembrie 20, 2009, de pe Kosson comunitate virtual: www.kosson.ro 57. Library of Congress Subject Headings. Library of Congress, 1999 58. Linch, C. A. (2008, Februarie). Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age. Preluat pe Februarie 26, 2009, de pe ARL: http://www.arl.org/newsltr/226/ir.html 59. M. J. Bates. Idea tactics. Journal of the American Society for Information Science, 30(5):280- 289, 1979. 60. M. J. Bates. Information search tactics. Journal of the American Society for Information Science, 30(4):205-214, 1979. 61. M. J. Bates. Where should the person stop and the information search interface start? Information Processing and Management, 26(5):575-591, 1990. 62. M. Mlivoncic, C. Schuler, and C. Trker. Hyperdatabase Infrastructure for Management and Search of Multimedia Collections. In DELOS Workshop: Digital Library Architectures, pages 2536, S. Margherita di Pula, Cagliari, Italy, 2004. 63. M. Springmann. A Novel Approach for Compound Document Matching. Bulletin of the IEEE Technical Committee on Digital Libraries (TCDL), 3, 2006. To appear. 64. Manual UNIMARC: Format des notices d'Autorite. Biblioteca National Francez, 2004 65. Metadata Encoding and Transmission Standard (METS). http://www.loc.gov/standards/mets/ 66. Metadata Workflow (Dublin Core in practice): http://dublincore.org/resources/training/dc- 2008/T4-DC_in_practice.pdf 67. Misha Wolf and Charles Wicksteed- Reuters Corpus: http://www.reuters.com/researchandstandards/corpus/ Lansat n Noiembrie 2000 accesat n Iunie 2005 68. Morariu, D., Vintan, L., Tresp, V., Evaluating some Feature Selection Methods for an Improved SVM Classifier, International Journal of Intelligent Technology, Volume 1, no. 4, ISSN 1305-6417, pag. 288-298, Decembrie 2006 69. N. Fuhr, C.-P. Klas, A. Schaefer, and P. Mutschke. Daffodil: An integrated desktop for supporting high-level search activities in federated digital libraries. In Research and Advanced Technology for Digital Libraries. 6th European Conference, ECDL 2002, pages 597-612, Heidelberg et al., 2002. Springer. 70. N. Fuhr. Information Retrieval in Digitalen Bibliotheken. In: 21. DGI-Online-Tagung - Aufbruch ins Wissensmanagement. 1999. 71. OpenDOAR. (2008). The Directory of Open Access Repositorie. Preluat pe Iulie 18, 2009, de pe http://www.opendoar.org/ 72. Pyrounakis, George, Nikolaidou, Mara. Comparing Open Source Digital Library System. n: Handbook of Research on Digital Libraries: Design, Development and Impact. [online]. Disponibil pe Internet: http://www.torrentdownloads.net/torrent/1311967/Handbook+of+Research+on+Digital+Libraris +Design,+Development,+and+Impact 73. R. Tansley, M. Bass, and MacKenzie Smith. DSpace as an Open Archival Information System: Current Status and Future Directions. In Proceedings of the 7th European Conference on Research and Advanced Technologiey for Digital Libraries, ECDL 2003, pages 17-22, Trondheim, Norway, August 2003. 74. R. Tansley, M. Bass, D. Stuve, M. Branschofsky, D. Chudnov, G. McClellan, and MacKenzie Smith. The DSpace Institutional Digital Repository System: Current Functionality. In Proceedings of the 3rd Joint Conference on Digital Libraries, JCDL 2003, pages 87-97, IEEE Computer Society, 2003. 75. R. Weber and H-J. Schek. A Distributed Image-Database Architecture for Efficient Insertion and Retrieval Tasks. In 5th Intl. Workshop on Multimedia Information Systems (MIS99), pages 4855, 1999. 41 76. R. Weber, C. Schuler, P. Neukomm, H. Schuldt, and H.-J. Schek. Web Service Composition with OGrape and OSIRIS. In Proc. of VLDB Conf., Berlin, Germany, 2003. 77. R. Weber, H-J. Schek, and S. Blott. A Quantitative Analysis and Performance Study for Similarity-Search Methods in High-Dimensional Spaces. In VLDB 98: Proc. VLDB98, pages 194205, San Francisco, CA, USA, 1998. 78. R. Weber, J. Bolliger, T.R. Gross, and H.-J. Schek. Architecture of a Networked Image Search and Retrieval System. In Proc. of CIKM Conf., pages 430441, Kansas City, Missouri, USA, 1999. 79. RAMEA U-Repertoire d 'Autorite-Matiere Encyclopedique et Alfabetique Unifie. Biblioteca National Francez, 2002 80. Rankink Web of World Repositories Site topul celor 400 depozite institutionale lista depozitelor / tri / http://repositories.webometrics.info 81. Repanovici, A. (2009). Marketing Research about Attitudes, Difficulties and interest of academic Community about Institutional Repository, PLENARY LECTURE. Advances in Marketing, Management and Finances, Proceedings of the 3 rd International Conference in Management, Marketing and Finances, (MMF09), Houston,USA,April 30-May 2, 2009, ISSN 1790-2769, ISBN 978-960-474-073-4,pag.88-95 (pg. 88-95). Houston,USA: WSEAS. 82. Repanovici, A., & Turcanu, D. (2009). Qualitative and quantitative measures in marketing research for university library resourse assesment. Books of abstracts, Qualitative and quantitative methods in libraries QQML 2009, (p. 73). Chania, Greece. 83. RoMEO, S. (2006). RoMEO News. Preluat pe Iulie 18, 2009, de pe http://www.sherpa.ac.uk/romeo/ 84. S. Kriewel, C.-P. Klas, A. Schaefer, N. Fuhr. Daffodil - Strategic Support for User - Oriented Access to Heterogeneous Digital Libraries. D-Lib Magazine, 10(6), June 2004. 85. S. Payette and S. Thornton. The Mellon Fedora Project: Digital Library Architecture Meets XML and Web Services. In Proceedings of 6th European Conference on Research and Advanced Technologiey for Digital Libraries, ECDL 2002, pages 406-421, Rome, Italy, September 2002. 86. Scott Ambler, The Object Primer. Third edition, 2004 87. Sherpa. (2006). University of Nottingen. Preluat pe Iulie 20, 2009, de pe http://www.sherpa.ac.uk/ 88. SOROS. (2009). Open access software. Preluat pe Noiembrie 14, 2008, de pe http://www.soros.org/openaccess/software 89. STAS 10711-89-Reguli generale pentru elaborarea si dezvoltarea tezaurelor monolingve 90. Suber, P. (2005). Overview iin Open access- Unrestricted access to published research. 93rd Indian Science Congress , 7-13. 91. T. Staples, R. Wayland, and S. Payette. The Fedora Project: An Open-source Digital Object Repository Management System. DLib Magazine, 9 (4), April 2003. 92. T. van Veen and B. Oldroyd. Search and Retrieval in The European Library. D-Lib Magazine, 10(2), February 2004 93. TEL The European Library. http://www.theeuropeanlibrary.org/ 94. Transilvania, U. (2009). Institut de cercetare-dezvoltare-inovare:produse high-tech pentru dezvoltare durabil. Preluat pe septembrie 3, 2009, de pe http://www.unitbv.ro/institut_prodd/index.php?id=8 95. Transilvania, U. (2009). Pagina web a universittii Transilvania. Preluat pe Septembrie 1, 2009, de pe Departamentul Informatizare: http://www.unitbv.ro/Default.aspx?tabid=1222&language=en-US 96. Understanding Metadata. [online]. Disponibil pe Internet: www.niso.org/standards/resources/UnderstandingMetadata.pdf 97. UNIMARC Manual: Bibliographic Format 1994, Concise version 98. V. Iverson, Y.-W. Song, R. Van de Walle, M. Rowe, C. Doim, E. Santos, and T. Schwartz. MPEG-21 Digital Item Declaration. ISO/IEC JTC 1/SC 29/WG 11 N397, http://xml.coverpages.org/MPEG21-WG-11-N3971-200103.pdf 42 99. Wikipedia- User interface (http://en.wikipedia.org/wiki/User_interface ) 100. Woldering, B., 2004, Presentation on TEL, Online Information and Education Conference 2004, Bangkok 101. Yiotis, Kristin. Electronic theses and dissertation (ETD) repositories: What are they? Where do they come from? How do they work? [online]. Disponibil pe Internet la adresa: www.emeraldinsight.com/1065-075X.htm 102. Zeng, Marcia L. Dublin Core in Practice. [online]. Disponibil pe Internet: dublincore.org/resources/training/dc.../T4-DC_in_practice.pdf.