Sunteți pe pagina 1din 19

TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p. 17

Biblioteca virtual digitizare cutare Carmen DIACONESCU

Abstract: The accomplishment of a digitizing module is necessary in order to create digital databases and, consequently, a national virtual library, which promotes collecting, organizing, storage, dissemination, retrieval and preserving information services in an efficient and qualitative way. Digitizing by scanning, photographing, audio file saving combined with search algorithms is a method which allows users to access documents, erasing time and space boundaries. The article presents text, image and sound documents integrated in the Aleph library system and also full text search possibilities.

(biblioteci virtuale; digitizare; ALEPH)

"Nu ndrznim nu pentru c lucrurile sunt dificile, ci pentru c nu ndrznim lucrurile sunt dificile" (Seneca)

n cadrul iniiativei internaionale de construire a unei economii a culturii ca parte

integrant a unei societi globalizate informaionale, bazat pe cunoatere, apare convergena dintre evoluiile instituiilor culturale, depozitare de cunostine i valori artistice (biblioteci, arhive, muzee) i cele ale tehnologiilor informatice i ale comunicaiilor. Primele iniiative privind folosirea tehnologiilor informaiei n instituiile depozitare de bunuri culturale au aprut n lumea academic. Oamenii de tiin au urmrit, n primul rnd, gsirea unor moduri noi pentru prezervarea i conservarea motenirii culturale acumulate i creterea numrului celor care au acces nengrdit i rapid la acestea. Valorificarea n sens economic a motenirii culturale aflate n biblioteci i arhive - ca principale depozitare de informaii i cunostine - a determinat afirmaia marcat de vizionarism, conform creia pentru Europa patrimoniul cultural este o resurs strategic care poate juca rolul pe care l are petrolul pentru rile arabe. Dei astfel de prognoze nu s-au confirmat n msura sperat, au aprut n peisajul lumii afacerilor, pe lng productorii de tehnologii, o serie de organizaii economice cu rol de transformare, distribuire i intermediere a accesului la bunurilor culturale transformate. n ncercarea de a mbunti accesul, ca vitez i ca arie de acoperire, precum i de a oferi servicii de calitate, au fost create instrumente informatice. Guvernele rilor dezvoltate au sesizat c societatea informaional global (SIG) are dimensiunea cultural mai important dect cea industrial. De renaterea crilor erau interesate biblioteci, arhive, universiti, care doreau s transmit viitorimii patrimoniul cultural stravechi de care dispuneau ntr-o form ct mai accesibil. n aceeai viziune, documentul digitizat avea s permit o mai bun citire i o analiz a detaliilor. n secolul XXI, "Secolul Gutenberg", cum l-au intitulat europenii pentru a da un nou imbold culturii, digitizarea documentelor prin scanare nseamna salvarea tipriturilor, mbuntirea pstrrii i conservrii documentelor originale, eventuala lor retiprire, acces larg prin ndeprtarea barierelor geografice, sociale sau financiare, mbuntirea procesului de formare

i pregtire a utilizatorilor, construirea de baze de date, contribuie la biblioteca universal digital. n ultimii ani, paradigma bibliotec digital a cptat un interes considerabil din partea a numeroase i variate instituii tiintifice (universiti, institute de art, biblioteci), dar i a organizaiilor din domeniul industriei, termenul de bibliotec digital fiind adecvat pentru a numi rezultatul proliferrii informaiei i a tehnologiei avansate. TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p. 18 n comparaie cu biblioteca tradiional, biblioteca digital promoveaz eficient i la nivel calitativ nalt servicii de colectare, organizare, stocare, diseminare, regsire i prezervare a informaiei. Graie acestui tip de bibliotec, se pot accesa online documente istorice i culturale a cror existen fizic este n pericol. Se ofer exploatare de calitate n multe domenii, regsirea facil a informaiei, baze de date multimedia, posibiliti de data mining, informaii online despre locaia fizic a documnetelor i, n plus, procesarea imaginilor, hipertext n mediu virtual, contact cu ntregul world wide web. Avantajele bibliotecii virtuale sunt imense:

Accesarea informaiei de oriunde; Reducerea birocraiei n accesarea informaiei; Baze de date distribuite (informaiile nu trebuie pstrate n acelai loc) Eliminarea nevoii de a nelege structura catalogului; Cutare n baze de date full text; Protejarea sursei informaiei;

Referinele incruciate (cross references) spre alte documente (menite s uureze munca cercettorilor; O mare capacitate de explorare i exploatare a informaiei.

O privire prospectiv, bazat i pe studii deja ntreprinse cu privire la modificrile de ateptat n natura nsi a profesiei din biblioteci i din alte sisteme de informare i documentare arat o necesar racordare la nou a profesionistului din domeniu. Rolul bibliotecarului, n contextul bibliotecii digitale, implic i cunostine de utilizare a softurilor corespunzatoare din bibliotec, i activiti online, i capacitatea de a forma publicul n sensul de a-i asigura fiecrui cititor autonomia de care se bucura n mediul bibliotecilor tradiionale. Bibliotecarul devine:

consultant individual n obinerea informaiei; cunosctor al surselor de informaie, cel ce poate rafina informaiile, pentru a le acorda ct mai bine cu nevoile beneficiarului final; colaborator al furnizorului de resurse tehnologice; o legatur ntre trecut si viitor, n planul accesului la informaie; creator de baze de date; avocat n politica de dezvoltare a informaiei.

Utilizarea crescnd a reelelor de informare i accelerarea ritmului de acumulare a cunotinelor cer competene n gestiunea informaiei i a cercetrii documentare care se dovedesc a fi superioare competenelor tradiionale ale profesionistului bibliotecii. Numai astfel el devine parte din comunitatea partenerilor (constructori de instrumente software, proprietari de baze de date, proprietari de fonduri de arhiv etc.)!

Biblioteca virtual: descriere

Indiferent cum o denumim, bibliotec digital, bibliotec electronic sau bibliotec virtual, biblioteca de care ne ocupm aici are urmtoarele trsturi:

are posibilitatea tehnologic de a se conecta la resurse ale mai multor biblioteci; poate oferi copii electronice (printabile, la nevoie) ale unor documente care nu pot fi accesate altfel; ofer resurse de informaii selecionate i organizate; deine personal care are o imagine global a informaiilor i cunotinelor disponibile, a surselor de informare, a sistemelor de comunicare i a serviciilor de informare; TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p.

19 este n msur s evalueze validitatea surselor de informare; are personalul capabil s formeze persoanele apte s gestioneze informaia.

Filosofia pe care se construiete biblioteca virtual conine cteva trsturi eseniale:

Accesul universal la acest tip de bibliotec i la servicii de informare este un scop; Transparena conectrii utilizatorilor la resursele sale este o necesitate.

Ideea realizrii unei biblioteci digitale universale este determinat de necesitatea de a ntreine diversitatea intelectual care contribuie la capitalul intelectual al omenirii i datoria de a garanta accesul la informaie, tiut fiind c diversitatea st la baza societii informaionale moderne. Nici un capital intelectual nou nu se poate constitui dac utilizatorii de informaie, indiferent de domeniu, nivel sau categorie, nu pot utiliza la maximum patrimoniul cultural universal. Biblioteca electronic modific formele de colaborare dintre personal i utilizatori, oferind acestora din urm noi oportuniti: Consultarea unei alte persoane pentru a-i pune n ordine ceea ce tii c tii (help in selecting information); Consultarea unei alte persoane pentru a obine informaii care nu sunt semnificative pentru publicul larg i nu sunt indexate (seeking informal information); Consultarea unei alte persoane pentru asisten n obinerea-nelegerea informaiilor care sunt ntr-un context vast n natur (information for highly specific needs and interests); Cooperarea bibliotecar/studeni, bibliotecar/profesori, pentru acoperirea unor funcii sociale importante (socializing function). Se apreciaz c serviciile tehnice de bibliotec au un rol crucial n dezvoltarea bibliotecii digitale. Cele trei puncte majore n favoarea bibliotecii electronice sunt: Interaciunea cu resursele de informaie; Medierea ntre resursele de informaie i utilizatori (ceea ce d valoare de durat procesului de transfer de informaie); Interaciunea cu potenialul de informaie al beneficiarului, definit ca fiind orice entitate activ care cere o informaie unui agent de cutare (seeking agent).

Digitizarea

Digitizarea nseamn transformarea datelor analogice n date n format numeric, adic n serii de bii (0 i 1). n felul acesta, este posibil procesarea datelor de ctre sistemele de calcul. Documentele digitale pot s se prezinte sub trei forme:

1. Text 2. Imagine 3. Audio

Filosofia sistemului se bazeaz pe document, care este unit cu atributele sale pentru procesul de arhivare i regsire a datelor. Fiecare document reprezint o intrare unic n catalog/baza de date i conine informaii cu legturi la bazele de date full text. Avem n vedere aici doar bazele de date locale. TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p. 20

Cmpurile ce formeaz baza de date sunt structurate relaional. Cmpuri ca autor, titlu etc. furnizeaz informaia structurat ca n sistemele tradiionale de bibliotec. Structura cmpurilor reprezint baza interogrilor relaionale, facilitnd accesul utilizatorilor la informaie. Bazele de date participante sunt n ntregime stocate local. Parteneriatele se realizeaz prin

acordarea de drepturi de acces la bazele proprii i altor instituii conectate la Internet. Baza de date conine i nregistrri full text accesabile cu uurin de utilizatori. Atributul full text al unui document este o secven nestructurat de cuvinte stocate n baze de date i reprezint un superset de cmpuri din structura documentului. Imaginea salvat ntr-un format (JPG, PNG, TGA, TIF) cu rezoluie diferit, n funcie de importan, poate fi ataat documentului dorit. Aceste imagini sunt stocate pe servere locale i pot fi accesate de utilizatori. Datele audio sunt salvate ntr-un format WMA (Windows Media Audio), MP3 etc. pe servere locale.

Arhitectura sistemului Soluia tehnic a proiectului este bazat pe biblioteca virtual proiectat i distribuit ntr-o arhitectur client-server. Regsirea i arhivarea datelor trebuie s se realizeze n i la multe locaii, aflate la distan. Cea mai mic unitate din procesul de arhivare i regasire este, aa cum am mai spus, documentul. Termenul trimite la nregistrrile catalogate. Serverul central are rolul de a asigura managementul datelor distribuite n serverele locale ale creatorilor de baze de date care particip la realizarea bibliotecii virtuale. Managementul informaional reprezint un control sistematic al gestionrii informaiei stocate pe diferite medii (hrtie, film, cd-uri, casete audio i video, microfilme, casete magnetice) constituind un suport, pentru managerul de alt nivel, n luarea deciziilor i n atigerea obiectivelor propuse. TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p.

21

Gestionarea electronic a informaiei trebuie s se fac n concordan cu regulile i cu legile specifice fiecrei ri, avnd ns drept int accesul la nregistrarile dorite n orice moment din ciclul lor de via al documentelor electronice. Aplicaia de gestiune automat a nregistrrilor trebuie s ofere faciliti de vizualizare, localizare, printare, copiere pe toat durata existentei acestora, dar i posibilitatea de trecere la noi formate de stocare i reprezentare atunci cnd vechile formate nu mai sunt utilizate pe scar larg. Pentru a avea informaia ntr-o baz de date i a o regsi este esenial introducerea datelor i procesarea lor n urma unei analize competente. Introducerea datelor constituie o problem ce depinde de multe criterii i care trebuie controlat de operatorii umani (rezolvat parial prin utilizarea unui format MARC n descrierea nregistrrii).

Fie c se folosete formatul UNIMARC sau USMARC, exist un cmp 856 - localizare electronic i acces cu urmtoarele subcmpuri:

$a Host name (Repeatable) $b Access number (Repeatable) $c Compression information (Repeatable) $d Path (Repeatable) $f Electronic name (Repeatable) $g Uniform Resource Name (Repeatable) $h Processor of request (Not repeatable)

$i Instruction (Repeatable) $j Bits per second (Not repeatable) $k Password (Not repeatable) $l Login/login (Not repeatable) $m Contact for access assistance (Repeatable) $n Name of location of host in subfield $a (Not repeatable) $o Operating system (Not repeatable) $p Port (Not repeatable) $q Electronic Format Type (Not repeatable) $r Settings (Not repeatable) TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p. 22 $s File size (Repeatable) $t Terminal emulation (Repeatable) $u Uniform Resource Locator (Repeatable) $v Hours access method available (Repeatable) $w Record control number (Repeatable) $x Nonpublic note (Repeatable) $y Access method (Repeatable) $z Public note (Repeatable) $4 Copyright message (NR) $9 Type of program (NR)

Introducerea informaiilor n acest cmp, n softul de bibliotec ALEPH, se face n modulul de catalogare:

Problemele care apar la introducerea datelor n sistemul digital sunt datorate diversitii formatelor de stocare a documentelor audio i video, rezoluiei imaginii, dimensiunilor acestor informaii digitale.

Redm mai jos un document imagine obinut prin scanare. Este vorba despre coperta lucrrii Platonis opera a Marsilio Ficino traducta - Plato (nr.sistem 388375 n Aleph BCU Iai).

TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p.

23

Document full text obinut prin fotografiere

TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p. 24 Document sonor n format WAV Colinde de Craciun - Ansamblul folcloric al Colegiului National Andrei Saguna din Brasov (315664 - Nr. Sistem n Aleph BCU Iai).

Cutare ntr-un document full text

TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p.

25 Cutare ntr-o baz de date full text

Interfaa de regsire permite utilizatorilor accesul la documente digitizate eliminnd conveniene temporale sau spaiale. Utilizatorii nu se confrunt cu un spaiu fizic sau cu un orar i nu sunt obligai s mearg la bibliotec pentru a obine informaii.

Viteza mare de transfer n cadrul reelei trebuie s ofere o cutare rapid i uoar n special pentru vizualizarea imaginilor. Imaginile digitizate trebuie s apar pe desktop-ul clientului n cteva secunde. Aceasta funcie de vizualizare trebuie s ofere o varietate de operaii suportate de imagini, cum ar fi selectarea unei poriuni din imagine, mrirea scrii imaginii etc. Gsirea full text-ului trebuie s fie uoar i confortabil ntr-o cutare online. Pentru formulri complexe ale cererilor softul trebuie s suporte operatori Booleeni. Structura cmpurilor trebuie s permit o cutare tradiional (autor, titlu etc.).

Pentru o cutare i colectare rapid a informaiilor i o interogare a bazei de date ce conine documente full text vom prezenta caracteristicile unui soft de cutare. Motorul de cutare trebuie sa fie un software de cutare rapid n site-uri web, intraneturi sau portaluri. Descriem mai jos un astfel de motor.

Caracteristici de baz:

- Multiple metode de cutare; - Algoritm pentru relevana rezultatului (determin care sunt cele mai relevante documente n setul rezultat i le afieaz la nceput n lista de rezultate); - Clasificarea rezultatelor pe categorii; - Evidenierea (sublinierea) rezultatelor relevante; - Vizualizare rapid; - Asisten gramatical la cutare (se efectueaz cutarea chiar dac utilizatorul a tastat greit cuvntul, prin legatura la cea mai apropiat form a cuvntului din dicionar); - Scalabilitate, extensibilitate.

n procesul de implementare a softului de cutare se ncepe cu definirea formatelor de fiiere pe care motorul de cutare le va gestiona i a surselor de date. Exist trei tipuri de formate de fiiere:

Formate nestructurate - conin n special informaii sub forma de text (fiiere plain text, fiiere word, email-uri; nu exist o structur tipic n aceste documente i exist foarte puine legturi ntre elementele fiierului); Formate semi-structurate - conin att informaii sub form de text ct i sub form de date structurate (ex. fiiere html, foi de calcul; structura acestor fiiere nu este definit att de rigid ca n cadrul documentelor structurate); Formate structurate - informaia este structurat ntr-un format foarte bine definit, ca de exemplu o baz de date relaional.

De exemplu, se ncepe implementarea motorului de cutare prin punerea de coninut html n intranet. Apoi se decide adaugarea de documente pdf i word. Apare apoi nevoia privind furnizarea de acces ctre baza de date clieni sau ctre date XML create n alte sisteme. Motorul de cutare n intranet trebuie sa suporte toate aceste tipuri de fiiere, chiar i n mai multe limbi.

Caracteristici ale cutrii

Cutare polimorf - caut orice tip de date, nestructurate, semi-structurate sau structurate, suportand peste 140 de formate; TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p. 26 Mai multe moduri de cutare (ntruct mai multi ultilizatori nseamna i mai multe metode de cutare):

orii,

Cutarea include toate formele gramaticale ale cuvntului: timpuri ale verbului, forme ale substantivelor etc.; Cutarea se bazeaz pe cmpuri este limitat, se aplica doar unde cutarea tradiional eueaz; Operatori de cutare avansat (n afara de AND i OR). Aceti operatori pot gsi cuvinte aflate n acelai paragraf, la cteva cuvinte distan, unul lng altul etc.; ntelegerea numerelor i a datelor, indiferent de formatul n care sunt scrise acestea. Utilizatorul poate cauta 1/1/02 i obine acelai rezultat pe care l-ar fi obinut dac ar fi cautat 1st Jan 2002, 1 Jan 2002,01/01/2002 etc.; Cutarea ntr-un interval numeric sau de tip date specificat, putnd limita astfel cutarea; Agentul inteligent poate realiza cutarea n locul utilizatorului. Acesta trebuie doar sa precizeze ce tip de informaie caut;

Suport multi lingvistic - cutarea se poate face n una din limbile: francez, german, spaniol, portughez etc. datorit suportului Unicode; Utilizarea Sinonimelor - se pot personaliza asocierile dintre cuvinte, astfel nct, dac se face cutarea dupa un cuvnt, rezultatul va conine i sinonimele specificate; Asisten la tastare prin ntrebarea Dead you mean? afiat n special cnd numrul de rezultate este egal cu zero sau este foarte mic.

Afiarea rezultatelor

Interfaa web trebuie sa fac posibil parcurgerea rapid a rezultatelor cutrii. Afiarea rezultatelor are urmatoarele caracteristici:

Afiarea ntr-un interval de timp sub o secund; Afiarea rezultatelor relevante. Algoritmul de relevan web decide care rezultate sunt mai importante pentru a fi afiate la nceputul listei; Afiarea metadatelor i a informaiilor despre documentul gsit n format de tip hint; Vizualizare rapida a rezultatelor; Evidenierea (sublinierea) cuvntului cutat n setul rezultat; Afiare document gsit n format original; Generare tabel cuprins ; Apelarea programului word de procesare a textelor din browser; Securitate - accesul utilizatorilor n funcie de drepturile fiecruia; abloane SQL ample pentru bazele de date.

Obinerea i vizualizarea rezultatelor

Categorisirea n timp real - n momentul indexrii; Cutarea n lista de rezultate; Filtrarea rezultatelor; TENDINE NOI N BIBLIOTECONOMIE Carmen Diaconescu: Biblioteca virtual

BIBLOS 19-20 / 2007-2008 p.

27 Sublinierea termenilor cutai n rezultate i navigarea facil ntre acetia; Ascunderea rezultatelor nedorite; Adnotarea documentelor rezultate fr a modifica originalele.

Administrare

Administrare prin interfa web; Server web; Suport software pentru personalizarea aplicaiei; Monitor al activitii pe site; Indexare pentru peste 140 de tipuri de fiiere; ncorporarea n cutare a site-urilor externe; Conversia n html a peste 100 de tipuri de fiiere sub licen; Indexarea prin ftp a sistemului de fiiere din Unix; Interfa personalizabil; Suport pentru scripturi php;

Suport pentru includerea de fiiere n pagini; Suport pentru extensii CGI i ISAPI; Module de acces extern; Analiz statistic; Administrare de la distan; Securitate Windows NT i Apache; Pn la 64 milioane documente per index i numr nelimitat de indeci; Pstrarea integritii datelor indexate; Indexarea automat prin temporizare.

Concluzii

Natura dubl a bibliotecilor, n general, i a celor mari, n special, a fost demult anticipat: au rmas, pe de o parte, instituii cu sli de lectur, colecii de documente i, pe de alt parte, au devenit organizaii virtuale care ofer o gam variat de servicii online; succesul a fost asigurat de faptul c a fost ncurajat cercetarea i dezvoltarea unor noi modele de funcionare a bibliotecilor care s mbine perfect latura tradiional cu latura modern. Rolul lor s-a extins, de la achiziia, prelucrarea i furnizarea documentelor, la un alt fel de organizare a cunotinelor i a informaiilor specializate, punnd accentul pe evaluare, adugarea de valoare i validare n tranzaciile cu publicul, iar specialitii n tiina informrii au competena de a parcurge i analiza relevana unui document, de a-l sistematiza i oferi utilizatorilor interesai, dup cum au i capacitatea de a recepiona i analiza feedback-ul primit de la utilizatori pentru o perpetu reconsiderare a modului de prelucrare i de diseminare a unui coninut. S-a schimbat i modul de organizare a muncii. Lucrul n echip, cu granie fluide ntre

specialitii n biblioteconomie i cei n IT, a ctigat teren mai ales n bibliotecile mari. A lucra n colaborare a devenit un modus operandi pentru biblioteci, parteneriatul fiind perceput ca esenial pentru ca bibliotecile s i ndeplineasc scopurile i obiectivele asumate: crearea unor resurse informaionale calitativ superioare i coordonate. Evoluia produselor software pentru biblioteci asigur, pe de alt parte, suportul necesar pentru a regndi modalitile de lucru specifice, evitnd instalarea n mentalul colectiv a ideii c am avea de-a face cu instituii obsolete, depite, inutile.

S-ar putea să vă placă și