Documente Academic
Documente Profesional
Documente Cultură
Ghid Digitizare - Biblioteci - v2009 PDF
Ghid Digitizare - Biblioteci - v2009 PDF
I. Aspecte teoretice
1. Introducere.......2
2. Etapele desfurrii procesului de digitizare..3
3. Resurse informaionale i documentare n bibliotecile din Romnia...3
4. Criteriile de selecie.3
5. Modelul Europeana.....4
1.Terminologie......6
2. Formate......7
3. Denumirea fiierelor ....10
3.1 Excepie: Documente din arhiva istoric.11
4. Tipologie documentar....12
5. Descrierea obiectelor digitizate. Metadate.....13
Concluzii...23
1. Introducere
Bibliotecile din sistemul naional de biblioteci sunt componente definitorii ale sistemului
naional informaional. Prin structuri, funcionaliti, servicii i patrimoniu info-documentar
ele trebuie s rspund cerinelor complexe i variate de informare.
Prin participarea tuturor bibliotecilor din cadrul sistemul naional de biblioteci, deintoare
de documente i colecii, se va putea crea o bibliotec digital cu un coninut eterogen din
punct de vedere al tipului de documente (cri, manuscrise, publicaii seriale), al perioadei
de publicare, al adresabilitii.
4. Criteriile de selecie
Criteriile de selecie pot fi i de cele mai multe ori trebuie s fie combinate pentru obinerea
unui soluii optime.
- valoarea documentar:
- reprezentativitatea pentru un anumit domeniu, o anumit perioad de timp sau o anumit
regiune geografic, att la nivel naional, ct i la nivel internaional;
- gradul de interes i adresabilitate;
- prezervarea documentelor originale;
- regimul juridic (dreptul de autor i dreptul de difuzare);
- criteriul financiar;
- soluia de scanare si tehnologia implicat.
5. Modelul Europeana
Metadatele se vor gsi n cadrul portalului, iar documentele digitale vor rmne la
deintor.
Europeana
Biblioteca Digital a
Romniei
1.Terminologie
Digitizare reprezint procedeul prin care informaia este capturat n format digital
(imagine, document text, fiier audio, etc.) cu ajutorul unui echipament tehnic digital
(camer digital, scanner, etc.). Cnd vorbim despre digitizarea documentelor, de cele
mai multe ori ne referim la imaginea paginii capturat de un astfel de echipament - pur i
simplu o poz a documentului sau o versiune full-text, n care documentul este stocat
folosind caractere text/scrise. Forma neprocesat a documentului (plain-text), reprezint
varianta integral a documentului, folosind caractere ASCII sau Unicode, pentru acestea
existnd posibilitatea efecturii unei cutri n text (cuvinte sau fraze), ns se pierde
structura i aspectul original al documentului.
Fiiere / Documente derivate sunt create din documentul imagine digital master cu
scopul de a fi editate ulterior, de a fi mrite, transformate n diferite formate, dar i pentru a
fi reprezentate i transmise prin intermediul reelelor (ca de exemplu imagini create
pentru accesare i imagini timbru)
Metadate: orice date referitoare la datele specifice crerii unui obiect digital i care se
refer la descrierea informaiilor caracteristice (informaii legate de publicarea acestuia,
formatul, drepturi, etc.).
TEI (Text Encoding Initiative) un consoriu internaional care public indicaii referitoare la
schimbul i codificarea textelor electronice, conform specificaiilor limbajelor SGML i
XML pentru prezervarea textelor literare i lingvistice folosite n mediile culturale i
academice.
2. Formate
Sistemele care dein drepturi de proprietate pot fi potrivite pentru tiprirea unui document,
prin instrumentele de procesare text sau formatele descrierilor de pagin (de exemplu,
Microsoft Word, PDF) i permit publicarea acestora pe web, prin intermediul funciei
"Salvare ca HTML". n cazul n care este necesar mutarea/migrarea datelor pe o alt
platform software, exist riscul de a pierde informaiile de formatare. Pentru c astfel de
sisteme depind de existena unor programe cu drept de proprietate - ai cror termeni de
liceniere i existen nu pot fi definii pe termen lung - acestea nu sunt recomandate
pentru scopuri de arhivare sau pentru definirea unei existene durabile n timp. De
asemenea este indicat s fie identificate formatele acceptate pentru transfer, stocare i
distribuie ctre utilizator, deoarece acestea pot diferi, s nu fie utilizate metode de criptare
sau comprimare pentru fiierele care vor fi pstrate n arhiv i trebuie micorat numrul
tipurilor de formate, pentru ca documentele digitizate s fie gestionate ct mai uor.
.tiff, .tif TIFF (Tagged Document la rezoluie maxim Calitate nalt; Documente
Image File recomandat; formatul a fost foarte mari; Majoritatea
Format) creat la nceput pentru programelor care recunosc
publicarea electronic 1 64 bit acest format ating un maxim
adncime. Folosit n general de 24-bit culoare.
pentru imagini de nalt calitate Distribuia pe web este
i pentru stocare arhivat. limitat de dimensiunea
fiierului/documentului.
3. Denumirea fiierelor
Se pot stabili convenii pentru nume, tabele cu semne sau reguli (de ex. reguli referitoare
la punctuaie i la majuscule) uniformizarea acestora fiind un aspect foarte important.
Cota/nr. inv_TD_secvena.ext
unde:
- TD
- tipologia documentar;
- identific tipul documentului (vezi mai jos codurile);
- cmp alfanumeric din doua poziii:
o o majuscul pentru clasa de documente;
o un numr pentru tipul documentului n cadrul clasei (este 0 dac nu
exist subclasificare).
- secvena
- poziia obiectului digitizat n cadrul unei structuri (de exemplu identific
numrul paginii ntr-o carte, sau al unei melodii pe un CD);
- cmp numeric din minim 2 cifre;
- este 00 dac obiectul digitizat nu este structurat;
- se completeaz obligatoriu zerourile (de ex. 07, 095, 0087 etc.).
- .ext
- reprezint extensia (tipul fiierului);
- ex.: .tiff, .jpg etc.
Cota(Fondul)_Dosar_docnnn_secvena.ext
Unde:
- dosar
- reprezint numrul dosarului n cadrul fondului;
- cmp alfanumeric, numr variabil de caractere;
- se vor completa zerourile
- docnnn
- reprezint reprezint numrul documentului din cadrul dosarului;
- cmp alfanumeric;
- nnn este un numr
- exemplu: doc005, doc157 etc.;
- secvena
- reprezint numrul paginii din cadrul documentului (nu al filei);
- cmp numeric, numr variabil de caractere;
- .ext
- reprezint extensia (tipul fiierului);
- ex.: .tiff, .jpg etc.
Exemple:
Biblioteca Naional a Romniei
4. Tipologie documentar
C. Carte tiprit
1. carte veche
2. incunabul
3. carte rar/bibliofil
4. carte curent
P. Publicaii periodice
1. periodice vechi
2. periodice rare/bibliofile
3. periodice curente
M. Manuscrise
1. carte manuscris a unei singure opere
2. carte manuscris-miscelaneu
3. manuscrise de autor
4. coresponden
F. Microformate
1. microfi
2. microfilm
H. Documente cartografice
1. hri (plane, n relief sau globulare);
2. atlase
3. planuri tiprite
A. Documente audio-video
1. muzicale tiprite
2.audio muzic
3 audio voce
4. video
G. Documente grafice
1. studiu
2. desen tehnic
3. program
4. anun
5. proclamaie
6. plan
V. Arte vizuale:
1. gravur
2. desen
3. ex libris
4. reproducere de art
5. fotografie
6. afi
7. pictur
8. sculptur
Tipuri de metadate:
Dac aceste metadate nu se regsesc, accesul la obiectul digital poate fi ngrdit, iar
prezervarea acestuia nu se poate realiza. Metadatele care ofer informaii despre
contextul tehnic al resursei (formatul fiierului, posibilitile de acces, etc.) i a altor
informaii (legate de drepturile de autor, drepturile de reproducere) sunt foarte importante
pentru gestionarea continu a obiectului digital. Ele ofer informaii utile n procesul de
prezervare, asemenea msurilor de securitate ce trebuie luate pentru un document fizic.
Fr aceste metadate nu se poate ti ce reprezint resursa, cum poate fi folosit, care a
fost procesul de realizare.
Metadatele pot fi stabilite pentru o ntreag colecie sau pentru fiecare exemplar n parte.
Metadatele de prezervare sunt importante datorit faptului c prin intermediul lor un obiect
digital poate s ofere informaii despre el nsui o perioad ndelungat de timp, facilitnd
astfel prezervarea i accesul, deintorului, custodelui, tehnologiei, i chiar comunitilor
utilizatorilor care se afl ntr-o permanent schimbare.
Metadate DESCRIPTIVE
ELEMENT STATUT
ELEMENT STATUT
Identificator Obligatoriu
Folosit pentru stabilirea unui cod de
identificare unic documentelor digitale care
au fost create cu scopul de a fi expuse pe
web - prin intermediul unui program de
gestionare a obiectelor digitale, stocate pe
un server sau orice alt modalitate
Formatul documentului digital Recomandat (.jpg, .pdf, etc.)
Mrimea /Rezoluia fiierului Recomandat (dac e comprimat, etc.)
Aplicaia folosit Recomandat
Numele, Versiunea, Creatorul acesteia
Software folosit Recomandat (Denumire, caracteristici)
Hardware folosit Recomandat (Denumire, caracteristici)
Tehnica de reproducere Recomandat (Scanner, Camer digital -
caracteristici,etc.)
Data efecturii reproducerii/ Recomandat
crerii obiectului digital
Instituia care a efectuat reproducerea Recomandat
In-house, externalizare; evidena
deintorilor obiectului digital, pentru
eventualele modificri
Metoda de siguran Recomandat
Procedeul de codificare: watermark,
semntur digital, etc.
Autenticitatea documentului digital Recomandat
Metadatele de prezervare trebuie s includ
informaie suficient pentru validarea unui
obiect digital, pentru confirmarea scopului
digitizrii acestuia dar i pentru confirmarea
faptului c acesta nu a fost alterat/modificat
fie intenionat sau neintenionat
Relaie / Legtur cu Recomandat
Structural pentru stabilirea relaiilor
dintre obiecte; Derivare replic sau
transformare a unui alt obiect digital
Locaia / Directorul Obligatoriu (server, hard extern, etc.)
Drepturile de management Recomandat
n context depozit digital, se refer la
aciunile efectuate n scopul prezervrii
(numele persoanei autorizate, poziia
ocupat)
Drept de acces Obligatoriu
Restricii referitoare la drepturile de utilizare,
reproducere, distribuire; modaliti folosite
dc:relation Obligatoriu
(relaia cu alt resurs) europeana:isShownBy referina clar URL ctre pagina web
a instituiei care deine obiectul digital disponibil la cea mai
bun rezoluie
FIE
europeana: isShownAt - referina URL ctre descrierea
complet a obiectului digital pe pagina web a instituiei
deintoare
europeana:userTag Etichete create de ctre utilizatori nregistrai prin interfaa
Europeana. Pentru aceast informaie furnizorul de coninut nu
are nicio responsabilitate.
europeana:unstored Recomandat
Locul unde se afl stocate informaiile referitoare la obiectul
digital, fr de care acestuia nu i se pot atribui elemente
specifice Europeana. Include informaii necesare indexrii. Vor
fi incluse toate elementele care nu se regsesc n cmpurile
deja stabilite. Nu va fi afiat ca rezultat la o cutare complet.
europeana:object Adugat n mod obligatoriu de ctre Europeana
Referina URL la obiectul digital cu cea mai bun rezoluie
disponibil pe pagina web a furnizorului de coninut pentru a
genera o imagine timbru. n cazul n care nu exist deja o
imagine timbru Europeana va crea cte una pentru fiecare
obiect n parte iar dac sunt mai multe imagini incluse, va fi
aleas prima. n cazul unui document n format PDF, se va
alege drept reprezentativ pagina de titlu.
europeana:language Recomandat
Limba atribuit resursei cu referin la furnizorul de coninut.
Este obinut automat din fiierul de autoritate al furnizorilor din
Europeana.
Pentru aceast informaie furnizorul de coninut nu are nicio
responsabilitate.
*
Specification for the Europeana Semantic Elements V 3.1, 25/02/2009+
Terminologie
Calitatea imaginii capturate poate fi definit prin suma dintre rezoluia scanrii,
profunzimea biilor imaginii scanate, procesul de compresie aplicat, echipamentul de
scanare i tehnica folosit, i ndemnarea operatorului.
Profunzimea (Bit depth). Un bit (pl. bii) reprezint cea mai mic unitate de date (0 sau
1, alb sau negru). 8 bii reprezint un byte. Profunzimea biilor reprezint numrul de bii
folosii pentru a defini un pixel. Cu ct aceasta este mai mare cu att este mai variat
numrul de tonuri i nuane.
Tehnici de scanare:
scanare bitonal - bitonal scanning se utilizeaz un bit per pixel pentru a reprezenta
culorile negru sau alb
scanare cu nuane de gri - greyscale scanning - mai muli bii per pixel pentru
reprezentarea mai multor nuane de gri; nivelul preferat de scar gri este de 8 bii per
pixel, iar la acest nivel imaginea afiat poate selecta 256 de la diferite niveluri de gri.
scanare color - colour scanning - se utilizeaz mai muli bii per pixel pentru a
reprezenta culoare; 24 bii per pixel reprezint adevratul nivel de culoare i face
posibil o selecie din 16,7 milioane de culori.( 24-bit RGB)
Tipuri de fiiere
n funcie de scopul crerii fiierelor digitale, s-au conturat trei tipuri de fiiere:
fiier master: copie identic cu obiectul digitizat, de nalt rezoluie, necomprimat,
utilizat pentru prezervare.
fiier pentru acces: fiier derivat din mater, care se aproprie de original, utilizat
pentru publicare i care asigur o vitez rezonabil la livrare.
fiier pictogram (thumbnail): fiier derivat din master, de dimensiuni i rezoluie
mic, utilizat pentru previzualizare.
Aparatura de scanare
- dac se constat diferene riscante, fiecare volum va fi nvelit n material neutru, cu rol de
tampon la umiditate ( de ex. finet alb de bumbac) i numai astfel va fi dus n sala de lucru,
iar aici va fi lsat, pentru aclimatizare, 45 60 minute;
- transportarea documentelor din depozite n spaiile de lucru i retur se va face n couri de
dimensiuni medii, din material plastic bine finisat, care s poat fi mnuite i de o singur
persoan;
- nainte de nceperea scanrii, toate volumele trebuie desprfuite pe toate suprafeele
exterioare (coperte, cotor, trane), iar n interior fil cu fil, n zona cotorului, fr a se
atinge oglinda textului sau ornamentaiile; aceast operaiune se va face dup
recomandrile conservatorului, n funcie de particularitile fiecrui obiect; se vor folosi
pensule de diverse dimensiuni, din pr animal, crpe de bumbac i va fi amenajat un
spaiu optim pentru aceast operaiune;
- personalul care desprfuiete trebuie s fie echipat cu halat cu mneci lungi, cu masc de
reinere a pulberilor ( aezat peste nas i gur), cu ochelari de protecie la praf i cu
mnui chirurgicale din latex natural, de unic folosin, care se vor trage peste mnecile
halatului.