Sunteți pe pagina 1din 231

CAP.7.

BAZA DE DATE RESURS ELECTRONIC DE INFORM

Curs:
Tehnologia infor n cercetare

Mat. Gabriela MAILAT


Prof.dr.ing. Elena HELER

CUPRINS

Baze de date. Defini ie. Clasificare


Modalit i de acces n bazele de date tiin ifi Sisteme de reg sire a
informa iei

Exemple de sisteme de reg sire a informa iei


Sistemul de reg sire a informa iei: Opera iile de sto
reg sire

Indexarea documentelor Standardizare i sisteme Afi area rezultatelor


Linii directoare pentru afi aj

Baze de date. Defini ie. Clasificar

Baza de date este unul dintre instru fundamentale utilizat


pentru orga informa iei. Baza de date reprez colec ie de

date organizate pentru a c utarea i reg sirea rapid prin inte


calculatorului.

Baze de date. Defini ie. Clasificare

Reprezint structuri pe care sunt co majoritatea sistemelor


informatice.

Bazele de date sunt structurate astf s faciliteze stocarea,


reg sirea, mod i tergerea datelor n concordan cu opera ii
de procesare a datelor.

Baze de date. Defini ie. Clasificare

O baz de date o serie de nr fiecare dintre


acestea fiind o entitate specifi construite n
acela i mod (cu atribute com interconectate.

nregistr rile sunt componentele elemen unei

baze de date i pot con ine informa ii n text sau


reprezent ri grafice.

nregistrare cuprinde cmpuri de d elemente


de date (numele autorului, titlu e descriu
principalele atribute ale unei entit i.

Baze de date. Defini ie. Clasificare

Bazele de date pot fi stocate pe diferite s offline sau online i pot fi


accesate prin int re elelor de informare locale, la distan Internet.

Patru criterii importante caracterizeaz c unei baze de date:


volumul

informa iei i acoperirea domeniilor d tiin ific,

facilit ile de interogare,

timpii de acces,

grafica ecranului.

Baze de date. Defini ie. Clasificare

n procesul de prelucrare i de reg informa iilor o baz de date poate fi


folosit p

generarea de indexuri tip rite;

realizarea de cercet ri retrospective;

realizarea bibliografiilor;

diseminarea selectiv a informa iei.

Baze de date. Defini ie. Clasificare

O cercetare retrospectiv cercetare la c se realizeaz ntr-un corp de


literatur retro pentru a g si titluri privind un subiect gen specific, la
cererea utilizatorului.
Un serviciu curent de diseminare sele informa iei are n vedere
numai literatura p recent.

Baze de date. Defini ie. Clasificare

informa iei, interesul utilizatorului pe subiect este convertit


n strategie de c numit n mod frecvent profilul utiliza Acest
profil se p streaz ntr-un fi ier completeaz pe m sur ce apa
suplimentare.

Baze de date. Defini ie. Clasificare

Pornind de la structura lor, bazele de da clasificate n:

baze de date ierarhizate i

baze de date rela ionale.

10

Baze de date. Defini ie. Clasificare

Bazele de date ierarhizate

tradi ional structura arborescent pentru informa iei. Ele constau dintrun fi ier form multe nregistr ri, care la rndul lor sunt din numeroase
cmpuri de date. Aceste date sunt mai degrab inflexibile i folo spa iu
ntruct datele sunt adesea repetitive

11

Baze de date. Defini ie. Clasificare

Baze de date rela ionale permit d nregistr rilor n mai multe p r i


care sunt p diferite fi iere. Aceste p r i sunt legate pentru a forma

nregistr ri individuale. informa ie individual este stocat ntr-un si dar


ea poate fi utilizat n mai multe nregis ex. numele unui autor poate fi
stocat ntr-pentru nume, dar fiecare nregistrare a lucr ri a
respectivului autor este afi at mpr numele autorului pe ecran.

12

Baze de date. Defini ie. Clasificare

Bazele de date ndeplinesc numeroase func


pot stra date administrative, colec ii de ima date numerice brute;

pot fi depozite de articole cu text integral;


pot ine eviden a inventarului i a mprumutur Dup func ia ndeplinit ,
bazele de date pot fi mp r ite n dou categorii:
Baze de date bibliografice (de referin )
Baze de date tip surs .

13

Baze de date. Defini ie. Clasificare

Primele (bibliografice) con in:

informa ii despre literatura or adic date bibliografice i suplim


referitoare la c r i, articole din pe documente
guvernamentale, ra lucr ri de la conferin e, dizerta ii, b

14

Baze de date. Defini ie. Clasificare

date bibliografice (autor, titlu clasific ri, cuvinte cheie,


precum informa ii suplimentare pertinente scurt descriere a
con inutului publi

15

Baze de date. Defini ie. Clasificare

n cadrul acestor baze de date bibliografic leg turi (link-uri) sau


trimiteri (pointer) spr care se afl n afara respectivei baze de d
exemplu, indexul unei reviste (periodic) informa ii despre loca ia i con
inutul unor
(lucr ri tiin ifice) care sunt stocate n alt pa

16

Baze de date. Defini ie. Clasificare

Una dintre cele mai cunoscute baze de acest tip este METADEX,
pentru domeniu materialelor, care poate fi accesat prin In pagina
WEB a re elelor DIALOG sau STN, mari re ele de informare online
din domeniul

17

Baze de date. Defini ie. Clasificare

Bazele de date tip surs pot fi:


full-text care con in textul integ fragmente din documente, ca:
articol poeme, eseuri;

numerice
financiare, rezultate ale diverselor propriet i fizice sau chimice ale
substan

18

Baze de date. Defini ie. Clasificare

Exemplu de baz de date numeric n d atomic i molecular


i.

AMDIS

(Atomic and Molecular Data

http://dpc.nifs.ac.jp/amdata/am

System)

n
cadrul

bazei de date AMDIS, s


transversale teoretice i experimentale (ob tehnici de fascicul) pentru
procesele de ex ionizare ale atomilor, ionilor i a unor mole impact
electronic sunt stocate mpre referin ele.

19

Baze de date. Defini ie. Clasificare

CHART (Charge Transfer between Atoms


http://dpc.nifs.ac.jp/amdata/chartlist.html

Sec iunea transversal experimental pentru de sarcin al ionilor n


coliziune cu inte d atomic i molecular sunt stocate mp referin ele.

20

Baze de date. Defini ie. Clasificare

hibride (mixte)

nregistr ri reprezentnd o combina ie ntre date full-text i cele


numerice;
faptice spre deosebire de cele bibliografi informa ia primar .
n Germania, GENESIS-Online
de date care ofer date statistice. https://wwwgenesis.destatis.de/genesis/on

21

Baze de date. Defini ie. Clasificare

Alt exemplu l constituie EUROSTAT, care of statistice privind


Comunitatea European .
http://www.esds.ac.uk/international/support/u
des/eurostat/cronos.asp
http://epp.eurostat.ec.europa.eu/portal/page/
urostat/home/

22

Baze de date. Defini ie. Clasificare

e. pentru brevete

Aproape jum tate din cererile de breve lume sunt respinse de c tre
birourile de b deoarece conceptul presupusei inven ii nu nou.
Pentru a evita riscul unei investi ii de mil cercetare i dezvoltare,
trebuie mai nti co o astfel de baz de date care con ine b existente
pn la acea dat .

23

Baze de date. Defini ie. Clasificare

pentru rapoarte i proiecte de cercetar furnizeaz informa ii asupra


proiecte cercetare i dezvoltare. Un exemplu es (National Technical
Information Service)

http://www.ntis.gov/.
C utarea n baza de dat http://www.ntis.gov/products/ntrl.aspx.

24

Modalit i de acces n bazele de date tiin ifice

Accesul la informa iile con inute se poate intermediul produc


torului bazei de date distribuitorii de servicii online. Pentr

calculator conectat, distribuitorul de serv atribuie un cont,


identificat prin nume care asigur confiden ialitatea accesului l

25

Modalit i de acces n bazele de date tiin ifi

Contul se afl localizat pe un calculat (gazd ) situat n Centrul


Informatic i se la operator. Calculatorul host

produsele soft implementate i cana comunica ie la care este


conectat) activit ile n re ea ale utilizatorului, protocoalele
Internet.

26

Figura reprezint schema de principiu a modului de acc baze de date prin re ele de informare
online.

27
Accesul la bazele de date prin re ele automatiz

Sisteme de reg sire a informa iei

n cele ce urmeaz se vor defini acele eleme s -i familiarizeze pe poten


ialii utiliza terminologia i conceptele de baz ale proce reg sire a

informa iei. Din cele prezen continuare va rezulta c reg sirea inform
implic numai procese specifice sistemului mult, procese care includ
chiar utilizatorul.

28

Sistem de reg sire a informa iei

Fiecare sistem de reg sire a informa iei accesul la un set de


documente. Un do reprezint un obiect care este reg sit de u de reg
sire a informa iei. Acesta poate co con inutul complet al informa iei

cerute, n este considerat un document full-text, de ex pagin WEB


sau un articol din revist .

29

Sistem de reg sire a informa iei

n cadrul sistemelor de reg sire a i bibliografice, adeseori


documentul fu este disponibil, astfel nct se utili rezumat numit
document surogat (c care este stocat n locul documentulu

Acesta cuprinde date cu rol de identif ar fi informa ii asupra cit


rilor biblio rezumate care ajut la ide documentului.
30

Sistem de reg sire a informa iei

Documentele pot fi de lungimi difer exemplu de la scurte pasaje


de text opere monografice complete, sau pot a formate media
cum ar fi imagini vid sunete.

31

Sistem de reg sire a informa iei

Exist dou metode de c utare:


interogarea i

baleierea informa iei, ambele putnd continuare subdivizate.


Interogarea poate fi:
identificarea (punerea n coresponde baz de fraz sau
identificarea prin cuvinte cheie.

32

Sistem de reg sire a informa iei

Identificarea pe baz de fraz const n p unui ir format din caractere de


c utare c exact din nregistr rile aflate n sistem (s precis, cu indec ii

genera i ). Ace interogare solicit cuvintelor din ir s se reg n aceea i


ordine ca n interogarea de c u permite termenilor sau irurilor s se reg
s cmpuri diferite.

33

Sistem de reg sire a informa iei

Identificarea prin cuvinte cheie permite term fie dispersa i. C utarea


pe baz de cuvin implic punerea n coresponden a unor separate cu
indec ii sistemului, recurgnd a operatori booleeni sau la formul ri de

pro pentru a-i combina. Cuvintele cheie pot fi unor termeni care apar
n mai mult de u cmp sau index.

34

Sistem de reg sire a informa iei

Baleierea informa iei, la rndul ei, poate fi divizat n dou categorii:

Baleierea linear pre-secven ial utilizatorilor s scaneze liste de


antete/titluri sau scurte titluri pentru teme sau articole de interes.
Aceasta abordare structurat , recurgnd la org intern a datelor de c
tre sistem.

35

Sistem de reg sire a informa iei

Cel de-al doilea tip de baleiere pro Hildreth este neliniar i multidirec
ional este tipul de baleiere nestructurat . utilizarea leg turilor/ linkurilor hypertex a naviga ntre diferite articole.

36

Sistem de reg sire a informa iei

Interogarea este preferabil n cazul n care tiu exact ceea ce- i doresc,
n timp ce constituie o alternativ n cazul reg sirii nregistr ri ca r spuns
la o interogare.

37

Sistem de reg sire a informa iei

De exemplu, dac un utilizator caut un d dup criteriul autor, numele


fiind Popescu, cunoa te dect ini iala R. a prenum interogare bazat
pe baleiere l va plasa pe caut ntr-un index al tuturor numelor de p cu
numele de familie Popescu, n punctul vor ncepe prenumele cu ini

iala R. De punct, utilizatorul poate scana nume fie na dup numele


introdus.

38

Sistem de reg sire a informa iei

Dac aceast list con ine, adi ional numel i nregistr ri asociate cu
numele respectiv utilizatorul poate determina mai u or care reprezint
pe R. Popescu c utat. O op baleiere pe subiect
subiecte apropiate cuvntului care a fost intr scopul c ut rii.

39

Sistem de reg sire a informa iei

n cazul n care utilizatorul nu este sigur a ceea ce dore te sau atunci


cnd utiliza cunoa te irul exact utilizat n sistem p descrie ceea ce

caut , baleierea poate fi o mai adecvat pentru a satisface informa


ional a utilizatorului.

40

Sistem de reg sire a informa iei

Procesul de interogare a bazelor de limbajele de comand


utilizate includ:

Alegerea bazei de date . serviciul online acces la mai baze


de date este necesar alegere de date dorite pentru
interogare;
Selectarea termenilor de c utar individual, fie n combina ii
cu al ii, u operatori booleeni;
41

Sistem de reg sire a informa iei

C utarea pe cmpuri specific nregistr rii (autor, titlu etc.);


Utilizarea trunchierii termenilor de c ut

C utarea pe baz de fraz sau expres


C utarea termenilor care apar n a propozi ie sau acela i
cmp;
C utarea termenilor utiliznd un sist clasificare sau un
tezaur;
42

Sistem de reg sire a informa iei

Generarea seturilor de c utare i ut ulterioar a informa iilor


reg site;

Salvarea listelor generate n proce c utare;


Printarea referin elor g site;
nc rcarea referin elor pe sistemul pro Abandonarea sesiunii
de c utare.
43

Sistem de reg sire a informa iei

O baz de date este interogat instruc iuni sau comenzi


concepute p localiza toate nregistr rile care anumi i
termeni, combina ii de terme diferite valori.

44

Sistem de reg sire a informa iei

De exemplu la c utarea termenului sistemul de reg sire va afi a


num nregistr ri n care este prezent cuvntu Dac ne gndim la o
nregistrare bibli termenul c utat poate ap rea n titlu, n r n titlul

publica iei etc. Dac se cercetarea poate fi f cut numai pe un


cmp, cum ar fi titlul, crescnd astfel gr relevan al rezultatelor.

45

Sistem de reg sire a informa iei

Termenii pot fi asocia i cu indec i documente sau pentru interog


ri. n proces rii interog rii,

(interogare) sunt asocia i cu termenii ind care se mai numesc i


cuvinte che definesc termenii c utabili din baza de da

46

Sistem de reg sire a informa iei

Interog rile pot avea diferite forme:


Interog rile de tip boolean ter operatorii care definesc contextul
termenilor. Cnd se impune c utarea printr-o combi termeni, criteriile

de c utare sunt stabilite cu operatorilor booleni AND ( I), OR (SAU (F


R ), care se folosesc pentru a pun leg tur logic diferi i termeni. Logica
b rezult din aplicarea algebrei lui G. Boole i operarea/ stabilirea a trei
tipuri de rela descriptori.

47

Sistem de reg sire a informa iei

Rela ia de intersec ie (produs logic): se u operatorul I (AND) pentru


a lega doi descri impune ca ambii termeni s existe n nre reg site. Cei
fie pr indexarea documentului, pentru ca doc respectiv s fie
considerat pertinent.

48

Sistem de reg sire a informa iei

Cu alte cuvinte, va restrnge c utarea la un n mic de nregistr ri dect


dac s-ar c uta pent

termen separat.
AND

composite
wooden

boards
fibres

49

Sistem de reg sire a informa iei

Rela ia de uniune (sum logic ): folosir (OR) presupune ca fie


primul, fie al doilea, descriptori s fie prezen i n nregistr rile m rind
astfel num rul documentelor p

reg site.
OR

composites

50

wood

Sistem de reg sire a informa iei

Rela ia de excludere (diferen a logic ) operatorului F R (NOT)


implic excluderea d rezultate a tuturor nregistr rilor care con i c ruia i
se aplic operatorul, dac dorim ca d s fie pertinent.

51

Sistem de reg sire a informa iei

Rezultatul acestor opera ii de coord descriptorilor este ecua ia de


cercetare. cteva proceduri care permit s se formule se completeze
ecua ia de cercetare.

NO

PAL PAP

52

Sistem de reg sire a informa iei

Interog rile n limbaj natural


structura lingvistic i pozi ia cuvinte identificarea contextului.

Anumite sisteme permit introducerea d termeni, caz n care


distan a dintre termen rela ia dintre ace tia. n cazul utiliz rii inte
limbaj natural, fie f cu limbajele artificiale de interogare car
opera iuni de interogare valide.

53

Sistem de reg sire a informa iei

Sistemele de reg sire a informa iilor pot func iunea de c utare liber a
textului sau p bazeze pe un vocabular controlat.

C utarea tip text liber nu limiteaz termenii la un set predefinit de


termeni. Vocabularul care este implementat de regul ca subject sau
descriptori, limiteaz c utarea la un termeni necunoscu i care au fost
indexa i.

54

Sistem de reg sire a informa iei

Indicatorul de proximitate (al t Folosirea lui impune ca


primul descri fie n imediata apropiere a celui de-al Prin
acest indicator se define te apr descriptorilor n textul

documentul utilizeaz foarte mult n c utarea tip te (sau se


aplic rezumatelor care ncorp descriptori).

55

Sistem de reg sire a informa iei

Cel baza indic d doi descriptori trebuie s fie succesivi se g


seasc n aceea i fraz (2) sau fie desp r i i ntre ei n text
dect num r determinat de cuvinte (3).

56

Sistem de reg sire a informa iei

Indicatorul de ponderare: se aloc , indexarea documentelor,


ct i la c fiec rui descriptor, n func ie de imp conceptului
reflectat n document cerere (3,2,1).

57

Sistem de reg sire a informa iei

Trunchierea: permite c utarea unui cuv descriptor, datorit unui


grup de litere (r sau radical), f r s inem seama de pre sufixe (de
exemplu: document, docum documentarist); dac cercetarea se f

descriptorul-document, se vor g si documentele care au fost


indexate cu de care au acela i radical.

58

Sistem de reg sire a informa iei

Extensia/expandarea: permite completarea de c utare printr-o


comand de ad ugare termen generic (TG), specific (TS) sau asoc iar
calculatorul va conduce la corespunz tori din tezaur pentru descrip
cauz .

Compara ia numeric : permite desf urar cercet ri n func ie de criterii


cantitative.
Exemplu: > 1976 (literatura publicat dup 1

59

Exemple de sisteme de reg sire a informa iei

Sistemele de reg sire a informa iei clasificate dup :


con inut sau

prin modelele utilizate pentru repre rea i extragerea con


inutului.

60

Exemple de sisteme de reg sire a informa ie

Datorit cre terii capacit ii de stocare pre a reducerii costurilor se tinde


din ce n mult spre reprezentarea i st documentelor, full-text (complet)
inclus componentelor non-textuale cum ar fi grafic

Printre aplica iile sistemelor de reg informa iei se num r i bazele de


bibliografice.

61

Exemple de sisteme de reg sire a informa ie

Multe sisteme de asisten (help) asociate cu aplica ii


software per asemenea c ut ri simple, baza con inutul helpului.
Internetul a contribuit la mbun sistemelor de reg sire a
informa iilor.

62

Exemple de sisteme de reg sire a informa ie

Motoarele de c utare

de reg sire a informa iei care pot fi pentru indexarea con


inutului distri WEB-ului i altor p r i ale internetul pot fi
folosite numai pentru ind con inutului local.

63

Exemple de sisteme de reg sire a informa ie

Aceste servicii de c utare asigur acc un mare volum de


documente f Sistemele de reg sire a informa ie sisteme

read-only n care uti efectueaz o simpl c utare, ne


modifica con inutul bazei de date.

64

Exemple de sisteme de reg sire a informa ie

Procesul de reg sire a informa iei implic u ntre utilizator i sistemul de


reg sire a inform

Caracteristicile principale ale stoc rii infor ale procesului de reg sire
sunt preze schema de mai jos :
Apelarea la serviciile unui sistem de reg informa iei este determinat
de nevoia de in a utilizatorului.

65

Exemple de sisteme de reg sire a informa ie

Utilizatorul tie c baza de date l sistemul de reg sire asigur


accesu con ine resursele care l intere Deoarece utilizatorul
cunoa te att do asupra c ruia vrea s se informeze modul

de utilizare a sistemului de reg informa iei, el formuleaz o


prim inte pe care o transmite sistemului.
66

Exemple de sisteme de reg sire a informa ie

Caracteristicile principale ale informa iei i ale procesului de


reg si prezentate n schema de mai jos :

67

Procesul de stocare i reg sire a informa iei

68

Exemple de sisteme de reg sire a informa ie

Interac iunea cu sistemul de reg informa iei este asigurat


prin int interfe ei cu utilizatorul. n urma pa unor articole
eligibile, utilizatorul rafina (detalia) cererea de informa ii i
modul de interogare a sistemului

69

Exemple de sisteme de reg sire a informa ie

Aceasta este cunoscut sub denum

relevance feedback.
pn cnd necesarul de informa ie satisf cut ntr-o m sur
suficient s cnd utilizatorul realizeaz c sistem poate
ndeplini cerin ele, moment procesul de c utare nceteaz .

70

Exemple de sisteme de reg sire a informa ie

Func iunile sistemului sunt invizibile pentru dar sunt importante


ntruct de ele capacitatea sistemului de a ndeplini c informa ie.

Nu este posibil includerea ntr-un singur ntregului volum de resurse


existent n lume.
Sistemul procedeaz la includere selectiv , atrase informa iile care
sunt de cea importan pentru scopul sistemului de Sistemul trebuie s g
seasc o mod reprezentare eficient a con inutului informa

71

Sistemul de reg sire a informa iei: Opera iile de


stocare i reg sire

Subiectele discutate au examinat s de reg sire a informa iei


-o pers descriptiv , r a detaliile procesului de reg sire propri

Procesul utare i reg sir genera o sarcin de calcul semnific


func ie de modelul de reg sire a inf implementat.
72

Sistemul de reg sire a informa iei:


Opera iile de stocare i reg sire

Stocarea i reg sirea eficien documentelor ca i mecanismele


a prezint interes pentru cercetare.

Pot fi folosite diferite tehnici n proce stocare i reg sire.


Procesele discutate n cele ce urme de sisteme de tip
Boolean, ce f termeni scri i ntre ghilimele i co metoda de
baz utilizat de maj sistemelor.
73

Stocarea i indexarea documente

Documentele stocate ntr-un sistem trebuie procesate pentru a se


asigura suficiente pu acces n vederea simplific rii reg sirii.

ntr-un mediu de fi iere inversate terme


folosi i
pentru
reg sirea
documente
conformitate cu parametrii interog rii.
Termenii care pot fi utiliza i la c utarea ntr-u

se g sesc pe o list , ntr-un fi ier de termen


indec i, care contorizeazrul documen
cadrul setului de documente indexate ce c

74
anumit termen.

Stocarea i indexarea documentelor

La introducerea termenului se stabile te o c tre o loca ie dintr-un fi ier


de post ri. O reprezint un termen indexat ntr-un do Dup ce s-a stabilit

c un document co anumit termen, documentul respectiv p reg sit.


Rela iile ntre termeni, post ri i do sunt prezentate n figura de mai jos.

75

Stocarea i indexarea documentelor

Reprezentarea fi ierelor unui sistem de reg sire a info

76

Stocarea i indexarea documentelor

La integrarea unor noi documente sistem de reg sire a


informa iei treb nti identifica i prin analiz sin termenii de c
utare din ele. Proce analiz sintactic va identifica n termen
prin caractere de delimitare v

77

Stocarea i indexarea documentelor

De exemplu, un termen valid poate ncep caracter alfanumeric i va fi


delimitat de c nonalfanumerice.

Termenii propu i pentru c utare sunt compara i cu o list de cuvinte


omise (sto care identific acele cuvinte care nu indexate.
Cuvintele omise pot fi the, to, a, for cuvinte frecvent utilizate i
care apar pe m documente dintr -un domeniu.

78

Stocarea i indexarea documentelor

n numeroase sisteme, exist instruc iun omiterea articolelor ini


iale la introducer ir pentru c utare. Utilizatorii manifest t de a

urma aceast recomandare instruc iunea se observ u or i dac v


zut din c su a de c utare.
Dac utare include totu i articolu poate rezulta una din urm
toarele situa ii:
79

Stocarea i indexarea documentelor

Sistemul returneaz un mesaj c utilizat primit rezultate i nu mai sunt


incluse d informa ii.

Sistemul

utilizatorului un me ndep rta articolul ini ial i de a

ncerca din n Sistemul trateaz un articol ini ial de o diferit ,


depinznd de tipul de c utare, pe cuvnt cheie, baleiere sau
echivalen
exact .
Sistemul pur i simplu elimin artico n tiin area utilizatorului i efectueaz
c utar

80

Stocarea i indexarea documentelor

Ultima posibilitate din list poate fi bun anumi i utilizatori, ns exist ,


binen eles, m cnd articolul (sau ceea ce pare a fi un arti cuvnt str

in, poate) este necesar pentru o de succes (ex. o carte intitulat A is


for Apple
Exist anumi i algoritmi pentru iden variantelor morfologice ale
termenilor indexa

81

Stocarea i indexarea documentelor

Variantele acestea pot fi apoi condensat r d cin comun .


Excluderea cuvintelor din indexul de termeni poate dimensiunea
fi ierului de post ri, n t anumi i algoritmi pot reduce fi ierul de t
Termenul ales este apoi c utat n fi i termeni.

82

Stocarea i indexarea documentelor

Dac n fi ier, se creeaz nregistrare, num rul de apari ii sau num


rezultate este setat la cifra 1 i se adaug nregistrare n fi ierul de post
ri, leg termenul de documentul aflat n fi i documente.

Dac deja n fi ierul de num rul de apari ii este incrementat i nou este
ad ugat la fi ierul de post ri.

83

Stocarea i indexarea documentelor

Dac este posibil c utarea dup cmpuri, ad uga un identificator de


cmp la fi i termeni.

Dac termenul apare n mai multe cmpu ad ugate intr ri suplimentare


pentru acela i fiec rui cmp ndu-i o unic apari
Dac posibilitatea c ut rii prin pro (al turare) trebuie de asemenea repr
loca iile multiple ale unui anumit termen n i unui cmp.

84

Stocarea i indexarea documentelor

n acest caz se vor efectua mai multe in postare pentru fiecare apari
ie a ter Valoarea offset- ului (decalajului) de la cmpului stabile te
loca ia n care terme pozi ionat n interiorul cmpului, de ex. un aflat

la nceputul cmpului va avea un offset 0. Termenul urm tor va avea


un offset eg .a.m.d. Aceasta poate conduce la c semnificativ a
dimensiunii fi ierului de po cmpurile de indexare ale sistemelor dator
iruri lungi de texte.

85

Stocarea i indexarea documentelor

Frecven a apari iei unui termen ntr-un c ntrun document serve te la calculul termenului,
oferind indica ii asupra importa n cuprinsul
documentului.
Strategia de indexare a unui document extrem
de simpl prin includerea tuturor te posibili care

86

se identific cu u urin la pro ini ial a


documentului.

Pr

tan ii de sisteme de reg sire a inform creat

oi

rutine de indexare automat care i termenii

ec

adecva i.

Standardizare i sisteme

Nu exist standarde reale, numai linii di generale i sugestii.


Din cauza naturii competitive a comercian il pie ele OPAC-urilor, o
interfa standard susceptibil de a ap rea curnd.

Sunt dezvoltate s turi i fiecare co plaseaz diferite niveluri de importan


pe aspecte ale propriului design de sistem.
Unele au diferite scheme de organizare altele au diferite capacit i de c
utare.

87

Standardizare i sisteme

Comercian ii ncearc s dezvolte c atr g toare interfa , caracteristici de


c module, n scopul de a c tiga un procent mare de pia .

Aceast competi ie contribuie la lip standardizare din proiectul


sistemului ns dat , poate contribui la inova iile i progr termen lung.

88

Standardizare i sisteme

Aceasta ar putea reprezenta o chestiune de echilibrului potrivit ntre


standardizare i for e pia .

Indexurile online, de asemenea, sunt cara de o mare varietate i de pu


in stand Aceasta este o continuare a unei lungi istorii a standard z rii
n indexurile tip rite.

89

Standardizare i sisteme

Cteva arii n care a fost recomandat standardizarea includ:


Afi area rezultatelor

interog rile de c utare fundamentale tratamentul articolelor


ini iale
utilizarea operatorilor Booleni, proximit trunchierea
punctua ia

90

Standardizare i sisteme

Afi area
Una dintre ariile cheie n care standardiza cea mai evident este n afi
rile sistemului.

Afi rile pot fi divizate n dou categorii:


afi area seturilor de rezultate reg site i
afi area metadatelor din nregistr rile sur
ambele ncorpornd probleme legate de for ie ire a informa ieie pe
ecran i de design.

91

Afi area rezultatelor

Afi area rezultatelor reg site


Prima preocupare n problema afi rii este rezultatele c ut rii apar ca
list de nregistr ri individuale sau

list antete/titluri afi ate mai nti, nainte de prezentarea pentru


vizualizare a nregistr ri propriu-zise.

92

Afi area rezultatelor

Exemplu
Unele sisteme, ca r spuns la o c utare p autor cu numele de familie
Benson, afi e Benson-ii din sistem, grupa i dup prenumelui.

Se poate naviga prin aceast list i se poat titlul/antetul adecvat nainte


de a avea lista c de cercetat am nun it.
Alte sisteme rezultate care sunt lucr ri legate de fiecare Benson
nainte de Benson exist . Se solicit paginarea prin lis autorilor ct i a
titlurilor nainte de a baleia
nume.

93

Afi area rezultatelor

Cea de-a doua preocupare n afi area rez este ordinea n care sunt
prezentate acestea

Pe m sur ce sistemele deveneau mai sofis fost acordat utilizatorului


mai mult control afi rii.
n anumite sisteme, utilizatorii pot specifica (cel mai adesea dintr-o list
scurt , prede op iuni) care s fie utilizat pentru a rezultatelor afi ate ale
c ut rii.

94

Afi area rezultatelor

De exemplu, dac se alege s rezultatelor dup autor, atunci i


principal este afi at n lista sortat este posibil ca intrarea
principal s autorul de care este interesat utilizato nu acel

Benson care este un al doilea autor al unui pachet informa


ional).

95

Afi area rezultatelor

Exist adesea trei niveluri de afi are ntr-un c online:


o versiune de una sau dou linii o afi are scurt
i o afi are integral / complet .

De i complet rareori nseamn c toate inf dintr-o nregistrare codat


sunt afi ate, sisteme permit afi area ntregii nregistr ri M

96

Afi area rezultatelor

Afi area implicit , atunci cnd o nregistrare este reg sit ca r spun
interogare sau dup ce un utilizator a se nregistrare dintr-o list
pentru a fi vizu este de obicei vizualizarea scurt .

Cantitatea i tipurile de informa ii omise nregistrare integral


pentru a crea u scurt difer de la sistem la sistem.

97

Afi area rezultatelor

Allyson Carlyle i Traci Timmons au examin 122 de cataloage bazate


pe Web i au conc c urm toarele cmpuri: autor personal, publica ie
sunt ntotdeauna afi ate n nr singulare implicite, ns alte cmpuri

sunt afi pu in frecvent, iar cele care sunt afi ate sun inconsistent (ex.
cmpuri de titlu includea declara ii de responsabilitate sau nu).

98

Afi area rezultatelor

Thomas remarc faptul c utilizatorii numai cteva mpuri


utile; astfel trebui s existe linii directoare selectarea
cmpurilor cele mai neces afi at.

99

10

Afi area rezultatelor

0
Etichetarea metadatelor n nregistr ri de asemenea de
la sistem la sistem, diferen e n terminologia utilizat
etichetare.
nregistr rile pentru (publica ii) seriale de probleme de
etichetare mai mul nregistr rile pentru monografii. Info
referitoare la fond(uri) pot crea c

utili
zat

orului, chiar i cu cele mai etichete disponibile.

Afi area rezultatelor

10
1

Este pus n discu ie ns i nevoia de meta etichetare. Etichetele


pot crea confuzie acoper n mod necesar totul ntr-un cmp.
Dac , n loc de etichetarea fiec rui cmp, ar recurge la formatul
ISBD (cu punctu standardizat i ordinea stabilit a infor etichetele
care creeaz confuzie ar p eliminate.

Adi

al, formatul ISBD ar permite mai informa ii referitor la un

ion

pachet informa ion afi ate pe un ecran.

Afi area rezultatelor

Cnd este utilizat un format ISBD, numai nregistr ri au nevoie

10

de un al doilea ecra afi area ntregii nregistr ri. Cu etichetele,

nregistr ri. (Aceasta se nainte de WebPAC-uri, n care

nregistr ri au nevoie de un al doilea ecra afi area ntregii


nregistr necesit mai degrab derularea/ defilare deplasarea la

un
al
doil
ea
ecr
an.

Utilizatorii tind s priveasc la ceea ce li se prima vedere,


nainte de derulare/defilare trecerea la cel de-al doilea ecran).

Linii directoare pentru afi aj

Aceste abord ri diferite la ambele tipuri d (i.e. afi area rezultatelor reg
site i nregistr rilor) au determinat crearea directoare pentru
standardizarea afi ajelor.

O sarcin de for a Federa iei Interna i Asocia iilor i Institu iilor


Biblioteconomice (I 1999 a emis linii directoare pentru a bibliotecile n
proiectarea sau reproiectarea urilor.

10
3

Linii directoare pentru afi aj

Aceste linii directoare constau din 37 bazate pe obiectivele


catalogului i pe tip c ut ri pe care le deruleaz utilizatorii.

Principiile directoare recomand un set stan afi aje implicite, definite ca


i caracteristici trebui oferite utilizatorilor care nu au sele op iuni,
incluznd utilizatorii care dor demareze c utarea imediat, f r prea
instruire.

10
4

Linii directoare pentru afi aj

Dac asemenea afi aje implicite ar fi imple pe scar larg , utilizatorii ar


ob ine bene posibilitatea de a transfera abilit ile de ut catalogului
dobndite ntr-o bibliotec la nu alte biblioteci.

Str daniile IFLA i ale numero i cercet tori concentrate pe nevoia


utilizatorilor instrumente puternice, ns u or de utilizat.

10
5