Sunteți pe pagina 1din 86

Academia Romn

Secia tiina i Tehnologia Informaiei


Institutul de Cercetri pentru Inteligen Artificial












Referat III


Sistem pentru asistarea deciziilor bazat pe descoperirea
cunotinelor din date: rezultate experimentale








Coordonator tiinific:

Acad. Florin FILIP




Doctorand:

Cornel LEPDATU



Bucureti
2013

Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


CUPRINS


1. INTRODUCERE 5
2. SOLU II INFORMATICE PENTRU PROIECTAREA
CONCEPTUAL A DEPOZITELOR DE DATE
9
2.1 Modelarea multidimensional a datelor 9
2.2 Proiectarea conceptual a depozitelor de date 10
2.3 Metode orientate ctre date 12
2.4 Metode orientate ctre cerine 12
2.5 Metode hibride 14
2.5.1 Metode hibride pure 14
2.5.2 Metode hibride paralele 15
2.5.3 Metode hibride secveniale 15
3. STUDIU DE CAZ 23
3.1 Sistemul suport pentru decizii al unei biblioteci 23
3.1.1 Obiectivele sistemului 23
3.1.2 Direcii de mbuntire a activitilor 23
3.1.3 Arhitectura sistemului 24
3.1.4 Resurse necesare 25
3.1.5 Avantajele sistemului 25
3.2 Analiza cerinelor informaionale 26
3.2.1 Cerinele biblioteconomice 26
3.2.1.1 Cerine instituionale 26
3.2.1.2 Procese biblioteconomice 27
3.2.1.3 Msurarea activitilor 27
3.2.1.4 Indicatori operaionali 28
3.2.1.5 Indicatori de performan 31

3
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.2.2 Cerinele bibliografice 39
3.2.2.1 Cerine funcionale privind datele bibliografice 39
3.2.2.2 Definirea entitilor i relaiilor 40
3.2.2.3 Descrierea entitilor 43
3.2.2.4 Descrierea relaiilor 46
3.2.3 Cerinele bibliometrice 49
3.2.3.1 Indicatori bibliometrici 49
3.2.3.2 Indicatori bibliometrici de productivitate 51
3.2.3.3 Indicatori bibliometrici de performan 53
3.2.3.4 Comentarii 61
3.3 Reconcilierea cu sursele de date 61
3.3.1 Sursele de date 61
3.3.2 Surogat bibliografic documente 65
3.3.3 Surogat bibliografic publicaii 66
3.4 Depozitarea datelor 66
3.4.1 Identificare fapte 66
3.4.2 Definire dimensiuni 66
3.4.3 Definire ierarhii dimensionale 67
3.4.4 Definire msuri 68
3.4.5 Setul de interogri preliminare 68
3.4.6 Cuburi de date 69
3.4.7 Schema conceptual a depozitului de date 70
3.5 Descoperirea cunotinelor din date 71
3.5.1 Nucleu de autoritate 72
3.5.2 Grupare bazat pe densitate 72
3.5.3 Programul CBD 75
2. CONCLUZII 83
BIBLIOGRAFIE
85
LISTA FIGURILOR
87
LISTA TABELELOR
87



4
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


1. INTRODUCERE

Conceptul de sistem suport pentru decizii desemneaz o clas de sisteme informatice, cu
caracteristici antropocentrice, adaptive i evolutive, care integreaz o serie de tehnologii
informatice i de comunicaii, de uz general i specifice i care interacioneaz cu celelalte
pri ale sistemului informatic global al unei organizaii. Menirea unui sistem suport pentru
decizii este de a atenua efectul limitelor i resticiilor decidentului intelectual ntr-un numr
semnificativ de activiti pentru rezolvarea unei palete largi de probleme decizionale nebanale
pe baza implementrii computerizate a unora dintre funciile de suport ale deciziilor care ar fi
fost realizate altfel de ctre o echip decizional ierarhic.
Dezvoltarea ideilor privind sistemul uman suport pentru decizii, privind modelul bazat pe
cunoatere al activitilor decizionale, privind funciunile unui procesor pentru probleme
decizionale sau privind extinderile posibile ale sistemelor de gestiune a bazelor de date pentru
a integra cunotine descriptive (date) i cunotine procedurale (modele), au permis
conturarea unui cadru conceptual generic sau arhitectur generic care s acopere majoritatea
soluiilor arhitecturale, identificabile n sisteme suport pentru decizii specifice, indiferent de
domeniul de aplicaie, de abordarea constructiv i de tehnologia informatic folosit.
Prin prisma arhitecturii generice, orice sistem suport pentru decizii se compune din patru
componente eseniale: un sistem de limbaj, format din mesaje pe care sistemul le poate
accepta; un sistem de prezentare, format din mesaje pe care sistemul le poate emite; un sistem
al elementelor de cunoatere, constnd din cunotine deinute de sistem i, n fine, un sistem
de tratare a problemei, constnd din module software prin care elementele de cunoatere sunt
prelucrate ca urmare a interpretrii mesajelor de intrare.
Arhitectura generic permite evidenierea diferenierilor dintre categoriile distincte de
sisteme suport pentru decizii, arhitecturile personalizate pstrnd caracteristicile sugerate de
modelul conceptual generic dar fiind orientate ctre o anumit tehnologie (sau tehnologii) de
reprezentare i prelucrare de cunotine.
n funcie de tehnologia dominant, sistemele suport pentru decizii pot fi: orientate ctre
texte, orientate ctre hipertext, orientate ctre baze de date, orientate ctre foi electronice de
calcul, orientate ctre reguli sau orientate ctre rezolvatoare (solver). Dac factorul decizional
are nevoie de capacitile de prelucrare oferite de mai multe tehnologii de management al
cunotinelor exist dou opiuni de baz: utilizarea mai multor sisteme suport pentru decizii,
fiecare orientat ctre o anumit tehnologie sau utilizarea unui singur sistem suport pentru
decizii, dar care integreaz mai multe tehnologii.
Un caz special de integrare, deosebit de important prin implicaiile sale, l reprezint
combinaia dintre o tehnologie de management a rezolvatoarelor flexibile i o tehnologie de
management a bazelor de date. Cu toate c aceast arhitectur acoper doar o parte din
posibilitile identificate de arhitectura generic ea este adesea citat, n cri i articole de
specialitate, ca fiind arhitectura sistemelor suport pentru decizii. Foarte utilizat n prezent
este o variant a acestei combinaii respectiv integrarea depozitrii datelor cu rezolvatoare
analitice (prelucrare analitic on-line) i rezolvatoare data mining (mineritul datelor i
descoperirea cunotinelor).
Procesul de construire al unui sistem suport pentru decizii specific de aplicaie se
compune din o serie de activiti care ncep cu generarea ideii de introducere a sistemului n

5
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
organizaie i se termin cu obinerea unei versiuni relativ stabile, utilizabile n mod curent, a
sistemului. Etapele corespund ciclului de via al oricrui sistem informatic, evoluia i
perfecionarea sistemului continund i dup nceperea folosirii acestuia n mod curent.
Principalele tehnologii informatice menite s susin activitile decizionale care presupun
analiza datelor sunt: depozitarea datelor, prelucrarea analitic on-line, mineritul datelor i
descoperirea cunotinelor.
Conceptul de depozit de date desemneaz o colecie de date orientate pe subiecte,
integrate, istorice i nevolatile destinat sprijinirii procesului de luare a deciziilor manageriale.
Depozitarea datelor este un proces care const, mai nti, dintr-o faz de construire (prin
integrare, curire i consolidare a unor colecii de date) i apoi, dintr-o faz de utilizare (prin
tehnologii integrate de asistare a deciziilor) a unui depozit de date, oferind factorilor
decizionali ai unei organizaii, arhitecturi i instrumente pentru a organiza sistematic, a
nelege i, mai ales, pentru a utiliza datele n luarea deciziilor.
Prelucrarea analitic on-line desemneaz o categorie de instrumente software care permit
analitilor i managerilor s neleag esena datelor printr-un acces rapid, consistent i
interactiv la o mare varietate de vederi posibile ale informaiilor, care au fost obinute prin
transformarea datelor primare, astfel nct s reflecte dimensiunile reale ale organizaiei aa
cum o percepe i o nelege utilizatorul. Esenial este faptul c este nevoie de a reprezenta n
mod explicit caracteristici importante ale informaiilor, care nu mai sunt legate de
reprezentarea abstract a conceptelor lumii reale ci, mai degrab, de obiectivul factorilor de
decizie i anume susinerea proceselor de analiz a datelor orientate ctre luarea deciziilor.
Exist cel puin dou noiuni specifice pe care orice model conceptual pentru baze de date
multidimensionale trebuie s le includ ntro anumit form i anume faptul i dimensiunea.
Faptul este o entitate, a unei aplicaii, care face obiectul unei analize orientat ctre decizie,
reprezentabil prin intermediul cubului de date, iar dimensiunea corespunde perspectivei din
care faptele pot fi analizate n mod concludent. Aspectele specifice i msurabile ale unui
fapt, relevante pentru analiz, sunt numite msuri.
Eficiena modelrii n depozitarea datelor depinde strict de capacitatea de a descrie datele
factuale n funcie de dimensiunile adecvate, adic n funcie de perspectivele din care datele
pot fi analizate. Pentru a putea susine mai bine analiza datelor este util ca pentru fiecare
dimensiune s se organizeze o ierarhie de niveluri obtenabil prin gruparea elementelor
dimensiunii n funcie de nevoile analizei. Un nivel are asociate, de obicei, atribute descriptive
(nume i descrieri). O dimensiune are deci trei componente principale: o mulime de niveluri,
o mulime de descrieri de niveluri i o ierarhie ntre niveluri.
O colecie de msuri ale aceluiai fapt este reprezentat prin metafora cub de date,
avnd cte o dimensiune fizic pentru fiecare dimensiune conceptual a msurrii: o
coordonat a cubului de date specific o combinaie de membri ai nivelurilor mai multor
dimensiuni iar celula corespunztoare conine msura (msurile) asociat (asociate) unei
astfel de combinaii. n cazul n care membrii unui nivel pot fi agregai n membri ai unui alt
nivel se spune c primul nivel se agreg la cel de al doilea nivel.
Proiectarea conceptual a unui depozit de date este pasul cel mai important n
reprezentarea corect a unui domeniu de interes, fiind elementul esenial asupra cruia att
factorii de decizie ct i informaticienii sunt de acord. Este foarte important ca proiectanii
unui depozit de date s urmeze o metodologie de proiectare conceptual, consolidat i
robust dat fiind c dezvoltarea unui depozit de date este un proces foarte scump chiar i
astzi cnd exist multe instrumente software oferind soluii prefabricate care acoper toate
etapele din ciclul de via al depozitului de date.

6
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Proiectarea conceptual a unui depozit de date se bazeaz pe metafora cubului de date
care poate fi obinut prin mai multe categorii de metode: orientate ctre date, metode
orientate ctre cerine i metode mixte sau hibride.
In abordarea orientat ctre date schemele multidimensionale se definesc printr-un proces
de reinginerie a surselor de date, reducnd ns participarea utilizatorilor finali i riscnd
astfel un eec posibil fa de ateptrile acestora. Abordarea orientat ctre date poate asigura
o trasabilitate perfect i consisten cu sursele de date - de fapt garanteaz prezena datelor ce
vor fi utilizate n procesarea analitic - dar nu poate exclude lipsuri n raport cu cerinele
utilizatorilor.
n abordarea orientat ctre cerine schemele multidimensionale se definesc pe baza
obiectivelor instituionale care rezult din cerinele factorilor de interes. Sursele de date sunt
luate n considerare ulterior, atunci cnd se proiecteaz extragerea, transformarea i ncrcarea
datelor i cnd conceptele multidimensionale (fapte, dimensiuni i msuri) trebuie s fie
mapate pe sursele de date pentru a programa planul de alimentare al depozitului de date. n
acest moment ns se poate ntmpla ca proiectantul s descopere c datele necesare nu sunt
disponibile n sursele de date. Abordarea orientat ctre cerine permite proiectanilor s
obin o schem conceptual foarte aproape de cerinele utilizatorilor dar care poate s nu fie
susinut de disponibilitatea efectiv a datelor.
Aceste dou abordri de proiectare conceptual a depozitelor de date, orientat ctre date
i, respectiv, ctre cerine, sunt n antitez una cu cealalt proiectanii fiind obligai s aleag
una dintre ele. Pentru remedia neajunsurile fiecreia dintre cele dou abordri i pentru a
valorifica avantajele fiecreia dintre ele s-a recurs la definiriea unor metode hibride bazate pe
diferite modele multidimensionale.
Eforturile de a defini o strategie unitar care s integreze beneficiile celor dou abordri
au condus la abordarea hibrid, metodele elaborate putnd fi grupate astfel: metode hibride
pure, metode care efectueaz procesul de proiectare lund n considerare simultan att sursele
de date ct i obiectivele instituionale i metode hibride integrate, metode care combin i
integreaz o etap de abordare orientat ctre date cu o etap de abordare orientat ctre
cerine. La rndul lor, metodele hibride pot fi grupate n: metode hibride paralele, n care cele
dou etape sunt executate independent i, la final, schemele multidimensionale provenind din
fiecare etap sunt comparate i integrate i metode hibride secveniale, n care cele dou etape
sunt executate ntr-o ordine prefixat, ieirea primei etape fiind utilizat ca intrare n a doua
etap.
Pn n prezent rezultatele cele mai promitoare au fost obinute prin metodele hibride
secveniale. Pe scurt, etapele generale ale unei astfel de metode sunt: analiza cerinelor
informaionale, modelarea multidimensional, reconcilierea cu sursele de date, generarea
arborilor de atribute i modelarea avansat a datelor.
Mineritul datelor i descoperirea cunotinelor este un ansamblu de metode i algoritmi
destinat explorrii i analizei unor (adesea) mari volume de date n vederea deducerii, din
aceste date, a unor reguli, a unor asocieri, a unor tendine necunoscute (nefixate priori), a
unor structuri specifice care s restituie n mod concis esena informaiei utile pentru asistarea
deciziilor.
Procesul de realizare al unui sistem suport pentru decizii de bibliotec, nou i captivant,
creeaz multe provocri dar promite mari mbuntiri n modul de desfurare a activitilor,
n modul de nelegere a ceea ce se face n prezent i a ceea ce se preconizeaz pentru viitor.


7
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale












































8
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

9

2. SOLUII INFORMATICE PENTRU PROIECTAREA
CONCEPTUAL A DEPOZITELOR DE DATE

2.1 Modelarea multidimensional a datelor
Exist n prezent o multitudine de soluii de modelare conceptual a datelor, cu
caracteristici i putere expresiv diferite n funcie , n principal, de domeniile de aplicaie
pentru care au fost elaborate.
n contextul depozitrii datelor (data warehousing) esenial este faptul c, n proiectarea
depozitului de date, este nevoie de a reprezenta n mod explicit caracteristici importante ale
informaiilor, dar care nu mai sunt legate strict de reprezentarea abstract a conceptelor lumii
reale ci, mai degrab, de obiectivul final al depozitului de date i anume susinerea proceselor
de analiz a datelor orientate ctre luarea deciziilor [ 7, 13, 30].
Exist cel puin dou noiuni specifice pe care orice model conceptual pentru depozitarea
datelor trebuie s le includ ntro anumit form i anume faptul i dimensiunea. Faptul este
o entitate a unei aplicaii care face obiectul unei analize orientat ctre decizie. Dimensiunea
corespunde perspectivei din care faptele pot fi analizate n mod concludent. Aspectele
specifice i msurabile ale unui fapt, relevante pentru analiz, sunt numite msuri.
Eficiena modelrii n data warehousing depinde strict de capacitatea de a descrie datele
factuale n funcie de dimensiunile adecvate, adic n funcie de perspectivele din care datele
pot fi analizate. Pentru a putea susine mai bine analiza datelor este util ca pentru fiecare
dimensiune s se organizeze o ierarhie de niveluri obtenabil prin gruparea
elementelor/membrilor dimensiunii n funcie de nevoile analizei. Un nivel are asociate, de
obicei, atribute descriptive (nume i descrieri). O dimensiune are deci trei componente
principale: o mulime de niveluri, o mulime de descrieri de niveluri i o ierarhie ntre
niveluri.
O colecie de msuri ale aceluiai fapt este reprezentat prin metafora cub de date,
avnd cte o dimensiune fizic pentru fiecare dimensiune conceptual a msurrii: o
coordonat a cubului de date specific o combinaie de membri ai nivelurilor mai multor
dimensiuni iar celula corespunztoare conine msura (msurile) asociat (asociate) unei
astfel de combinaii. n cazul n care membrii unui nivel pot fi agregai n membri ai unui alt
nivel ' se spune c (nivelul) se agreg la (nivelul) ' sau rolls-up to .
Fie dat o mulime numrabil de atribute descriptive i fie T o mulime finit de tipuri
de valori de baz, cum ar fi ntreg, zecimal, dat calendaristic sau text. Fiecare tip de valori
de baz t e T este asociat cu un domeniu dom(t) de valori de baz ale acestui tip. Fiecare
element o al unei mulimi obiecte O din viaa real, o e O, este identificat n mod unic prin
utilizarea unor valori, id(o), distincte de valorile de baz, numite identificatori.
Fie D o mulime finit de dimensiuni D = {D}.
Definiia 1. O schem dimensional, D = (A, , ), este format din:
o mulime finit A de nume de niveluri, e A;
o mulime finit

de descrieri de niveluri pentru fiecare nivel e A,


eA

= ,
fiecare descriere de nivel e

_ este asociat cu un tip de baz t () e T;


o relaie _ A A de ordine parial intre nivelurile e A; dac (
1
,
2
) e se
spune c
1
rolls-up to
2
.
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Definiia 2. O instaniere dimensional pentru D = (A, , ), d = ({O

}
eA
; {M

}
eA
;

) , este format din:


o mulime finit O

de obiecte (din lumea real) pentru fiecare nivel e A, fiecare


obiect o e O

are asociat un identificator unic id(o) numit membru al lui , e


M

;
o funcie

: M
l
dom(t()), de la membrii fiecrui nivel e A la domeniul tipului
de baz t() e T asociat cu fiecare descriere de nivel e

_ ,

;
o funcie rolls-up
1 2

1,2
: M
1
M
2
, de la membrii nivelului
1
la membrii
nivelului
2
pentru fiecare pereche de niveluri (
1
,
2
) e ; dac
2
= rolls-up
1 2
(
1
) spunem c
1
rolls-up
2
,
1,2
e

.
Definiia 3. O schem multidimensional , (D , F ), este format din:
o mulime finit D = { D = (A, , ) } de scheme dimensionale;
o mulime finit F = { f [A
1
:
1
, ... , A
n
:
n
] [M
1
: m
1
,... , M
k
: m
k
] de scheme cub
de date, unde:
f este un nume;
fiecare A
i
(i = 1 n) este un nume distinct numit atribut al lui f;
fiecare
i
este un nivel al lui D ;
fiecare M
j
(j = 1 k) este un nume distinct numit msur a lui f;
fiecare m
j
este fie un tip de baz (t e T), fie un nivel al lui D ( e A).
Fie: (D, F) o schem multidimensional, fie d = ({ O

}
eA
; { M

}
eA
;

) o
instaniere a lui D e D, D = (A, , ) i fie f[A
1
:
1
, ... , A
n
:
n
] [M
1
: m
1
,... , M
k
: m
k
] o
schem cub de date din F.
Definiia 4. O coordonat (conceptual) c a lui f n (instanierea) d este un tuplu de
atribute ale lui f, adic o funcie care asociaz fiecrui atribut A
i
un membru al nivelului
i

care apare n d.
Definiia 5. Un fapt al lui f n (instanierea) d este un tuplu de msuri ale lui f, adic o
funcie care asociaz fiecrui nume de msur M
j
fie cu o valoare (dac m
j
este un tip de baz,
t e T) fie cu un membru din d (dac m
j
este un nivel, e A).
Definiia 6. O instaniere a unei (DB-)scheme multidimensionale (D, F) este format din:
o instaniere dimensional d pentru fiecare schem dimensional D e D, (d e d);
o funcie parial numit cub de date care asociaz coordonate ale lui f n d cu fapte
ale lui f n d pentru fiecare schem cub de date f e F.

2.2 Proiectarea conceptual a depozitelor de date

Proiectarea conceptual a unui depozit de date este pasul cel mai important n
reprezentarea corect a unui domeniu de interes, n aceast privin att factorii de decizie ct
i informaticienii sunt total de acord. Prin urmare este foarte important pentru proiectanii de
depozite de date s urmeze o metodologie de proiectare conceptual, consolidat i robust

10
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
dat fiind c dezvoltarea unui depozit de date este un proces foarte scump chiar i astzi cnd
exist multe instrumente software acoperind toate etapele din ciclul de via al depozitului de
date i oferind soluii prefabricate [37].
Proiectarea conceptual a unui depozit de date se bazeaz pe metafora cubului de date
care poate fi obinut prin mai multe categorii de metode:
metode orientate ctre date (data-driven sau supply-driven);
metode orientate ctre cerine (requirement-driven, demand-driven sau goal-oriented);
metode mixte sau hibride (hybrid).
In abordarea orientat ctre date schemele multidimensionale se definesc printr-un proces
de reinginerie a surselor de date dar reducnd participarea utilizatorilor finali i riscnd astfel
un eec posibil fa de ateptrile acestora. Abordarea orientat ctre date poate asigura o
trasabilitate perfect i consisten cu sursele de date, de fapt garanteaz prezena datelor ce
vor fi utilizate n procesarea analitic, dar nu poate exclude lipsuri n raport cu cerinele
utilizatorilor.
ntro abordare orientat ctre cerine schemele multidimensionale se definesc pe baza
obiectivelor instituionale care rezult din cerinele factorilor de interes. Sursele de date sunt
luate n considerare ulterior, atunci cnd se proiecteaz extragerea, transformarea i ncrcarea
datelor (ETL - Extraction, Transformation, Loading) i cnd conceptele multidimensionale
(fapte, dimensiuni i msuri) trebuie s fie mapate pe sursele de date pentru a programa planul
de alimentare al depozitului de date. n acest moment, se poate ntmpla ca proiectantul s
descopere c datele necesare nu sunt disponibile n sursele de date.
Abordarea orientat ctre cerine permite proiectanilor s obin o schem conceptual
foarte aproape de cerinele utilizatorilor dar care poate s nu fie susinut de disponibilitatea
efectiv a datelor.
Aceste dou abordri de proiectare conceptual a depozitelor de date, orientat ctre date
i orientat ctre cerine, sunt n antitez una cu cealalt i proiectanii sunt obligai s aleag
una dintre ele. Pentru remedia neajunsurile fiecreia dintre cele dou abordri i pentru a
valorifica avantajele fiecreia dintre ele s-a conturat ideea definirii unor metode hibride bazate
pe diferite modele multidimensionale.
Eforturile de a defini o strategie unitar care s integreze beneficiile celor dou abordri
au condus la abordarea hibrid metodele definite putnd fi grupate n:
metode hibride pure, metode care efectueaz procesul de proiectare lund n
considerare simultan att sursele de date ct i obiectivele instituionale [33];
metode hibride integrate (integration-derived), metode care combin i integreaz o
etap de abordare orientat ctre date cu o etap de abordare orientat ctre cerine i
care, la rndul lor, pot fi grupate n:
metode hibride paralele, n care cele dou etape sunt executate independent i, la
final, schemele multidimensionale provenind din fiecare etap sunt comparate i
integrate [2, 32];
metode hibride secveniale, n care cele dou etape sunt executate ntr-o ordine
prefixat, ieirea primei etape fiind utilizat ca intrare n a doua etap [11, 27, 29,
34].


11
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
2.3 Metode orientate ctre date

n abordarea orientat ctre date, metodele de proiectare a schemelor multidimensionale
ncep cu intervievarea utilizatorilor finali, n scopul de a identifica fapte i dimensiuni de
interes i de a defini un set preliminar de interogri (preliminary workload). Cerinele
utilizatorilor sunt reprezentate n limbaj natural, vag i informal. Cerinele identificate nu
reprezint constrngeri pentru proiectant ci doar un fel de sugestii posibil de folosit ntr-o faz
ulterioar de remodelare a datelor, proiectarea conceptual bazndu-se n principal pe
experiena i capacitatea proiectantului.
Metodele se concentreaz n continuare pe analiza surselor de date, pe normalizarea i
integrarea schemelor, eventual pe alte aspecte care trebuiesc rezolvate nainte de proiectarea
conceptual a depozitului de date. Proiectarea conceptual a depozitului de date utilizeaz
modelul DFM (Dimensional Fact Model) care definete cuburi i dimensiuni pornind de la
schemele relaionale sau E/R ale surselor de date [12]. Metoda de modelare conceptual este
semiautomat bazndu-se pe un algoritm care genereaz un arbore de atribute reprezentnd o
surs de date integrat. Rdcina arborelui este o relaie sau o entitate care a fost aleas n
mod arbitrar de ctre proiectant drept fapt. Algoritmul genereaz cte un nod pentru fiecare
atribut ntlnit n timp ce navigheaz recursiv relaiile i entitile din sursele de date. Pentru
proiectarea conceptual a depozitului de date generarea arborelui de atribute reprezint un
prim rezultat.
Proiectantul are, n continuare, posibilitatea de a remodela arborele de atribute prin
adugri de noi noduri, prin eliminri de noduri inutile sau prin schimbri de noduri printe.
Cnd remodelarea se consider finalizat, arborele de atribute este interpretat ca un cub de
date: rdcina arborelui reprezint faptul, un nod fiu de rdcin (eventual prevzut cu
ierarhii) reprezint o dimensiune iar un nod frunz legat direct de rdcin reprezint o
msur.
n general, etapele unei astfel de metode sunt urmtoarele:
identificarea cerinelor utilizatorilor prin interviuri cu utilizatorii finali;
analiza i integrarea surselor de date n scopul de a crea o schem global;
din schema global, crearea cte unui arbore de atribute pentru fiecare posibil fapt, pe
baza experienei proiectantului i cerinelor utilizatorilor;
remodelarea arborelui n scopul de a defini conceptele multidimensionale (dimensiuni
i msuri);
crearea de scheme de fapte transformabile n scheme stea / fulg de nea.
Datorit dificultilor de nelegere a nevoilor utilizatorilor, metodele orientate ctre date
au o mare probabilitate de eec n realizarea unui depozit de date care s sprijine n mod
eficient luarea deciziilor. n plus, aceste metode pot conduce la un consum mare de timp,
deoarece proiectantul nu i poate concentra atenia doar pe partea util a sursei de date ci este
obligat s examineze ntreaga surs de date pentru a identifica elementele multidimensionale.

2.4 Metode orientate ctre cerine

n abordarea orientat ctre date nu se ofer nici o metod formal pentru a ine seama de
cerinele utilizatorilor n timpul crerii i remodelrii arborelui de atribute. Datorit faptului c
cerinele utilizatorilor sunt slab reprezentate i puin utilizate, proiectantul poate avea mari

12
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
dificulti privind identificarea alegerii ''corecte'' a rdcinii arborelui de generat (n special n
prezena unui numr mare de relaii ntr-o surs de date integrat), privind identificarea
atributelor care nu sunt necesare, privind identificarea atributelor care trebuiesc adugate sau
privind determinarea numrului strict necesar de niveluri din ierarhia unei dimensiuni.
Dificultile de acest gen pot fi depite n mod satisfctor pe baza cerinelor utilizatorilor,
ele reprezentnd de fapt singurele constrngeri care pot ghida proiectantul n modelarea
conceptual.
Pentru a descrie activitile i relaiile existente ntre actorii implicai n mediile de
depozitare a datelor (factorii de decizie i depozitul de date n sine) metoda care s-a relevat
eficient i a i fost adoptat cu succes s-a bazat [26] pe Cadrul-i* (i* framework) propus
pentru a modela, n faza de definire a cerinelor, rolurile active ale actorilor unui sistem
informatic. Cadrul-i* permite proiectanilor s realizeze analiza aprofundat a unui domeniu
i s elaboreze un model formal al mediului decizional.
Acest model poate fi folosit ca punct de plecare pentru a crea o schem multidimensional
bazat exclusiv pe cerinele utilizatorilor:
informaiile solicitate de factorii de decizie sunt convertite n elemente
multidimensionale (fapte, msuri i dimensiuni) reprezentate n conformitate cu
formalismul UML (Unified Modeling Language ) extins [22, 35] cu profile care s acopere
fiecare aspect al ciclului de via al depozitului de date;
n Cadrul-i* cerinele utilizatorilor, respectiv obiectivele instituionale, sunt
reprezentate ntr-o ierarhie detaliat de obiective imbricate:
strategice, obiectivele de nivel nalt care urmeaz s fie atinse de ctre organizaie;
decizionale, pentru a rspunde la modul n care obiectivele strategice pot fi
ndeplinite;
informaionale, pentru a defini informaiile necesare pentru luarea deciziilor;
din obiectivele informaionale sunt derivate cerinele informaionale adic un set
preliminar de interogri de nivel nalt strict legate de conceptele multidimensionale;
pentru a descrie relaiile dintre actorii principali ai organizaiei, n funcie de interesele
fiecruia, proiectantul elaboreaz [23] un model, SDM (strategic dependency model),
care evideniaz modul n care depozitul de date poate ajuta fiecare actor s i ating
obiectivele inclusiv cnd acestea prezint interdependene;
pentru fiecare actor inclus n SDM proiectantul elaboreaz cte un model, SRD
(strategic rationale model), care descrie n mod detaliat obiectivele instituionale
specifice i activitile;
modelul SDM i modelele SRD permit obinerea schemei multidimensionale finale a
depozitului de date, n conformitate cu formalismul UML.
Proiectantului nu i se ofer ns posibilitatea de a rafina eventual astfel de scheme pentru
a opera, atunci cnd este cazul, modificrile necesare. Rafinarea ar putea, de exemplu, s
impun includerea de msuri calculate sau modificarea nivelurilor ierarhice ale dimensiunilor.
Abordarea orientat ctre cerine permite proiectanilor s obin o schem conceptual
foarte aproape de cerinele utilizatorilor care ns nu poate fi susinut de disponibilitatea
efectiv a datelor.


13
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
2.5 Metode hibride

Schema multidimensional obinut printro abordare orientat ctre cerine poate prezenta
o structur dificil de populat deoarece corespondenele dintre elementele multidimensionale i
elementele entitilor din sursele de date pot fi greu de detectat. n cazurile cele mai
nefavorabile elementele multidimensionale identificate nu au toate omologi n sursele de date,
ceea ce nseamn c factorul de decizie dorete informaii care nu sunt susinute de date
efective. Pentru a depi astfel de impedimente i n scopul de a obine scheme
multidimensionale n concordan cu datele operaionale, o extensie a metodei sugereaz
reconcilierea schemelor multidimensionale UML cu sursele de date prin aplicarea formelor
normale multidimensionale [20, 25].
Etapele de parcurs sunt:
efectuarea unei analize profunde a domeniului pe baza cerinelor utilizatorilor n
scopul de a identifica obiectivele instituionale;
analiza obiectivelor instituionale, n scopul de a identifica cerinele informaionale;
definirea schemelor multidimensionale, folosind cerinele informaionale;
reconcilierea schemelor multidimensionale cu sursele de date;
transformarea schemelor multidimensionale reconciliate n scheme stea/fulg de nea.
Schemele multidimensionale produse de aceast extensie nu numai c sunt orientate ctre
cerine dar asigur i trasabilitatea cu datele care urmeaz s fie utilizate n luarea deciziilor.
Aceast metod mbuntit a fost ulterior prezentat ca i metodologie hibrid [27]
pentru c ntr-adevr, folosind aceste scheme multidimensionale, proiectantul gestioneaz o
imagine simplificat i compact a surselor de date.
Totui, proiectantului nu i se ofer posibilitatea de a rafina eventual astfel de scheme
pentru a opera, atunci cnd este cazul, modificrile necesare.

2.5.1 Metode hibride pure
O metod hibrid pur se bazeaz pe ipoteza c cerinele utilizatorilor ar putea fi n
ntregime acoperite prin definirea unui set preliminar de interogri (preliminary workload)
care s conin toate interogrile analitice pe care utilizatorii finali ar inteniona s le execute
pentru a obine din depozitul de date informaiile necesare [33].
n aceast ipotez exist elaborat un algoritm capabil s genereze n mod automat un graf,
ale crui noduri sunt tabele ale surselor de date i ale crui arce sunt join-uri de tabele, pe care
este posibil s se identifice dac o anumit tabel trebuie considerat fapt sau dimensiune i s
fie etichetat ca atare. De exemplu, o tabel a crei cheie primar apare ntr-o clauz group by
este etichetat ca nivel dimensional. Etichetele sunt atribuite prin examinarea rolurilor jucate
de tabele i de atribute n setul de interogri preliminare. Etichetarea corect a tuturor
nodurilor genereaz n mod normal o schem multidimensional valabil.
Metoda ajut proiectanii, n primele etape ale procesului de proiectare, s identifice rapid
i n mod automat faptele i dimensiunile din sursele de date i rezultatul obinut reprezint un
bun punct de pornire pentru rafinri suplimentare.
Totui, interogrile preliminare, care provin din obiective instituionale, nu pot avea n
vedere nici sintactic, nici semantic sursele de date i nu exist nici o meniune despre cum s
se procedeze n cazul unor eventuale incompatibiliti sintactice sau semantice. De fapt,

14
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
algoritmul doar atribuie o etichet pentru fiecare tabel din sursele de date dar nu produce o
nou schem.

2.5.2 Metode hibride paralele
n conformitate cu abordarea hibrid paralel [2] cele dou metode, metoda orientat ctre
cerine i metoda orientat ctre date, sunt aplicate independent una de alta i cu fiecare dintre
ele se obine cte o schem multidimensional distinct:
una derivat din paradigma GQM (goal, question, metric) i
cealalt derivat dintr-o reinginerie a schemelor E/R.
Schema multidimensional final se obine prin maparea celor dou scheme
multidimensionale conform cu o strategie de mapare care verific dac acestea evideniaz
aceleai fapte i msuri n raport cu setul de dimensiuni considerat.

2.5.3 Metode hibride secveniale
Metodele hibride secveniale pornesc cu analiza obiectivelor instituionale definite de
ctre factorii de decizie [25, 27]. Folosind aceste obiective, primul rezultat obinut este o
schem de reprezentare a cerinelor informaionale. In continuare, prin identificarea faptelor i
dimensiunilor din cerinele informaionale, se obine o schem conceptual iniial a
depozitului de date. Pentru a lua n consideraie i sursele de date schema conceptual iniial
este reconciliat cu schemele logice ale surselor de date prin aplicarea formelor normale
multidimensionale.
Reconcilierea cu sursele de date a unei scheme multidimensionale, obinut prin o
abordare orientat ctre cerine, nu este suficient, n sine, pentru a defini o metod hibrid.
Reconcilierea nseamn doar a verifica dac o schem conceptual iniial este n acord cu
sursele de date, n timp ce factorii de decizie ar dori s obin i anumite informaii care nu
pot fi efectiv disponibile din cauza lipsei lor din sursele de date. n abordrile orientate ctre
date, metodele respective permit proiectanilor ca, printr-un proces de reinginerie a surselor de
date (remodelare), s modifice manual dependenele funcionale dintr-o schem
multidimensional att prin eliminarea de relaii inutile ct i prin introducerea de relaii utile
(adugare de dimensiuni la cuburile de date sau creare de ierarhii pentru de cile de agregare),
de asemenea, proiectanii pot aduga atribute derivate din datele existente (ca msuri
calculate).
Metoda hibrid secvenial, descris n [34], adopt un model bazat pe grafuri ce permite
proiectantului s construiasc cu uurin o schem grafic, aa-numitul graf al depozitului de
date, care poate fi mapat pe modele relaionale sau orientate obiect. Proiectantul poate mai
nti s obin o schem multidimensional, care se potrivete cel mai bine nevoilor
utilizatorilor i apoi s verifice compatibilitatea acesteia cu schemele surselor de date. Pentru
a verifica compatibilitatea pot fi folosite tehnici automate iar eventuale incompatibiliti
semantice care pot apare n timpul maprii pot fi rezolvate folosind o ontologie.
Metoda hibrid secventiala, descris n [29], se concentraz mai nti asupra surselor de
date i ulterior asupra cerinelor utilizatorilor i se bazeaz pe un algoritm iterativ care
identific entitile reprezentnd fapte pe baza atributelor lor numerice. In prima iteraie a
algoritmului este analizat entitatea cu cel mai mare numr de atribute numerice, urmtoarele
iteraii lund n consideraie, n ordine descresctoare, celelalte entiti. Dac entitatea
considerat particip ntr-o relaie n:1, atunci aceast relaie permite identificarea entitilor ce

15
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
reprezint dimensiuni i prin examinarea recursiv a tipului cardinalitii relaiilor sunt
construite nivelurile ierarhice ale dimensiunilor . n fiecare iteraie a algoritmului se obine
cte o schem multidimensional cu un fapt candidat i dimensiunile sale. Algoritmul se
termin cnd au fost analizate toate entitile din sursele de date. Proiectantul poate alege
schema multidimensional care permite cel mai bun rspuns la setul preliminar de interogri
utiliznd un tabel avnd attea rnduri cte interogri preliminare au fost definite i attea
coloane cte scheme multidimensionale au fost create automat. Celula (i, j) din tabel conine
simbolul ''x'' dac interogarea i poate fi executat pe schema multidimensional j, simbolul ''p''
dac schema multidimensional j rspunde parial la interogarea i i '' '' (simbolul blank) n
rest. n cazul n care schema multidimensional selectat nu rspunde complet toate
interogrile (adic rndul corespunztor nu conine peste tot ''x'') proiectantul poate rafina
manual schema pe baza propriilor cunotine cu privire la cerinele utilizatorilor.
Metoda hibrid secvenial, descris n [11], ncepe cu analiza cerinelor pe baza
metodologiei Tropos (Tropos: an agent-oriented software development methodology) i are ca
scop de a modela domeniul de interes n funcie de dou perspective diferite: modelarea
organizaional, care descrie obiectivele factorilor de interes i modelarea decizional, care
descrie obiectivele factorilor de decizie. Ulterior schemele multidimensionale derivate din
analiza cerinelor se potrivesc cu cele derivate din sursele de date, n trei etape:
n prima etap conceptele multidimensionale identificate sunt mapate pe entitile din
sursele de date, rolul cel mai important este jucat de ctre schemele multidimensionale
derivate din modelarea decizional cele provenite din modelarea organizaional fiind
mai puin utile;
n a doua etap, n scopul de a construi n mod automat ierarhiile pentru fiecare fapt
mapat cu succes, sunt navigate recursiv relaiile m : 1 i sunt generate scheme de fapte,
n general mai simple i mai reduse dect dac ar fi fost generate lund n considerare
n mod direct sursele de date;
n a treia etap, proiectantul obine schema multidimensional final prin rafinarea
manual a schemelor de fapte pentru a le adapta mai bine cerinelor utilizatorilor.
Evalurile actuale din literatura de specialitate sunt n acord cu privire la importana
covritoare a efortului (inclusiv financiar) pentru a identifica n mod corect nevoile
utilizatorilor i cu privire la necesitatea crucial a reprezentrii formalizate a cerinelor
instituionale n cadrul procesulului de proiectare conceptual a depozitelor de date [37].
Proiectantul trebuie s ia n considerare ntotdeauna att schema multidimensional
reprezentnd sursele de date ct i schema multidimensional reprezentnd cerinele
instituionale i s asigure alinierea acestor scheme conceptuale n jurul acelorai elemente
multidimensionale.
Pentru a obine alinierea, simpla mapare [25] nu este suficient din moment ce trebuiesc
fcute modificri ori de cte ori cerinele instituionale sunt inconsistente n raport cu sursele
de date. Pentru a rezolva inconsistenele, se efectueaz o reconciliere a schemelor
multidimensionale cu sursele de date prin aplicarea formelor normale multidimensionale. De
exemplu, pe baza primei condiii a primei forme normale multidimensionale, conform creia
fiecare dependen funcional din schema multidimensional trebuie s corespund cu o
dependen funcional din sursele de date, o anumit asociere trebuie eliminat sau, pe baza
celei de a doua condiii a primei forme normale multidimensionale care prevede c fiecare
dependen funcional din sursele de date trebuie s fie reprezentat printr-o asociere n
schema multidimensional, o anumit asociere trebuie adugat. Reconcilierea este o
abordare mai bun [20, 27]. Pe de o parte, schema multidimensional reconciliat este destul

16
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
de ndeprtat de schema multidimensional rezultat iniial din cerinele utilizatorilor pentru
c reconcilierea a modificat schema original i a eliminat anumite operaii (roll-up, drill-
down) dorite iniial de ctre factorii de decizie. Pe de alt parte, schema multidimensional
reconciliat este foarte apropiat de sursele de date.
Cnd n urma alinierii se obine o schem conceptual consistent proiectantul dispune de
o vedere simplificat asupra surselor de date eseniale i poate apoi continua cu o rafinare
manual suplimentar pentru a asigura corectitudinea i completitudinea schemei conceptuale.
Rafinarea are drept scop de a modifica schema multidimensional n conformitate cu o
abordare orietat ctre date complet.
Dac proiectantul dorete o schem conceptual care s se potriveasc mai bine cu
cerinele utilizatorilor, atunci schema multidimensional trebuie s fie remodelat manual
(advanced data modelling) prin impunerea unor dependene funcionale care nu sunt prezente
n schema iniial dar cu condiia ca acestea s fie inerente domeniului de aplicaie [13].
n scopul de a valorifica cele mai bune caracteristici ale fiecreia dintre metode a fost
dezvoltat o metod hibrid secvenial [37] care acoper att analiza cerinelor ct i
proiectarea conceptual.
S-a dorit obinerea de scheme multidimensionale care, pe de o parte, s rspund nevoilor
utilizatorilor iar, pe de alt parte, s i permit proiectanilor s execute activitatea de
remodelare a datelor. Ideea principal a fost de a folosi ca intrri n faza de remodelare ( sau
modelare avansat a datelor) schemele multidimensionale UML reconciliate, obinute din
Cadrul-i* i modelarea multidimensional UML.
Metoda se bazeaz deci pe dou modele multidimensionale:
modelul UML pentru a reprezenta schemele multidimensionale orientate ctre cerine
ale depozitului de date i
modelul E-DFM (Extended Dimensional Fact Model) pentru a reprezenta o viziune
arborescent asupra surselor de date.
Aceast viziune i anume arborele de atribute, permite proiectantului s opereze cu
uurin pe structura datelor eseniale din sursele de date. n conformitate cu acest model,
modificarea dependenelor funcionale din sursele de date corespunde la operaiuni intuitive
pe arbore, cum ar fi adugarea i/sau eliminarea de noduri.
Modelarea multidimensional urmeaz metodologia hibrid convenional pentru a
produce scheme UML reconciliate iar modelarea avansat a datelor (sau remodelarea) se
bazeaz pe modelul E-DFM un model definit pentru a mbunti anumite caracteristici ale
modelului DFM i echipat cu un program logic capabil de a construi arbori de atribute din
orice schem relaional care conine relaii binare.
Pentru a utiliza schemele multidimensionale UML reconciliate ca intrri pentru activitatea
de modelare avansat a datelor, proiectantul se confrunt [1] cu o problem de traducere de
schem conceptual adic: fiind date dou modele M1 (UML) i M2 (E-DFM) i o schem
multidimensional S1 pe M1 s se gseasc o schem multidimensional S2 pe M2
echivalent cu S1.
Dei cele dou modele sunt destul de diferite, att n terminologie ct i n elementele
grafice, ele permit reprezentri ale acelorai elemente multidimensionale n sensul c fiecare
element din UML are omologul su n E-DFM i vice-versa.
Pentru a face traducerea schemei conceptuale sunt necesare:
definirea unei mapri ntre elementele celor dou modele multidimensionale;

17
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
dezvoltarea un algoritm care genereaz arbori de atribute pornind de la scheme UML.
Fie x i respectiv y nodurile din arborele de atribute corespunztoarer atributelor X i
respectiv Y. Pe un arbore de atribute generat sunt definite urmtoarele operaii de baz:
create x, crearea nodului x;
delete x, tergerea nodului x;
add xy, adugarea unui arc de la x la y;
remove xy, eliminarea arcului de la x la y.
Pot fi, de asemenea, definite operaii complexe precum:
prune x, tergerea nodului x mpreun cu toi copiii al cror printe este;
graft x, tergerea nodului x i adugarea copiilor si la prinii nodului x;
change parent of y from x to z, care nseamn c, avnd arcul xy i nodul z,:
remove xy ;
add zy.
n consecin, cele patru operaii de baz definite pe arborele de atribute corespund
respectiv la: crearea unui atribut x, tergerea unui atribut x, adugarea unei dependene
funcionale xy i eliminarea unei dependene funcionale xy. n plus, operaiunea de
schimbare a printelui este foarte util pentru a modifica nivelurile ierarhice ale
dimensiunilor. Prin urmare, operaiile de baz permit efectuarea reingineriei schemelor
multidimensionale folosind o abordare orientat ctre date complet.
n UML, fiecare element grafic este reprezentat cu un profil specific. Pentru a putea folosi
schemele multidimensionale UML ca intrri pentru modelarea avansat a datelor este necesar
definirea corespondenelor dintre elementele grafice ale modelelor multidimensionale UML i
E-DFM. Fiecare element al E-DFM este ntotdeauna afiat ca un nod, dar semantica acestuia
este stabilit de poziia nodului n arbore. Astfel, rdcina este fapt, nodurile frunz sunt
atribute descriptive (cele legate direct la rdcin sunt msuri) iar nodurile care nu sunt
frunze sunt atribute dimensionale (cele legate direct de rdcin sunt dimensiuni, celelalte
sunt niveluri ierarhice ale dimensiunilor).
Generarea arborelui de atribute (extins) din o schem multidimensional UML este
realizat de un algoritm, descris n continuare, care este capabil s genereze arbori de atribute
conform cu modelul E-DFM. Algoritmul are nevoie de doar dou primitive grafice:
root (x), funcia care creeaz un graf cu x ca nod rdcin, i
add (y, z), funcia care creeaz pe y ca nod copil al nodului z.
Arborele este realizat ca un graf orientat, arcul este un drum (de obicei, reprezentat prin o
sgeat normal) de la z la y. n cazul n care nodul y deja exist, atunci este creat numai
drumul de la z la y. n scopul de a distinge raportul de cardinalitate al relaiilor dintre noduri,
se folosete o alt primitiv grafic, numit add_dot (y, z), care creeaz o sgeat neorientat
de la z la y dac z Rolls-upTo y cu multiplicitatea n, adic, exist o relaie m : n ntre z i y.
Pseudo-codul algoritmului este prezentat n Figura 1, unde:
base(d) este funcia care extrage prima baz (adic cel mai sczut nivel de agregare)
din Dimension class d;
explore(z, y) este funcia recursiv descris mai jos;
descriptor(b) este funcia care extrage Descriptor-ii lui Base class b, i

18
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
cardinalityRolls-upTo(b, u) este funcia care returneaz cardinalitatea asocierii Rolls-
upTo dintre nodurile u i b.
Generarea arborelui se bazeaz pe funcia recursiv explore(z, y) care navigheaz prin
Base classes prin intermediul elementelor Rolls-upTo ale schemei UML. (Base classe z i
Base classe y sunt astfel nct y are o relaie Rolls-upTo cu z, adic este posibil s se ajung de
la Base class z la Base class y printr-o relaie 1 : n)
De fiecare dat cnd este ntlnit o Base class, este creat un nod, mpreun cu copiii si.
Recursivitatea se termin cnd este ntlnit o Base class fr nici un element Rolls-upTo.

Elemente UML Notaii Elemente E-DFM
Fact class - f fapt Fact
Descriptor - h descriptor Dimensional attribute
Fact attribute - m msur Measure
- f
m
mulimea de msuri ale lui f
Dimension class - d dimensiune Dimension
- f
d
mulimea de dimensiuni ale lui f
Base class - b nivel dimensional de baz Dimensional level
Descriptor - k descriptor Dimensional attribute
Dimension attribute Descriptive attribute
- b
a
mulimea de atribute ale lui b
- u, v nodes
Descriere algoritm (pseudocod)
u = root(f)
// adugarea unei msuri la rdcin
for each m in f
m

add(m, u)
end for

for each d in f
d

b = base(d)
explore(b, u)
end for

function explore(b, u)
k = descriptor(b)
h = descriptor(u)
n = cardinalityRolls-upTo(b, u)
// adugare atribut dimensional
if (n = 1)
add(k, h)
else
add_dot(k, h)
// adugare atribut descriptiv
for each v in b
a

add(v, k)
end for


19
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
for each c sach that b Rolls-upTo c
explore(c, b)
end for
end function

Figura 1. Algoritm de generare a arborilor de atribute

n general, n metodele orientate ctre date, prima activitate este de a identifica n mod
corect faptele din sursele de date [13]. Cu aceast metod activitatea nu mai este necesar
pentru c toate faptele au fost deja identificate i reprezentate folosind schemele
multidimensionale UML. Totui, pentru a putea efectua remodelarea schemelor
multidimensionale UML, acestea trebuiesc redefinite n funcie de activitile de baz ale unei
metode orientate ctre date.
Procesul de remodelare se bazeaz nu numai pe experiena proiectantului ci i pe cerinele
utilizatorilor. Astfel activitile de modelare avansat a datelor pe arbori de atribute derivai
din scheme multidimensionale UML reconciliate sunt:
Definirea dimensiunilor: Pentru fiecare resurs, referitoare la un rol al actorului
depozit de date, proiectantul alege dimensiunile unui fapt n funcie de diferite
contexte de analiz. n cazul n care nu sunt definite ca atare n schemele
multidimensionale UML aceste contexte de analiz ar trebui s devin copii ai unei
rdcini. Pot apare diferite situaii. n situaia n care contextul selectat corespunde la
un nod n arbore, proiectantul efectueaz o operaie de schimbare de printe pentru a-l
face un copil al rdcinii. n situaia n care n arbore nu exist nici un nod care s
corespund contextului respectiv, proiectantul nu poate aduga aceast dimensiune la
fapt din cauza lipsei efective a datelor din sursele de date i va trebui s caute alte
contexte de analiz pentru a descrie faptul la un alt nivel de granularitate. Dac nici
aceast operaiune nu reuete atunci aceast dimensiune nu poate fi aleas pentru acel
fapt. Pe de alt parte copiii unei rdcini care nu s-au dovedit necesari ca dimensiuni
sunt eliminai din arbore.
Definirea msurilor: n cazul n care dimensiunile unui fapt se schimb - n primul
rnd, aceast schimbare se ntmpl n timpul etapei de reconciliere - proiectantul
trebuie s verifice din nou formele normale multidimensionale. Mai precis, trebuie s
verifice dac fiecare msur derivat poate fi calculat pe baza datelor disponibile i
dac dimensiunile determin funcional msurile. Cu alte cuvinte, msurile trebuie s
fie corect reprezentate la nivelurile de agregare stabilite de setul de dimensiuni ale
unui fapt.
Definirea ierarhiilor: Pentru fiecare resurs referitoare la un rol al actorului depozit de
date, toate contextele de analiz care nu sunt definite ca dimensiuni trebuie s formeze
o ierarhie. n primul rnd proiectantul alege drumul de agregare dorit dup care fiecare
context de analiz devine un nivel dimensional n ierarhie adic intr-un sub-arbore
avnd drept rdcin dimensiunea respectiv. n cazul n care un nivel dimensional
corespunde unui nod prezent n arbore proiectantul efectueaz o operaie de schimbare
de printe pentru a face nivelul dimensional n copil al nivelului dimensional n 1. De
exemplu, al doilea nivel dimensional devine copil al dimensiunii, al treilea nivel
dimensional devine copil la al doilea i aa mai departe. Dac nu exist nici un nod n
arbore care s corespund unui nivel dimensional atunci contextul de analiz dorit nu
poate fi furnizat pentru acel fapt. Dup ce toate contextele de analiz au fost luate n

20
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
considerare nodurile care nu corespund nici unui context de analiz sunt eliminate din
arbore.
Definirea atributelor descriptive: Proiectantul nu poate introduce atribute descriptive
noi, pentru care datele necesare ar putea s nu fie disponibile i prin urmare el trebuie
s se bazeze doar pe atributele capturate de ctre schemele UML i mapate cu succes
pe sursele de date n pasul de reconciliere. Proiectantul poate ns elimina atributele
descriptive inutile sau poate fuziona mai multe noduri ntr-un singur nod.
Optimizarea bazat pe cunoatere: Aceasta este o activitate opional n care
proiectantul poate modifica structura arborelui prin utilizarea experienei personale i a
propriilor cunotine. Proiectantul poate mbunti drumurile de agregare n ierarhii
deoarece unele contexte de analiz necesare pot fi obinute, chiar dac acestea nu sunt
prezente n mod explicit n sursele de date. De exemplu, deoarece o dimensiune timp
complet poate fi derivat dintr-o dat, proiectantul ar putea introduce semestrul ca
nivel dimensional n ierarhia dimensiunii timp dac acest lucru ofer un context de
analiz interesant.
Validarea: Presupunnd c sarcinile descrise n modelele SRM (Strategic Rationale
Models) ale factorilor de decizie corespund analizelor tipice care urmeaz s fie
efectuate pe depozitul de date, proiectantul verific dac elementele multidimensionale
din arborii de atribute ofer rspunsuri la aceste ntrebri. Pentru fiecare fapt dat
proiectantul trebuie s verifice dac agregrile cerute sunt operaiuni corecte i
executabile. Pentru fiecare agregare proiectantul trebuie s se asigure c exist un
nivel dimensional corespunztor i pentru fiecare msur, un atribut numeric
corespunztor ca i copil al rdcinii arborelui.
Pe scurt, etapele generale ale metodei sunt:
Analiza cerinelor: const n efectuarea, utiliznd Cadrul-i*, a unei analize profunde a
domeniului pe baza cerinelor utilizatorilor, n scopul de a detecta obiectivele
instituionale. Analiza obiectivelor instituionale permite apoi proiectantului s deduc
cerinele informaionale.
Modelarea multidimensional: const n definirea manual a schemelor
multidimensionale utiliznd cerinele informaionale.
Reconcilierea: const n reconcilierea schemelor multidimensionale prin maparea lor
pe sursele de date i soluionarea inconsistenelor. Aceast activitate se poate face i
automat [24] cu ajutorul instrumentului QVT (QueryViewTransformation Facility).
Generarea arborelui de atribute: const n crearea n mod automat de arbori de atribute
pentru fiecare schem UML obinut n pasul anterior.
Modelarea avansat a datelor: permite proiectantului remodelarea manual a arborelui
de atribute n scopul de a modifica dependene funcionale. Acest lucru ar putea fi
necesar pentru a alinia mai bine schema la cerinele utilizatorilor i pentru a mbunti
relaiile ierarhice dintre nivelurile dimensionale.
Activitatea de modelare avansat a datelor se face dup modelarea multidimensional pe
baza cerinelor utilizatorilor i din moment ce sunt utilizate schemele multidimensionale UML
i nu scheme E/R, nivelul de abstractizare al reprezentrii intrrii n modelarea avansat a
datelor nu a fost modificat.
Din cauza etapei de reconciliere, o schem multidimensional UML reconciliat asigur
disponibilitatea efectiv a datelor necesare. Chiar dac arborele generat ar putea fi considerat

21
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
un surogat al surselor de date el acoper partea din sursele de date strict necesar pentru
cerinele informaionale i prin urmare, proiectantul se va putea concentra n continuare numai
pe relaiile relevante din sursele de date.
Metoda ofer proiectantului o schem preliminar care reprezint sursele de date, dar n
care cerinele informaionale legate de obiectivele instituionale au fost complet acoperite.
Utiliznd ca intrare, pentru modelarea avansat a datelor, schema multidimensional UML
reconciliat proiectantul poate s introduc msuri derivate i poate s modifice dependene
funcionale pe baza unor considerente i a unei experiene proprii. Pentru a exemplifica,
dimensiunile care determin un fapt pot fi modificate i nivelurile de agregare ntr-o ierarhie,
de asemenea. Aa cum s-a menionat anterior, acest lucru poate fi realizat nu numai n scop de
optimizare (ca un exemplu, dou atribute descriptive numele i prenumele se pot uni n unul
singur pentru a reduce numrul de atribute), dar, de asemenea, pentru a asigura cea mai bun
aderen a schemei la cerinele utilizatorului.
Alte avantaje ale acestei metode sunt dup cum urmeaz.
Schemele multidimensionale UML reprezint o formalizare puternic a obiectivelor
instituionale i ofer un limbaj comun att pentru informaticieni ct i pentru factorii
de decizie. Prin urmare, este mai greu s apar nenelegeri i/sau omisiuni.
Schemele multidimensionale UML reprezint concepte multidimensionale bine
definite, cum ar fi faptele i dimensiunile. Ca urmare, proiectantul nu mai este obligat
s se ocupe cu identificarea direct a acestor concepte n sursele de date.
Generarea schemelor multidimensionale UML reconciliate determin o selecie
preliminar a atributelor, furniznd proiectantului numai pe cele strict necesare. Dac
ar lucra direct pe sursele de date proiectantul ar trebui s fac aceas selecie pe foarte
multe entiti avnd, la rndul lor, multe atribute, cele mai multe dintre acestea nefiind
utile.























22
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

3. STUDIU DE CAZ

3.1 Sistemul suport pentru decizii al unei biblioteci
Concepia i implementarea sistemelor informatice, deci i a sistemelor suport pentru
decizii, sunt influenate [3] de ctre o serie de factori, printre care pot fi menionai:
obiectivele urmrite, persoanele implicate, recomandrile, normele i standardele utilizate,
restriciile impuse de ctre instituie, evoluia mediului, bugetul disponibil i termenele de
finalizare.

3.1.1 Obiectivele sistemului
Provocrile cu care se confrunt un sistem suport pentru decizii de bibliotec [19] sunt:
mbuntirea satisfaciei utilizatorilor (n sediul propriu i n afara lui);
Elaborarea unei politici de achiziie orientat ctre cerere;
mbuntirea conservrii coleciilor;
Optimizarea fluxurilor;
Optimizarea alocrii resurselor (umane i financiare);
Diversificarea i creterea veniturilor (culturale i comerciale);
Comunicare mai bun cu partenerii (organisme guvernamentale, alte biblioteci).
Obiectivele sistemului suport pentru decizii de bibliotec sunt:
Furnizarea de indicatori care s permit evaluarea n timp a conformitii cu
obiectivele bibliotecii, prin:
evaluarea rezultatelor obinute, sesizarea tendinelor, alerte;
evaluarea indicatorilor operaionali;
evaluarea indicatorilor de performan;
rapoarte de activitate.
Furnizarea unor instrumente de analiz a tendinelor, de sesizare a situaiilor
decizionale i de sugerare a unor aciuni corespunztoare (analize complexe, simulri,
prognoze) n vederea lurilor de decizii.
Integrarea datelor i compararea informaiilor din aplicaii informatice existente.
Simplificarea accesului la informaie prin:
schimb transparent de informaii;
diseminare accelerat a informaiilor.

3.1.2 Direcii de mbuntire a activitilor
Utilizatorii sistemului pot solicita un spectru larg de expertize, de la cutri simple la
statistici avansate. Pentru a putea adapta seviciile oferite de sistem la cerinele fiecrei
categorii de utilizatori se au n vedere patru categorii principale de astfel de servicii:

23
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

24
Cutri simple care furnizeaz rapoarte predefinite i indicatori de performan;
Interogri avansate i/sau interogri personalizate, la cerere;
Analize avansate implicnd navigare multidimensional i funcii puternice de analiz;
Simulri i statistici avansate.
Domeniile posibile de imbuntire a activitii bibliotecii sunt:
Dezvoltarea coleciilor;
Accesibilitatea coleciilor;
Accesul la publicaii;
Utilizarea bibliotecii;
Digitalizarea coleciilor;
Serviciile bibliografice, asisten, ndrumare;
Potenialul de dezvoltare;
Conservarea coleciilor;
Managementul.

3.1.3 Arhitectura sistemului


















Figura 2. Arhitecura sistemului suport pentru decizii


Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Aceast arhitectur, combinaie dintre o tehnologie de management a rezolvatoarelor
flexibile i o tehnologie de management a bazelor de date, dei acoper doar o parte din
posibilitile identificate de arhitectura generic [9, 10] ea este adesea citat, n cri i articole
de specialitate, ca fiind arhitectura sistemelor suport pentru decizii [5, 6]. n Figura 2 este
prezentat o variant a acestei combinaii respectiv integrarea depozitrii datelor cu
rezolvatoare analitice (prelucrare analitic on-line) i rezolvatoare data mining (mineritul
datelor i descoperirea cunotinelor).

3.1.4 Resurse necesare
Pentru resursele umane se impune urmtoarea structur:
Un comitet de management;
O echip de proiect;
Grupuri de lucru cu utilizatorii;
O firm de consultan (pentru analiza cerinelor);
Un subcontractant (pentru dezvoltare-implementare).
Pentru resursele financiare trebuiesc avute n vedere:
Instrumentele de fundamentare a deciziilor;
Un instrument ETL pentru date ;
Un instrument de raportare;
Consultan;
Contract pentru dezvoltarea sistemului.

3.1.5 Avantajele sistemului
Asigur informaii de calitate i beneficiaz de noi instrumente de management;
Adaptabilitate, pe msura utilizrii sistemului cerinele pot evolua;
Asigur satisfacerea cerinelor utilizatorilor i a cerinelor tehnice actuale i viitoare;
Rezolv o serie de faze tehnice critice privind furnizarea, modelarea i stocarea
datelor;
Impune personalului dezvoltarea n consecin a abilitilor;
Susine trecerea la o cultur orientat ctre performan;
Procesul de realizare a unui astfel de sistem, nou i captivant, creeaz multe provocri
dar promite mari mbuntiri n modul de desfurare a activitilor, n modul de
nelegere a ceea ce se face n prezent i a ceea ce se preconizeaz pentru viitor.




25
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.2 Analiza cerinelor informaionale
3.2.1 Cerinele biblioteconomice
tiina care se ocup cu studiul crilor sub aspectul publicrii, difuzrii i comercializrii
lor este bibliologia. Biblioteconomia, ramur a bibliologiei, se ocup cu formarea,
administrarea i organizarea bibliotecilor. Fondator al biblioteconomiei moderne poate fi
considerat Gabriel Naud (1600 - 1653), bibliotecarul cardinalului Mazarin, prin lucrarea sa
Advis pour dresser une bibliothque (1627). Recent, termenul de biblioteconomie este tot
mai frecvent nlocuit prin tiinele informrii i bibliotecilor (Library and Information
Science).
Coleciile unei biblioteci pot cuprinde urmtoarele categorii de documente: cri,
publicaii seriale, manuscrise, microformate, documente cartografice, documente de muzic
tiparite, documente audiovizuale, documente grafice, colecii electronice, documente
fotografice sau multiplicate prin prelucrri fizico-chimice, documente arhivistice, alte
categorii de documente indiferent de suportul lor material.

3.2.1.1 Cerine instituionale
Principalele cerine la care trebuie s rspund o bibliotec naional [21] se refer la:
Colectarea i prezervarea publicaiilor de interes naional general i de importan
deosebit:
publicaii tiprite i materiale audiovizuale;
documente nepublicate, precum manuscrisele sau nregistrri audio i vizuale.
Descrierea bibliografic a publicaiilor:
crearea nregistrrilor bibliografice pentru publicaiile din ar;
accesul utilizatorilor la nregistrrile bibliografice, att din ar ct i din alte ri.
Disponibilitatea documentelor: obinerea, de oriunde din lume, a publicaiilor necesare
pentru a satisface nevoia de informare a utilizatorilor.
Accesul la documente:
acces pentru consultare n sediu, inclusiv electronic;
furnizare la distan de reproduceri sau mprumut.
Accesul la informaii independente de documente:
informaii primare;
informaii prelucrate, potrivit interesului utilizatorilor;
ghiduri de informare.
Schimbul de publicaii: eliminarea surplusului de material, prin redistribuiri la i ntre
biblioteci.
Serviciile pentru alte biblioteci sau uniti informare.
Potenialul de dezvoltare:

26
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
instruirea i formarea profesional;
cercetarea i dezvoltarea.

3.2.1.2 Procese biblioteconomice
Principalele procese biblioteconomice se grupeaz pe trei domenii funcionale [36]:
Dezvoltarea coleciilor:
elaborarea politicii de selecie a publicaiilor;
identificarea surselor de unde pot fi obinute;
selecia i achiziia publicaiilor.
Organizarea coleciilor:
descrierea bibliografic a publicaiilor i constituirea cataloagelor de bibliotec;
aranjarea n depozite i conservarea publicaiilor;
evaluarea coleciilor i eliminarea de publicaii.
Utilizarea coleciilor:
mprumutul documentelor;
asistena i ndrumarea utilizatorilor;
elaborarea produselor de informare;

3.2.1.2 Msurarea activitilor
Procesele biblioteconomice sunt vzute ca succesiuni de activiti formate la rndul lor
din secvene de operaii elementare consumatoare de resurse.
Definiia 7. Indicele de selecie al unei operaii, s(u) e {0, 1}, este o valoare scalar care
descrie faptul c, n conformitate cu o anumit politic de selecie (sau planificare), pentru o
anumit operaie analizat u, descris ntr-un anumit nomenclator de operaii u e O, se
consider necesar efectuarea ei:
1 dac realizarea operaiei u este considerat necesar;
s(u,O ) =
{
0 n caz contrar.
Definiia 8. Indicele de realizare al unei operaii, r(u) > 0, este o valoare scalar care
descrie faptul c o anumit operaie analizat u, descris ntr-un anumit nomenclator de
operaii u e O, a fost realizat:
> 0 dac operaia u a fost realizat;
r(u,O ) =
{
0 n caz contrar.

27
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Observaie. In procesele biblioteconomice curente se realizeaz i operaii care nu fac
obiectul unei politici de selecie.

3.2.1.3 Indicatori operaionali
Prin agregri ale indicilor de selecie sau de realizare se pot obine valorile indicatorilor
care descriu starea curent a sistemului bibliotecii [16], pe principalele domenii funcionale:

1. Dezvoltarea coleciilor:
1.1 numrul total de volume Cri i periodice tiprite (legate):
numrul de volume intrate n timpul anului de referin;
numrul de volume existente la sfritul anului de referin;
(cu evidenierea crilor i periodicelor rare, uniti fizice/volume)
1.2 numrul total de uniti fizice Manuscrise:
numrul de uniti fizice intrate n timpul anului de referin;
numrul de uniti fizice existente la sfritul anului de referin.
1.3 numrul total de uniti fizice Microformate:
numrul de uniti fizice intrate n timpul anului de referin;
numrul de uniti fizice existente la sfritul anului de referin.
1.4 numrul total de uniti fizice Documente audiovizuale, din care:
documente audio;
documente vizuale;
documente audiovizuale combinate;
numrul de uniti fizice intrate n timpul anului de referin;
numrul de uniti fizice existente la sfritul anului de referin.
1.5 numrul total de uniti fizice Colecii electronice, din care:
documente digitale;
periodice electronice;
baze de date;
(cu evidenierea tipului de suport: CD-ROM; DVD-ROM; WEB; ALT-TIP)
numrul de uniti fizice intrate n timpul anului de referin;
numrul de uniti fizice existente la sfritul anului de referin;
1.6 numrul total de uniti fizice Alte documente de bibliotec:
numrul de uniti fizice intrate n timpul anului de referin;
numrul de uniti fizice existente la sfritul anului de referin.
1.7 numrul total de titluri Cri tiprite i electronice:
numrul total de titluri intrate n timpul anului de referin;
numrul total de titluri existente la sfritul anului de referin.
(Pentru indicatorii 1.1 1.7 se evideniaz numrul de documente n limba romn, n alte
limbi sau bilingve)
1.8 numrul total de Periodice curente (tiprite i electronice):
numrul de titluri intrate n timpul anului de referin;
numrul de abonamente n timpul anului de referin.
1.9 numrul de Resurse gratuite de pe Internet n timpul anului de referin.
1.10 numrul total de Documente achiziionate n timpul anului de referin, din care:
din finanare public;
din finanare instituional;

28
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
din venituri proprii;
din alte venituri.
1.11 numrul total de Documente eliminate n timpul anului de referin, din care:
cri i periodice tiprite (legate) volume;
manuscrise uniti fizice;
microformate uniti fizice;
documente audiovizuale uniti fizice;
colecii electronice uniti fizice;
alte documente de bibliotec uniti fizice.

2. Accesul i facilitile bibliotecii n timpul anului de referin:
2.1 numrul total de uniti fizice Documente cu acces liber la raft.
2.2 numrul total de metri liniari de rafturi ocupate de colecii, din care:
numrul de metri liniari de rafturi cu acces liber ocupate de colecii.
2.3 numrul total de nregistrri catalografice n sistem automatizat, din care:
numrul de documente rare nregistrate catalografic n sistem.
2.4 numrul total de Calculatoare (PC).
2.5 numrul total de Staii de lucru pentru utilizatori, din care:
numrul de staii conectate la Internet;
numrul de staii conectate la Intranet.
2.6 numrul total de Imprimante.
2.7 numrul total de Scannere.
2.8 numrul total de Cititoare de cri electronice.
2.9 numrul total de Fotocopiatoare pentru utilizatori.
2.10 numrul total de Locuri n slile de lectur.
2.11 numrul total de Sesiuni de comunicri tiinifice, simpozioane i conferine.
2.12 numrul total de Programe i proiecte educative pentru populaie total din care:
pentru persoanele din grupa de vrst: sub 15 ani;
pentru persoanele din grupa de vrst: 15-24 ani;
pentru persoanele din grupa de vrst: 25-64 ani;
pentru persoanele din grupa de vrst:65 ani i peste.
2.13 numrul total de Cursuri de formare continu.
2.14 numrul total de Activiti n cadrul programelor educative total din care:
pentru persoanele din grupa de vrst: sub 15 ani;
pentru persoanele din grupa de vrst: 15-24 ani;
pentru persoanele din grupa de vrst: 25-64 ani;
pentru persoanele din grupa de vrst:65 ani i peste.

3. Utilizarea i utilizatorii bibliotecii n anul de referin:
3.1 numrul total de Utilizatori nscrii.
3.2 numrul total de Utilizatori activi, din care:
dup continuitate:
noi nscrii;
vizai.
dup naionalitate:
romn;
alte naionaliti.
dup gen:
masculin;

29
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
feminin.
dup vrst:
persoanele din grupa de vrst: sub 15 ani;
persoanele din grupa de vrst: 15-24 ani;
persoanele din grupa de vrst: 25-64 ani;
persoanele din grupa de vrst:65 ani i peste.
dup statutul ocupaional:
profesii intelectuale;
tehnicieni;
funcionari;
muncitori;
elevi;
studeni;
pensionari;
casnice;
omeri;
alte categorii.
3.3 numrul total de Tranzacii de mprumut individual (documente eliberate), din care:
dup tipul documentelor
cri (volume);
periodice(volume);
fotocopii, microformate (uniti fizice).
dup coninutul documentelor:
generaliti;
filozofie, psihologie;
tiine sociale, religie;
tiine politice;
tiine economice;
drept, administraie;
nvmnt;
etnografie, folclor;
matematic, fizic, chimie;
geologie, biologie, botanic, zoologie;
medicin;
tehnic, inginerie, industrii;
comer, marketing, management;
arte;
sport;
lingvistic;
literatur romn;

30
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
literatur universal;
geografie;
arheologie, istorie, tiine ale istoriei, biografii.
3.4 numrul total de Titluri solicitate prin mprumut interbibliotecar
Titluri solicitate de bibliotec altor biblioteci, din care:
din ar;
din strintate.
Titluri primite de bibliotec de la alte biblioteci, din care:
din ar;
din strintate.
Titluri solicitate bibliotecii de alte biblioteci, din care:
din ar;
din strintate.
Titluri furnizate de bibliotec altor biblioteci, din care:
din ar;
din strintate.
3.6 numrul total de Tranzacii de referine virtuale.
3.7 numrul total de Vizite la bibliotec.
3.8 numrul total de Vizite virtuale la resursele din reea ale bibliotecii.
3.9 numrul total de Participani la Programe i proiecte educative pentru populaie
din care:
pentru persoanele din grupa de vrst: sub 15 ani;
pentru persoanele din grupa de vrst: 15-24 ani;
pentru persoanele din grupa de vrst: 25-64 ani;
pentru persoanele din grupa de vrst:65 ani i peste.
3.10 numrul total de Participani la sesiuni de comunicri tiinifice, simpozioane i
conferine
3.11 numrul total de Participani la cursuri de formare continu

Tabelul 1. Lista indicatorilor operaionali ai bibliotecii
3.2.1.4 Indicatori de performan
Managementul performant al unei instituii se bazeaz pe un set de obiective fixate i un
sistem de indicatori de performan asociat, menite s faciliteze sesizarea situaiilor
decizionale, identificarea aciunilor posibile de urmat i luarea deciziilor.
In continuare sunt prezentate obiectivele i indicatorii de performan ai bibliotecii [17].

1. Dezvoltarea coleciilor:
1.1 ponderea titlurilor deinute de bibliotec n producia naional de publicaii:
I
1
= (p
3
/ P
3
) 100 , unde
p
3
numrul de publicaii achiziionate n ultimii 3 ani;
P
3
numrul total de publicaii aprute n aceeai perioad.

31
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
1.2 ponderea titlurilor deinute de bibliotec n numrul total de titluri solicitate de
ctre utilizatori:
I
2
= (s / S) 100 , unde
s numrul de publicaii servite utilizatorilor n anul de referin;
S numrul total de publicaii solicitate de utilizatori n acelai an.

2. Accesibilitatea coleciilor:
2.1 ponderea publicaiilor din coleciile generale, accesibile utilizatorilor n numrul
total de publicaii aprute n ultimii 2 ani:
I
3
= (p / P
2
) 100 , unde:
p numrul de publicaii catalogate (achiziionate i procesate) n anul de referin;
P
2
numrul total de publicaii aprute n ultimii 2 ani.
Dobndirea i integrarea rapid n coleciile bibliotecii a titlurilor recent aprute este un
criteriu major de eficien. Procentajul mic poate avea multe cauze: procedurile pentru
depozitul legal insuficient urmrite, lipsa preocuprii pentru publicaiile noi, ntrzieri n
catalogare.
2.2 ponderea materialelor rare ce pot fi regsite prin resurse web n numrul total de
materiale din coleciile speciale, reflect gradul de preocupare al bibliotecii privind
promovarea propriilor colecii:
I
4
= (m / M) 100, unde:
m numrul de materiale rare accesibile pe web n anul de referin;
M numrul total de materiale rare existente n colecii, n acelai an.

3. Accesul rapid i uor la publicaii:
3.1 durata procesrii publicaiilor se refer la numrul mediu de zile dintre data intrrii
unei publicaii n bibliotec i apariia sa n inventar, catalog, resurse web etc., include
achiziia, catalogarea descriptiv, indexarea, procesarea fizic.
Pentru fiecare publicaie i e P se calculeaz z(i) numrul de zile dintre data intrrii i data
de la care publicaia a devenit accesibil utlizatorilor.
I
5
= T / P, unde:
T = E
P
i=1
z(i) numrul total de uniti de timp (zile) consumate n anul de referin
pentru catalogarea publicaiilor,
P numrul de publicaii catalogate, n acelai an.
Scorul slab poate nsemna comunicare insuficient ntre compartimente i/sau acumulare
de stocuri i/sau personal insuficient.

32
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.2 ponderea publicaiilor nregistrate care se afl la locul corect:
I
6
= (p / P) 100, unde:
p numrul de publicaii corect aezate, n anul de referin;
P numrul total de publicaii existente n acelai an.
3.3 durata medie a procesului de regsire a unei publicaii:
Pentru fiecare publicaie i e I se calculeaz r(i) numrul de uniti de timp dintre
momentul solicitrii i momentul servirii.
I
7
= T / P, unde:
T = E
P
i=1
r(i) numrul de uniti de timp (ore) consumate pentru regsirea
publicaiilor, n anul de referin;
P numrul total al publicaiilor regsite, n acelai an.
3.4 timpul mediu al schimburilor interbibliotecare msoar eficiena serviciilor de
mprumut extern, se refer la timpul consumat pentru completarea formularelor necesare unui
mprumut interbibliotecar:
I
8
= (T / F), unde
T numrul total de uniti de timp (zile) consumate n anul de referin pentru
completarea formularelor de mprumut;
F numrul de formulare (de cerere i de primire) completate, n acelai an.
3.5 accesibilitatea direct a publicaiilor descrie accesibilitatea celor mai solicitate
materiale prin intermediul paginii web a instituiei, fiind msurat prin numrul de click-uri
necesare pentru a se ajunge la documentul respectiv.
Pentru fiecare intrare web i e I se calculeaz p(i) numrul de puncte acumulate.
I
9
= (b / B) 100, unde:
b = (E
I
i=1
p(i)) / I ) numrul mediu de puncte acumulate de intrrile web, n anul de
referin;
I numrul total de intrri web, n acelai an;
B numrul total de butoane din meniu, n acelai an.

4. Utilizarea bibliotecii:
4.1 gradul de solicitare al publicaiilor strine:
I
10
= (p
3
/ P
3
) 100, unde
p
3
numrul total al mprumurilor efectuate n anul de referin cu publicaii strine
intrate n ultimii 3 ani;

33
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
P
3
numrul total al publicaiilor strine intrate n acceai perioad.
4.2 costul utilizrii resurselor electronice:
I
11
= C / U, unde:
C costul resurselor electronice n anul de referin (baze de date, reviste electronice
pentru care biblioteca pltete);
U numrul de uniti de coninut descrcate, n acelai an.
4.3 gradul de ocupare a locurilor disponibile proporia n care publicul utilizeaz
resursele bibliotecii, valoarea bibliotecii ca spaiu fizic:
I
12
= (l / L) 100, unde:
l numrul mediu de locuri ocupate zilnic, n anul de referin;
L numrul total de locuri disponibile, n acelai an.
4.4 gradul de participare la evenimentele culturale msoar atractivitatea
evenimentelor culturale organizate de bibliotec:
I
13
= P / E, unde:
P numrul total de participani la evenimente culturale, n anul de referin;
E numrul total de evenimente culturale organizate de bibliotec , n acelai an.
4.5 gradul de satisfacere a utilizatorilor exprim aprecierea utilizatorilor privind
serviciile oferite, ca un ntreg sau ca servicii individuale. n general, pentru fiecare grup int
de utilizatori exist un chestionar special i o scar de valori numerice.
I
14
= S / U, unde:
S suma valorilor acordate de utilizatori, ntr-o anumit perioad de referin;
U numrul total de utilizatori chestionai, n acceai perioad.

5. Digitalizarea coleciilor:
5.1 gradul de digitizare a coleciilor generale msoar gradul n care biblioteca i
ndeplinete misiunea de a face accesibil publicului motenirea documentar n format
digital:
I
15
= (d / D) 1.000, unde:
d numrul de documente digitizate n anul de referin;
D numrul total de documente, n acelai an.
5.2 gradul de digitizare a coleciilor speciale msoar gradul n care biblioteca i
ndeplinete misiunea de a face accesibil publicului motenirea documentar n format
digital:

34
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
I
16
= (d / D) 100, unde:
d numrul de documente speciale digitizate n anul de referin;
D numrul total de documente n coleciile speciale, n acelai an .
5.3 ponderea documentelor descrcate descrie msura n care biblioteca dispune de
resurse digitale relevante necesare utilizatorilor:
I
17
= (d / D) 100, unde:
d numrul de documente downloadate din coleciile digitale ale bibliotecii n anul
de referin;
D numrul total de documente digitizate, n acelai an.

6. Servicii bibliografice, asisten, ndrumare
6.1 ponderea cererilor de asisten soluionate eficient n raport cu numrul total al
cererilor de asisten:
I
18
= (s / S) 100, unde:
s numrul de solicitri de asisten soluionate corect n anul de referin;
S numrul total de solicitri de asisten, n acelai an.
Calificativele sunt urmtoarele :
rspuns complet rspuns corect i complet prin trimitere la o singur surs sau
trimitere la mai multe surse, dintre care una conine rspunsul corect i comoplet;
rspuns parial complet trimitere la una sau mai multe surse, nici una dintre
neconducnd direct la rspuns, dar una cel puin fiind n situaia de a constitui surs
preliminar;
referin rspuns direct inexistent, dar trimitere la o alt persoan, instituie, surs;
incorect sau nici un rspuns nici un rspuns, nici o indicaie sau indicaii complet
greite.
O valoare mare reflect acurateea mare a rspunsurilor. Poate furniza infirmaii mai utile
n cazul n care referinele sunt furnizate online. Poate fi influenat de natura ntrebrilor,
abilitatea personalului, calitatea, varietatea, disponibilitatea surselor i bazelor de date
existente.
6.2 timpul mediu de rspuns la solicitrile de asisten descrie timpul mediu necesar
personalului bibliotecii pentru a rspunde unei solicitri de asisten, msurat n uniti de
timp (minute, ore, zile) n funcie de specificul fiecrui serviciu i msoar gradul n care
rspunsul se ncadreaz ntr-un interval de timp rezonabil.
I
19
= (T / S), unde:
T numrul total de uniti de timp consumate n anul de referin pentru acordarea
de rspunsuri la solicitrile de asisten;

35
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
S numrul total de solicitri de asisten, n acelai an.
O valoare mic este considerat pozitiv, reflectnd buna organizare a serviciilor
bibliotecii.

7. Creterea potenialului de dezvoltare.
7.1 timpul mediu alocat activitilor de IT, pregtirea informatic descrie importana
acordat de instituie implicrii resurselor umane n serviciile electronice, gradul de prioritate
acordat acestui aspect de ctre instituie. Indicatorul se refer la volumul timpului de lucru pe
care personalul implicat l dedic organizrii, meninerii, oferirii i dezvoltrii de resurse IT,
dezvoltrii tehnice i mbuntirii serviciilor electronice ale instituiei:
I
20
= (T / A), unde:
T numrul total de uniti de timp consumate n anul de referin de angajaii
bibliotecii pentru activiti legate de IT;
A numrul total de angajai, n acelai an.
O valoare mare reflect gradul mare de interes acordat de instituie dezvoltrii.
7.2 ponderea pregtirii profesionale msoar importana acordat de instituie pregtirii
personalului propriu pentru creterea abilitilor profesionale, prin participri la cursuri de
specializare.
I
21
= (a / A) 100, unde:
a numrul de angajai care au urmat cursuri de specializare n anul de referin;
A numrul total de angajai, n acelai an.
O valoare mare e considerat pozitiv, una mic reflect necesitatea creterii gradului de
implicare a personalului n activiti de instruire. Poate fi influenat de numrul i calitatea
cursurilor oferite. Instituia poate promova cursuri prin reeaua intranet sau ncercnd s afle
necesitile personalului pentru o pregtire absolut specific, ca s ias n ntmpinarea lor.
7.3 ponderea bunurilor obinute prin granturi msoar ponderea mijloacelor dobndite
urmare a derulrii unor granturi:
I
22
= (v / V) 100, unde
v valoarea bunurilor dobndite n anul de referin prin granturi sau resurse
extrabugetare;
V valoarea total a bunurilor instituiei, n acelai an.
Obiectivul su este acela de a msura performana instituiei n a obine resurse financiare
adiionale i de aici abilitatea sa n procesul propriei dezvoltri. O valoare mare indic
succesul instituiei n a obine prin iniiativ proprie mijloace suplimentare. Msoar i
capacitatea bibliotecii de a se implica n sarcini care trec dincolo de sarcina sa principal i o
calific pentru obinerea de mijloace suplimentare.
7.4 ponderea personalului implicat n granturi msoar intensitatea i spectrul
cooperrii la nivel naional sau internaional al instituiei i de aici importana i impactul

36
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
instituiei:
I
23
= (a / A) 100, unde:
a numrul de angajai implicai n proiecte i cooperri naionale sau internaionale
n anul de referin;
A numrul total de angajai, n acelai an.
Un procentaj mare e considerat pozitiv, reflectnd angajamentul instituiei n provocrile
societii informaionale. Performanele pot varia mult de la un an la altul, fiind influenate
mult de disponibilitatea fondurilor. Utilitatea sa se vede mai ales dac este aplicat consecutiv
muli ani.

8. Conservarea coleciilor
8.1 gradul de accesibilitate a pieselor originale din colecii, msoar capacitatea
bibliotecii de conserva materialele originale, preocuparea ei pentru conservare i gradul de
prioritate al acestei activiti.
I
24
= (e / E) 100, unde:
e numrul de exemplare aflate n condiie stabil, n anul de referin;
E numrul total de exemplare existente, n acelai an .
Obiectele sunt clasificate n patru categorii :
aflate n condiie bun utilizabile cu grija normal pentru orice material din colecie;
condiie acceptabil, corect deteriorat, dar stabil i utilizabil cu o precauie sporit;
condiie precar deteriorare moderat, imposibil de utilizat fr creterea gradului de
deteriorare;
inutilizabil grav deteriorat, exclus de la acces public i de la utilizare din cauza
fragilitii, infestrii etc.
Primele dou categorii pot fi considerate separat ca stabile, celelalte dou ca instabile.
Indicatorul definete ponderea materialelor din colecie aflate n stare stabil, adic apte a
fi folosite fr riscul unor deteriorri. Dac rezultatul arat un grad redus de stabilitate a
condiiei de conservare a materialelor, atunci trebuie luate msuri specifice fiecrei categorii
(manuscrise medievale, cartografie, monede) n vederea creterea gradului de conservare i a
prioritizrii acestor activiti. Msurile in de mbuntirea condiiilor de microclimat,
schimbarea metodelor de utilizare i mnuire, tratament n vederea conservrii, deacidificare,
efectuarea de copii pentru public.
8.2 ponderea materialelor care au beneficiat de restaurare n raport cu volumul total al
materialelor de restaurat:
I
25
= (m / M) 100, unde:
m numrul de materiale care au beneficiat de restaurare n anul de referin;
M numrul total de materiale care au nevoie de restaurare, n acelai an.

37
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Materialele luate n calcul sunt crile rare publicate nainte de 1800, incunabulele i
manuscrisele [18]. Un procentaj ridicat va fi considerat bun. Poate fi aplicat i pe categorii
mai restrnse de material (manuscrise, ziare, hri, stampe, monede). Dac rezultatul este slab,
atunci trebuie luate msuri de promovare a importanei prezervrii materialelor originale prin
toate tipurile de media, ncercarea de a obine fonduri suplimentare inclusiv prin tehnici de
tipul adoptai-o-carte (obiect). Aceste tehnici ar putea avea succes avnd n vedere impactul
public al materialelor rare.
8.3. ponderea spaiilor cu mediu ambiental adecvat descrie n ce msur coleciile sunt
asigurate cu un spaiu de depozitare adecvat i au o utilizare adecvat. Datele legate de
temperatur i RH trebuie stocate un an de zile prin msurtori permanente cu aparatele
necesare.
I
26
= (s / S) 100, unde:
s suprafaa spaiilor de depozitare care beneficiaz de condiii de mediu adecvate n
anul de referin;
S suprafaa total a spaiilor de depozitare, n acelai an.
O valoare mare este considerat pozitiv. Trebuie utilizate filtre de ultraviolete, sticl
protectoare, draperii care s mpiedice accesul luminii naturale.

9. Management eficient:
9.1 costul mediu al serviciilor de catalogare msoar costurile de personal pentru
descrierea unui document i inserarea sa logic i coerent ntr-un catalog. Scopul su este
acela de a urmri costurile de personal i a le acomoda cu o politic specific ce vizeaz
generarea de nregistrri bibliografice.
I
27
= (T h + C) / P, unde:
T numrul total de ore consumate n anul de referin pentru nregistrri
bibliografice, descrieri, identificri;
h costul unei ore de lucru;
C costul subcontractrilor, dac este cazul;
P numrul de publicaii catalogate, n acelai an.
Dac rezultatul indic costuri mari, atunci pot fi luate msuri precum: reconsiderarea
complexitii descrierii pentru diferite tipuri de documente; evaluarea performanelor software
i hardware; revizuirea fluxurilor de lucru; creterea volumului de date copiate de la alte
biblioteci.
9.2 costul mediu al serviciilor de mprumut msoar costurile pentru asigurarea
serviciilor de mprumut:
I
28
= (T h) / P, unde:
T numrul de ore consumate n anul de referin pentru activitile referitoare la
mprumuturi;

38
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
h costul unei ore de lucru;
P numrul total de publicaii mprumutate, n acelai an.
Dac costurile de personal par a fi prea mari, msurile de luat pot fi: computerizarea
proceselor, revizuirea fluxurilor de lucru, nlocuirea personalului de specialitate, calificat, n
anumite servicii, cu personal necalificat care poate ndeplini sarcini adecvate.
9.3 productivitatea serviciilor de catalogare msoar productivitatea activitilor de
procesare (achiziie i catalogare) a publicaiilor:
I
29
= P / A, unde:
P numrul total de publicaii achiziionate i procesate n anul de referin;
A numrul de angajai implicai n achiziia i procesarea lor, n acelai an.
Rezultatul poate fi influenat de tipul de media supus procesrii, metodele de procesare,
calificarea personalului. Dac eficiena este redus, instituia poate recurge la reconsiderarea
nivelului de descriere a materialului, la revizuirea fluxurilor de lucru, la utilizarea mai larg a
procedeelor automatizate, la pregtirea sporit a personalului sau la creterea volumului de
date importate de la alte biblioteci.
9.4 productivitatea serviciilor de mprumut msoar productivitatea activitilor de
mprumut, lund n calcul raportul dintre numrul anual al tranzaciilor de mprumut, de toate
felurile i numrul angajailor implicai.
I
30
= P / A, unde:
P numrul total de publicaii mprumutate n anul de referin (n instituie, n afara
ei, interbibliotecar);
A numrul de angajai implicai n activitile de mprumut, n acelai an.
Valorile mari sunt considerate pozitive. Performana poate fi influenat de tipul de
material care urmeaz a fi livrat, ponderea diferitelor tipuri de mprumuturi, gradul de
automatizare i fluxurile de lucru. Instituia poate recurge la reorganizarea fluxurilor de lucru,
automatizarea sporit a proceselor, intensificarea pregtirii personalului.

Tabelul 2. Obiectivele bibliotecii i indicatorii de performan

3.2.2 Cerinele bibliografice

3.2.2.1 Cerine funcionale pentru datele bibliografice

Modelul conceptual de referin pentru datele bibliografice [4, 15] este modelul FRBR
(Functional Requirements for Bibliographic Records) elaborat ntre 1992 i 1997 de ctre un
grup de experi IFLA (International Federation of Library Associations and Institutions).
Modelul FRBR are o dubl orientare:
Consolidarea acumulrilor trecute privind att raionalizarea funciilor unui catalog de
bibliotec ct i justificarea tiinific posteriori a practicilor (costurilor) de
catalogare la nivel internaional prin reconfirmarea valabilitii ISBD-urilor

39
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
(International Standard for Bibliographic Description) i prin redefinirea informaiilor
minime pe care trebuie s le conin o nregistrare bibliografic;
Oferirea de deschideri spre viitor stabilind fundamentele pentru cataloage inovatoare i
asigurnd cadrul conceptual i terminologic pentru actualizarea Principiilor
internaionale de catalogare i pentru elaborarea Codului internaional de catalogare
(RDA - Resource Description and Access).
Deoarece FRBR s-a referit numai la informaiile bibliografice privind documentele, IFLA
a extins eforturile de modelare la toate informaiile prezente ntr-un catalog de bibliotec i n
consecin:
n aprilie 1999 a fost stabilit grupul de experi FRANAR (Functional Requirements
and Numbering of Authority Records) cu misiunea de a modela coninutul
nregistrrilor de autoritate. Grupul FRANAR a publicat, n 2009, modelul FRAD
(Functional Requirements for Authority Data).
n aprilie 2005 a fost stabilit grupul de experi FRSAR (Functional Requirements for
Subject Authority Records) responsabil pentru modelarea relaiilor dintre datele
bibliografice i fiierul de autoritate discipline. Grupul FRSAR a finalizat n 2010
modelul FRSAD (Functional Requirements for Subject Authority Data).
Etapa ulterioar de dezvoltare const n fuzionarea celor trei modele FRBR, FRAD i
FRSAD ntr-unul singur.
Modelul FRBR a fost conceput n conformitate cu un formalism de tip entitate-relaie.
Dorina de a apropia acest model de modelul echivalent dezvoltat de comunitatea
muzeografic, CIDOC CRM (CIDOC Conceptual Reference Model), a condus ulterior la
reformularea modelului FRBR n formalismul orientat-obiect, n care este exprimat acesta din
urm, cu consecina c n prezent exist dou versiuni distincte ale modelului: FRBR
ER
i
FRBR
OO
.
Modelul FRBR consider descrierea bibliografic a unui document ca pe o mulime de
informaii privind patru aspecte diferite ale documentului descris:
caracteristicile individuale ale unui exemplar al documentului;
caracteristicile publicaiei de care aparine;
caracteristicile coninutului intelectual sau artistic;
caracteristicile creaiei abstracte la care se refer acest coninut (de exemplu: textul
original al unui roman i o traducere a acestui roman se refer la o aceeai creaie
abstract).
Aceste patru aspecte au fost denumite respectiv: exemplar, manifestare, expresie i
lucrare.
La fiecare din aceste patru niveluri de analiz, documentul descris este pus n relaie cu o
persoan sau cu o colectivitate care a intervenit ntr-un mod specific la acest nivel.
Fiecare dintre aceste ase noiuni, la care se mai adaug nc alte patru loc, eveniment,
obiect i concept pot constitui subiectele unei lucrri.

3.2.2.2 Definirea entitilor i relaiilor

Entitile definite n cadrul modelului FRBR reprezint obiectele eseniale relevante
pentru utilizatorii datelor bibliografice. Acestea sunt mprite n trei grupuri:

40
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
primul grup include produse ale unei activiti intelectuale sau artistice care sunt
numite sau descrise n nregistrrile bibliografice: lucrare, expresie, manifestare i
exemplar;
al doilea grup include entiti care au diferite responsabiliti privind coninutul
intelectual sau artistic, producia fizic, distribuia, gestionarea sau aspectele juridice
ale unor astfel de produse: persoan i comunitate;
al treilea grup include un alt set de entiti care constituie subiecte ale demersului
intelectual sau artistic: concept, obiect, eveniment i loc.
Produse ale unei activiti intelectuale sau artistice:
Identificator Denumire Definire Comentariu
EPw lucrare
o anumit creaie/oper
intelectual sau artistic
entitate abstract; identitatea de
coninut a mai multor expresii
EPe expresie
realizarea intelectual sau
artistic a unei lucrri
notaie alfanumeric, muzical sau
coregrafic; form sonor, vizual,
obiectual, cinetic sau combinaii
EPm manifestare
materializarea unei expresii
a unei lucrri
n functie de suport: manuscrise,
cri, periodice, afie, fonograme,
filme, casete, cd-uri
EPi exemplar
un exemplar izolat al unei
manifestri
un anumit exemplar al unei
monografii, al unei casete audio,
etc

Tabelul 3. Produsele unei activiti intelectuale sau artistice

Responsabili pentru coninutul intelectual sau artistic, realizarea material i
diseminarea sau pentru gestionarea i aspectele juridice, ale unei lucrri:

Identificator Denumire Definire Comentariu
ERp persoan indivizi
autori, compozitori, artiti, editori,
traductori, dirijori, interprei, etc
ERc colectivitate
organisme sau grupuri de
indivizi i/sau colectiviti
identificate prin un nume specific
i care acioneaz ca un tot

Tabelul 4. Responsabilii pentru produsele unei activiti intelectuale sau artistice

Subiecte ale lucrrilor:

Identificator Denumire Definire Comentariu
ESc concept o noiune / idee abstract
domenii de cunoatere, discipline,
teorii, metode, tehnici, practici, etc
ESo obiect o realitate material
obiecte naturale sau artificiale,
existente sau disprute
ESe eveniment o aciune sau un fapt
evenimente istorice, epoci,
perioade cronologice
ESp loc date geografice/topografice
subiect al unei hri, al unui atlas
sau al unui ghid turistic etc

Tabelul 5. Subiectele produselor unei activiti intelectuale sau artistice

Relaiile definite n cadrul modelului FRBR reprezint legturi eseniale ntre entitile
bibliografice, relevante pentru utilizatorii datelor bibliografice:

41
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
O lucrare poate fi realizat prin una sau mai multe expresii; o expresie poate fi realizare
a unei singure lucrri.
O expresie poate fi materializat/ncorporat n una sau mai multe manifestri; o
manifestare poate materializa/ncorpora una sau mai multe expresii.
O manifestare poate fi reprezentat/exemplificat de unul sau mai multe exemplare; un
exemplar poate reprezenta/exemplifica o singur manifestare.
O lucrare poate fi creat de ctre una sau mai multe persoane i/sau colectiviti; o
persoan sau o colectivitate poate crea una sau mai multe lucrri.
O expresie poate fi realizat de ctre una sau mai multe persoane i/sau colectiviti; o
persoan sau o colectivitate poate realiza una sau mai multe expresii
O manifestare poate fi produs de ctre una sau mai multe persoane i/sau colectiviti;
o persoan sau o colectivitate poate produce una sau mai multe manifestri.
Un exemplar poate fi deinut de ctre una sau mai multe persoane i/sau colectiviti; o
persoan sau o colectivitate poate deine unul sau mai multe exemplare.
O lucrare poate avea drept subiect unul sau mai multe concepte i/sau obiecte i/sau
evenimente i/sau locuri; un concept sau un obiect sau un eveniment sau un loc poate fi
subiect ale uneia sau mai multor lucrri.
O lucrare poate avea drept subiect una sau mai multe lucrri i/sau expresii i/sau
manifestri i/sau exemplare i/sau persoane i/sau colectiviti; o lucrare sau o
expresie sau o manifestare sau un exemplar sau o persoan sau o colectivitate poate fi
subiect ale uneia sau mai multor lucrri.
O lucrare poate fi parte din o singur lucrare; o lucrare poate avea ca parte una sau
mai multe lucrri.
O expresie poate fi parte din o singur expresie; o expresie poate avea ca parte una sau
mai multe expresii.
O manifestare poate fi parte din o singur manifestare; o manifestare poate avea ca
parte una sau mai multe manifestri.
Un exemplar poate fi parte din un singur exemplar; un exemplar poate avea ca parte
unul sau mai multe exemplare.
O lucrare poate avea drept succesor i/sau supliment i/sau complement i/sau rezumat
i/sau adaptare i/sau transformare i/sau imitaie una sau mai multe lucrri; o lucrare
poate fi succesor i/sau supliment i/sau complement i/sau rezumat i/sau adaptare i/sau
transformare i/sau imitaie pentru o singur lucrare.
O lucrare poate avea drept succesor i/sau supliment i/sau complement i/sau rezumat
i/sau adaptare i/sau transformare i/sau imitaie una sau mai multe expresii; o expresie
poate fi succesor i/sau supliment i/sau complement i/sau rezumat i/sau adaptare i/sau
transformare i/sau imitaie pentru o singur lucrare.
O expresie poate avea drept succesor i/sau supliment i/sau complement i/sau rezumat

42
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
i/sau adaptare i/sau transformare i/sau imitaie una sau mai multe expresii; o expresie
poate fi succesor i/sau supliment i/sau complement i/sau rezumat i/sau adaptare i/sau
transformare i/sau imitaie pentru o singur expresie.
O expresie poate avea drept scurtare sau revizuire sau traducere sau aranjament una sau
mai multe expresii; o expresie poate fi scurtare sau revizuire sau traducere sau aranjament
pentru o singur expresie.
O manifestare poate fi reproducere pentru o singur manifestare; o manifestare poate
avea drept reproducere una sau mai multe manifestri.
Un exemplar poate fi reproducere pentru o singur manifestare; o manifestare poate
avea drept reproducere unul sau mai multe exemplare.
Un exemplar poate fi reproducere pentru un singur exemplar; un exemplar poate avea
drept reproducere unul sau mai multe exemplare.
O manifestare poate fi alternativ pentru o singur manifestare; o manifestare poate
avea drept alternativ una sau mai multe manifestri.
Un exemplar poate fi reconfigurare pentru un singur exemplar; un exemplar poate avea
drept reconfigurare unul sau mai multe exemplare.

Tabelul 6. Relaiile dintre entitile bibliografice

3.2.2.3 Descrierea entitilor

Atributele entitii EPw := lucrare

Identificator Denumire atribut Comentariu
APw00
id-w

APw01
titlul lucrrii
cuvnt, expresie sau grup de caractere
APw02
forma lucrrii
roman, simfonie, hart, pictur, fotografie, etc.
APw03
data lucrrii
dat la care lucrarea a fost creat iniial
APw04
caracteristica distinctiv
difereniaz lucrrile cu acela titlu
APw05
completitudinea vizat
indicaie de finalizare/continuare nedefinit
APw06
publicul vizat
categoria de utilizatori creia i se adreseaz
APw07
contextul lucrrii
context istoric, social, intelectual, artistic etc.
APw08
distribuia executrii
(lucrare muzical)
APw09
referine numerice
(lucrare muzical)
APw10
tonalitate
(lucrare muzical)
Apw11
coordonate
(lucrare cartografic)
APw12
echinox
(lucrare cartografic)

Atributele entitii EPe := expresie

Identificator Denumire atribut Comentariu
APe00


APe01
titlul expresiei
cuvnt, grup de cuvinte sau de caractere
APe02 forma expresiei
notaie alfanumeric sau musical, sunet,

43
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
imagine, sculptur, dans, etc
APe03
data expresiei
data la care a fost creat expresia
APe04
limba expresiei
pot fi mai multe, pentru elemente diferite
APe05
caracteristic distinctiv
pentru a distinge expresiile aceleiai lucrri
APe06
aptitudinea de dezvoltare a expresiei
mbogirea n timp a coninutului
APe07
aptitudinea de revizuire a expresiei
versiune de lucru, actualizabil periodic, etc
APe08
volumul expresiei
numr de cuvinte, de imagini, durata, etc
APe09
rezumatul coninutului
un abstract, un sumar, un synopsis, un cuprins
APe10
contextul expresiei
contextul istoric, social, artistic, etc
APe11
receptarea expresiei
citarea opiniei unui critic, unui autor, etc
APe12
restriciile de utilizare a expresiei
restricii bazate pe copyright
APe13
structurarea
(priodic) pe volume, numere, etc
APe14
regularitatea
(periodic) apariie regulat sau neregulat
APe15
periodicitatea
(periodic) lunar, trimestrial, anual, etc.
APe16
prezentarea musical
(notaie muzical)
APe17
distribuia de execuie
(notaie muzical sau inregistrare sonor)
APe18
scara
(imagine/obiect cartografic)
APe19
proiecia
(imagine/obiect cartografic)
APe20
tehnica de prezentare
(imagine/obiect cartografic)
APe21
reprezentarea reliefului
(imagine/obiect cartografic)
APe22
msurile geodezice, verticale; caroiaj
(imagine/obiect cartografic)
APe23
tehnica de nregistrare
(imagine de teledetecie)
APe24
caracteristica special
(imagine de teledetecie)
APe25
tehnica
(imagine grafic sau proiectat)

Atributele entitii EPm := manifestare

Identificator Denumire atribut Comentariu
APm00


APm01
titlul manifestrii
unul sau mai multe titluri
APm02
meniunea responsabilitii
autor, interpret, editor, traductor
APm03
meniunea ediiei
ediia II , versiunea 3.0
APm04
locul ediiei/difuzrii
comun, ora, provincie, ar
APm05
editorul/difuzorul
individ, grup, organism
APm06
data ediiei/difuzrii
data punerii la dispoziia publicului
APm07
fabricantul
individ, grup, organism
APm08
mentiunea coleciei
indic nomele coleciei de care aparine
APm09
tipul de suport
caset, microfilm, videodisc, diapozitiv
APm10
numrul de unitai materiale
foi (volante), discuri, bobine
APm11
materialul
hrtie, lemn, plastic, metal
APm12
modul de nregistrare
analogic, acustic, electric, numeric, optic, etc.
APm13 dimensiunile suportului
film de 8 mm, diapozitiv de 5 x 5 cm, plan n
relief de 9 x 30 x 20 cm, disc de 30 cm
APm14
identificarea manifestrii
ISBN, cot, numr de inventar
APm15 furnizorul
nume i adresa pentru cel care autorizeaz
accesul sau achiziia (editor, difuzor, etc.)
APm16
modalitile de punere la dispoziie
gratuit, pre
APm17
restriciile de acces la manifestare
bazate pe copyright,
APm18
stilul caracterelor
Baskerville, Times New Roman
APm19
mrimea caracterelor
10 puncte

44
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
APm20
formatul bibliografic
(cri vechi) in-quarto, in-octavo, etc.
APm21
colaionarea
(cri vechi) patru caiete notate de la A la D
APm22
starea publicaiei
(priodic) mort sau viu
APm23
numerotarea
(priodic) volumul 1, numrul 1, ianuarie 1971
APm24
viteza de rotaie sau de defilare
(nregistrare sonor)
APm25
limea canelurii
(nregistrare sonor) nr canale/inch
APm26
tipul gravurii (direcia anurilor)
(nregistrare sonor) lateral, vertical
APm27
configuraia benzii
(nregistrare sonor) numrul de piste
APm28
tipul de redare sonor
(nregistrare sonor) mono/stereo/quadro-fonic
APm29
caracteristicile speciale ale redrii
(nregistrare sonor)
APm30
culoarea
(imagine)
APm31
raportul de reducie
(microform) 42x, de la 61x la 90x
APm32
polaritatea
(microform/imagine proiectat)
APm33
generaia
(microform/imagine proiectat)
APm34
formatul de prezentare
(imagine proiectat) wide screen, Beta, VHS,
APm35
configuraia necesar
(resurs electronic) hard, soft, periferice
APm36
caracteristicile fiierului
(resurs electronic) ASCII, SGML, etc.
APm37
modul de acces
(resurs electronique accesibil la distan)
APm38
adresa de acces (adresa URL)
(resurs electronique accesibil la distan)

Atributele entitii EPi := exemplar

Identificator Denumire atribut Comentariu
APi00


APi01
identificarea exemplarului
cot, numr de acces, cod debare, etc
APi02
amprenta
identificator, difereniaz exemplarele ntre ele
APi03
proveniena exemplarului
lista posesorilor/depozitarilor precedeni
APi04
adnotri/inscripionri
semnturi, note, etc. unice
APi05
participrile la expoziii
list de expoziii publice, data, locul
APi06
starea exemplarului
starea fizic i/sau de conservare
APi07
operaiile de prezervare efectuate
procedurile, operatiile, datele interveniilor
APi08
operaiile de prezervare de efectuat
procedurile, operatiile, datele interveniilor
APi09
restriciile de comunicare
orice limitare a accesului fizic la exemplar

Atributele entitii ERp := persoan

Identificator Denumire atribut Comentariu
ARp00


ARp01
numele
numele persoanei
ARp02
datele
datele persoanei
ARp03
titlul
titlul persoanei
ARp04
alt caracteristic asociat
alt calificativ al persoanei

Atributele entitii ERc := colectivitate

Identificator Denumire atribut Comentariu
ARc00


ARc01
numele
numele colectivitii
ARc02
numrul asociat
numerotare pentru colectivitate

45
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
ARc03
locul
localizarea colectivitii
ARc04
datele
datele asociate colectivitii
ARc05
alt caracteristic asociat
alt calificatif al colectivitii

Atributele entitii ESc := concept

Identificator Denumire atribut Comentariu
ASc00


ASc01
numele conceptului
termen care denumete conceptul

Atributele entitii ESo := obiect

Identificator Denumire atribut Comentariu
ASo00


AS001
numele obiectului
termen care denumete obiectul

Atributele entitii ESe := eveniment

Identificator Denumire atribut Comentariu
ASe00


ASe01
numele evenimentului
termen care denumete evenimentul

Atributele entitii ESp := loc

Identificator Denumire atribut Comentariu
ASp00


ASp01
numele locului
termen care denumete locul

3.2.2.4 Descrierea relaiilor

Relaii EPw EPw := lucrare lucrare

Identificator Nume relaie Descriere
PwPw08
Subiect
are drept subiect >> < este subiect al
PwPw09
ntreg/parte
are ca parte >> < este parte din
PwPw10
Succesor
are drept succesor >> < este succesor al
PwPw11
Supliment
are drept supliment >> < este supliment al
PwPw12
Complement
are drept complement >> < este complement al
PwPw13
Rezumat
are drept rezumat >> < este rezumat al
PwPw14
Adaptare
are drept adaptare >> < este adaptare a
PwPw15
Transformare
are drept transformare >> < este transformare a
PwPw16
Imitaie
are drept imitaie >> < este imitaie a

Relaii EPw EPe := lucrare expresie

Identificator Nume relaie Descriere
PwPe01
Realizare
este realizat prin >> < este realizare a
PwPe08
Subiect
are drept subiect >> < este subiect al
PwPe10
Succesor
are drept succesor >> < este succesor al

46
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
PwPe11
Supliment
are drept supliment >> < este supliment al
PwPe12
Complement
are drept complement >> < este complement al
PwPe13
Rezumat
are drept rezumat >> < este rezumat al
PwPe14
Adaptare
are drept adaptare >> < este adaptare a
PwPe15
Transformare
are drept transformare >> < este transformare a
PwPe16
Imitaie
are drept imitaie >> < este imitaie a

Relaii EPw EPm := lucrare manifestare

Identificator Nume relaie Descriere
PwPm08
Subiect
are drept subiect >> << este subiect al

Relaii EPw EPi := lucrare exemplar

Identificator Nume relaie Descriere
PwPi08
Subiect
are drept subiect >> << este subiect al

Relaii EPw ERp := lucrare persoan

Identificator Nume relaie Descriere
PwRp04
Creaie
creat de >> << este creator al
PwRp08
Subiect
are drept subiect >> << este subiect al

Relaii EPw ERc := lucrare colectivitate

Identificator Nume relaie Descriere
PwRc04
Creaie
creat de >> << este creator al
PwRc08
Subiect
are drept subiect >> << este subiect al

Relaii EPw ESc := lucrare concept

Identificator Nume relaie Descriere
PwSc08
Subiect
are drept subiect >> << este subiect al

Relaii EPw ESo := lucrare obiect

Identificator Nume relaie Descriere
PwSo08
Subiect
are drept subiect >> << este subiect al

Relaii EPw ESe := lucrare eveniment

Identificator Nume relaie Descriere
PwSe08
Subiect
are drept subiect >> << este subiect al

Relaii EPw ESp := lucrare loc

Identificator Nume relaie Descriere
PwSp08
Subiect
are drept subiect >> << este subiect al
Relaii EPe EPe := expresie expresie

47
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Identificator Nume relaie Descriere
PePe09
ntreg/parte
are ca parte >> < este parte din
PePe10
Succesor
are drept succesor >> < este succesor al
PePe11
Supliment
are drept supliment >> < este supliment al
PePe12
Complement
are drept complement >> < este complement al
PePe13
Rezumat
are drept rezumat >> < este rezumat al
PePe14
Adaptare
are drept adaptare >> < este adaptare a
PePe15
Transformare
are drept transformare >> < este transformare a
PePe16
Imitaie
are drept imitaie >> < este imitaie a
PePe17
Scurtare
are drept scurtare >> < este scurtare a
PePe18
Revizuire
are drept revizuire >> < este revizuire a
PePe19
Traducere
are drept traducere >> < este traducere a
PePe20
Aranjament
are drept aranjament >> < este aranjament al

Relaii EPe EPm := expresie manifestare

Identificator Nume relaie Descriere
PePm02
Materializare
este ncorporat n >> << ncorporeaz

Relaii EPe ERp := expresie persoan

Identificator Nume relaie Descriere
PeRp05
Realizare
realizat de >> << este realizator al

Relaii EPe ERc := expresie colectivitate

Identificator Nume relaie Descriere
PeRc05
Realizare
realizat de >> << este realizator al

Relaii EPm EPm := manifestare manifestare

Identificator Nume relaie Descriere
PmPm09
ntreg/parte
are ca parte >> < este parte din
PmPm21
Reproducere
are drept reproducere >> < este reproducere a
PmPm22
Alternativ
are drept alternativ >> < este alternativ a

Relaii EPm EPi := manifestare exemplar

Identificator Nume relaie Descriere
PmPi03
Reprezentare
este exemplificat prin >> < exemplific
PmPi21
Reproducere
are drept reproducere >> < este reproducere a

Relaii EPm ERp := manifestare persoan

Identificator Nume relaie Descriere
PmRp06
Producere
este produs de >> << este productor al

Relaii EPm ERc := manifestare colectivitate

48
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

Identificator Nume relaie Descriere
PmRc06
Producere
este produs de >> << este productor al

Relaii EPi EPi := exemplar exemplar

Identificator Nume relaie Descriere
PiPi09
ntreg/parte
are ca parte >> < este parte din
PiPi21
Reproducere
are drept reproducere >> < este reproducere a
PiPi23
Reconfigurare
are drept reconfigurare >> < este reconfigurare a

Relaii EPi ERp := exemplar persoan

Identificator Nume relaie Descriere
PiRp07
Posesie
este deinut de >> << deine

Relaii EPi ERc := exemplar colectivitate

Identificator Nume relaie Descriere
PiRc07
Posesie
este deinut de >> << deine


3.2.3 Cerinele bibliometrice

3.2.3.1 Indicatori bibliometrici
Cercettorii, ca autori, elaboreaz diverse tipuri de lucrri care conin rezultate
experimentale, teorii, recenzii etc.
Cea mai simpl metod pentru a msura productivitatea unui cercettor sau a unui grup
de cercetare este de a numra documentele publicate (publicrile) de un anumit autor sau de
un anumit grup dintr-un anumit interval de timp. Indicatorii destinai pentru a msura
productivitatea cercettorilor sau a grupurilor de cercetare sunt considerai indicatori
cantitativi [8].
Pentru a raporta constatrile lor la rezultate anterioare autorii citeaz alte lucrri. n mod
firesc un autor citeaz un anumit document dac:
a studiat acel document;
l consider relevant pentru lucrarea proprie;
l consider suficient de important pentru a-l cita n mod explicit.
Modalitatea actual de a msura impactul lucrrilor tiinifice se bazeaz pe numrul de
citri. Indicatorii care ajut la identificarea nivelului de calitate al lucrrilor unui cercettor
sau ale unui grup de cercetare i pot fi utilizai pentru a evalua impactul cercetrilor n
comunitatea tiinific sunt considerai indicatori de performan [8].
Descoperirile tiinifice i rezultatele cercetrii sunt publicate n reviste tiinifice sau pe
site-uri Web. nainte de publicare articolele tiinifice sunt, n general, supuse controlului unor
experi din domeniul respectiv (peer review). Dup publicare, rezultatele cercetrilor sunt
utilizate de ctre ali cercettori pentru studiile lor i citate ca referine n articolele ulterioare
ale acestora. Citarea articolelor utilizate este caracteristic publicaiilor tiinifice i este

49
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
general acceptat faptul c numrul de citri ale unui anumit articol este o reflectare a
impactului acesteia n comunitatea tiinific.
Citrile furnizeaz date care pot fi utilizate pentru a msura statistic i matematic
importana relativ a unui articol sau a unei publicaii precum i conectivitatea dintre domenii
tiinifice, dintre departamente de cercetare sau dintre autori.
Aplicarea de metode matematice i statistice de analiz a crillor, a articolelor i a altor
mijloace de comunicare, pentru a le msura cantitatea i performanele (de exemplu, calitatea)
este cunoscut n lumea tiinific sub numele de bibliometrie.
Ca sistem de msurare a performanelor produciilor tiinifice, bibliometria, exprimat
prin diferii indicatori, a devenit foarte important att pentru cercettori ct i pentru
organizaii.
Pentru cercettori, indicatorii bibliometrici sunt importani deoarece permit msurtori
obiective ale difuzrii i a impactului n comunitatea stiintific a articolelor publicate de o
anumit revist. Practic, aceti indicatori pot ajuta cercettorii n selectarea revistelor la care
s-i prezinte manuscrisele lor.
Pentru organizaii, indicatorii bibliometrici sunt importani deoarece permit msurtori
obiective privind calitatea unei anumite cercetri, unui cercettor individual sau a unui grup
de cercetare. Practic, aceti indicatori pot ajuta organizaiile s ia decizii privind angajarea,
promovarea i finanarea.
Mai mult dect att, indicatorii bibliometrici pot fi utlizai pentru a determina originea
geografic a cercetrilor i a detecta creterea sau eroziunea impactului tiinific la nivel de
ri. Ei pot fi folosii pentru a msura concentrarea cercetrilor i pentru a detecta alocarea
greit a resurselor de cercetare. Acetia pot fi de asemenea folosii pentru previziona
succesul cercetrii precum i fondurile de cercetare privind optimizarea politicii de cercetare.
Trei legi sunt frecvent utilizate n bibliometrie i anume legea productivitii tiinifice a
lui Lotka, legea dispersiei a lui Bradford i legea frecvenei cuvintelor a lui Zipf.
Legea lui Lotka descrie frecvena cu care public autorii dintr-un anumit domeniu: n
mulimea tuturor autorilor care public ntr-un anumit domeniu, A(c), procentul de autori
care public n articole este de 60 / n
2
.
Legea lui Bradford servete bibliotecarilor ca un ghid general n determinarea numrului
de reviste de baz din orice domeniu: dac (P(c)( reprezint numrul total de reviste din un
anumit domeniu c i (D(c)( reprezint numrul total de articole publicate n aceste reviste
atunci exist constantele n i q astfel nct cele (P(c)( reviste pot fi organizate n trei
grupuri, fiecare grup de publicaii publicnd cam acelai numr de articole, ~ (D(c)( / 3 i
(P(c)(~ (n q
0
) + (n q
1
) + (n q
2
).
Legea lui Zipf este utilizat pentru a prezice frecvena cuvintelor n cadrul unui text:
pentru un text destul de lung, dac se listeaz cuvintele n ordinea descresctoare a frecvenei
lor, rangul unui cuvnt din aceast list nmulit cu frecvena sa va fi egal cu o constant:
r f = k, unde:
r este rangul cuvntului, f este frecvena iar k este o constant, k ~ 26.500 (Potter 1988).




50
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.2.3.2 Indicatori bibliometrici de productivitate
Pentru entitile care fac obiectul analizelor bibliometrice sunt utilizate, n continuare,
urmtoarele notaii:
D mulimea documentelor (publicrilor), d e D;
A mulimea autorilor, a e A;
G mulimea grupurilor de cercetare (centre de cercetare, universiti, etc. la care
sunt eventual afiliai autorii) g e G;
P mulimea publicaiilor, p e P;
R mulimea responsabililor de ediii (editorilor), r e R;
E mulimea editurilor, e e E;
C mulimea domeniilor de cercetare c e C
S mulimea subiectelor, ca pri ale unui (sub)domeniu de cercetare, s e S;
x(y) entitate, din mulimea X, care conine pe y;
X(y) seciune a mulimii X definit de y, adic, toate entitile din mulimea X care
conin pe y;
X(Y)
yeY
X(y);
x(y, z) entitate din mulimea X, care conine i pe y i pe z
X(y, z) submulimea entitilor din X(y) care conin pe z. X(y, z) = X(y) X(z)
Definiia 9. Indicele de publicare al unui document d, este o valoare scalar, t(d, x'), care
descrie faptul c una sau mai multe entiti x' e X'(d), X'(d) c X au contribuit n mod specific
la publicarea documentului d e D:
1 dac x' e X'(d)
t(d, x') =
{
0 n caz contrar
Definiia 10. Indicele de cotare al unei publicaii p este o valoare scalar, (p, k'), care
descrie faptul c publicaia p satisface un anumit criteriu de selecie k' (ISI, top journal .a.):
1 dac p satisface criteriul k'
(p, k') =
{
0 n caz contrar
Definiia 11. Indicele de cotare al unui document: (d, k') = (p, k') unde t(d, p) = 1.
Definiia 12. Funcia de publicare este o funcie H(x, -) : N
+
, unde H(x, t) este o
valoare scalar care reprezint numrul tuturor publicrilor produse de entitatea analizat, x,

nainte de momentul t.
O variant, simpl i calculabil, de definire a funciei de publicare pentru entitatea
analizat x i intervalul de timp analizat T = [0, t-1] este:
H(x, t) = E
deD(x, T)
t(d, x), unde
D(x, T) = { d |d e D(x), t(d) e T }.

51
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Tabelul de mai jos conine majoritatea indicatorilor bibliometrici de productivitate
specificai n literatura de specialitate [8, 31, 39]:

1.1 numrul total de publicri produse de entitatea analizat, x, n intervalul de timp
analizat T = [t', t]:
P H(x, T) = E
deD(x, T)
t(d, x).
1.2 numrul de publicri avnd co-autori dintr-o alt entitate x' produse de entitatea
analizat x n intervalul de timp analizat T = [t', t]:
P
x'
= E
a'eA(x')
E
deD(x, T)
t(d, x) t(d, a').
1.3 co-authoring ponderea publicrilor avnd co-autori dintr-o alt entitate, se obine
mprind numrul de publicri cu co-autori dintr-o entitate selectat x', la numrul total de
publicri produse de unitatea analizat x n intervalul de timp analizat T = [t', t]:
p
x'
= P
x'
/ H(x, T).
Acest indicator este utilizat pentru a arta n ce msur o entitate analizat coopereaz cu
alte entiti n producerea de articole:
colaborare internaional ponderea publicrilor cu co-autori de la organizaii din cel
puin dou ri diferite;
colaborare naional ponderea publicrilor cu co-autori de la cel puin dou
organizaii din aceeai ar;
colaborare departamental ponderea publicrilor cu co-autori de la cel puin dou
departamente din cadrul aceleiai organizaii;
colaborare organizaional ponderea publicrilor cu co-autori din dou sau mai
multe uniti de cercetare.
1.4 number of publications in Thomson ISI indices numrul total de publicri, cotate
ISI, produse de unitatea analizat x n intervalul de timp analizat T = [t', t]:
P
ISI
= E
deD(x, T)
t(d, x) (d, ISI).
1.5 number of publications in top journals numrul de publicri, n intervalul de timp
analizat T = [t', t], ale unitii analizate n publicaii selectate cu un criteriu adecvat:
P
TJ
= E
deD(x, T)
t(d, x) (d, TJ).
1.6 CEST field-based world share of publications ponderea publicrilor H(x, c, T), din
intervalul de timp analizat T = [0, t-1] produse de entitatea analizat x n fiecare domeniu c e
C(x) n care entitatea este activ, n totalul publicrilor din domeniul respectiv H (c, T):
p
w
= 1000 (E
ceC(x)
H(x, c, T) H(c, T)) / (E
ceC(x)
H(c, T)), unde
H(x, c, T) = E
deD(c, T)
t(d, x);
H(c, T) = E
deD(c, T)
t(d, c)
1.7 CEST degree of specialization gradul de specializare al unei unei entiti analizate x
pe intervalul de timp analizat T = [0, t-1]:
DS = ( E
c eC
) / (
c
(C((100)
2
), unde:

c
= 100R
c
-100 ;
R
c
= ( H(x, c, T) / E
ceC
H(x, c, T) ) / ( H(c, T) / E
ceC
H(c, T));

52
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
c e C i(C(= 107, numrul de domenii pentru publicaiile cotate ISI.
Gradul de specializare al unei entiti analizate este un indicator structural bazat pe
numrul de domenii de cercetare n care entitatea analizat este activ i pe numrul de
publicri produse n fiecare din ele.
Gradul de specializare global este prin definiie 0. O entitate foarte specializat poate avea
un grad maxim de specializare 1. ntre aceste dou extreme exist 5 clase:
grad foarte redus de specializare : DS < 0,2 ;
grad redus de specializare : 0,2 DS < 0,4 ;
grad mediu de specializare : 0,4 DS < 0,6 ;
grad nalt de specializare : 0,6 DS < 0,8 ;
grad foarte ridicat de specializare : DS 0,8.
1.8 CEST relative activity index indicatorul de activitate relativ descrie faptul c
entitatea analizat x este mai mult sau mai puin activ n domeniile de cercetare alese n
raport cu restul lumii; valorile sunt normalizate ntr-un interval de la 0 la 200 n care 100
reprezint media mondial:
RAI = 100 + 100 *( (R
c
2
1) / ( R
c
2
+1) ), unde
R
c
= ( H(x, c, T) / E
ceC
H(x, c, T) ) / ( H(c, T) / E
ceC
H(c, T) ).

Tabelul 7. Indicatori bibliometrici de productivitate

3.2.3.3 Indicatori bibliometrici de performan
Definiia 13. Indicele de impact este o valoare scalar, (d, d') e {0, 1}, care descrie
faptul c un anumit document d e D a fost citat ntr-un un alt document d'
,
d'

e D, d'

= d :
1 dac pentru d exist o referin n d'


(d, ) =
{
0 n caz contrar
Dac documentele d' = d citeaz amndou un anumit document se spune c sunt
cuplate bibliografic chiar dac ele nu se citeaz direct unul pe altul. Cu ct citeaz mpreun
mai multe documente, cu att relaia lor este mai puternic.
Definiia 14. Indicele de cuplare bibliografic a dou documente, d' = d, este o valoare
scalar, (d', d) e N, care descrie faptul c articolele d' i d citeaz amndou documentul
e D :
(d', d) = ((, unde = { e D (, d' ) = 1 . (, d ) = 1} sau
(d', d) = E
deD
(d, d' ) (d, d ).
Dac dou documente d' = d sunt citate mpreun de ctre un anumit document se
spune c sunt cuplate prin co-citare chiar dac acestea nu se citeaz direct ntre ele. Cu ct
sunt citate mpreun de mai multe documente cu att relaia lor este mai puternic. Cuplarea
co-citrilor este o metod utilizat pentru a stabili o similitudine de subiect ntre dou
documente.

53
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

54
Definiia 15. Indicele de cuplare prin co-citare a dou documente, d' = d, este o valoare
scalar, w(d', d) e N, care descrie faptul c articolele d' i d sunt citate mpreun de
articolele e _ D :
w(d', d) ((, unde = { e D ( (d', ) = 1 ) . ( (d , ) = 1 )} sau
w(d', d) = E
deD
(d', d) (d, d).
n marea majoritate a cazurilor, autorii documentelor extrem de citate au avut un impact
major n domeniul lor de cercetare, dar exist i multe situaii n care numrul mare de citri
nu susine un autor relevant. Din cauza practicilor de inginerie a citrilor, rspndite n
publicare, autocitri, co-autori, cluburi de citare i alte tehnici pentru a obine rezultate
umflate, astfel de citri devin evident mai puin relevante. O soluie menit s diminueze
erorile din sistemul actual poate fi obinut prin definirea unei msuri a impactului lucrrilor
tiinifice bazat att pe credibilitatea documentului care citeaz ct i pe relevana citrii
respective.
Definiia 16. Indicele de notorietate al unei entiti analizate, x, este un scor c(x) ataat
lui x de ctre experi, membri ai unor centre recunoscute ca autoriti tiinifice.
Indicele de notorietate este o msur a competenei ntr-un anumit (sub)domeniu de
cercetare definit de (sau care include) un anumit subiect de interes. Indicele de notorietate este
n funcie de anumite opinii personale deci este o msur subiectiv a competenei.
Atribuirea scorurilor se bazeaz pe informaii obinute prin:
interviuri/sondaje ale unor experi;
analiza unor bibliografii;
pentru entitile care nu au nici o referire n interviuri, sondaje sau bibliografii scorul
atribuit implicit este zero.
Scorurile sunt nregistrate n liste de notorietate cu clasificri ale autorilor, publicaiilor,
centrelor de cercetare, editurilor i documentelor. Entitile fr nici o referire n interviuri,
sondaje sau bibliografii nu sunt nregistrate n listele de notorietate.
n ceea ce privete documentele, de regul, un document izolat d nu are ataat un indice de
notorietate c(d), nregistrarea unui document ntr-un nomenclator de notorietate a
documentelor este o excepie. Listele de documente de notorietate conin exclusiv nregistrri
pentru texte care aparin unui stoc de documente de baz respectiv documente eseniale i
de actualitate pentru un anumit domeniu de cercetare.
Definiia 17. Indicele de ncredere al unui document d este un indice c(d), care depinde de
toi sau de o parte a indicilor de notorietate ataai entitilor care sunt n relaie cu acel
document, respectiv autorul, editura, publicaia sau grupul la care este afiliat autorul:
c(d) = |( c(A(d)), c(E(d)), c(P(d)), c(G(A(d))) ).
O variant simpl, dar evaluabil, de definire a indicelui de ncredere pentru un document
d este:
c (d) = ( w c(A(d))+ w c(E(d))+ w c(P(d)) + w c(G(A(d))) ) / , unde
A E P G

w
A
+ w
E
+ w
P
+ w
G
=1; w
A
, w
E
, w
P
, w
G
0;
= c(A(d))+ c(E(d))+ c(P(d)) + c(G(A(d))).
c(d) este un indice priori, care descrie un document d n momentul publicrii, nainte de
a se obine informaii despre referinele la d.
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Definiia 18. Indicele de relevan al unei citri este o valoare scalar, (d, ) 0, care
descrie ct de relevant poate fi considerat citarea documentului d e D de ctre documentul
d' e D:
> 0 dac d este citat n d'
(d, )
{
= 0 n caz contrar
O formul simpl, dar evaluabil, pentru indicele de relevan al unei citri este:
(d, d') = M / (m + M), unde:
d e D(a), d'e D(a'), M = max{(a, a'), (a', a)} i m = min{ (a, a'), (a', a)}.
Observaii. (d, ) e [0.5, 1.0]; m numr de citri reciproce (a a') sau numr de
autocitri (a = a').
2.1 numrul total de citri ale unui anumit document, d e D:
(d) (d, D) = E
d'eD
(d, )
2.2 numrul de citri ale unui document, d e D, de ctre un autor, a' e A:
(d, a') (d, D(a')) = E
eD(a')
(d, )
2.3 numrul total de citri ale unui autor, a e A:
(a) (D(a), D) = E
deD(a)
E
eD
(d, )
2.4 numrul de citri ale unui autor a e A de ctre alt autor a' e A:
(a, a') (D(a), D(a')) = E
deD(a)
E
eD(a')
(d, )
2.5 numrul de citri ale unui document, d e D, de ctre o publicaie, p' e P:
(d, p') (d, D(p')) = E
d'eD(p')
(d, )
2.6 numrul de citri ale unei publicaii, p e P de ctre o alt publicaie, p' e P:
(p, p') (D(p), D(p')) = E
deD(p)
E
eD(p')
(d, d')
2.7 numrul total de citri ale unei publicaii, p e P:
(p) (D(p), D) = E
deD(p)
E
d'eD
(d, d')
2.8 numrul total de citri primite de entitatea analizat, x, n intervalul de timp
analizat, T:
(x, T) (D(x), D(T)) = E
deD(x)
E
d'eD(T)
(d, d')
2.9 numrul de citri primite de o entitate analizat, x, de la o entitate selectat, x', n
intervalul de timp analizat, T:
(x, x', T) (D(x), D(x', T)) = E
deD(x)
E
d'eD(x', T)
(d, d')
2.10 Hirsch index (h-index) indicele Hirsch [14] reprezint numrul de publicri
produse de entitatea analizat x n perioada de timp analizat T care au cel puin h citri,
H
h
(x,T) c H(x,T). Articolele publicate de entitatea analizat sunt sortate n ordinea
descresctoare a numrului de citri, se numr articolele ncepnd din partea superioar a
listei i atunci cnd numrul curent al unui articol depete numrul de citri al acelui articol,
numrul curent al articolului precedent este luat n considerare ca h-index.
h h-index(x,T) = i, unde:

55
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

56
[ i s (d'
i
) ] . [ i +1 > (d'
i +1
) ]; d'
i
e D'(x, T) i
D'(x, T) = { d'
i
( d'
i
e D(x,T), (d'
i +1
) (d'
i
), ()i e [1, H(x,T) 1] }.

2.11 cited half-life funcia de njumtire a numrului de citri ale unei publicaii p,
este o funcie H
l
(p, -) : P 9
+
unde H
l
(p, t) este o valoare scalar care reprezint intervalul
de timp (numrul de ani), anterior anului t, care acoper jumtate din totalul citrilor primite
de publicaia p n anul t (38). Documentele d'
i
care citeaz publicrile D(p, t) din anul t
produse de publicaia analizat p, sunt numrate i sortate dup data apariiei t(d'
i
) n ordine
descresctoare. Valoarea funciei se obine scaznd din t anul apariiei documentului avnd
indicele egal cu jumtate din numrul total de documente care citeaz publicaia p:
H
l
(p, t) = t t(d

'), unde :
= [(D'(p, t)( / 2] ;
D'(p, t) = {d'
i
d'
i
e D, t(d'
i
) > t(d'
i+1
), (d, d'
i
) = 1, d e D(p, t) }
Funcia de njumtire a citrilor nu reflect valoarea tiinific a unei anumite publicaii
(40) ea poate da informaii cu privire la politica editorial sau domeniul de cercetare o
valoare mic poate reflecta o politic editorial care pune accent pe contientizarea actual
sau pe rapida evoluie a domeniului de cercetare, n timp ce o valoare mare poate reflecta fie
accentul pe literatura de arhiv fie o evoluie lent a domeniului (23). n practic, funcia de
njumtire a citrilor poate fi utilizat pentru ajustarea politicilor editoriale sau intrarea pe
noi segmente de cercetare.
2.12 self citedness - ponderea autocitrilor, n cazul n care autorii din entitatea analizat
x i citeaz propriile publicri.
Se calculeaz (x, T) numrul total de citri pentru toate publicrile entitii analizate x n
intervalul de timp analizat T. Se verific de unde provin citrile i se calculeaz numrul de
citri provenind de la entitatea analizat
x
(x, T). Se mparte al doilea numr cu primul pentru
a obine ponderea autocitrilor:
c
s
=
x
(x, T) / (x, T) , unde:

x
(x, T) (D(x), D(x, T)) = E
deD(x)
E
d'eD(x, T)
(d, d')
(x, T) (D(x), D(T)) = E
deD(x)
E
d'eD(T)
(d, )
2.13 uncitedness - ponderea publicrilor necitate ale unei entiti analizate x dup o
anumit perioad de timp T.
Autocitrile sunt eliminate: ( (d, d' e D(x, a)) . ((d, d') = 1) ) (d, d') = 0
Se determin numrul de publicri care nu au fost citate n perioada de timp T i se
mparte cu numrul total de publicri ale entitii analizate din aceeai perioad de timp:
p
n
= (D
0
(x,T)( / H(x,T), unde
D
0
(x,T) = {d(d e D(x,T), (d) = 0};
(D
0
(x,T)(= E
deD(x, T)
E
d'eD
(-1)( (d, d') 1), numrul de publicri necitate ale lui x
n perioada T;
H(x,T) = E
deD(x, T)
t(d, x) = numrul total de publicri ale lui x n perioada T.

Tabelul 8. Indicatori bibliometrici de performan (1)
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Definiia 19. Funcia de impact a unui document d este o funcie I(d, -) : N
+
, unde
I(d, t) este o valoare scalar care descrie impactul tuturor referinelor la d

nainte de
momentul (anul) t.
I(d, t), valoarea funciei de impact a lui d la momentul t, depinde de:
numrul (d)

de citri ale documentului d n intervalul de timp T = [t(d), t-1] unde t(d)
este anul publicrii documentului d;
indicii c(d') i o(d,

d') care descriu credibilitatea documentelor d' care citeaz pe d i
respectiv relevana acestor citri.
O variant simpl, dar calculabil, de definire a funciei de impact a unui document
analizat d e D este:
I(d, t) = E
d'eD'(T)
(d, d'), unde:
T = [t(d), t-1] este intervalul de timp analizat;
sumarea se face pentru toate documentele d' care conin o referin la d i au fost
publicate n intervalul de timp T, t(d') e T.
Definiia 20. Funcia de impact a unei mulimi de documente, , este o funcie I(, -) : N

+
, unde I(, t) este o valoare scalar care descrie impactul tuturor referinelor la
documentele e nainte de momentul (anul) t:
I(, t) = E
e
I(, t), unde
I(, t) este valoarea funciei de impact a documentului la momentul t;
Definiia 21. Funcia de impact a unui autor este o funcie I(a, -) : N
+
, unde I(a, t)
este o valoare scalar care descrie impactul tuturor documentelor publicate de autorul a

nainte de momentul (anul) t:
I(a, t) = E
deD(a)
I(d, t), unde
I(d, t) este valoarea funciei de impact a documentului d la momentul t;
D(a) este mulimea tuturor documentelor d publicate de autorul a nainte de momentul
t, t(d) s t-1.
Definiia 22. Funcia de impact a unei publicaii, p, este o funcie I (p, -) : N
+
, unde
I (p, t) este o valoare scalar care descrie impactul din momentul t al tuturor documentelor
publicate nainte de momentul (anul) t, n publicaia p:
I(p, t) = E
deD(p)
I(d, t), unde
I(d, t) este valoarea functiei de impact a documentului d la momentul t;
sumarea se face pentru toate documentele d publicate de publicaia p nainte de
momentul t, t(d) s t-1.
Definiia 23. Funcia de impact a unui domeniu de cercetare, c, este o funcie I(c, -) : N

+
, unde I(c, t) este o valoare scalar care descrie impactul din momentul t al tuturor
documentelor publicate nainte de momentul t n toate publicaiile din domeniul c, p e P(c)

.
I(c, t) = E
peP(c)
I(p, t), unde:
I(p, t) este valoarea functiei de impact a publicaiei p la momentul t;

57
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
sumarea se face pentru toate publicaiile p e P(c).
Definiia 24. Funcia de impact a unei entiti pentru o fereastr de citare de n ani este
este o funcie I
n
(x, -) : N
+
, unde I
n
(x, t) este o valoare scalar care descrie impactul din
momentul t al tuturor documentelor publicate de entitatea analizat x

ntr-un interval de timp
analizat T = [t-n, t-1]:
I
n
(x, t) = E
deD(x, T)
I(d, t), unde
I(d, t) este valoarea funciei de impact a documentului d la momentul t;
sumarea se face pentru toate documentele d publicate de entitatea x n intervalul de
timp analizat, t(d) e T .
Definiia 25. Factorul de impact al unei entiti analizate x pentru o fereastr de citare de
n ani, este:
IF
n
(x) = I
n
(x, t) / H(x, T), unde
T = [t-n, t-1] este intervalul de timp analizat (fereastra de citare);
I
n
(x, t) = valoarea la momentul t a funciei de impact a entitii x pentru perioada T ;
H(x, T) = numrul total de documente publicate de entitatea x n aceeai perioad.

2.14 Journal Impact Factor (IF) factorul de impact al unei publicaii, pentru o fereast
de citare de 2 ani este:
IF = IF
2
(p) = I
2
(p, t) / H(p, T), unde:
I
2
(p, t) este valoarea functiei de impact a publicaiei p la momentul t, pentru n = 2;
H(p, T) reprezint numrul total de documente publicate de publicatia p n intervalul
de timp T = [t-2, t-1].
2.15 5-year journal IF factorul de impact al unei publicaii, pentru o fereast de citare
de 5 ani, este:
IF
5
(p) = I
5
(p, t) / H(p, T), unde
I
5
(p, t) este valoarea functiei de impact a publicaiei p la momentul t, pentru n = 5;
H(p, T) reprezint numrul total de documente publicate de publicatia p n intervalul
de timp analizat, T = [t-5, t-1].
2.16 Immediacy Index (II) factorul de impact imediat (pentru o fereastr de citare de 0
ani) al unei publicaii p, msoar importana actual a documentelor publicate de p:
II(p) = I
0
(p, t) / H(p, T), unde
I
0
(p, t) este valoarea funciei de impact a publicaiei p n momentul (anul) t, n = 0;
H(p, T) reprezint numrul total de documente publicate de p n acelai an T = t.
2.17 Journal-to-Field Impact Score (JFIS) factorul de impact publicaie-domeniu
msoar numrul mediu citri per document, pe o perioada de 5 ani, pentru o anumit
publicaie p i compar acest numr cu cel al tuturor publicaiilor din acelai domeniu de
cercetare c :
JFIS(c, p) = IF
5
(p) / IF
5
(c).

58
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

59
2.18 CWTS field normalized citation score (crown indicator) indicatorul coroan,
msoar impactul tiinific al unui cercettor sau a unui grup de cercetare (14) i se calculeaz
prin mprirea sumei numerelor de citri primite de publicrile d produse de entitatea
analizat x n intervalul de timp analizat T n domeniul de cercetare c, la suma mediilor
citrilor documentelor d' de acelai tip , din acelai an t e T i publicate n reviste p din
acelai domeniu c:
CI(x, c) = [E
d(c)eH(x,T)
(d(c)] / [E
d(c)eH(x,T)
(E
d'eD'(d(c))
(d') /(D'(d(c))()], unde:
D'(d(c)) = {d' e D ([(d') = (d)] . [t(d') = t(d)] . [c(d') = c(d)]}, ()d(c)eH(x, T).
(d) e {review article, technical report, original research article, case report, pictorial
essays}.

Tabelul 8. Indicatori bibliometrici de performan (2)

Definiia 26. Vectorul de influen al publicaiilor [38] dintr-un set dat P
S
= {p
s
}
s=1S
de
publicaii surs, este vectorul propriu lider (corespuztor celei mai mari valori proprii), p*, al
matricii unde:
= ' + (1 - ) v e
T
este matricea asociat, conform abordrii PageRank, setului P
S
.
vectorul v este un vector cu S componente v
s
= H(s, T) / E
S
s=1
H(s, T) reprezentnd
raportul dintre numrul total de publicri produse de publicaia s e S i numrul total
de publicri produse de toate cele S publicaii surs pentru o fereastr de citare de cinci
ani, T = [t-5, t-1]. Vectorul v este normalizat, suma componentelor fiind 1.
e
T
este vectorul linie 1 i deci matricea = v e
T
este o matrice cu coloane identice
fiecare egal cu vectorul v.
matricea ' = [']
ij
(h'
ij
) este obinut din matricea prin nlocuirea, cu vectorul v,
a coloanelor cu toate elementele nule (noduri suspendate, cazul publicaiilor care nu
citeaz nici o alt publicaie);
matricea = []
ij
(h
ij
), obinut prin normalizarea matricii : h
ij
= z
ij
/ E
k
z
kj

matricea = []
ij
(z
ij
) are elementele:
(i, j) pentru i = j
z
ij
=
{
0 pentru i = j
In matricea sunt omise autocitrile (fcnd 0 toate elementele de pe diagonal).
(i, j) = numrul de citri (de la documentele) din publicaia j la (documentele din)
publicaia i, n intervalul de timp T = [t-5, t-1]; i, j = 1 S
(i, j) (D(i, T), D(j, T)) = E
deD(i,T)
E
d'eD(j,T)
(d, d')
Componentele vectorului p* sunt folosite n ponderarea valorilor de citare.


Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

60

2.19 eigenfactor scor scorul vectorului propriu [38] al publicaiei s, EF , este
s
definit ca
procent din totalul de citate ponderate pe care publicaia s le primete de la cele S publicaii
surs. Vectorul de scoruri Eigenfactor este:
EF = 100 p* / E
s
[p*]
s
2.20 article influence score scorul de influen al documentelor [38] din publicaia s ,
AI
s
, este o msur a influenei citrilor per document ale publicaiei s. Scorul de influen al
documentelor din publicaia s este:
AI
s
= 0,01 EF
s
/ v
s
, unde
EF
s
[EF]
s
este scorul Eigenfactor al publicaiei s i v
s
[v]
s
este a s-a component a
vectorului v.



Tabelul 8. Indicatori bibliometrici de performan (3)

Definiia 27. Indicele de notorietate al unei mulimi de entiti analizate, X, este o valoare
scalar (X) care depinde de toi sau de o parte a indicilor de notorietate c(x) ataai entitilor
din X.
Exemplul 1. Indicele de notorietate al unei mulimi de documente X este un indice (X)
care depinde de indicii de notorietate ai editurilor i/sau publicaiilor pentru fiecare d e X. n
mod obinuit X = D(x) unde entitatea analizat x poate fi un autor a, un grup de cercetare g, o
publicaie p sau o editur e:
(X) (D(x)) = | ( {(c(E(d)), c(P(d))) | d e D(x)} )
O variant simpl, dar calculabil, a definiiei este:
(D(x)) = E
deD( x)
( w (c(E(d)) + w c(P(d) ), unde
E P

w
E
+ w
P
= 1; w
E
, w
P
0.
Exemplul 2. Indicele de notorietate al unui autor a este un indice (a
3
) care depinde de a
i de afilierea acestuia, G(a).
O variant simpl, dar evaluabil a definiiei este:
(a) = w
A
c(a) + w
G
c(G(a)), unde
w
A
+ w
G
= 1; w
A
, w
G
0.
Definiia 28. Indicele de notorietate-impact al unei mulimi de documente X, este un
indicator I(X) care depinde de indicele de notorietate (X) i de valoarea funciei de impact
I(X, t), n anul de referin t.
Cea mai simpl form de definiie calculabil este:
I(X):= w
1
(X) + w
2
I(X, t), unde
w
1
+ w
2
= 1; w
1
, w
2
0.
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.2.3.4 Comentarii:
Indicatorii de performan se bazeaz pe ipoteza c frecvena citrilor unui articol de
ctre alte articole reflect calitatea acelui articol.
Indicatorii ofer doar o imagine parial i prtinitoare a anumitor aspecte ale vieii
tiinifice, fr acoperirea ansamblului. Acetia trebuie s fie completai i/sau
corectai de experii din domeniul tiinei i, de asemenea, interpretai dac sunt
utilizai n scopul unei evaluri sau luri de decizii.
Se recomand utilizarea literaturii bibliometrice pentru a identifica ct mai precis
semnificaia real a indicatorilor i prtinirile lor.
Msurarea calitii i impactului revistelor tiinifice, a grupurilor de cercetare sau a
cercettorilor individuali este recomandabil s fie fcut prin intermediul mai multor
indicatori i nu doar prin unul singur.
Avnd n vedere diferenele semnificative dintre domeniile de cercetare n ceea ce
privete productivitatea, obiceiurile de citare i dinamica citrilor, se recomand ca
indicatorii bibliometrici s nu fie utilizai pentru a compara cercettori, grupuri de
cercetare sau reviste din domenii diferite.
Deoarece s-a constatat c n analiza citrilor erorile de msurare sunt foarte importante
se recomand cu trie multiplicarea surselor, analiza critic a rezultatelor cu
implicarea experilor din domeniu i, de asemenea, o atenie deosebit la ordinele de
mrime al indicatorilor.
Indicatorii numerici sunt foarte uor manipulabili de ctre persoane fizice, instituii i
alte pri interesate din viaa tiinific (cum ar fi revistele). Numrul manipulrilor
crete i poate fi corelat cu efectul influenei crescnde a indicatorilor.
Utilizarea indicatorilor bazai pe analiza citrilor nu este favorabil asumrii de riscuri
tiinifice i inovrii. O utilizare abuziv a acestora sau, mai ru, automat ar fi un
obstacol major n calea inovrii.

3.3 Reconcilierea cu sursele de date

3.3.1 Sursele de date

Pentru depozitul de date al unui sistem suport pentru decizii de bibliotec principalele
surse de date pot fi:
Bazele de date operaionale ale bibliotecii ;
Bazele de date bibliografice, respectiv cataloagele on-line de bibliotec ;
Biblioteci digitale precum Europeana, WDL .a.
Publicaii i baze de date internaionale, on-line, pentru documentare precum Science
Direct, SpringerLink, Wiley Blackwell, Taylor and Francis, DOAJ, etc.;
Baze de date bibliometrice precum ISI Web of Science (Thomson Reuters) , Scopus
(Elsevier), Google Scholar (Google), .a.
Reconcilierea cerinelor informaionale privind descrierile bibliografice cu sursele de date
se realizeaz prin maparea informaiilor existente n sursele de date pe informaiile
considerate necesare n modelul FRBR descris anterior. n raport cu cerinele respective

61
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
sursele de date ofer mult mai puine informaii obinndu-se practic un fel de surogate ale
descrierilor bibliografice dup cum se poate vedea n exemplele urmtoare.
Exemplul 1. Descrierea bibliografica a unei publicaii (revist)

FRBR Surse de date Informaia bibliografic
APw01 titlu-pub
Acta Electrotechnica et Informatica
APe10 context-pub

APw02 forma-pub
J (journal)
APe02 tip-pub
E; P (versiune Electronica si/sau Printata)
APm14 id-int-pub
[EISSN: 13383957; ISSN: 13358243]
APw03 data-pub
2011 (start year)
APe15 frecvena-pub
T (trimestrial)
APm04 ara
SL (Slovakia)
APe04 limba-pub
ENG (english)
APw06 domeniu-pub
[Computer Science]
ASc01 subiect-pub
[electrical engineering, electronics and microelectronics, computer science,
information technology, information systems] (keywords)
APe08 volum-doc
(nr. pag.)
APe09 coninut-pub
C (Cuprins / Full text)
APm02 editor-pub
[id-rsp (Faculty of Electrical Engineering and Informatics, Technical University
of Koice, Slovakia) ]
APm05 editur-pub
id-edt (Versita Open ; Versita Ltd, 78 York Street, London W1H 1DP, Great
Britain,Tel: +44 (0) 20 7692 4902, info@versita.com )
APm03 ediie-pub
1
APm08 colecie-pub
Versita Emerging Science Publishers
APm13 format-pub
A4
APm15 furnizor-pub
Versita Open
APm16 cost-pub
0
APm17 restricii-pub
open access
APm22 stare-pub
A (activ)
APm23 nrotare-pub
Volume 11 (2011), Issue 1(mar 2011)
APm35 config-pub
Adobe
APm36 fiier-pub
pdf
Apm37 acces-pub
on-line
APm38 adrURL-pub
http://versita.com/aei/

Tabelul 9. Descrierea bibliografic a unei reviste

Exemplul 2. Descrierea bibliografica a unei publicaii (proceedings)

FRBR Surse de date Informaia bibliografic
APw01 titlu-pub Proceedings 2003 VLDB Conference
APe10 context-pub 29 th International Conference on Very Large Databases, Berlin, 9-12 sept, 2003
APw02 forma-pub P (proceedings)
APe02 tip-pub E; (electronic version)
APm14 id-int-pub ISBN: 978-0-12-722442-8
APw03 data-pub 2003
APe15 frecvena-pub
APm04 ara GER (Germany)
APe04 limba-pub ENG (english)
APw06 domeniu-pub Databases

62
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
ASc01 subiect-pub [very large databases] (keywords)
APe08 volum-doc 345 (pagini)
APe09 coninut-pub [Keynotes, Ten-Year Best Paper Award, Research Sessions, Industrial Sessions,
Panels, Demo Sessions, Tutorials] (capitole)
APm02 editor-pub Johann-Christoph Freytag, Peter Lockemann, Serge Abiteboul, Michael Carey,
Patricia Selinger; Andreas Heuer (editors)
APm05 editur-pub Elsevier Inc (publisher)
APm03 ediie-pub I
APm08 colecie-pub
APm13 format-pub A4
APm15 furnizor-pub
APm16 cost-pub
APm17 restricii-pub organization's agreement with publisher
APm22 stare-pub A (activ)
APm23 notare-pub
APm35 config-pub Adobe
APm36 fiier-pub PDF
Apm37 acces-pub on-line
APm38 adrURL-pub http://www.sciencedirect.com/science/book/9780127224428

Tabelul 10. Descrierea bibliografic a unui proceedings.

Exemplul 3. Descrierea bibliografica a unei publicaii (monografie)

FRBR Surse de date Informaia bibliografic
APw01 titlu-pub Handbook on Decision Support Systems V1: Basic Themes V2: Variations
APe10 context-pub
APw02 forma-pub M (monografie)
APe02 tip-pub E; P (electronic version: eBook, print version: Hardcover)
APm14 id-int-pub ISBN: 978-3-540-48712-8; eISBN: 978-3-540-48713-5
APw03 data-pub 2008
APe15 frecvena-pub
APm04 ara GER (Germany)
APe04 limba-pub ENG (english)
APw06 domeniu-pub [Operations Research ; Decision Theory]
ASc01 subiect-pub [Decision Support Systems] (keywords)
APe08 volum-doc 854; 800 (pagini)
APe09 coninut-pub [V1: Foundations of DSS, 1-8; DSS Fundamentals, 9-16; Multiparticipant DSS, 17-
23; Intelligent DSS, 24-31; Effects of computer based DS, 32-36]
[V2: Time and space issue for DS, 37- 42; Scope of DS, 43- 48; Developing and
managing DSS, 49- 53; DS cases and applications, 54- 63; DS horizons: 64-71]
(parts and chapters)
APm02 editor-pub [Burstein, Frada; Holsapple, Clyde W.] (editors)
Professor Frada Burstein, Center for Organizational and Social Informatics, Faculty
of Information Technology, Monash University P.O. Box 197 Caulfield East, 3145,
Victoria, Australia, Frada.Burstein@infotech.monash.edu.au
Professor Clyde W. Holsapple, Gatton College of Business and Economics,
University of Kentucky, 425B, Gatton Building, Lexington KY 40506-0034, USA,
cwhols@uky.edu
APm05 editur-pub Springer-Verlag Berlin Heildelberg (publisher)
APm03 ediie-pub I
APm08 colecie-pub International Handbooks on Information Systems (Series)
APm13 format-pub A4
APm15 furnizor-pub Springer
APm16 cost-pub V1 eBook 189,99 (gross) price ISBN 978-3-540-48713-5 PDF
Hardcover 106,95 (gross) price ISBN 978-3-540-48712-8
APm17 restricii-pub organization's agreement with publisher

63
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
APm22 stare-pub
APm23 notare-pub
APm35 config-pub Adobe
APm36 fiier-pub PDF
Apm37 acces-pub on-line
APm38 adrURL-pub http://www.springer.com/978-3-540-48712-8

Tabelul 11. Descrierea bibliografic a unei monografii

Exemplul 4. Descrierea bibliografic a unei publicaii (monografie, OPAC)

FRBR Surse de date Informaia bibliografic
Apm37 Cota II 924314
Apm02 Autor Filip, Florin Gheorghe
Apw01 Titlul Sisteme suport pentru decizii
Apm02 Respons. primar acad. Florin Gheorghe Filip
Apm04 Localitate Bucureti
Apm05 Editur Editura Tehnic
Apw03 An 2007
APe08 Descriere fizic 364 p. : il. ; 24 cm
Apm08 Serie Tehnologia informaiei
APe04 Limba rum
Apm04 ara de publicare RO
APe09 Bibliografie p. 320-346
Apm14 ISBN/Pre 978-973-31-2308-8
Apm08 Titlul seriei Tehnologia informaiei
APe09 Subiect termen nec. Tehnologia informaiei
Sistem informaional
Sistem suport
Informatic
Management


Tabelul 12. Descrierea bibliografic a unei monografii, format UNIMARC

Exemplul 5. Descrierea bibliografic a unui document (articol)

FRBR Surse de date Informaia bibliografic
APw01 titlu-doc
A fuzzy incremental clustering approach to hybrid data discovery
APw02 forma-doc
A (Articol / Capitol)
APe02 tip-doc
E (versiune Electronic / Tiparita)
APw03 data-doc
23 10 2012 (data publicare online)
APe04 limba-doc
ENG (english)
APw06 domeniu-doc
[data mining]
APe05 subiect-doc [incremental clustering; fuzzy; agents; hybrid data] (keywords)
APe08 volum-doc
8 (pagini)
APe09 rezumat-doc
A (abstract)
APi06 stare-doc
T (full text)
APm02 resp-doc
[id-aut (Gceanu, Radu D.) ; id-aut (Pop , Horia F.)] ;[id-afl (Computer Science
Department, Babes-Bolyai University, Cluj-Napoca, Romania)]
APm03 ed-pub
[id-pub (Acta Electrotechnica et Informatica); Vol. 12, No. 2, Oct 2012, 1623]
APm13 format-doc
A4
APm16 cost-doc
null
APm17 restricii-doc
free

64
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
APm35 config-doc
Adobe
APm36 fiier-doc
PDF; 190 K
APm37 acces-doc
on-line
APm38 adrURL-doc
http://www.degruyter.com/view/j/aeei.2012.12.issue-2/v10198-012-0010-
x/v10198-012-0010-x.xml

Tabelul 13. Descrierea bibliografic a unui articol de revist

Exemplul 6. Descrierea bibliografic a unui document (capitol de monografie)

FRBR Surse de date Informaia bibliografic
APw01 titlu-doc
DSS Architecture and Types
APw02 forma-doc
C (Articol / Capitol)
APe02 tip-doc
E (versiune Electronic sau Printata)
APw03 data-doc
2008 (publicare)
APe04 limba-doc
ENG (english)
APw06 domeniu-doc
[DSS]
APe05 subiect-doc
[Architecture; Decision support system; DSS; Framework; Knowledge system;
Language system; Presentation system; Problem-processing system] (keywords)
APe08 volum-doc
27 (pagini)
APe09 rezumat-doc
A (abstract)
APi06 stare-doc
F (full text)
APm02 resp-doc
[id-aut (Clyde W. Holsapple)] [id-afl (School of Management, Gatton College of
Business and Economics, University of Kentucky, Lexington, KY, USA)]
APm03 ed-pub
id-pub (Handbook on Decision Support Systems Vol 1: Basic Themes, Part II:
DSS Fundamentals, Chapter 9, pp 163- 189)
APm13 format-doc
A4
APm16 cost-doc
25 ( )
APm17 restricii-doc
none
APm35 config-doc
Adobe
APm36 fiier-doc
PDF; 190 K
APm37 acces-doc
on-line
APm38 adrURL-doc
http://www.degruyter.com/view/j/aeei.2012.12.issue-2/v10198-012-0010-
x/v10198-012-0010-x.xml

Tabelul 14. Descrierea bibliografic a unui capitol dintr-o monografie

3.3.2 Surogat bibliografic documente

FRBR Surse de date FRBR Surse de date FRBR Surse de date
1
APw01
titlu-doc 8
APe08
volum-doc 15
APm17
restricii-doc
2
APw02
forma-doc 9
APe09
rezumat-doc 16
APm35
config-doc
3
APe02
tip-doc 10
APi06
stare-doc 17
APm36
fiier-doc
4
APw03
data-doc 11
APm02
resp-doc 18
APm37
acces-doc
5
APe04
limba-doc 12
APm03
ed-pub 19
APm38
adrURL-doc
6
APw06
domeniu-doc 13
APm13
format-doc


7
APe05
subiect-doc 14
APm16
cost-doc



Tabelul 15. Maparea pe sursele de date a descrierii bibliografice - document



65
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.3.3 Surogat bibliografic publicaii

FRBR Surse de date FRBR Surse de date FRBR Surse de date
1
APw01
titlu-pub 10
APw06
domeniu-pub 19
APm15
furnizor-pub
2
APe10
context-pub 11
ASc01
subiect-pub 20
APm16
cost-pub
3
APw02
forma-pub 12
APe08
volum-doc 21
APm17
restricii-pub
4
APe02
tip-pub 13
APe09
rezumat-pub 22
APm22
stare-pub
5
APm14
id-int-pub 14
APm02
editor-pub 23
APm23
nrotare-pub
6
APw03
data-pub 15
APm05
editur-pub 24
APm35
config-pub
7
APe15
frecvena 16
APm03
ediie-pub 25
APm36
fiier-pub
8
APm04
ara 17
APm08
colecie-pub 26
Apm37
acces-pub
9
APe04
limba-pub 18
APm13
format-pub 27
APm38
adrURL-pub

Tabelul 16. Maparea pe sursele de date a descrierii bibliografice - publicaie

3.4 Depozitarea datelor
3.4.1 Identificare fapte
Pentru mediul decizional al unei biblioteci subiectele majore de interes sunt:
Serviciile de bibliotec;
Apariiile editoriale;
Calitatea publicaiilor;
3.4.2 Definire dimensiuni
Perspectivele de analiz necesare pentru faptele identificate sunt urmtoarele:
Pentru serviciile de bibliotec:
timpul;
operaiile;
utilizatorii.
Pentru apariiile editoriale:
timpul;
publicrile;
autorii;
editorii;
publicaiile;
subiectele.
Pentru calitatea publicaiilor:
timpul;
publicrile;
autorii;
referinele;
publicaiile;
subiectele.


66
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

3.4.3 Definire ierarhii dimensionale:

Dimensiuni
D e D
Nume de niveluri
e A
Ci de agregare
_ A A
Descrieri de niveluri
e


perioad

- fereastra de analiz
an

- anul
semestru

- semestrul
trimestru

- trimestrul
lun

- luna
Timp
zi - data
format

- format-document
tip

- tip-document
Document
document
- titlu
- limba
ar

- nume ar
localitate

- nume ora
afiliere autor

- nume instituie
- adres
Autor
autor
- nume autor
- profesie
- adres
ar

- nume ar
localitate

- nume ora
afiliere editor

- nume instituie
- adres
Editor
editor
- nume editor
- profesie
- adres
ara

- nume ar
ora

- nume localitate
editur

- nume editur
- adres
Publicaie
publicaie
- titlu
- limba
- frecvena

67
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
domeniu

- nume de domeniu
subdomeniu

- nume de subdomeniu
- list de descriptori
Subiect
subiect
- nume de subiect
- list de descriptori
sistem

- nume instituie
proces

- nume proces
activitate

- nume activitate
compartiment

- nume compartiment
post

- nume angajat
- funcie angajat
Operaie
operaie
- nume operaie
- cod operaie
continuitate

- re-nscris/nou-nscris
naionalitate

- romn/altele
gen

- masculin/feminin
vrst

- nume categorie-vrst
ocupaie

- nume statut-ocupaional
Utilizator
utilizator
- cod
- nume/numr permis

Figura 3. Dimensiuni, niveluri dimensionale i ci de agregare
3.4.4 Definire msuri
Aspectele specifice i msurabile ale faptelor, relevante pentru analiz, la nivelul minim
de granularitate, sunt:
Pentru serviciile de bibliotec: indicii de selecie (s) i de realizare (r); duratele (t) i
costurile (c) unitare ale operaiilor;
Pentru apariiile editoriale: indicii de publicare (t) i de cotare ();
Pentru calitatea publicaiilor: indicii de notorietate (c), de citare () i, eventual, de
relevan a citrilor (o).

3.4.5 Setul de interogri preliminare
Sistemele de indicatori (operaionali, de performan i bibliometrici) construite n
capitolul anterior reprezint de fapt cerine ale utilizatorilor i constituie setul de interogri
preliminare (preliminary workload) la care trebuie s poat rspunde depozitul de date.

68
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

69
3.4.6 Cuburi de date
Schemele cuburilor de date sunt reprezentate prin diagrame specifice n care: faptele sunt
reprezentate prin dreptunghiuri; dimensiunile sunt reprezentate prin dreptunghiuri rotunjite;
msurile sunt reprezentate prin cercuri.
Cuburile de date cu dimensiunile din figura 3 corespunztoare faptelor analizate (servicii,
publicri i citri) sunt reprezentate n continuare:
Schema cubului de date Servicii de bibliotec:














Selecie Realizare Durat Cost

Figura 4. Cub de date privind serviciile bibliotecare

Schema cubului de date Publicri:








t

Publicare Cotare

Figura 5. Cub de date privind apariiile editoriale

subiect
timp

publicaie editor autor document

utilizator
timp

Servicii de bibliotec

operaie
t
c r s

Publicri
t
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

70

Schema cubului de date Citri:












Notorietate Impact Relevan

Figura 6. Cub de date privind calitatea publicrilor

3.4.7 Schema conceptual a depozitului de date



Figura 7. Schema constelaie a depozitului de date

subiect
timp

publicaie autor document document

Citri
o c
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
3.5 Descoperirea cunotinelor din date

3.5.1 Nucleu de autoritate

Definirea de nuclee de autoritate n diferite mulimi de entiti implic definirea unei
proceduri generale, ct mai simpl posibil, pentru a genera ierarhii bibliometrice. Ideea
fundamental a abordrii este de a considera entitile analizate ca pri ale unui sistem,
fiecare entitate putnd fi caracterizat de ctre celelalte. Elementul de legtur este mulimea
de documente. Compararea a dou entiti nseamn s se selecteze din mulimea de
documente o seciune corespunztoare i s se efectueze comparaia n interiorul acelei
seciuni.
n continuare este schiat o procedur pentru definirea unei ierarhizri a autorilor care au
tratat un anumit subiect, definirea de proceduri similare pentru alte entiti precum
publicaiile, editurile sau organizaiile tiinifice fiind simple exerciii.
Un dezavantaj al abordrii ar putea fi numrul mare de ponderi, dar procedura poate
funciona, de asemenea, cu ponderi elementare, booleene.
Fie s un anumit subiect de interes i fie S o mulime de subiecte care conine pe s.
Mulimea S conine subiectul s dar include i alte subiecte apropiate din acelai (sub)domeniu
pentru a evita cutarea ntr-un set prea ngust de subiecte.
Se dorete o ierarhizare n interiorul mulimii de autori n subiectul s.
Pentru punerea n aplicare a procedurii se presupune c mulimea documentelor care
abordeaz subiectul s nu este vid, D(s) = C i, de asemenea, c exist informaiile necesare,
listele de clasificare notorietate-expert i mulimile de ponderi.

Pasul-1. Iniializarea procedurii
s subiectul de interes
S mulimea de subiecte ce conine pe s
A
+
listele autorizate cu autorii de notorietate
W mulimea de valori pentru ponderi
Pasul-2. Selecia documentelor care trateaz subiectul s
D(s) { d(s) }
Pasul-3. Selecia documentelor care citeaz documente din D(s)
R(D(s)) { d' | (d, d') = 1, d e D(s)}
Pasul-4. Generarea seciunii de documente privind subiectul s
D D(s) R(D(s))
Pasul-5. Generarea mulimii de autori
A

A(D) A
+
, unde:
A(D) = { a | a e A(d); d e D }
A
+
= { a | c(a) > 0 }

71
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

72
Pasul-6. Determinarea indicilor de notorietate pentru submulimile de documente cu
subiecte din S elaborate de autorii din A
N(S, A) { (D(S, a)) | a e A }, unde:
D(S, a) = D(S) D(a)
(D(S, a)) = E
deD(S, a )
( w
E
c(E(d)) + w
P
c(P(d)) )
Pasul-7. Determinarea funciilor de impact I pentru submulimile de documente cu subiecte
din S elaborate de autorii din A
I(S, A) { I(D(S, a), t) | a e A }, unde:
D(S, a) = D(S) D(a)
I(D(S, a), t) = E
deD(S, a)
I(d, t)
Pasul-8. Determinarea indicilor de notorietate-impact I pentru submulimile de documente
cu subiecte din S elaborate de autorii din A
Y(S, A) { I(D(S, a)) | a e A }, unde:
I(D(S, a)) = w
1
(D(S, a)) + w
2
I(D(S, a), t)
Pasul-9. Furnizarea, n ordine descresctoare, a valorilor din Y(S, A)
Sort descending (Y(S, A))
Pasul-10. Finalizare
Delimitare nucleu de autoritate;
Interpretri;
Alte prelucrri (deterministe i/sau probabiliste).

Figura 8. Algoritm de generare nucleu de autoritate

3.5.2 Gruparea bazat pe densitate

Gruparea const n identificarea de grupuri sau clustere ntr-o mulime de date.
Clusterizarea bazat pe densitate ncearc s identifice i s separe regiunile dense (foarte
populate) ale unei mulimi de puncte, P, dintr-un spaiu multidimensional (*).
Densitatea este definit ca fiind numrul de puncte existente ntr-o regiune de cutare, de
dimensiune eps specificat, numit eps-vecintate.
Un punct este considerat punct de baz dac eps-vecintatea sa conine mai multe puncte
dect un numr, MinPts, specificat. Punctele de baz sunt n interiorul unui cluster.
Un punct este considerat punct de frontier dac eps-vecintatea sa conine un numr de
puncte mai mic dect MinPts dar se afl n eps-vecintatea unui punct de baz.
Un punct este considerat punct de zgomot dac nu este nici punct de baz i nici punct de
frontier.

(*) KRIEGEL, H.-P.; KRGER, P.; SANDER, J.; ZIMEK, A. (2011) Density-based clustering. In WIREs Data
Mining and Knowledge Discovery, 1 (3), pp 231240
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

73
Definirea clusterelor se bazeaz pe noiunea de accesibilitate n densitate.
Un punct Q este direct accesibil n densitate dintr-un alt punct P dac punctul Q este
coninut n eps-vecintatea lui P i dac P este punct de baz. P i Q fac parte din acelai
cluster.
Un punct Q este accesibil n densitate dintr-un alt punct P dac exist o secven de
puncte P
1
, ..., P
n
cu P
1
= P i P
n
= Q n care fiecare punct P
i+1
este direct accesibil n
densitate din punctul P
i
.
Relaia de accesibilitate n densitate nu este simetric. Dac punctul Q ar fi situat la
frontiera unui cluster, avnd deci insuficient de multe puncte vecine pentru a conta ca punct
de baz, procesul de gsire a unui drum ntre Q i P s-ar ntrerupe acesta oprindu-se la primul
punct care nu este punct de baz. ncepnd ns procesul din punctul P drumul ar ajunge la Q
i procesul s-ar opri aici, acesta fiind primul punct gsit care nu este punct de baz. Datorit
acestei asimetrii, a fost necesar introducerea noiunii de conectare n densitate.
Dou puncte P i Q sunt conectate n densitate dac exist un punct O astfel nct ambele
puncte P i Q sunt accesibile n densitate din O. Conectarea n densitate este simetric.
Un cluster este o submulime de puncte a lui P care satisface dou proprieti:
Toate punctele din cluster sunt reciproc conectate n densitate.
Dac un punct este conectat n densitate cu orice punct de cluster atunci aceasta
aparine clusterului.
Algorimul de clusterizare, propus de Martin Ester, Hans-Peter Kriegel, Jrg Sander i
Xiaowei Xu n 1996, [40] ncepe cu un punct de pornire arbitrar, care nu a fost vizitat. Sunt
cutate punctele din eps-vecintatea sa i n cazul n care punctul este un punct de baz un nou
cluster este pornit. n caz contrar, punctul este etichetat ca zgomot. Acest punct ar putea fi
ulterior regsit ntr-o eps-vecintate a unui alt punct de baz i atunci este inclus n acel
cluster. Dac un punct s-a dovedit a fi un punct de baz al unui cluster atunci ntreaga sa eps-
vecintate este, de asemenea, parte din acel cluster. Sunt incluse n cluster toate punctele care
se gsesc n interiorul eps-vecintii precum i punctele din eps-vecintile acestora atunci
cnd acestea sunt, de asemenea, puncte de baz. Acest proces continu pn cnd clusterul de
conectare n densitate este complet descoperit. n continuare, un alt punct nevizitat este
procesat, ceea ce duce la descoperirea unui alt cluster sau zgomot .a.m.d.
Parametrii eps i MinPts reprezint o estimare a densitii punctelor din clustere i trebuie
s fie specificai de ctre utilizator.
Dac eps este ales prea mic, o mare parte din puncte nu vor fi grupate n timp ce, pentru o
valoare prea mare, grupurile vor fuziona i majoritatea punctelor vor fi n acelai cluster.
Valoarea MinPts = 1 nu are sens, fiecare punct va fi un grup. Valoarea MinPts = 2 va da
acelai rezultat cu clasificarea ierarhic dar algoritmul bazat pe densitate este mult mai rapid.
Valorile mai mari sunt mai potrivite pentru mulimi de date cu zgomot i vor produce mai
multe clustere semnificative. De regul MinPts poate fi derivat din numrul de dimensiuni d
ale setului de date: MinPts > d + 1.
Descrierea algoritmului (pseudocod) :



Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

Pasul-1. Iniializare
eps distana aleas pentru eps-vecintate (regiuneadeCutare)
MinPts numrul minim de puncte ales pentru a forma un cluster
M matricea clusterelor

Pasul-2. Prelucrri preliminare
se selecteaz elementele mulimii P
se determin coordonatele punctelor P e P n spaiul multidimensional
se determin distanele dintre puncte
se constituie regiunile de cutare

Pasul-3. Clusterizare(P, eps, MinPts)
C = 0
pentru fiecare punct nevizitat P din mulimea P
se marcheaz P ca vizitat
regiuneadeCutare(P, eps, NrPts(P), Pts(P))
dac NrPts(P) < MinPts
expandareZgomote(Pts(P), eps, MinPts, 0)
altfel
C = C+1 (clusterul urmtor)
expandareCluster(P, eps, MinPts, C)

expandareCluster(P, eps, MinPts, C)
se adaug punctul P la clusterul C (P e C)
pentru fiecare punct Q din mulimea P
dac Q e C i Q nu este membru al clusterului C
se marcheaz Q ca membru al clusterului C
regiuneadeCutare(Q, eps, NrPts(Q), Pts(Q))
clusterul C = clusterul C reunit cu Pts(Q)
se marcheaz punctele din Pts(Q) ca vizitate

expandareZgomote(Pts(P), eps, MinPts, 0)
pentru fiecare punct Q din Pts(P)
regiuneadeCutare(Q, eps, NrPts(Q), Pts(Q))
dac ()Q e Pts(P), NrPts(Q) < MinPts
clusterul 0 = clusterul 0 reunit cu Pts(Q)
se marcheaz punctele din Pts(P) ca zgomote (membri al clusterului 0)

74
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
se marcheaz punctele din Pts(Q) ca vizitate

regiuneadeCutare(P, eps, NrPts(P), Pts(P))
se returneaz numrul NrPts(P) i punctele Pts(P) din eps-vecintatea punctului P, inclusiv P

Pasul-4. Finalizare
se returneaz pentru fiecare cluster descoperit punctele din cluster

Figura 9. Algoritm de clusterizare bazat pe densitate

3.5.3 Programul CBD
Pentru algoritmul de Clusterizare Bazat pe Densitate a fost realizat un program CBD
implementat sub sistemul MS-ACCESS. Programul CBD:
nu are nevoie s i se specifice priori numrul de grupuri;
necesit doar doi parametri i este insensibil la ordonarea punctelor;
poate descoperi grupuri de form de arbitrar;
poate descoperi un grup complet nconjurat de un alt grup;
poate separa zgomotele.
n continuare sunt prezentate dou exemple: unul ilustrativ i cellalt bazat pe un set de
date preluat din [8] (Performance Indicators of General Radiology Journals, Sorted by
Decreasing IF).
Exemplul 1. P
1
c 9
2
este o mulime de puncte din plan.



Figura 10. Meniul programului CBD

75
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

76
Valorile alese pentru cei doi parametri ai programului sunt: eps = 2,237; MinPts = 3

P
1
= { P
1
(4, 9), P
2
(5, 11), P
3
(5, 14), P
4
(6, 8), P
5
(7, 4), P
6
(7, 6), P
7
(7, 17), P
8
(8, 8),
P
9
(8, 14), P
10
(9, 11), P
11
(9, 16), P
12
(9, 18), P
13
(10, 9), P
14
(10, 14), P
15
(11, 17), P
16
(13, 10),
P
17
(13, 12), P
18
(14, 15), P
19
(15, 17), P
20
(16, 14), P
21
(17, 16), P
22
(18, 10), P
23
(18, 12) }



Figura 11. Coordonatele punctelor norului P
1
c 9
2


Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


Figura 12. Distanele ntre punctele norului P
1
c 9
2


77
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


Figura 13. Distribuia punctelor norului P
1
c 9
2
n regiunile de cutare



Figura 14. Gruparea punctelor din norul P
1
c 9
2
: 3 clustere (1, 2, 3) i zgomotele (Z)

Figura 15 ilustreaz norul de puncte P
1
nainte i dup procesul de grupare a punctelor.

78
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


Figura 15. Norul P
1
c 9
2
, clusterele (, ,) i zgomotele ()

79
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
Exemplul 2. Mulimea P
2
c 9
8
este format din 15 reviste avnd asociate valori pentru
un set de 8 indicatori bibliometrici [8]:


Figura 16. Valori ale indicatorilor bibliometrici pentru un set de reviste

Valorile indicatorilor bibliometrici sunt normalizate i proiectate n intervalul [0, 50], ele
reprezint coordonatele punctelor norului P
2
c 9
8
; eps = 17; MinPts = 4.


Figura 17. Coordonatele punctelor norului P
2
c 9
8


80
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


Figura 18. Distanele ntre punctele norului P
2
c 9
8




Figura 19. Distribuia punctelor norului P
2
c 9
8
n regiunile de cutare

81
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale


Figura 20. Gruparea punctelor din norul P
2
c 9
8
: 1 cluster (1) i zgomotele (Z)































82
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

4. CONCLUZII

Provocrile cu care se confrunt un sistem suport pentru decizii de bibliotec sunt:
mbuntirea satisfaciei utilizatorilor n sediul propriu i n afara lui, elaborarea unei politici
de achiziie orientat ctre cerere; mbuntirea conservrii coleciilor; optimizarea fluxurilor
i alocrii resurselor umane i financiare; diversificarea i creterea veniturilor; comunicarea
mai bun cu partenerii.
Domeniile de activitate ale bibliotecii, posibile de mbuntit, sunt: dezvoltarea
coleciilor; accesibilitatea coleciilor; accesul la publicaii; utilizarea bibliotecii; digitalizarea
coleciilor; serviciile bibliografice, asistena i ndrumarea; potenialul de dezvoltare;
conservarea coleciilor; managementul.
Utilizatorii sistemului solicit un spectru larg de expertize, de la cutri simple la
statistici avansate. Pentru a putea adapta seviciile oferite de sistem la cerinele fiecrei
categorii de utilizatori principalele categorii de servicii care trebuiesc avute n vedere sunt:
cutrile simple, care furnizeaz rapoarte predefinite i valori ale indicatorilor operaionali
i/sau de performan; interogrile avansate i/sau personalizate; analizele avansate, care
implic navigare multidimensional i funcii puternice de analiz; simulrile i statisticile
avansate.
Arhitectura necesar sistemului suport pentru decizii al unei biblioteci este o
combinaie dintre o tehnologie de management a rezolvatoarelor flexibile i o tehnologie de
management a bazelor de date menit s asigure integrarea depozitrii datelor cu
rezolvatoarele analitice (prelucrare analitic on-line) i cu rezolvatoarele data mining
(mineritul datelor i descoperirea cunotinelor).
Pentru realizarea depozitului de date este foarte important ca proiectanii s urmeze o
metodologie de proiectare conceptual consolidat i robust dat fiind c dezvoltarea acestuia
este un proces foarte scump chiar n condiiile actuale cnd exist instrumente software care
ofer soluii prefabricate acoperind toate etapele din ciclul de via al unui depozit de date.
Concepia i implementarea sistemului suport pentru decizii al unei biblioteci, ca de altfel
ale oricrui sistem informatic, sunt influenate de ctre o serie de factori, ntre care pot fi
menionai: obiectivele urmrite; personalul implicat; recomandrile, normele i standardele
utilizate; restriciile impuse de ctre instituie; evoluia mediului; bugetul disponibil pentru
realizare; termenele de finalizare.
Obiectivele sistemului suport pentru decizii de bibliotec sunt:
furnizarea de indicatori care s permit evaluarea n timp a conformitii cu
obiectivele bibliotecii prin: evaluarea rezultatelor obinute, sesizarea tendinelor,

83
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
alerte; evaluarea indicatorilor operaionali, de performan i bibliometrici; rapoarte de
activitate.
furnizarea unor instrumente de analiz a tendinelor, de sesizare a situaiilor
decizionale i de sugerare a unor aciuni corespunztoare (analize complexe, simulri,
prognoze) n vederea lurilor de decizii.
integrarea datelor i compararea informaiilor din aplicaii informatice existente.
simplificarea accesului la informaie prin schimb transparent de informaii i
diseminare accelerat a informaiilor.
Pentru stabilirea cerinelor informaionale se impune aplicarea cu discernmnt a
prevederilor normative specifice domeniului bibliotecilor elaborate, recomandate i utilizate
att pe plan intern ct i pe plan internaional privind: descrierile bibliografice; indicatorii
operaionali; indicatorii de performan i indicatorii bibliometrici. Practic trebuie definit un
sistem personalizat, unic, unitar, coerent i evolutiv de indicatori.
Pentru personalul implicat se impune urmtoarea structur: un comitet de management;
o echip de proiect; grupuri de lucru cu utilizatorii; o firm de consultan pentru analiza
cerinelor; un subcontractant pentru dezvoltare-implementare.
La evaluarea resurselor financiare necesare trebuiesc avute n vedere: instrumentele de
fundamentare a deciziilor (OLAP, Data mining .a.); metodele i instrumentele de realizare a
depozitului de date, un instrument ETL pentru date ; un instrument de raportare; consultana;
contractul pentru dezvoltarea sistemului.
Pentru o bibliotec avantajele majore ale sistemului suport pentru decizii sunt: asigur
informaii de calitate i noi instrumente de management; rezolv faze tehnice critice privind
furnizarea, modelarea i stocarea datelor; satisface cerine tehnice actuale i viitoare; satisface
cerinele utilizatorilor; este adaptabil; susine trecerea la o cultur orientat ctre performan
i impune personalului dezvoltarea n consecin a abilitilor; promite mari mbuntiri n
modul de nelegere a ceea ce se face n prezent i a ceea ce se preconizeaz pentru viitor.











84
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
BIBLIOGRAFIE

[1] ATZENI, P.; CAPPELLARI, P.; TORLONE, R.; BERNSTEIN, P.A.; GIANFORME, G. (2008) Model
independent schema translation. In Journal of Very Large Data Bases, 17, pp 13471370.
[2] BONIFATI, A.; CATTANEO, F.; CERI, S.; FUGGETTA, A.; PARABOSCHI, S. (2001) Designing
data marts for data warehouses. In ACM Transactions on Software Engineering and Methodology, 10, pp
452483.
[3] BORNE, P.; POPESCU, P.; FILIP, F.-G.; STEFANOIU, D. (2013) Optimisation en sciences de
lingnieur mthodes exactes, Paris: Lavoisier, 332 p.
[4] BNF - Bibliothque nationale de France (2012) Fonctionnalits requises des notices bibliographiques :
rapport final. Trad. de : Functional requirements for bibliographic records : Final Report - 2e dition
franaise, Paris, BNF, 100 p.
[5] BURSTEIN, F.; HOLSAPPLE, C.W. (Eds) (2008), Handbook on Decision Support Systems 1 : Basic
Themes, International Handbooks on Information Systems, Springer-Verlag, 854 p.
[6] BURSTEIN, F.; HOLSAPPLE, C.W. (Eds), (2008), Handbook on Decision Support Systems 2 :
Variations, International Handbooks on Information Systems, Springer-Verlag, 800 p.
[7] CABIBBO, L.; TORLONE, R. (1998) A logical approach to multidimensional databases. In 6th
International Conference on Extending Database Technology (EDBT98), Springer-Verlag, pp 183-197.
[8] DURIEUX, V.; GEVENOIS, P. A. (2010) Bibliometric indicators: quality measurements of scientific
publication. In RADIOLOGY, 255 (2), pp 342-351.
[9] FILIP, F.-G. (2005) Decizie asistat de calculator: decizii, decideni - metode de baz i instrumente
informatice asociate, Ed. a 2-a, rev., Bucureti: Ed Tehnic, 376 p.
[10] FILIP, F.-G. (2007) Sisteme suport pentru decizii, Ed. a 2-a, rev., Bucureti: Editura Tehnic, 364 p.
[11] GIORGINI, P.; RIZZI, S.; GARRETTI, M. (2008) GRAnD: a goal-oriented approach to requirement
analysis in data warehouses. In Decision Support Systems, 45, pp 421.
[12] GOLFARELLI, M.; MAIO, D.; RIZZI, S. (1998) Conceptual design of data warehouses from E/R
schema. In Thirty-First Annual Hawaii International Conference on System Sciences, 7, pp. 334344.
[13] GOLFARELLI, M.; RIZZI, S. (2009) Data Warehouse Design: Modern Principles and Methodologies,
McGraw-Hill, 445 p.
[14] HIRSCH, J. E. (2005) An index to quantify an individuals scientific research output
(http://arxiv.org/pdf/physics/0508025.pdf )
[15] IFLA - International Federation of Library Associations and Institutions (2008) Functional
requirements for bibliographic records : Final Report.
(http://www.ifla.org/files/cataloguing/frbr/frbr_2008.pdf)
[16] INS - Institutul National de Statistica (2012) Cult1 Activitatea bibliotecilor. n Chestionare
statistice, Statistica culturii. (http://www.insse.ro/cms/files/chestionare/cult/CULT1%202012.pdf )
[17] ISO (2009) TR28118 Information and documentation Performance indicators for national libraries.
(http://www.iso.org/iso/home/store/catalogue_ics/catalogue_detail_ics.htm?ics1=01&ics2=140&ics3=20&c
snumber=44512)
[18] ISO (2013) 2789 Information and documentation - International library statistics
(http://webstore.ansi.org/RecordDetail.aspx?sku=ISO%202789:2013&source=google&adgroup=iso13&gcli
d=CLb-2s78kLsCFQ1c3godxDcAeQ )
[19] JOUGUELET, S.; PARD, T. (2005) Defining and building a decision support system: the experience
of the Bibliothque nationale de France. In LIBER QUARTERLY The Journal of the Association of
European Research Libraries, 15, No 3/4.
[20] LECHTENBRGER, J.; VOSSEN, G. (2003) Multidimensional normal forms for data warehouse
design. In Information Systems, 28, pp 415434.
[21] LOR, P. J. (1997) Guidelines for legislation for national library services CH97/ WS/ 7.

85
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale
[22] LUJAN-MORA, S.; TRUJILLO, J.; SONG, I.Y. (2006) A UML profile for multidimensional modelling
in data warehouses. In Data & Knowledge Engineering, 59, pp 725769.
[23] MAZN, J.-N.; TRUJILLO, J.; SERRANO, M.; PIATTINI, M. (2005) Designing data warehouses:
from business requirement analysis to multidimensional modeling. In: K. Cox, E. Dubois, Y. Pigneur, S.J.
Bleistein, J. Verner, A.M. Davis, R. Wieringa (Eds.), Requirements Engineering for Business Need and IT
Alignment, Paris, pp. 4453.
[24] MAZN, J.-N.; TRUJILLO, J.; LECHTENBRGER, J. (2006) A Set of QVT Relations to assure the
correctness of data warehouses by using multidimensional normal forms. In: D.W. Embley, A. Oliv, S.
Ram (Eds.), ER: Lecture Notes in Computer Science, vol. 4215, Conceptual Modeling, pp. 385398.
[25] MAZN, J.-N.; TRUJILLO, J.; LECHTENBRGER, J. (2007) Reconciling requirement-driven data
warehouses with data sources via multidimensional normal forms. In Data & Knowledge Engineering, 63,
pp 725751.
[26] MAZN, J.-N.; PARDILLO, J.; SOLER, E.; GLORIO, O.; TRUJILLO, J. (2008) Applying the i*
framework to the development of data warehouses. In Proceedings of the 3rd International i* Workshop
(iStar08, February 11-12), pp 79 82.
[27] MAZN, J.-N.; TRUJILLO, J. (2009) A hybrid model driven development framework for the
multidimensional modeling of data warehouses, In SIGMOD Record, 38, pp 1217.
[28] PENDLEBURY, D.A. (2008) Using Bibliometrics in Evaluating Research
(http://wokinfo.com/media/mtrp/UsingBibliometricsinEval_WP.pdf )
[29] PHIPPS, C.; DAVIS K.C. (2002) Automating data warehouse conceptual schema design and
evaluation. In: Laks V.S. Lakshmanan (Ed.), DMDW: CEUR Workshop Proceedings, 58, Design and
Management of Data Warehouses, pp 2332.
[30] RAFANELLI, M.(2003)Multidimensional databases: problems and solutions. Ideea Group Inc., 446 p.
[31] REHN, C.; KRONMAN, U.; WADSKOG, D. (2007) Bibliometric indicators definitions and usage at
Karolinska Institutet.
(http://ki.se/content/1/c6/01/79/31/Bibliometric%20indicators%20-%20definitions_1.0.pdf )
[32] ROMERO, O.; ABELL, A. (2009) A survey of multidimensional modeling methodologies, In
International Journal of Data Warehousing and Mining, 5, pp 123.
[33] ROMERO, O.; ABELL, A. (2010) Automatic validation of requirements to support multidimensional
design. In Data & Knowledge Engineering, 69, pp 917942.
[34] SCHNEIDER, M. (2008) A general model for the design of data warehouses. In International Journal
of Production Economics, 112, pp 309325.
[35] STEFANOV, V.; LIST, B. (2007) A UML profile for modeling data warehouse usage. In: J. Hainaut et
al. (Eds.), ER Workshops: Lecture Notes in Computer Science, vol. 4802, Advances in Conceptual
Modeling Foundations and Applications, pp. 137147.
[36] TRZIMAN, E. (2000) Procesele de bibliotec: abordare n contextul utilizrii noilor tehnologii.
Bucureti : Editura Universitii Bucureti, 108 p.
[37] TRIA (DI), F.; LEFONS, E.; TANGORRA, F. (2012) Hybrid methodology for data warehouse
conceptual design by UML schemas. In Information and Software Technology, 54, pp 360379.
[38] WEST, J.; ALTHOUSE, B.; ROSVALL, M.; BERGSTROM, C.; BERGSTROM, T. (2008)
Eigenfactor Score and Article Influence Score: Detailed methods. Methods version 2.01.
(http://www.eigenfactor.org/methods.pdf ).
[39] * * * (2011) The evolution of journal assessment - SNIP & SJR new perspectives in journal metrics.
(http://www.journalmetrics.com/documents/Journal_Metrics_Whitepaper.pdf ).
[40] * * * (2013) http://en.wikipedia.org/wiki/DBSCAN .




86
Sistem pentru asistarea deciziilor bazat pe descoperirea cunotinelor din date: rezultate experimentale

87


LISTA FIGURILOR

Figura 1. Algoritm de generare a arborilor de atribute
Figura 2. Arhitecura sistemului suport pentru decizii
Figura 3. Dimensiuni, niveluri dimensionale i ci de agregare
Figura 4. Cub de date privind serviciile bibliotecare
Figura 5. Cub de date privind apariiile editoriale
Figura 6. Cub de date privind calitatea publicrilor
Figura 7. Schema constelaie a depozitului de date
Figura 8. Algoritm de generare nucleu de autoritate
Figura 9. Algoritm de clusterizare bazat pe densitate
Figura 10. Meniul programului CBD
Figura 11. Coordonatele punctelor norului P
1
c 9
2

Figura 12. Distanele ntre punctele norului P
1
c 9
2
Figura 13. Distribuia punctelor norului P
1
c 9
2
n regiunile de cutare
Figura 14. Gruparea punctelor din norul P
1
c 9
2
: 3 clustere (1, 2, 3) i zgomotele (Z)
Figura 15. Norul P
1
c 9
2
, clusterele (, , ) i zgomotele ()
Figura 16. Valori ale indicatorilor bibliometrici pentru un set de reviste
Figura 17. Coordonatele punctelor norului P
2
c 9
8

Figura 18. Distanele ntre punctele norului P
2
c 9
8

Figura 19. Distribuia punctelor norului P
2
c 9
8
n regiunile de cutare
Figura 20. Gruparea punctelor din norul P
2
c 9
8
: 1 cluster (1) i zgomotele (Z)


LISTA TABELELOR

Tabelul 1. Lista indicatorilor operaionali ai bibliotecii
Tabelul 2. Obiectivele bibliotecii i indicatorii de performan
Tabelul 3. Produsele unei activiti intelectuale sau artistice
Tabelul 4. Responsabilii pentru produsele unei activiti intelectuale sau artistice
Tabelul 5. Subiectele produselor unei activiti intelectuale sau artistice
Tabelul 6. Relaiile dintre entitile bibliografice
Tabelul 7. Indicatori bibliometrici de productivitate
Tabelul 8. Indicatori bibliometrici de performan (1 3 )
Tabelul 9. Descrierea bibliografic a unei reviste
Tabelul 10. Descrierea bibliografic a unui proceedings
Tabelul 11. Descrierea bibliografic a unei monografii
Tabelul 12. Descrierea bibliografic a unei monografii, format UNIMARC
Tabelul 13. Descrierea bibliografic a unui articol de revist
Tabelul 14. Descrierea bibliografic a unui capitol dintr-o monografie
Tabelul 15. Maparea pe sursele de date a descrierii bibliografice - document
Tabelul 16. Maparea pe sursele de date a descrierii bibliografice - publicaie

S-ar putea să vă placă și