Sunteți pe pagina 1din 26

Sisteme de Management a Informatiilor din

Cercetare
Cristian Holdunu
June 2016

Contents
1 Abstract 2

2 Introducere 3
2.1 Scurt istoric . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Rolul si importanta sistemelor de management n cercetare . . . 4
2.3 Standardul CERIF . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Solutii de management utilizate in prezent 9


3.1 VIVO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.2 HubZero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3 dSpace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4 dSpace-CRIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4 Studiu de caz - dSpace-CRIS 25


4.1 Arhitectura Software . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2 Configurarea unei instante dSpace-CRIS . . . . . . . . . . . . . . 25
4.3 Implementarea unor module noi . . . . . . . . . . . . . . . . . . . 25

5 Bibiliografie 26

1
1 Abstract
Sistemele informatice au devenit tot mai puternice, iar odata cu performanta
acestora, a crescut semnificativ volumul de date ce sunt produse, stocate si re-
utilizate.

Informatiile preluate sunt stocate n baze de date, procesate si adnotate, sau


transformate cu diferite unelte pentru a obtine seturi noi de date. Informatiile
astfel obtinute sunt utilizate pentru a realiza lucrari stiintifice de cercetare,
rapoarte sau prezentari.

Managementul acestor informatii se poate dovedi destul de greoi, mai ales n


situatia n care asupra unui set de informatii, interactioneaza mai multi actori.
Interactionarea, schimbul de informatii sau integrarea unor rezultate obtinute,
se poate transforma ntr-o sarcina dificila.

Pentru a asigura o analiza sau integrare de calitate a seturilor de date, cat si pen-
tru a asigura accesul la informatiile de cercetare, seturile de date trebuie asociate
cu un set de informatii suplimentare - Informatii de Cercetare (Research Infor-
mation). Printre informatiile de cercetare asociate unui set de date, se numara
entitati ca - Publicatie, Proiect, Organizatie, Persoana, Produs, Patent, Servi-
ciu, Echipament, etc. Informatiile despre cercetare se organizeaza folosind un
sablon, unul dintre cele mai utilizate sabloane n Europa fiind CERIF.

2
2 Introducere
Invatamantul de nivel superior, stiinta si tehnologia, cercetarea si inovarea se
confrunta cu o crestere a complexitatii. Universitatile, de exemplu, au devenit
adevarate fabrici de date datorita contributiilor nsemnate n producerea de
noi cunostinte prin eforturi de cercetare.

Cu o putere de procesare n continua crestere, volumul de date create, proce-


sate, stocate sau reutilizate va fi mai mare ca niciodata. Informatiile preluate
sunt stocate n baze de date, procesate si adnotate, sau transformate cu diferite
unelte pentru a obtine seturi noi de date. Informatiile astfel obtinute sunt uti-
lizate pentru a realiza lucrari stiintifice de cercetare, rapoarte sau prezentari.

Pentru a asigura o analiza sau integrare de calitate a seturilor de date, dar


si pentru a asigura accesul la informatiile de cercetare, seturile de date trebuies
asociate cu un set de informatii suplimentare - Informatii de Cercetare (Re-
search Information).

La nivel european, informatiile de cercetare asociate lucrarilor devin tot mai im-
portante, atat pentru a evalua lucrari efectuate, a facilita accesul la informatii
stiintifice cat si pentru integrarea si managementului informatiilor la scara larga.
Majoritatea tarilor europene stocheaza n format digital informatiile de cercetare
n centre la nivel national, regional sau institutional, unde fiecare sistem este
construit folosind un format sau o structura adecvata nevoilor specifice.

Pentru a extrage informatii suplimentare din datele distribuite pe mai multe


sisteme, informatiile trebuie asignate si integrate. In practica, asta nseamna ca
structurile individuale de informatii si formatele sistemelor de informatii trebuie
transformate ntr-un format comun pentru a permite accesul si evaluarea, din
cadrul altor sisteme. Integrarea si standardizarea informatiilor este o sarcina
dificila la nivel national si o adevarata provocare la nivel European sau global.

2.1 Scurt istoric


In anii 1970 s-au facut eforturi deosebite pentru o cooperare internationala ntre
sistemele de informatii de cercetare (Research Information Systems). S-au efec-
tuat studii cu privire la potentialul stiintific si tehnologic al unei tari, pentru a
formula o politica de cercetare la nivel national.

Accesul la informatie n cadrul activitatilor curente de cercetare este esential


pentru a obtine succesul ateptat. Cheia n cercetare este reprezentata de idei,
rapoarte tehnice, publicatii, patente, prototipuri, produse ce conduc la un trans-
fer de tehnologie si genereaza noi idei de cercetare si dezvoltare.

S-a observat ca inovatorii din industrie si servicii, academicienii forteaza bari-


erele cercetarii si ale dezvoltarii, agentiile de finantare si cele guvernamentale,

3
toti solicita acces usor la informatiile din cercetare. De aceea consumatorul
informatiilor din cercetare are nevoie sa acceseze datele de care are nevoie prin
intermediul unei interfete familiare. Aceasta interfata comuna trebuie nu doar
sa acceseze continut, ci si sa aiba un format potrivit pentru a-l prezenta.

Informatia trebuie sa fie prezentata ntr-un mod uniform, cel putin la nivel
sumar. Indexarea subiectelor este obligatorie, ar terminologia trebuie sa aiba
acelasi nteles n toate limbile. De aceea, a fost propus Formatul Comun al
Informatiei n Cercetarea Europeanaa (Common European Research Informa-
tion Format - CERIF) in 1991 si revizuit n 1999.

Definitia acestei descrieri comune a informatiei necesita:


- definirea unui model care va acoperi structurile bazei de date ale majoritatii
formatelor de cercetare CRIS existente
- definirea unui set de modele de date care ar putea oferi exemple pentru schim-
buri de date
- definirea unor metadate ale modelului de date pentru a oferi o vedere sumara
uniforma a surselor de informatie heterogene.
[Zim]

2.2 Rolul si importanta sistemelor de management n cerc-


etare
Necesitatea de a avea calitate si de a gestiona fiabil rezultatele din cercetare a
devenit un motiv pentru a dezvolta sistemele actuale de gestiune si de distribuire
a rezultatelor din cercetare (Current Research Information Systems - CRIS).

Un sistem actual de gesiune a informa c tiilor din cercetare nregistreaza, proce-


seaza si prezinta indicatori si cifre referitoare la activitatea de cercetare de-a lun-
gul ciclului sau de viata. Indicatorii stocati ofera informatii deosebit de impor-
tante asupra caracteristicilor produsului stiitific (cum ar fi publicatii, patente,
date de cercetare si servicii) si asupra surselor sale ( cercetatori, institutii,
proiecte finantate) la diferite nivele.

Sistemele CRIS opereaza cu succes n domeniul international ca sisteme au-


tonome care ofera informatii centrale si fiabile cu privire la activitatea de cerc-
etare la nivel individual si institutional, la nivel national international. Uti-
lizarea lor a fost extinsa recent, iar ca rezultat, s-a stabilit ca sunt instrumente
puternice pentru a gestiona, distribui si exploata rezultatele din cercetare.

Stiinta este o componenta esentiala oricarui tip de progres. CRIS sustine dis-
tribuirea cunostintelor si beneficiile oferite unei game variate de utilizatori:
- indivizii au acceste la software expert si la sisteme pentru nregistrarea, proce-
sarea si exploatarea rezultatelor din cercetare serviciul prosperitatii societatii
- cercetatorii obtin acces liber la rezultatele din cercetare, rezultatul stiintific si
au oportunitatea de a colectiona informatii dintr-o gama variata de resurse care

4
sunt de ncredere
- partile administrative au acces la indicatorii de cercetare, analize detaliate si
informatii comparative ale activitatilor de cercetare din cadrul institutiilor

Printre rolurile importante ale sistemelor de management n cercetare se pot


enumera:
Administrarea cercetarilor - sistemele de management n cercetare pot fi
folosite pentru a sprijini administrarea procesului de dezvoltare, procesul de
trimitere a lucrarilor, publicarea rezultatelor. Avand informatiile potrivite cu
privire la oportunitatile de a ob tine fonduri este esential pentru oamenii de
stiinta, n mediul actual unde competitivitatea este foarte mare.

Publicare si acces la informatiile din cercetare -prin intermediul sis-


temelor de management n cercetare sunt publicate rezultatele cercetarilor n
jurnale electronice, utilizand astfel la maxim capabilitatile multimedia.

Gestionarea cunostintelor - poate fi o punte de legatura ntre informatiile


stiintifice si informatiile de inovare, care sunt doua tipuri de informatii diferite,
dar n acelasi timp complementare.[Zim]

2.3 Standardul CERIF


CERIF (Common European Research Information Format) este un standard
pentru gestionarea si schimbul de date de cercetare prin intermediul unui model
de date care poate fi utilizat pentru a descrie domenii de cercetare, inclusiv
relatiile dintre partile componente.

Tehnologia informatiei a fost folosita pentru a oferi suport partilor implicate n


procesul de cercetare de-a lungul anilor. Organizatiile de finantare a cercetarii
au sisteme pentru a gestiona propunerile de proiecte si granturile acordtae.
Universitatile au sisteme pentru a tine evidenta proiectelor de cercetare. De
asemenea au fost dezvoltate laboratoare, portaluri de acces la informatii, acces
la seturi de date, iar aceste sisteme tind sa fie de sine statatoare, heterogene,
incompatibile ntre ele si la stadii diferite de maturitate.

CERIF a fost dezvoltat cu ajutorul Comisiei Europene n doua etape majore:


1987-1990 si 1997-1999, iar din punct de vedere tehnic, este o recomandare a
Uniunii Europene pentru statele sale membre. Din 2002, CERIF a fost predat de
Comisia Europeana lui euroCRIS, o organizatie non-profit dedicata promovarii
CRIS.

Rationamentul din spatele CERIF se bazeaza pe faptul ca majoritatea statelor


sustin n mod public programele de cercetare, ceea ce a conduce la mbunatatirea
calitatii vietii. Deoarece este implicata finantarea publica, este necesar sa fie o
guvernare corespunzatoare, iar informatiile sa fie puse la dispozitia publicului.

5
In linii mari, fiecare stat are un proces de cercetare similar, ce implica o plan-
ificare strategica, anuntarea programelor, cererea de propuneri, evaluarea si
finantarea propunerilor, monitorizarea si exploatarea rezultatelor.

Cu toate acestea, cercetarea este internationala. Cel mai probabil, un proiect


de cercetare dintr-o anumita tara se bazeaza pe cercetarile efectuate n alte tari.
Prin urmare, este nevoie

Modelul fizic CERIF este model de baza de date relationala disponibila ca si


scripturi SQL bazate pe ERM (Entity Relationship Model).
Structura conceptuala modelului de date CERIF ofera un descriere abstracta a
entitatilor de cercetare si este formata dint tipuri de entitati si caracteristici.

Dintre tipuri, cele mai importante sunt tipul de baza , rezultat, legatura si

Figure 1: Entitati CERIF si relatiile dintre ele

entitatile de nivelul doi.

Entitatile de baza CERIF (CERIF Core Entities (core))


Entitatile de baza sunt Persoana (Person), Unitate Organizationala (Organisa-
tionUnit) si Proiect(Project). Acestea permit repezentarea actorilor stiintifici.
In figura de mai sus, acestea sunt la baza si n centru si sunt indicate relatiile

6
de legatura.

Entitatile rezultat CERIF (CERIF Result Entities (result))


Entitatile rezultat sunt Publicarea Rezultat (ResultPublication), Brevetul Rezul-
tat (ResultPatent) si Produsul Rezultat (ResultProduct). Acestea sunt rezul-
tatul cercertarii si sunt indicate n figura de mai sus n partea central-superioara.

Entitatile de nivel doi CERIF (CERIF 2nd Level Entities (2nd))


Printre entitatile de nivel doi se pot enumera Echipament (Equipment), CV, Cal-
ificare (Qualification), Metrici (Metrics), Eveniment (Event), Adresa Postala(PostalAddress)
si Adresa Electronica (ElectronicAddress) si corespund mediului de cercetare.
In figura de mai sus sunt prezentate nconjurul entitatilor de baza si rezultat.

Entitatile legatura CERIF (CERIF Link Entities (link))


Entitatile de lip legatura sunt considerate a fi un punct forte n modelul CERIF.
Pot fi identificate ca relatiile dintre entitatile de baza, rezultat si cele de nivel doi.

Dintre cele mai importante caracteristici se pot enumera suportul pentru mai
multe limbi si semantica.
Suportul multilingv (CERIF Multilingual Features (lang))
Suportul multilingv este foate important n tarile unde sunt vorbite mai multe
limbi oficiale. De asemenea este important n munca de cercetare care necesita
colaborare, iar acelasi proiect este nregistrat n limbi diferite de catre institutiile
din diferite tari.
CERIF ofera suport n mai multe limbi pentru titluri, descrieri, cuvinte cheie,
abstract si pentru semantica.

Semantica (CERIF Semantic Features (class))


Nivelul semantic CERIF este vazut ca un container pentru a gestiona si a pastra
contextul asa cum a fost stabilit cu legaturile dintre entitati.

CERIF poate fi folosit n trei modalitati:


- ca model pentru implementarea unui CRIS de sine statator
- ca model pentru a defini o interfata pentru sistemele CRIS care sunt non-
CERIF si au nevoie de acces omogen la sistemele heterogene
- ca definitie pentru formatul datelor care sunt schimbate

Prin prezentarea tipurilor de entitati, precum si a caracteristicilor multilingviste


si semantice se demonstreaza gradul de acoperire si flexibilitatea modelului n
raport cu contextele de cercetare. Modelul CERIF are ca scop sa reprezinte
domeniul de cercetare, iar datorita structurii modulare si a consistentei, per-
mite selectarea unor subdomenii sau a unor componente, dar respectand n
acelasi timp contextul aplicatiei si al cerintelor, asa cum este indicat mai jos:

7
Figure 2: Unele entitati CERIF selectate, ce indica managementul dintre se-
mantici cu ajutorul legaturilor

8
3 Solutii de management utilizate in prezent
3.1 VIVO
VIVO este o unealta web pentru cercetarile stiintifice. VIVO ofera suport pen-
tru cautarea, explorarea si vizualizarea activitatii de cercetare cu scopul de a
descoperi oameni, programe, facilitati, activitati scolare si evenimente.
De cele mai multe ori, VIVO este folosit la nivel de institutie, aproape de sursele
de autoritate ce i includ si pe cercetatori, dar este adaptat pentru a fi folosit de
catre centrele de cercetare din cadrul universitatilor, de departamentele gurver-
namentale sau de catre grupuri de indivizi ce functioneaza ca organizatii vir-
tuale.
Toate datele dintr-o instanta publica VIVO pot fi accesate direct atat prin inter-
mediul browser-elor web, cat si de alte aplicatii ce solicita date pentru interogare
sau descarcare pentru a analiza sau pentru a mbina cu alte date. []

Beneficii

Principalele domenii n care este folosit VIVO sunt:

Descoperiri
- directii catre seturi de date si produse de cercetare
- reprezentari comune ale datelor n cadrul a diferite sisteme

Oameni de stinta de baza


- toate datele sunt legate de contextul unei persoane, iar aceste date pot duce
la alte surse valoroase
- posibilitatea de promovare
- accesul facil la cercetari
- gasirea unor colaboratori
- sa fii gasit de potentiali colaboratori
- urmarirea colaboratorilor
- urmarirea competitiei
- gasirea evenimentelor si posibilitatea de a profita de oportunitati
- onotologia VIVO permite ca informatia sa fie usor de gasit

Clinicieni
- cautarea conferintelor, a seminariilor, a cursurilor ce urmeaza sa se desfasoare
- gasirea articolelor relevante, a cercertarilor conduse n cadrul unei institutii
- conectarea cu alte zone de cercetare sau grupuri din cadrul unei institutii
- organizarea de strangere de fonduri pentru a sprijini cercetarea
- gasirea unui expert ce se specializeaza pe o anumita procedura
- posibilitatea unui medic de a identifica posibile studii clinice care ar putea fi
de interes pentru pacientii sai

9
Studenti
- gasirea mentorilor
- indentificare oportunitatilor de cercetare
- identificarea cursurilor de interes
- identificarea seminariilor de interes
- toate datele sunt legate de contextul unei persoane, iar acele date pot conduce
la alte resurse valoroase

Crearea unui sistem VIVO


Deoarece o implementare cu succes a VIVO necesita implicare si informare, pre-
cum si gestionarea etapei de dezvoltare, a ncarcarii de date, planificarea atenta
este deosebit de importanta. Cu cat este mai multa informatie, cu atat pot fi
luate n considerare mai multe optiuni, iar n acest fel exista sanse mai mari
pentru succes.

O implementare VIVO presupune:

Figure 3: Etape creare sistem VIVO

Gestionare de proiect (project management) - gestionarea unui proiect


VIVO poate nsemna de la gasirea resurselor necesare pana la definirea struc-
turii, a misiunii si a strategiilor.
Etape de management a proiectului:

10
Analiza
- stabilirea limitelor - proiectele VIVO trec adesea granitele internationale.
Pentru a facilita luarea deciziilor si pentru a trasa directii, este nevoie de
un sponsor de proiect si de unul sau mai multe grupuri consultative din
care sa faca parte, preferabil, cercetatori.
- identificarea resurselor - dimensiunea si componena echipelor VIVO de-
pind de implementarea VIVO.

Proiectare
- personalizare - VIVO poate fi customizat sutilizeze culoriile institutiei
pentru care este folosit, logo-urile acesteia, precum si alte elemente de
identificare.
- definirea scopului

Implementare
- crearea unei strategii de lansare - presupune luarea unor decizii pre-
cum: VIVO va afia toti cercetatorii sau doar o parte? Va contine multe
informatii de la nceput sau vor fi adaugate pe parcurs? Indiferent de
alegerile facute, este nevoie de un brainstorming cu stakeholderii.

Lansare
- supervizarea campaniei de publicitate - comunicarea este o parte impor-
tanta campaniei de lansare. Este esential sa se informeze comunitatea ca
un nou proiect VIVO va fi lansat. Pot fi diferite tipuri de audienta, prin
urmare poate fi nevoie ca mesajele sa fie transmise diferit.
-implementarea planului de evaluare - trebuie definite criterii si scopuri
ce trebuie atinse pentru a stabili daca proiectul VIVO implementat a
reprezentat un succes sau nu.
Mentenanta
- contributia la comunitatea VIVO
Abordarea si implicarea comunitatii
Comunitatea VIVO cuprinde multi stakeholderi si sponsori din cadrul institutiilor,
prin urmare, comunicarea este critica.

Analiza
- identificarea stakeholderilor - n general, birourile institutionale care sunt
interesate n utilizarea si contribuirea la proiectele VIVO sunt cele ce
aduna sau utilizeaza informatiile din cercetare.
- identificarea cazurilor de utilizare - VIVO poate fi folosit pentru a obtine
raspunsuri sau pentru a identifica experti, ori pentru a genera rapoarte
formale despre anumite cercetari.

11
Proiectare
- distribuirea prototipurilor si/sau a proiectelor VIVO existente - n plus
fata de instalarea unui VIVO de test si invitarea utilizatorilor sa editeze
profiluri, o alta metoda de a demonstra valoarea si impactul de a avea un
VIVO este de a-l arata si altor organizatii.

Implementare
- identificarea utilizatorilor - contribuitorii cu informatii sau alti stake-
holderi pot ajuta la identificarea utilizatorilor care au o probabilitate mare
sa fie partiicpanti activi care editeaza si care si actualizeaza profilul pe-
riodic. Este posibil ca acestia sa fie utilizatori care au adoptat si alte
sisteme.
- dezvoltarea materialelor de nvatare (training)
Lansare
- publicitate - n plus fata de ntalnirile periodice cu stakeholderii princi-
pali, pot fi postate sau trimise pe e-mail materiale pentru persoanele cu
interes.
- organizarea sesiunilor de training - sesiunile de training sunt esentiale
pentru implicarea comunitatii. Acestea sunt ocazii perfecte pentru a co-
munica cu utilizatorii, de a le prezenta modul de functionare a VIVO si
de a le raspunde la ntrebari.

Mentenanta
- gasirea unor colaboratori noi - din momentul n care proiectul VIVO a
fost lansat, trebuie continuata implicarea membrilor comunitatii si sa fie
identificati noi colaboratori care pot aduce contributtii comunitatii VIVO
prin munca pe care o depun.
- ntalniri cu utilizatorii - ntalnirile cu utilizatorii sunt o metoda potrivita
pentru a primi feedback si pentru a face ajustari la structura existenta, n
functie de nevoi.

Gestionarea datelor
VIVO este despre date: unde sa fie gasite, cum sfie ncarcate, cum sa fie pastrate
cat mai actualizate.

Analiza
- identificarea posibilelor surse de date - de la foi de calcul la directoare de
date externe, exista o mare varietate de surse de date care pot fi integrate
n istanta VIVO creata.
Proiectare
- maparea datelor la ontologii - valoarea semanticii web sta n posibilitatea
de a defini datele folosind o varietate de ontologii acceptate.
- strategia de verificare a documentelor cu date - deoarece datele cu

12
legaturi au o posibilitate mare de a fi partajate, consistenta datelor este
esentiala. In functie de calitate si de variabilitate, este nevoie de un plan
pentru verificarea datelor nainte de a fi ncarcate n VIVO.
Implementare
- pregatirea ncarcarii datelor - n functie de cum sunt definite rolurile
tehnice, aceasta sarcina va fi mpartita ntre experti si dezvoltatori. In
acest punct, maparea ontologiilor n diagramele conceptuale devine con-
creta prin generarea RDF. Pregatirea pentru ncarcarea datelro implica:
executarea strategiei de verificare, maparea fizica a datelor la ontologii,
verificarea RDF generat.
- provenienta documentelor cu date
Lansare
- cereri de verificare a rutei datelor - de la strategia de verificare identificata
initial, este necesara determinarea sarcinilor urmatoare. Din momentul n
care este stabilita instanta VIVO, se va lucra cu managementul si se vor
identifica sursele si fluxul de lucru prin intermediul carora se vor face cereri
de mentenanta datelor.
- asigurarea suportului pentru date
Mentenanta
- gestionarea actualizarii ontologiilor - ontologiile pot fi actualizate pentru
adauga sau pentru a sterge termeni pe masura ce domeniul este din ce n
ce mai bine definit.
- agaugarea de noi date si surse - ajustarea datelor este o sarcina perma-
nenta si presupune includerea unor noi tipuri de date si de surse
Dezvoltarea tehnica
Dezvoltatorii, programatorii, administratorii de sisteme si alte persoane tehnice
pot accesa site-ul oficial al VIVO pentru a obtine informatii tehnice.
Analiza
- nvatarea arhitecturii sistemului - este utila cunoasterea aspectelor legate
de arhitectura pentru a putea estima stabili resursele necesare
- identificarea customizarilor - fiecare site efectueaza schimbari n cadrul
VIVO, fie ca sunt simple (doar schimbarea logo-ului) sau complexe (adaugarea
unor tipuri de date noi si proprietati)
Proiectare
- stabilirea modului de populare cu date - pentru majoritatea site-urilor
VIVO, o mare provocare este popularea acestora cu informatii din cadrul
sistemelor institutionale.
- dezvoltarea prototipurilor - este posibil sa fie necesaa crearea unor pro-
grame sau scripturi pentru a
Implementare
- construirea sistemelor customizate

13
- testarea performantei - nainte de a fi anuntat public sistemul VIVO,
acesta trebuie testat pentru a se asigura ca funcctioneaza corespunzator.
Lansare
- oferire suport pentru sistem
- implementarea actualizarilor pentru sistem
Mentenanta
- dezvoltarea unor caracteristici noi

3.2 HubZero
HUBzero este o platfoma software open source pentru construirea site-urilor
web ce sustin descoperirile stiintifice, cercetarea si colaborarea.
HUBzero permite utilizatorilor sa acceseze instrumente de simulare si sa dis-
tribuie informatii.

Fiecare site web create prin intermediul HUBzero se numeste hub deoarece are
o importanta majora pentru membrii comunitatii. In prezent, hub-urile servesc
ca si comunitati virtuale n domenii de sanatate, educatie, cercetare, mediu, etc.

O caracteristica importanta a HUBzero este capacitatea de a rula coduri sursa,


de a vizualiza si de a analiza rezultatele, ntr-un singur browser web. In plus,
platforma are un set tot mai mare de instrumente de gestionare a datelor,
HUBzero ofera caracteristici built-in pentru retelele de socializare, posibilitatea
de a crea comunitati n aproape orice domeniu, simplificarea comunicarii si a
colaborarii. Site-urile care folosesc infrastructura hub sunt standardizate cu
urmatoarele module:
- instrumente de simulare interactive, gazduite pe un cluster hub si livrate
browser-elor web
- instrumente pentru simularea dezvoltarii, inclusiv controlul codului sursa si
urmarire bug-urilor
- seminarii video si prezentari animate
- mecanisme pentru ncarcare si mpartirea resurselor

Diferentele dintre HUBzero si un site web

La baza, un hub este un site web cu multe pachete open-source cunoscute -


un server Apache, scripting PHP, sistem de gestiune a continutului Joomla si o
baza de date MySQL pentru a stocarea continutului si pentru statistici.
HUBzero este construit pe aceasta infrastructura pentru a crea un mediu n care
cercetatorii, profesorii si studentii pot accesa diferite instrumente si pot partaja
informatii. Mai specific, un hub poate fi definit ca un mediu de colaborare web
cu urmatoarele caracteristici:

Instrumente de simulare interactive

14
O caracteristica de baza a unui hub este de a oferi posibilitatea de a livra un-
elte interactive, de simulare grafica prin intermediul unui browser web obinuit.
Infrastructura HUBsero include un instrument de executie si un mecanism de
livrare bazat pe Virtual Network Computing (VNC), astfel ca orice instrument
cu interfata grafica poate fi instalat si rulat.

Figure 4: dSpace

Prezentari online
Pentru ca utilizatorii sa utilizeze la capacitate maxima instrumentele de pe un
hub, trebuie ntelese limitarile acestora si modul lor de functionare. Pe fiecare
hub sunt serii de semninarii online, care sunt prezentari PowerPoint combinate
cu animatii si voce.

Mecanisme de ncarcare a resurselor


Fiecare hub este un spatiu unde utilizatorii contribuie cu informatii. O modal-
itate importanta de a aduna cat mai multe informatii este prin ncurajarea uti-
lizatorilor de a ncarca propriile instrumente, prezentari si alte materiale folosi-
toare. [McL]

Zona de dezvoltare a instrumentelor


Incarcarea unei prezentari online sau a unui document PDF este clara, dar
ncarcarea unui instrument este mai complicata. Instrumentele trebuie ncarcate,
compilate, testate, efectuate ajustari, compilate din nou si restestate de mai
multe ori nainte de a fi publicate, iar HUBzero ajuta la automatizarea acestui
proces. Fiecare hub vine nsotit de un site pentru dezvoltarea codului sursa,
astfel ncat fiecare instrument va reprezenta un proiect n cadrul acestui site.
De asemenea, va beneficia de un depozit de versionare pentru controlul fisierelor

15
sursa, de un sistem de tichetare pentru urmarirea erorilor descoperite, precum
si de o zona pentru documentatia proiectului.

Evaluari si citari
Filozifia din spatele hub-ului se bazeaza pe faptul ca este determinata calitatea
resurselor de catre membrii comunitatii. Utilizatorii nregistrsati pot da evaluari
de cinci stele, pot lasa comentarii la fiecare resursa si pot posta citari care se
refera la o anumita sursa pentru a fi vizibila tuturor membrilor comunitatii.
Evaluarile si citarile pentru fiecare resursa sunt combinate cu statisticile web
pentru a rezulta un numar de la 0 la 10, denumit clasament, ce definete cali-
tatea resursei.

Etichetarea continutului
Fiecare resursa duincadrul unui hub face parte dintr-o anumita categorie prin
intermediul etichetelor. Fiecare eticheta are asociata o pagina unde este definit
sensul acesteia si unde sunt listate resursele asociate.

3.3 dSpace
DSpace este un mediu de stocare cu acces liber pentru institutiile academice,
organizatiile non-profit si cele comerciale ce contruiesc depozite digitale cu acces
liber. DSpace pastreaza si permite un acces usor la toate tipurile de continut
cum ar fi text, imagini si seturi de date. Acesta serveste ca un sistem digital de
arhivare, orientat pe stocarea pe termen lung, accesul si pastrarea continutului
digital.
Din punct de vedere al tehnologiei, DSpace este un set de aplicatii web Java si
de programe utilitare care gestioneaza o colectie de informatii. Aplicatiile web
ofera interfete pentru administrare, depozitare, adaugare, cautare si accesare de
noi informatii. []
Principalele roluri ale sale sunt: - faciliteaza adaugarea materialelor, inclusiv
metadate despre materiale
-faciliteaza accesul la materiale, atat prin cautare, cat si prin listare
- faciliteaza pastrarea pe termen lung a materialelor

Printre tipurile de materiale ce pot fi stocate se pot enumera:


- documente, cum ar fi articole, rapoarte tehnice, lucrari stiintifice, lucrari de
conferinte
- carti
- teze
- seturi de date
- programe pentru calculator
- modele de vizualizare, de simulare
- publicatii multimedia
- nregistrari administrative

16
- carti publicate
- fisiere audio
- fisiere video
- pagini web
Mod de functionare
Transmiterea: Inferfata web facilteaza crearea unui item de arhivare prin

Figure 5: dSpace

stocarea fisierelor.
Fisier: Fisierele, de asemenea denumite bitstreams, sunt organizate n seturi de
date. Fiecare bitsream are un format tehnic si alte informatii tehnice ce ajuta
pastrarea de-a lungul timpului.
Item: Un item este un atom de arhivare ce reprezinta continut grupat si de-
scrieri asociate. Itemii sunt organizati n colectii cu acelasi continut logic.
Comunitate: Comunitatea este cel mai nalt nivel al ierarhiei de continut
DSpace. Aceasta corespunde partilor din organizatie cum ar fi departamentele,
laboratoarele, centrele de cercetare sau scolile.
Stocarea: DSpace ofera un mediu de stocare functional unde fisierele sunt ac-
cesibile.

17
Interogarea: Interfata cu utilizatorul ofera posibilitatea de a explora si de a
cauta fisiere. []

Caracteristici
- este un software open source
- este customizabil pentru a corespunde necesitatilor clientului
- gestioneaza si stocheaza toate tipurile de continut digital
- poate fi instalat out of the box

Arhitectura
Sistemul DSpace este organizat pe trei nivele, fiecare dintre ele fiind format
dintr-un anumit numar de componente.

Figure 6: dSpace

18
Nivelul de stocare este responsabil pentru stocarea fizic a a metadatelor si a
continutului. Nivelul business se ocupa cu gestionarea continutului din arhive,
a utilizatorilor de arhive, a autorizatiilor si a fluxului de lucru. Nivelul aplicatie
contine componente care comunica n afara spatiului de instalare a DSpace.
Fiecare nivel apeleaza doar nivelul care se afla sub el. Astfel, nivelul aplicatie
nu poate folosi nivelul de stocare n mod direct. Fiecare componenta din nivelul
de stocare si business are definite API-uri publicei, iar totalitatea API-urilor
pentru nivelul de stocare este cunoscuta ca si Storage API, iar pentru nivelul
business, DSpace Public API.

3.4 dSpace-CRIS
Universitatile si centrele de cercetare regandesc strategiile de comunicare, evidentieaza
calitatea rezultatelor din cercetare, precum si profilurile celor mai buni cercetatori.
Listarea publicatiilor dintr-un expert de cautare (Expert Finder) poate reprezenta
o solutie, dar oferirea unui sistem Expert Finder n cadrul unui de depozit
institutional (Institutional Repository - IR) este o abordare mai inovativa.
Aceasta idee a fost dezvoltata n 2009 de Universitatea din Hong Kong mpreuna
cu tehnicienii de la Cineca si aplicat IR-ului lor. Mai tarziu aceasta idee a
devenit DSpace-CRIS care este o extensie open source a DSpace ce adauga
functionalitate utilizatorilor de sisteme CRIS. DSpace-CRIS consta ntr-un model
de date ce descrie obiecte de interes n domeniul cercetarii si al dezvoltarii, pre-
cum si un set de instrumente pentru a gestiona datele.

In viziunea DSpace-CRIS, pubicatiile sunt o componenta importanta a ciclu-


lui de viat a al cercetarii. Acestea creeaza legaturi ntre savanti si sprijina
administratorii n procesele de luare a deciziilor.

DSpace-CRIS permite stocarea, afisarea si gestionarea metadatelor, precm si


completarea entitatilor de cercetare cum ar fi proiectele, granturile, patentele,
unitatile organizationale, profiluri cercetatorilor. Acest modul ofera o integrare
uoara a membrilor nativi DSpace cu alte entitati CRIS, pentru ca apoi toate
entitatile sa poata fi legate ntre ele.

Astfel, DSpace-CRIS este un modul nou aditional pentru platforma DSpace.


Daca DSpace permite doar gestionarea publicatiilor, DSpace-CRIS permite ma-
nipularea altor entitati cum ar fi proiecte, oameni, departamente, etc., prin
intermediul interfetei cu utilizatorul.

Fiecare structura de date de tip entitate este configurabila prin adaugarea unor
campuri simple sau complexe. Din momentul n care modelul de date a fost
configurat, toate enitatile pot avea o pagina publica, unde pot fi prezentate un-
ele sau toate informatiile si pot fi cautate si explorate. []

Caracteristici

19
Gestionarea entitatilor CRIS
- interfata grafica dedicata pentru definirea modelelor de date de ale entitatilor
de la primul nivel CRIS
- posibilitatea de a defini noi tipuri de obiecte cu ajutorul interfetei grafice pen-
tru a gestiona entitati CRIS de nivel doi: echipamente, laboratoare partajate si
conectate la una sau mai multe entitati CRIS de la primul si al doilea nivel
- vizualizarea retelei si analize

Integrarea entitatilor DSpace-CRIS cu publicatiile


- posibilitatea de a ascunde publicatii (sau alte entitati asemanatoare: proiecte,
etc.) n profilul cercetatorului
- crearea unei liste de publicatii selectate (sau alte entitati asemanatoare)

Utilizarea statisticilor
- email si alerte RSS
- detalii despre vizitarea paginii entiatii CRIS

Metrici la nivel de articol


PubMed
- numarul de citari n pagina
- numarul de articole pubmed pentru cercetator

Interoperabilitate
- servicii web SOP pentru accesul READ-ONLY la informatiile CRIS - exportare
entitatilor CRIS in CERIF XML 1.6
- importarea entiatilro CRIS din CERIF 1.6 XML
- test de conformitate CERIF[]

Conformitatea cu CERIF

Din moment ce modelul de date actual este construit pe nevoile specifice ale
unei institutii prin intermediul procesului de configurare, gradul actual de con-
formitate al dSpace-CRIS la standardul CERIF poate varia. Sistemul ofera o
infrastructura generala care permite translatarea a diferite configuratii la mod-
elul de date CERIF.

Pentru fiecare entitate CERIF poate fi definita una sau mai multe entitati
dSpace-CRIS corespunzatoare, iar n acest fel se poate caracteriza mai bine,
de exemplu, o publicatie fata de un jurnal.

Pentru a manipula caracteristica de suport pentru mai multe limbi, exista doua
abordari:
- prima, si cea mai practica, este de a definit proprietati separate pentru fiecare

20
limba pentru institutia ar dori sa aiba n sistem
- a doua, mai precisa, este de a folosi un obiect imbricat cu doua proprietati:
una pentru limba si cealalta pentru valoarea actuala

Pentru a gestiona relatiile dintre entiatile CERIF si caracterizarea semanticii


dintre acestea exita urmatoarele posibilitati:
- sa fie definite proprietati separate pentru fiecare relatie
- sa fie folosit un obiect imbricat cu doua proprietati, una care sa retina seman-
tica relatiei, iar cealalta valoarea concreta.

Descriere functionala
In timp ce DSpace permite doar gestionarea publicatiilor, DSpace-CRIS per-
mite manipularea si altor tipuri de entitati cum ar fi proiecte, persoane, depar-
tamente etc., prin intermediul interfetei cu utilizatorul. Fiecare structura de
date a entitatilor este configurabila prin intermediul interfetei cu utilizatorul
prin adaugarea unor campuri simple sau complexe.

Figure 7: DSpace-CRIS

Dupa ce modelul de date a fost configurat, toate entitatile pot avea o pa-
gina publica unde pot fi afisate informatii ce pot fi distribuite. Orice relatie
dintre un element DSace si o entitate DSpace-CRIS sau ntre entitatile DSpace-

21
CRIS poate fi exploatata automat ntr-o maniera inversa astfel ncat n pagina
cercetatorului se poate afisa o lista de publica ctii ale acestuia.

Printre alte avantaje, DSpace-CRIS are o metoda unica de a arata ca o publicatie


este asociata unei persoane sau unui proiect, fara a fi necesare multe metadate,
permitand astfel crearea unor func ctionalitati mai avansate cum ar fi:
- agregarea statisticilor la diferite nivele: liste de publicatii pentru cercetatori,
proiecte pentru cercetatori, etc.
- afisarea grafica si analizarea diferitelor retele de relatii cum ar fi co-autorii,
interactiunile dintre departamente, proiectele de colaborare etc.

Modelul de date logic si fizic

Pentru a gestiona persistenta dinamicii nregistrarilor, DSpace-CRIS a adop-


tat JDynA. o librarie JAVA open-source ce are ca scop sa ofere persistenta JPA
pentru structurile dinamice. Incepand cu DSpace 5, baza de date DSpace-CRIS
se actualizeaza automat. In prezent se foloseste Flyway DB cu scripturi SQL
integrate n dspace-api.jar pentru a mentine baza de date DSpace actualizata
permanent. Deoarece Flyway automatizeaza procesul de actualizare, nu mai
este nevoie sa fie rulate scripturile SQl manual.

Entitatile de baza JDynA sunt ilustrate n diagrama urmatoare:

Figure 8: DSpace-CRIS

Clasa abstracta AnagraficaObject este mostenita de toate obiectele cu nregistrari

22
dinamice. Clasa Property contine atat definitii de campuri (PropertiesDefini-
tion), cat si valori (AValue). AWidget este o clasa imbricata a framework-ului,
creata pentru a instantia corect tipurile de date (String, Data, etc.) si pentru a
gestiona modul de intrare a datelor (autocompletare, din lista etc. ). Diagrama
nu ilustreaza toate tipurile de date ce pot fi manipulate. De asemenea poate
suporta valori numerice, legaaturi la alte entitati, clasificari, liste de subiecte
nchise sau deschise. De asemenea, JDynA poate fi extins pentru a crea noi
tipuri de date. Urmatoarea diagrama de tip E-R ilustreaza entitatile de baza
DSpace-CRIS.

Figure 9: DSpace-CRIS

JDYNA-VALUES este inclus n toate diagramele entitatilor de baza deoarece


colectioneaza valorile de la toate tipurile de date gestionate de DSpace-CRIS (
n special referinte la entitatile sistemului: RPVALUE, PROJECTVALUE, OU-
VALUE si DOVALUE). Datorita lui JDYNA-VALUES, DSpace-CRIS permite
gestionarea nelimitata a relatiilor dintre obiecte din cadrul modulului.

23
Tabela CRIS-DO reprezenta obiectul dinamic (Dynamic Object), redenumit mai
tarziu obiectul de cercetare (Research Object). Permite manipularea tuturor en-
titatilor de cercetare dedicate procesului de diseminare a informatiei, cum ar fi
laboratoare, instrumente, etc. De fapt, JDynA suporta definirea obiectelor a
caror configurare depinde de o topologie.

24
4 Studiu de caz - dSpace-CRIS
4.1 Arhitectura Software
4.2 Configurarea unei instante dSpace-CRIS
4.3 Implementarea unor module noi

25
5 Bibiliografie
References
[] url: https : / / wiki . duraspace . org / pages / viewpage . action ?
pageId=34657287.
[] url: https://en.wikipedia.org/wiki/DSpace.
[] url: https : / / wiki . duraspace . org / pages / viewpage . action ?
pageId=25467341#WhatisDSpace?-WhatisDSpace?.
[] url: http : / / cineca . github . io / dspace - cris / doc / technical -
documentation.pdf.
[] url: http://cineca.github.io/dspace-cris/features.html.
[McL] Michael McLennan. The Hub Concept for Scientific Collaboration. url:
https://hubzero.org/resources/768/download/HUB0_whitepaper.
pdf.
[Zim] Eric H. Zimmerman. CRIS-Cross: Current Research Information Sys-
tems at a Crossroads. In: ().

26

S-ar putea să vă placă și