Documente Academic
Documente Profesional
Documente Cultură
Cercetare
Cristian Holdunu
June 2016
Contents
1 Abstract 2
2 Introducere 3
2.1 Scurt istoric . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Rolul si importanta sistemelor de management n cercetare . . . 4
2.3 Standardul CERIF . . . . . . . . . . . . . . . . . . . . . . . . . . 5
5 Bibiliografie 26
1
1 Abstract
Sistemele informatice au devenit tot mai puternice, iar odata cu performanta
acestora, a crescut semnificativ volumul de date ce sunt produse, stocate si re-
utilizate.
Pentru a asigura o analiza sau integrare de calitate a seturilor de date, cat si pen-
tru a asigura accesul la informatiile de cercetare, seturile de date trebuie asociate
cu un set de informatii suplimentare - Informatii de Cercetare (Research Infor-
mation). Printre informatiile de cercetare asociate unui set de date, se numara
entitati ca - Publicatie, Proiect, Organizatie, Persoana, Produs, Patent, Servi-
ciu, Echipament, etc. Informatiile despre cercetare se organizeaza folosind un
sablon, unul dintre cele mai utilizate sabloane n Europa fiind CERIF.
2
2 Introducere
Invatamantul de nivel superior, stiinta si tehnologia, cercetarea si inovarea se
confrunta cu o crestere a complexitatii. Universitatile, de exemplu, au devenit
adevarate fabrici de date datorita contributiilor nsemnate n producerea de
noi cunostinte prin eforturi de cercetare.
La nivel european, informatiile de cercetare asociate lucrarilor devin tot mai im-
portante, atat pentru a evalua lucrari efectuate, a facilita accesul la informatii
stiintifice cat si pentru integrarea si managementului informatiilor la scara larga.
Majoritatea tarilor europene stocheaza n format digital informatiile de cercetare
n centre la nivel national, regional sau institutional, unde fiecare sistem este
construit folosind un format sau o structura adecvata nevoilor specifice.
3
toti solicita acces usor la informatiile din cercetare. De aceea consumatorul
informatiilor din cercetare are nevoie sa acceseze datele de care are nevoie prin
intermediul unei interfete familiare. Aceasta interfata comuna trebuie nu doar
sa acceseze continut, ci si sa aiba un format potrivit pentru a-l prezenta.
Informatia trebuie sa fie prezentata ntr-un mod uniform, cel putin la nivel
sumar. Indexarea subiectelor este obligatorie, ar terminologia trebuie sa aiba
acelasi nteles n toate limbile. De aceea, a fost propus Formatul Comun al
Informatiei n Cercetarea Europeanaa (Common European Research Informa-
tion Format - CERIF) in 1991 si revizuit n 1999.
Stiinta este o componenta esentiala oricarui tip de progres. CRIS sustine dis-
tribuirea cunostintelor si beneficiile oferite unei game variate de utilizatori:
- indivizii au acceste la software expert si la sisteme pentru nregistrarea, proce-
sarea si exploatarea rezultatelor din cercetare serviciul prosperitatii societatii
- cercetatorii obtin acces liber la rezultatele din cercetare, rezultatul stiintific si
au oportunitatea de a colectiona informatii dintr-o gama variata de resurse care
4
sunt de ncredere
- partile administrative au acces la indicatorii de cercetare, analize detaliate si
informatii comparative ale activitatilor de cercetare din cadrul institutiilor
5
In linii mari, fiecare stat are un proces de cercetare similar, ce implica o plan-
ificare strategica, anuntarea programelor, cererea de propuneri, evaluarea si
finantarea propunerilor, monitorizarea si exploatarea rezultatelor.
Dintre tipuri, cele mai importante sunt tipul de baza , rezultat, legatura si
6
de legatura.
Dintre cele mai importante caracteristici se pot enumera suportul pentru mai
multe limbi si semantica.
Suportul multilingv (CERIF Multilingual Features (lang))
Suportul multilingv este foate important n tarile unde sunt vorbite mai multe
limbi oficiale. De asemenea este important n munca de cercetare care necesita
colaborare, iar acelasi proiect este nregistrat n limbi diferite de catre institutiile
din diferite tari.
CERIF ofera suport n mai multe limbi pentru titluri, descrieri, cuvinte cheie,
abstract si pentru semantica.
7
Figure 2: Unele entitati CERIF selectate, ce indica managementul dintre se-
mantici cu ajutorul legaturilor
8
3 Solutii de management utilizate in prezent
3.1 VIVO
VIVO este o unealta web pentru cercetarile stiintifice. VIVO ofera suport pen-
tru cautarea, explorarea si vizualizarea activitatii de cercetare cu scopul de a
descoperi oameni, programe, facilitati, activitati scolare si evenimente.
De cele mai multe ori, VIVO este folosit la nivel de institutie, aproape de sursele
de autoritate ce i includ si pe cercetatori, dar este adaptat pentru a fi folosit de
catre centrele de cercetare din cadrul universitatilor, de departamentele gurver-
namentale sau de catre grupuri de indivizi ce functioneaza ca organizatii vir-
tuale.
Toate datele dintr-o instanta publica VIVO pot fi accesate direct atat prin inter-
mediul browser-elor web, cat si de alte aplicatii ce solicita date pentru interogare
sau descarcare pentru a analiza sau pentru a mbina cu alte date. []
Beneficii
Descoperiri
- directii catre seturi de date si produse de cercetare
- reprezentari comune ale datelor n cadrul a diferite sisteme
Clinicieni
- cautarea conferintelor, a seminariilor, a cursurilor ce urmeaza sa se desfasoare
- gasirea articolelor relevante, a cercertarilor conduse n cadrul unei institutii
- conectarea cu alte zone de cercetare sau grupuri din cadrul unei institutii
- organizarea de strangere de fonduri pentru a sprijini cercetarea
- gasirea unui expert ce se specializeaza pe o anumita procedura
- posibilitatea unui medic de a identifica posibile studii clinice care ar putea fi
de interes pentru pacientii sai
9
Studenti
- gasirea mentorilor
- indentificare oportunitatilor de cercetare
- identificarea cursurilor de interes
- identificarea seminariilor de interes
- toate datele sunt legate de contextul unei persoane, iar acele date pot conduce
la alte resurse valoroase
10
Analiza
- stabilirea limitelor - proiectele VIVO trec adesea granitele internationale.
Pentru a facilita luarea deciziilor si pentru a trasa directii, este nevoie de
un sponsor de proiect si de unul sau mai multe grupuri consultative din
care sa faca parte, preferabil, cercetatori.
- identificarea resurselor - dimensiunea si componena echipelor VIVO de-
pind de implementarea VIVO.
Proiectare
- personalizare - VIVO poate fi customizat sutilizeze culoriile institutiei
pentru care este folosit, logo-urile acesteia, precum si alte elemente de
identificare.
- definirea scopului
Implementare
- crearea unei strategii de lansare - presupune luarea unor decizii pre-
cum: VIVO va afia toti cercetatorii sau doar o parte? Va contine multe
informatii de la nceput sau vor fi adaugate pe parcurs? Indiferent de
alegerile facute, este nevoie de un brainstorming cu stakeholderii.
Lansare
- supervizarea campaniei de publicitate - comunicarea este o parte impor-
tanta campaniei de lansare. Este esential sa se informeze comunitatea ca
un nou proiect VIVO va fi lansat. Pot fi diferite tipuri de audienta, prin
urmare poate fi nevoie ca mesajele sa fie transmise diferit.
-implementarea planului de evaluare - trebuie definite criterii si scopuri
ce trebuie atinse pentru a stabili daca proiectul VIVO implementat a
reprezentat un succes sau nu.
Mentenanta
- contributia la comunitatea VIVO
Abordarea si implicarea comunitatii
Comunitatea VIVO cuprinde multi stakeholderi si sponsori din cadrul institutiilor,
prin urmare, comunicarea este critica.
Analiza
- identificarea stakeholderilor - n general, birourile institutionale care sunt
interesate n utilizarea si contribuirea la proiectele VIVO sunt cele ce
aduna sau utilizeaza informatiile din cercetare.
- identificarea cazurilor de utilizare - VIVO poate fi folosit pentru a obtine
raspunsuri sau pentru a identifica experti, ori pentru a genera rapoarte
formale despre anumite cercetari.
11
Proiectare
- distribuirea prototipurilor si/sau a proiectelor VIVO existente - n plus
fata de instalarea unui VIVO de test si invitarea utilizatorilor sa editeze
profiluri, o alta metoda de a demonstra valoarea si impactul de a avea un
VIVO este de a-l arata si altor organizatii.
Implementare
- identificarea utilizatorilor - contribuitorii cu informatii sau alti stake-
holderi pot ajuta la identificarea utilizatorilor care au o probabilitate mare
sa fie partiicpanti activi care editeaza si care si actualizeaza profilul pe-
riodic. Este posibil ca acestia sa fie utilizatori care au adoptat si alte
sisteme.
- dezvoltarea materialelor de nvatare (training)
Lansare
- publicitate - n plus fata de ntalnirile periodice cu stakeholderii princi-
pali, pot fi postate sau trimise pe e-mail materiale pentru persoanele cu
interes.
- organizarea sesiunilor de training - sesiunile de training sunt esentiale
pentru implicarea comunitatii. Acestea sunt ocazii perfecte pentru a co-
munica cu utilizatorii, de a le prezenta modul de functionare a VIVO si
de a le raspunde la ntrebari.
Mentenanta
- gasirea unor colaboratori noi - din momentul n care proiectul VIVO a
fost lansat, trebuie continuata implicarea membrilor comunitatii si sa fie
identificati noi colaboratori care pot aduce contributtii comunitatii VIVO
prin munca pe care o depun.
- ntalniri cu utilizatorii - ntalnirile cu utilizatorii sunt o metoda potrivita
pentru a primi feedback si pentru a face ajustari la structura existenta, n
functie de nevoi.
Gestionarea datelor
VIVO este despre date: unde sa fie gasite, cum sfie ncarcate, cum sa fie pastrate
cat mai actualizate.
Analiza
- identificarea posibilelor surse de date - de la foi de calcul la directoare de
date externe, exista o mare varietate de surse de date care pot fi integrate
n istanta VIVO creata.
Proiectare
- maparea datelor la ontologii - valoarea semanticii web sta n posibilitatea
de a defini datele folosind o varietate de ontologii acceptate.
- strategia de verificare a documentelor cu date - deoarece datele cu
12
legaturi au o posibilitate mare de a fi partajate, consistenta datelor este
esentiala. In functie de calitate si de variabilitate, este nevoie de un plan
pentru verificarea datelor nainte de a fi ncarcate n VIVO.
Implementare
- pregatirea ncarcarii datelor - n functie de cum sunt definite rolurile
tehnice, aceasta sarcina va fi mpartita ntre experti si dezvoltatori. In
acest punct, maparea ontologiilor n diagramele conceptuale devine con-
creta prin generarea RDF. Pregatirea pentru ncarcarea datelro implica:
executarea strategiei de verificare, maparea fizica a datelor la ontologii,
verificarea RDF generat.
- provenienta documentelor cu date
Lansare
- cereri de verificare a rutei datelor - de la strategia de verificare identificata
initial, este necesara determinarea sarcinilor urmatoare. Din momentul n
care este stabilita instanta VIVO, se va lucra cu managementul si se vor
identifica sursele si fluxul de lucru prin intermediul carora se vor face cereri
de mentenanta datelor.
- asigurarea suportului pentru date
Mentenanta
- gestionarea actualizarii ontologiilor - ontologiile pot fi actualizate pentru
adauga sau pentru a sterge termeni pe masura ce domeniul este din ce n
ce mai bine definit.
- agaugarea de noi date si surse - ajustarea datelor este o sarcina perma-
nenta si presupune includerea unor noi tipuri de date si de surse
Dezvoltarea tehnica
Dezvoltatorii, programatorii, administratorii de sisteme si alte persoane tehnice
pot accesa site-ul oficial al VIVO pentru a obtine informatii tehnice.
Analiza
- nvatarea arhitecturii sistemului - este utila cunoasterea aspectelor legate
de arhitectura pentru a putea estima stabili resursele necesare
- identificarea customizarilor - fiecare site efectueaza schimbari n cadrul
VIVO, fie ca sunt simple (doar schimbarea logo-ului) sau complexe (adaugarea
unor tipuri de date noi si proprietati)
Proiectare
- stabilirea modului de populare cu date - pentru majoritatea site-urilor
VIVO, o mare provocare este popularea acestora cu informatii din cadrul
sistemelor institutionale.
- dezvoltarea prototipurilor - este posibil sa fie necesaa crearea unor pro-
grame sau scripturi pentru a
Implementare
- construirea sistemelor customizate
13
- testarea performantei - nainte de a fi anuntat public sistemul VIVO,
acesta trebuie testat pentru a se asigura ca funcctioneaza corespunzator.
Lansare
- oferire suport pentru sistem
- implementarea actualizarilor pentru sistem
Mentenanta
- dezvoltarea unor caracteristici noi
3.2 HubZero
HUBzero este o platfoma software open source pentru construirea site-urilor
web ce sustin descoperirile stiintifice, cercetarea si colaborarea.
HUBzero permite utilizatorilor sa acceseze instrumente de simulare si sa dis-
tribuie informatii.
Fiecare site web create prin intermediul HUBzero se numeste hub deoarece are
o importanta majora pentru membrii comunitatii. In prezent, hub-urile servesc
ca si comunitati virtuale n domenii de sanatate, educatie, cercetare, mediu, etc.
14
O caracteristica de baza a unui hub este de a oferi posibilitatea de a livra un-
elte interactive, de simulare grafica prin intermediul unui browser web obinuit.
Infrastructura HUBsero include un instrument de executie si un mecanism de
livrare bazat pe Virtual Network Computing (VNC), astfel ca orice instrument
cu interfata grafica poate fi instalat si rulat.
Figure 4: dSpace
Prezentari online
Pentru ca utilizatorii sa utilizeze la capacitate maxima instrumentele de pe un
hub, trebuie ntelese limitarile acestora si modul lor de functionare. Pe fiecare
hub sunt serii de semninarii online, care sunt prezentari PowerPoint combinate
cu animatii si voce.
15
sursa, de un sistem de tichetare pentru urmarirea erorilor descoperite, precum
si de o zona pentru documentatia proiectului.
Evaluari si citari
Filozifia din spatele hub-ului se bazeaza pe faptul ca este determinata calitatea
resurselor de catre membrii comunitatii. Utilizatorii nregistrsati pot da evaluari
de cinci stele, pot lasa comentarii la fiecare resursa si pot posta citari care se
refera la o anumita sursa pentru a fi vizibila tuturor membrilor comunitatii.
Evaluarile si citarile pentru fiecare resursa sunt combinate cu statisticile web
pentru a rezulta un numar de la 0 la 10, denumit clasament, ce definete cali-
tatea resursei.
Etichetarea continutului
Fiecare resursa duincadrul unui hub face parte dintr-o anumita categorie prin
intermediul etichetelor. Fiecare eticheta are asociata o pagina unde este definit
sensul acesteia si unde sunt listate resursele asociate.
3.3 dSpace
DSpace este un mediu de stocare cu acces liber pentru institutiile academice,
organizatiile non-profit si cele comerciale ce contruiesc depozite digitale cu acces
liber. DSpace pastreaza si permite un acces usor la toate tipurile de continut
cum ar fi text, imagini si seturi de date. Acesta serveste ca un sistem digital de
arhivare, orientat pe stocarea pe termen lung, accesul si pastrarea continutului
digital.
Din punct de vedere al tehnologiei, DSpace este un set de aplicatii web Java si
de programe utilitare care gestioneaza o colectie de informatii. Aplicatiile web
ofera interfete pentru administrare, depozitare, adaugare, cautare si accesare de
noi informatii. []
Principalele roluri ale sale sunt: - faciliteaza adaugarea materialelor, inclusiv
metadate despre materiale
-faciliteaza accesul la materiale, atat prin cautare, cat si prin listare
- faciliteaza pastrarea pe termen lung a materialelor
16
- carti publicate
- fisiere audio
- fisiere video
- pagini web
Mod de functionare
Transmiterea: Inferfata web facilteaza crearea unui item de arhivare prin
Figure 5: dSpace
stocarea fisierelor.
Fisier: Fisierele, de asemenea denumite bitstreams, sunt organizate n seturi de
date. Fiecare bitsream are un format tehnic si alte informatii tehnice ce ajuta
pastrarea de-a lungul timpului.
Item: Un item este un atom de arhivare ce reprezinta continut grupat si de-
scrieri asociate. Itemii sunt organizati n colectii cu acelasi continut logic.
Comunitate: Comunitatea este cel mai nalt nivel al ierarhiei de continut
DSpace. Aceasta corespunde partilor din organizatie cum ar fi departamentele,
laboratoarele, centrele de cercetare sau scolile.
Stocarea: DSpace ofera un mediu de stocare functional unde fisierele sunt ac-
cesibile.
17
Interogarea: Interfata cu utilizatorul ofera posibilitatea de a explora si de a
cauta fisiere. []
Caracteristici
- este un software open source
- este customizabil pentru a corespunde necesitatilor clientului
- gestioneaza si stocheaza toate tipurile de continut digital
- poate fi instalat out of the box
Arhitectura
Sistemul DSpace este organizat pe trei nivele, fiecare dintre ele fiind format
dintr-un anumit numar de componente.
Figure 6: dSpace
18
Nivelul de stocare este responsabil pentru stocarea fizic a a metadatelor si a
continutului. Nivelul business se ocupa cu gestionarea continutului din arhive,
a utilizatorilor de arhive, a autorizatiilor si a fluxului de lucru. Nivelul aplicatie
contine componente care comunica n afara spatiului de instalare a DSpace.
Fiecare nivel apeleaza doar nivelul care se afla sub el. Astfel, nivelul aplicatie
nu poate folosi nivelul de stocare n mod direct. Fiecare componenta din nivelul
de stocare si business are definite API-uri publicei, iar totalitatea API-urilor
pentru nivelul de stocare este cunoscuta ca si Storage API, iar pentru nivelul
business, DSpace Public API.
3.4 dSpace-CRIS
Universitatile si centrele de cercetare regandesc strategiile de comunicare, evidentieaza
calitatea rezultatelor din cercetare, precum si profilurile celor mai buni cercetatori.
Listarea publicatiilor dintr-un expert de cautare (Expert Finder) poate reprezenta
o solutie, dar oferirea unui sistem Expert Finder n cadrul unui de depozit
institutional (Institutional Repository - IR) este o abordare mai inovativa.
Aceasta idee a fost dezvoltata n 2009 de Universitatea din Hong Kong mpreuna
cu tehnicienii de la Cineca si aplicat IR-ului lor. Mai tarziu aceasta idee a
devenit DSpace-CRIS care este o extensie open source a DSpace ce adauga
functionalitate utilizatorilor de sisteme CRIS. DSpace-CRIS consta ntr-un model
de date ce descrie obiecte de interes n domeniul cercetarii si al dezvoltarii, pre-
cum si un set de instrumente pentru a gestiona datele.
Fiecare structura de date de tip entitate este configurabila prin adaugarea unor
campuri simple sau complexe. Din momentul n care modelul de date a fost
configurat, toate enitatile pot avea o pagina publica, unde pot fi prezentate un-
ele sau toate informatiile si pot fi cautate si explorate. []
Caracteristici
19
Gestionarea entitatilor CRIS
- interfata grafica dedicata pentru definirea modelelor de date de ale entitatilor
de la primul nivel CRIS
- posibilitatea de a defini noi tipuri de obiecte cu ajutorul interfetei grafice pen-
tru a gestiona entitati CRIS de nivel doi: echipamente, laboratoare partajate si
conectate la una sau mai multe entitati CRIS de la primul si al doilea nivel
- vizualizarea retelei si analize
Utilizarea statisticilor
- email si alerte RSS
- detalii despre vizitarea paginii entiatii CRIS
Interoperabilitate
- servicii web SOP pentru accesul READ-ONLY la informatiile CRIS - exportare
entitatilor CRIS in CERIF XML 1.6
- importarea entiatilro CRIS din CERIF 1.6 XML
- test de conformitate CERIF[]
Conformitatea cu CERIF
Din moment ce modelul de date actual este construit pe nevoile specifice ale
unei institutii prin intermediul procesului de configurare, gradul actual de con-
formitate al dSpace-CRIS la standardul CERIF poate varia. Sistemul ofera o
infrastructura generala care permite translatarea a diferite configuratii la mod-
elul de date CERIF.
Pentru fiecare entitate CERIF poate fi definita una sau mai multe entitati
dSpace-CRIS corespunzatoare, iar n acest fel se poate caracteriza mai bine,
de exemplu, o publicatie fata de un jurnal.
Pentru a manipula caracteristica de suport pentru mai multe limbi, exista doua
abordari:
- prima, si cea mai practica, este de a definit proprietati separate pentru fiecare
20
limba pentru institutia ar dori sa aiba n sistem
- a doua, mai precisa, este de a folosi un obiect imbricat cu doua proprietati:
una pentru limba si cealalta pentru valoarea actuala
Descriere functionala
In timp ce DSpace permite doar gestionarea publicatiilor, DSpace-CRIS per-
mite manipularea si altor tipuri de entitati cum ar fi proiecte, persoane, depar-
tamente etc., prin intermediul interfetei cu utilizatorul. Fiecare structura de
date a entitatilor este configurabila prin intermediul interfetei cu utilizatorul
prin adaugarea unor campuri simple sau complexe.
Figure 7: DSpace-CRIS
Dupa ce modelul de date a fost configurat, toate entitatile pot avea o pa-
gina publica unde pot fi afisate informatii ce pot fi distribuite. Orice relatie
dintre un element DSace si o entitate DSpace-CRIS sau ntre entitatile DSpace-
21
CRIS poate fi exploatata automat ntr-o maniera inversa astfel ncat n pagina
cercetatorului se poate afisa o lista de publica ctii ale acestuia.
Figure 8: DSpace-CRIS
22
dinamice. Clasa Property contine atat definitii de campuri (PropertiesDefini-
tion), cat si valori (AValue). AWidget este o clasa imbricata a framework-ului,
creata pentru a instantia corect tipurile de date (String, Data, etc.) si pentru a
gestiona modul de intrare a datelor (autocompletare, din lista etc. ). Diagrama
nu ilustreaza toate tipurile de date ce pot fi manipulate. De asemenea poate
suporta valori numerice, legaaturi la alte entitati, clasificari, liste de subiecte
nchise sau deschise. De asemenea, JDynA poate fi extins pentru a crea noi
tipuri de date. Urmatoarea diagrama de tip E-R ilustreaza entitatile de baza
DSpace-CRIS.
Figure 9: DSpace-CRIS
23
Tabela CRIS-DO reprezenta obiectul dinamic (Dynamic Object), redenumit mai
tarziu obiectul de cercetare (Research Object). Permite manipularea tuturor en-
titatilor de cercetare dedicate procesului de diseminare a informatiei, cum ar fi
laboratoare, instrumente, etc. De fapt, JDynA suporta definirea obiectelor a
caror configurare depinde de o topologie.
24
4 Studiu de caz - dSpace-CRIS
4.1 Arhitectura Software
4.2 Configurarea unei instante dSpace-CRIS
4.3 Implementarea unor module noi
25
5 Bibiliografie
References
[] url: https : / / wiki . duraspace . org / pages / viewpage . action ?
pageId=34657287.
[] url: https://en.wikipedia.org/wiki/DSpace.
[] url: https : / / wiki . duraspace . org / pages / viewpage . action ?
pageId=25467341#WhatisDSpace?-WhatisDSpace?.
[] url: http : / / cineca . github . io / dspace - cris / doc / technical -
documentation.pdf.
[] url: http://cineca.github.io/dspace-cris/features.html.
[McL] Michael McLennan. The Hub Concept for Scientific Collaboration. url:
https://hubzero.org/resources/768/download/HUB0_whitepaper.
pdf.
[Zim] Eric H. Zimmerman. CRIS-Cross: Current Research Information Sys-
tems at a Crossroads. In: ().
26