Documente Academic
Documente Profesional
Documente Cultură
Semanti c Web
Fundamente si apl i ca ti i
2004
n memoria bunicilor no stri.
C up rins suc c int
Mul tumiri xii
Lista detabele xiii
Lista deguri xiv
Preambul 1
1 Arhitectura spa tiului WWW 7
1.1 Prezentare general a . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Componente de baz a al e spa ti ul ui WWW . . . . . . . . . 10
1.3 Evol u ti a spa ti ul ui WWW . . . . . . . . . . . . . . . . . . . 18
1.4 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Web-ul semantic 32
2.1 Prezentare general a . . . . . . . . . . . . . . . . . . . . . . 32
2.2 RDF cadru de descri ere a resursel or . . . . . . . . . . . 55
2.3 Uti l i z ari si apl i ca ti i . . . . . . . . . . . . . . . . . . . . . . 76
2.4 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3 Descrierea si reg asirea resurselor multimedia 81
3.1 Prel i mi nari i . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.2 Model area rel a ti i l or di ntre resurse . . . . . . . . . . . . . 83
3.3 C autarea . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.4 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4 Solu tii deimplementare 136
4.1 Prel i mi nari i . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.2 Agen ti software . . . . . . . . . . . . . . . . . . . . . . . . 137
v
4.3 Servi ci i Web . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.4 I TW o pl atform a di stri bui t a desti nat a descoperi ri i re-
sursel or mul ti medi a . . . . . . . . . . . . . . . . . . . . . . 157
4.5 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
5 La nal 172
5.1 Pri vi re de ansambl u . . . . . . . . . . . . . . . . . . . . . . 172
5.2 Di rec ti i vi i toare de cercetare . . . . . . . . . . . . . . . . . 174
A Folosirea metadatelor n contextul e-commerce 175
B Schema XML pentru limbajul XFi l es 183
C Schema XML pentru limbajul TRSL 191
D Schema XML pentru limbajul WQFL 195
E Acronime 200
Bibliograe 203
C up rins
Mul tumiri xii
Lista detabele xiii
Lista deguri xiv
Preambul 1
1 Arhitectura spa tiului WWW 7
1.1 Prezentare general a . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Componente de baz a al e spa ti ul ui WWW . . . . . . . . . 10
1.2.1 Hi pertextul . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1.1 Deni ti i . . . . . . . . . . . . . . . . . . . 10
1.2.1.2 Concepte . . . . . . . . . . . . . . . . . . . 11
1.2.1.3 Documente hi pertext . . . . . . . . . . . . 12
1.2.2 Local i zarea resursel or Web . . . . . . . . . . . . . 15
1.2.2.1 I denti catori uni formi de resurse . . . . 15
1.2.2.2 Si ntaxa URI . . . . . . . . . . . . . . . . . 16
1.3 Evol u ti a spa ti ul ui WWW . . . . . . . . . . . . . . . . . . . 18
1.3.1 Evol u ti a si ntaxei spre formate decl arati ve . . . . 19
1.3.2 Evol u ti a sti l ul ui (prezent ari i ): de l a formatare l a
foi de sti l uri . . . . . . . . . . . . . . . . . . . . . . 20
1.3.3 Evol u ti a structuri i . . . . . . . . . . . . . . . . . . 21
1.3.4 Evol u ti a semanti ci i . . . . . . . . . . . . . . . . . . 22
1.3.5 Evol u ti a el ementel or programabi l e . . . . . . . . . 28
1.4 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
vi i
2 Web-ul semantic 32
2.1 Prezentare general a . . . . . . . . . . . . . . . . . . . . . . 32
2.1.1 Preambul . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.2 Caracteri zare si di rec ti i de i nteres . . . . . . . . . 33
2.1.3 Structura Web-ul ui semanti c . . . . . . . . . . . . 36
2.1.3.1 I nterschi mbul i ntel i gent de date vi a XML 36
2.1.3.2 Expri marea metadatel or . . . . . . . . . . 37
2.1.3.3 Expri marea ontol ogi i l or . . . . . . . . . . 42
2.2 RDF cadru de descri ere a resursel or . . . . . . . . . . . 55
2.2.1 Prezentare general a . . . . . . . . . . . . . . . . . 55
2.2.2 Model ul de baz a al RDF . . . . . . . . . . . . . . . 56
2.2.3 Modul de reprezentare . . . . . . . . . . . . . . . . 57
2.2.4 Si ntaxa de baz a RDF . . . . . . . . . . . . . . . . . 59
2.2.5 Scheme si spa ti i de nume . . . . . . . . . . . . . . 61
2.2.5.1 Schemel e n detal i u . . . . . . . . . . . . . 61
2.2.5.2 Cl ase fundamental e . . . . . . . . . . . . 62
2.2.5.3 Propri et a ti fundamental e . . . . . . . . . 63
2.2.5.4 Restri c ti i . . . . . . . . . . . . . . . . . . . 65
2.2.5.5 Restri c ti i fundamental e . . . . . . . . . . 66
2.2.6 Col ec ti i de resurse . . . . . . . . . . . . . . . . . . . 67
2.2.7 Referen ti di stri buti vi . . . . . . . . . . . . . . . . . 70
2.2.8 Col ec ti i referi te de un URI . . . . . . . . . . . . . . 72
2.2.9 Model area decl ara ti i l or . . . . . . . . . . . . . . . . 73
2.3 Uti l i z ari si apl i ca ti i . . . . . . . . . . . . . . . . . . . . . . 76
2.4 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3 Descrierea si reg asirea resurselor multimedia 81
3.1 Prel i mi nari i . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.1.1 Moti va ti e . . . . . . . . . . . . . . . . . . . . . . . . 81
3.1.2 Prezentare general a . . . . . . . . . . . . . . . . . 82
3.2 Model area rel a ti i l or di ntre resurse . . . . . . . . . . . . . 83
3.2.1 Cl asi care a rel a ti i l or di ntre resurse . . . . . . . . 83
3.2.2 Model e temporal e . . . . . . . . . . . . . . . . . . . 85
3.2.2.1 I ntroducere . . . . . . . . . . . . . . . . . 85
3.2.3 Logi ca temporal a cu i nterval e . . . . . . . . . . . . 87
3.2.3.1 Structuri temporal e n l ogi ca I TL . . . . 87
3.2.3.2 Si stemul axi omati c al l ogi ci i I TL . . . . . 87
3.2.3.3 Speci carea rel a ti i l or temporal e . . . . . 90
3.2.3.4 Caracteri zarea peri oadel or de ti mp . . . 91
3.2.4 Si steme de si ere di stri bui te . . . . . . . . . . . . 93
3.2.4.1 Caracteri zare . . . . . . . . . . . . . . . . 94
3.2.4.2 Fi si erel e ca ti puri abstracte de date . . . 95
3.2.4.3 I nterfa ta de programare . . . . . . . . . . 96
3.2.4.4 Propri et a ti . . . . . . . . . . . . . . . . . . 97
3.2.5 Un model de descri ere XML/RDF a si stemel or de
si ere di stri bui te . . . . . . . . . . . . . . . . . . . 100
3.2.5.1 Li mbajul XFiles . . . . . . . . . . . . . . . 100
3.2.5.2 Exempl u . . . . . . . . . . . . . . . . . . . 102
3.2.6 Model area resursel or stocate de un server Web . . 104
3.2.6.1 Exempl u . . . . . . . . . . . . . . . . . . . 105
3.2.7 Model area rel a ti i l or temporal e di ntre resurse . . 107
3.2.7.1 Si ntaxa si semanti ca l i mbajul ui TRSL . . 109
3.2.7.2 Exempl e . . . . . . . . . . . . . . . . . . . 111
3.2.7.3 Suportul pentru Web-ul semanti c . . . . 115
3.3 C autarea . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.3.1 Argument . . . . . . . . . . . . . . . . . . . . . . . 116
3.3.2 Motoare de c autare . . . . . . . . . . . . . . . . . . 117
3.3.2.1 Prel i mi nari i . . . . . . . . . . . . . . . . . 117
3.3.2.2 Reg asi rea i nforma ti i l or de c atre uti l i zatori 117
3.3.2.3 Anatomi a unui motor de c autare . . . . . 118
3.3.2.4 Meta-c aut atoare si portal uri . . . . . . . 124
3.3.3 Expri marea i nterog ari l or pri n WQFL . . . . . . . 125
3.3.3.1 Prel i mi nari i . . . . . . . . . . . . . . . . . 125
3.3.3.2 Acti vi tatea de c autare . . . . . . . . . . . 127
3.3.3.3 Li mbajul WQFL . . . . . . . . . . . . . . 129
3.3.3.4 Exti nderea l i mbajul ui WQFL . . . . . . . 133
3.3.3.5 WQFL ca l i mbaj de i nterogare XML . . . 134
3.4 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4 Solu tii deimplementare 136
4.1 Prel i mi nari i . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.2 Agen ti software . . . . . . . . . . . . . . . . . . . . . . . . 137
4.2.1 Deni re . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.2.1.1 Agen ti i ca enti t a ti comportamental e . . . 137
4.2.1.2 Atri butel e agen ti l or . . . . . . . . . . . . 138
4.2.1.3 Caracteri z ari al e agen ti l or . . . . . . . . 139
4.2.1.4 Di rec ti i actual e de cercetare . . . . . . . . 142
4.2.2 Si steme mul ti -agent . . . . . . . . . . . . . . . . . 143
4.2.2.1 Prezentare general a . . . . . . . . . . . . 143
4.2.2.2 Model e BDI . . . . . . . . . . . . . . . . . 144
4.2.2.3 Comuni care i nter-agent . . . . . . . . . . 148
4.3 Servi ci i Web . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.3.1 Prezentare general a . . . . . . . . . . . . . . . . . 149
4.3.2 Standarde . . . . . . . . . . . . . . . . . . . . . . . 150
4.3.2.1 Descri erea unui servi ci u Web . . . . . . . 150
4.3.2.2 Publ i carea si reg asi rea unui servi ci u Web 151
4.3.2.3 I nvocarea servi ci i l or Web . . . . . . . . . 152
4.3.3 Servi ci i Web semanti ce . . . . . . . . . . . . . . . . 153
4.3.3.1 Probl emati ci actual e . . . . . . . . . . . . 153
4.3.3.2 Caracteri zare . . . . . . . . . . . . . . . . 154
4.3.3.3 Exempl i care . . . . . . . . . . . . . . . . 155
4.4 I TW o pl atform a di stri bui t a desti nat a descoperi ri i re-
sursel or mul ti medi a . . . . . . . . . . . . . . . . . . . . . . 157
4.4.1 Prezentare general a . . . . . . . . . . . . . . . . . 157
4.4.2 Arhi tectura si stemul ui . . . . . . . . . . . . . . . . 157
4.4.2.1 Agen ti I TW . . . . . . . . . . . . . . . . . 159
4.4.2.2 Servi ci i Web I TW . . . . . . . . . . . . . . 162
4.4.2.3 I nterfa ta I TW . . . . . . . . . . . . . . . . 165
4.4.2.4 I mpl ementarea curent a . . . . . . . . . . 167
4.4.2.5 Uti l i z ari . . . . . . . . . . . . . . . . . . . 169
4.5 Concl uzi i . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
5 La nal 172
5.1 Pri vi re de ansambl u . . . . . . . . . . . . . . . . . . . . . . 172
5.2 Di rec ti i vi i toare de cercetare . . . . . . . . . . . . . . . . . 174
A Folosirea metadatelor n contextul e-commerce 175
B Schema XML pentru limbajul XFi l es 183
C Schema XML pentru limbajul TRSL 191
D Schema XML pentru limbajul WQFL 195
E Acronime 200
Bibliograe 203
Mul tumiri
Aceast a l ucrare nu ar ajuns l a forma actual a f ar a suportul veni t di n
partea prof. dr. Dumitru Todoroi conduc atorul sti i n ti c al tezei de
doctorat , prof. dr. Toader J ucan, prof. dr. Dan Grigora s, prof. dr. Dan
Cristea, prof. dr. Cristian Masalagiu si conf. dr. Dorel Lucanu de l a
Facul tatea de I nformati c a a Uni versi t a ti i Al . I . Cuza di n I a si si di n
partea prof. dr. Stefan Tr au san-Matu de l a Uni versi tatea Pol i tehni c a
di n Bucure sti .
i men ti on am si pe col aboratori i si pri eteni i apropi a ti ing. Drago s
Acost achioaie (Bi osfarm I a si S.R.L.), cercet. drd. Lenu ta Alboaie
(I nsti tutul de I nformati c a Teoreti c a al Academi ei Romne l i al a I a si ),
cercet. Snic a Alboaie(I nsti tutul de I nformati c a Teoreti c a al Academi ei
Romne l i al a I a si ), asist. drd. Mihaela Brut (Facul tatea de I nfor-
mati c a di n I a si ) si lect. drd. Marius Cioca (Facul tatea de I ngi neri e a
Uni versi t a ti i L. Bl aga di n Si bi u) pentru ajutorul acordat pe parcur-
sul etapel or de el aborare a con ti nutul ui acestui materi al .
Nu-i ui t am ni ci pe absol ven ti i Petric a G abureanu si Victor Grigo-
riu, mul tumi ndu-l e pentru i nteresul acordat Web-ul ui semanti c, dar
mai al es pentru unel e contri bu ti i l a vol umul de fa t a. Expri m am grati -
tudi nea noastr a studen ti l or Florin Bandas si Adrian Mironescu pentru
ajutorul oferi t l a nal i zarea acestei c ar ti .
De asemenea, autorul este recunosc ator profesori l or Dr. Marcin
Paprzycki (Computer Sci ence Department, Okl ahoma State Uni versi ty,
USA) si Dr. Stefan Andrei (Facul tatea de I nformati c a di n I a si ) pentru
faci l i tarea accesul ui l a unel e resurse bi bl i ograce si pentru comenta-
ri i l e deosebi t de uti l e pri vi toare l a con ti nutul l ucr ari i .
List a d e ta b e le
1.1 Compara ti e ntre di verse formate de documente n evol u ti a
spa ti ul ui Worl d-Wi de Web . . . . . . . . . . . . . . . . . . 31
3.1 Rel a ti i l e stabi l i te ntre punctel e de nceput si de sfr si t
al e dou a i nterval e temporal e . . . . . . . . . . . . . . . . . 92
3.2 Rel a ti i l e restrnse ntre punctel e de nceput si de sfr si t
al e dou a i nterval e temporal e . . . . . . . . . . . . . . . . . 93
List a d e g uri
1.1 Rel a ti i l e di ntre o resurs a, adresa si reprezentarea resursei 11
2.1 Resursel e si l eg aturi l e au asoci ate descri eri semanti ce . 34
2.2 Ni vel uri l e de speci care a Web-ul ui semanti c . . . . . . . 36
2.3 Reprezentarea pri n grafuri a decl ara ti i l or RDF . . . . . . 57
2.4 Mul ti mi l e de cl ase si de propri et a ti . . . . . . . . . . . . . 62
2.5 I erarhi i l e de cl ase RDF . . . . . . . . . . . . . . . . . . . . 64
2.6 Restri c ti i l e n RDF . . . . . . . . . . . . . . . . . . . . . . 66
3.1 Axi omati zarea peri oadel or de ti mp . . . . . . . . . . . . . 88
3.2 Rel a ti i l e posi bi l e ntre peri oadel e de ti mp . . . . . . . . . 90
3.3 Reprezentarea grac a a l eg aturi i temporal e stabi l i te n-
tre dou a si turi Web . . . . . . . . . . . . . . . . . . . . . . 111
3.4 Reprezentarea grac a a l eg aturi l or stabi l i te ntre resur-
sel e Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3.5 Arhi tectura i ntern a a unui motor de c autare . . . . . . . 119
4.1 Ni vel uri l e de standardi zare al e servi ci i l or Web . . . . . . 150
4.2 Arhi tectura i ntern a a si stemul ui I TW . . . . . . . . . . . 159
4.3 Servi ci i l e Web l ocal e si externe fol osi te de I TW . . . . . . 168
4.4 Structura pe ni vel uri a componentel or I TW i mpl emen-
tnd servi ci i Web semanti ce . . . . . . . . . . . . . . . . . 170
Pre a m b ul
Dac a omul ar putea c al atori f ar a ntreruperetoat a via ta,
dela na sterepn a la moarte, timpul ar ajungesinonim
cu spa tiul str ab atut depa sii s ai.
Bergson
Prezentaregeneral a
T
EMA pri nci pal a a l ucr ari i de fa t a se nscri e pe coordonatel e reg asi ri i
i nforma ti i l or hi permedi a n spa ti ul Worl d-Wi de Web. n vederea
ndepl i ni ri i acestui dezi derat, pe parcursul materi al ul ui se prezi nt a un
model ori gi nal uti l i zat pentru speci carea rel a ti i l or spa ti o-temporal e
di ntre resursel e mul ti medi a al e unui (fragment de) si t Web, model ci r-
cumscri s probl emati ci l or actual e al e Web-ul ui semanti c.
La ni vel abstract, s-a recurs l a formal i z ari bazate pe l ogi ca tem-
poral a cu i nterval e I TL (I nterval Temporal Logic) [Al l en, 1991]. Mo-
del area rel a ti i l or spa ti al e are n vedere modul de stocare a acestora
n cadrul unui si stem de si ere di stri bui t, l undu-se n consi dera ti e
si posi bi l el e metadate care pot asoci ate resursel or (e.g., drepturi de
acces, ti p, propri etar etc.).
Pentru a asi gura i ndependen ta de pl atform a si al i ni erea l a pri nci -
pal el e standarde actual e al e Consor ti ul ui Web, mani era de stocare a
i nforma ti i l or real i zndu-se pri n crearea unor l i mbaje bazate pe meta-
l i mbajul XML (ExtensibleMarkup Language) [Bray et al., 2004]. Aces-
tea sunt meni te a i ntegrate n aser ti uni RDF (ResourceDescription
1
2 Sabi n Cornel i u Buraga
Framework) [Beckett, 2004] cadru oferi nd i nteroperabi l i tate apl i ca-
ti i l or di stri bui te care real i zeaz a schi mb i ntel i gent de i nforma ti i , n sen-
sul i nterpret ari i de c atre ma si n a a semanti ci i acestora. Di n acest punct
de vedere, probl emati ca dezb atut a poate consi derat a ca i nd al i ni at a
Web-ului semantic [Berners-Lee et al., 2001, Davi es et al., 2003].
Di n moment ce resursel e mul ti medi a pot descri se si pot i nter-
conectate pri n rel a ti i spa ti o-temporal e, exi st a posi bi l i tatea c aut ari i si
reg asi ri i l or, ntr-o mani er a asem an atoare cel ei adoptate de motoarel e
de c autare actual e [Bri n & Page, 1998, Chakrabarti et al., 1999]. Lu-
crarea propune uti l i zarea descri eri l or RDF al e metadatel or asoci ate
resursel or, cu concursul rel a ti i l or stabi l i te ntre documentel e mul ti me-
di a.
Una di ntre etapel e i mportante al e procesul ui de c autare este cea
a proces ari i i nterog ari l or compl exe formul ate de uti l i zatori . Di n acest
punct de vedere, cercet ari l e ntrepri nse se concentreaz a asupra ex-
pri m ari i i nterog ari l or pri n i ntermedi ul unui l i mbaj bazat pe XML, i n-
cl uznd n pl us unel e i nforma ti i pri vi nd structura, con ti nutul si rel a-
ti i l e pe care l e pot avea documentel e mul ti medi a c autate cu al te re-
surse.
Lucrarea propune o sol u ti e ori gi nal a de i mpl ementare, concreti zat a
n pl atforma I TW, bazat a pe componente di stri bui te eterogene, repre-
zentate di n agen ti [Bradshow, 1997, Luck, McBurney & Prei st, 2003],
servi ci i Web (semanti ce) [Curbera et al., 2002] si al te enti t a ti progra-
mabi l e. Aceste componente software, i ndependente de pl atform a si dez-
vol tate deschi s, pot i ntegrate n pl atforme de ti p Gri d [Buyya, 2002],
cu uti l i z ari n reg asi rea i nforma ti i l or mul ti medi a n cadrul organi za ti i -
l or vi rtual e exi stnd n I nternet.
Structura lucr arii
Vom prezenta n conti nuare structura general a a c ar ti i :
Capi tol ul 1 descri e arhi tectura spa ti ul ui WWW, trecnd n revi st a
pri nci pal el e concepte pe care se bazeaz a: hipertextul [Ni el sen, 1990],
identicatorii uniformi de resurse [Berners-Lee et al., 1998] si limba-
jele de adnotare [Buraga, 2001a, Tr au san-Matu, 2001]. De asemenea,
Preambul 3
se i l ustreaz a evol u ti a mai al es di n punctul de vedere al fami l i ei de
l i mbaje XML a Web-ul ui di n pri sma si ntaxei , sti l ul ui de prezentare,
structuri i si semanti ci i con ti nutul ui resursel or Web, urmndu-se n
pri nci pal l i ni i l e expuse n [Buraga, 2002a] si [Al boai e & Buraga, 2002].
n capi tol ul 2 se real i zeaz a o prezentare general a a probl emati ci l or
l egate de Web-ul semanti c, i nsi stndu-se asupra RDF conform cu cel e
detal i ate de [Beckett, 2004], [Bri ckl ey & Guha, 2000] si [Hayes, 2004]
si a descri eri i ontol ogi i l or. Unel e exempl i c ari recurg l a o seri e de
contri bu ti i propri i l egate de model area rel a ti i l or di ntre resursel e unui
si stem de tel econferi n te [Buraga, 1998, Buraga, 2001b, Buraga, 2001d]
sau al e componentel or unei pl atforme de ti p e-learning
[Buraga, 2001c, Buraga, 2003e].
Urm atorul capi tol detal i az a cercet ari l e pri vi toare l a descri erea si
reg asi rea resursel or mul ti medi a di sponi bi l e n I nternet. Acest capi tol
este di vi zat n dou a mari p ar ti :
Pri ma parte a capi tol ul ui prezi nt a o seri e de model e teoreti ce uti -
l i zate pentru descri erea propri et a ti l or temporal e al e si stemel or
di stri bui te, focal i zndu-se asupra l ogi ci i I TL (a se vedea sec ti u-
nea 3.2.3). Pe baza acestui formal i sm, se vor putea expri ma rel a-
ti i l e spa ti o-temporal e di ntre resursel e Web.
n vederea descri eri i resursel or di stri bui te n spa ti ul WWW, se
pl eac a de l a reprezentarea RDF a propri et a ti l or p ar ti l or compo-
nente al e unui si stem de si ere di stri bui t, pri n i ntermedi ul unui
l i mbaj propri u bazat pe XML XFiles descri s n [Buraga, 2000a],
[Buraga, 2002b] si [Buraga, 2003d]. Exti nznd model ul l a Web,
se pot expri ma rel a ti i l e spa ti al e stabi l i te ntre di verse resurse al e
unui Web l ocal (e.g., i ntranetul unei organi za ti i ). Resursel e tem-
poral e vor putea speci cate cu concursul unui al t l i mbaj TRSL
(Temporal Relation Specication Language) [Buraga, 2002c]
[Buraga & Ci obanu, 2002] care rescri e n termeni i XML rel a-
ti i l e formal e al e l ogi ci i I TL. Acest l i mbaj este suci ent de exi bi l
pentru a da posi bi l i tatea asoci eri i de ac ti uni care vor putea exe-
cutate l a apari ti a unui eveni ment de exempl u, i ni ti erea unei
ogl i ndi ri (copi eri ) a unei resurse pe al t si t Web l a un moment de
ti mp.
4 Sabi n Cornel i u Buraga
Subcapi tol ul secund se concentreaz a asupra probl emati ci i c aut a-
ri i resursel or mul ti medi a, l ucrarea propunnd o mani er a de uti -
l i zare a descri eri l or RDF al e metadatel or asoci ate resursel or si
expl oatare a i nforma ti i l or semanti ce asoci ate rel a ti i l or stabi l i te
ntre resursel e Web. Dup a o succi nt a prezentare a arhi tecturi i
motoarel or de c autare, se i l ustreaz a modul de expri mare a i n-
terog ari l or ce pot formul ate de uti l i zator n WQFL (Web Query
Formulating Language), conform seri ei de cercet ari ntrepri nse
si detal i ate n [Buraga & Rusu, 2000], [Buraga & Brut, 2001] si
[Buraga & Brut, 2002]. Acest l i mbaj bazat pe XML va putea ex-
pri ma i nterog ari l e compl exe date de uti l i zatori , dar de aseme-
nea va capabi l a desemna unel e i nforma ti i pri vi nd structura
si con ti nutul resursel or hi permedi a g asi te.
Strategi a de i nterogare pl eac a de l a premi sa c a uti l i zatori i prefer a
s a ob ti n a documente (mul ti medi a) avnd di verse structuri si ti pu-
ri de con ti nut, n acest sens trebui nd speci cate pozi ti i l e si num a-
rul de apari ti i al e unor el emente si ntacti ce compunnd un anumi t
document XML.
Pentru a oferi o ct mai mare exi bi l i tate, l i mbajul WQFL a fost
exti ns s a faci l i teze uti l i zarea expresi i l or regul ate Perl , recurgn-
du-se l a teori a l i mbajel or regul ate [Jucan, 1999].
Capi tol ul 4 ofer a o seri e de sol u ti i de i mpl ementare a si stemul ui
I TW [Buraga, 2003g, Buraga & G abureanu, 2003], medi u eterogen si
di stri bui t uti l i zat l a reg asi rea i nforma ti i l or mul ti medi a, fol osi nd agen ti
si servi ci i Web. Dup a o prezentare a probl emati ci i si stemel or mul ti -
agent [Bradshow, 1997, Mangi na, 2002] si a servi ci i l or Web bazate pe
XML [Vasudevan, 2001], l ucrarea conti nu a cu i l ustrarea arhi tecturi i
unei pl atforme di stri bui te compus a di n agen ti , servi ci i Web si al te en-
ti t a ti programabi l e. Si stemul I TWfol ose ste descri eri RDF/XML pentru
c autarea resursel or mul ti medi a, pl ecnd de l a i nterog ari formul ate n
WQFL pri n i ntermedi ul unei i nterfe te Web exi bi l e [Buraga, 2002a,
Buraga, 2003b], si se bazeaz a pe rel a ti i l e spa ti o-temporal e adnotate n
l i mbajel e XFiles si TRSL deni te n cadrul capi tol ul ui 3.
Si stemul de agen ti este bazat pe formal i smul BDI (Belief-Desire-
I ntention) [Rao et al., 1995], i ar pentru i mpl ementarea efecti v a se uti -
Preambul 5
l i zeaz a o pl atform a speci c a Omega [Al boai e & Buraga, 2002] per-
mi tnd i nterschi mb de i nforma ti i XML ntre agen ti pri n i ntermedi ul
seri al i z ari i [Buraga & Al boai e, 2004, Al boai e & Buraga, 2003a].
Se ofer a si dou a posi bi l e uti l i z ari :
n domeni ul e-learning conform cercet ari l or concreti zate n l u-
cr ari precum [Buraga, 2001c], [Buraga, 2003c], [Buraga, 2003e]
si [Buraga & Brut, 2003];
n model area uxul ui de i nforma ti i n cadrul ntrepri nderi l or vi r-
tual e (e-enterprise) rezul tatel e cercet ari l or efectuate i nd deta-
l i ate n [Ci oca & Buraga, 2003a] si [Ci oca & Buraga, 2003b].
Lucrarea se nchei e cu prezentarea concl uzi i l or general e si di rec ti i -
l or de cercetare vi i toare.
Pri ma anex a i l ustreaz a modul de generare si de uti l i zare a meta-
datel or asoci ate unor resurse Web pri n i ntermedi ul aser ti uni l e RDF n
contextul unui si t de comer t el ectroni c. Urm atoarel e trei anexe detal i a-
z a deni ti i l e formal e al e si ntaxei l i mbajel or bazate pe XML speci cate
n capi tol ul 3 XFiles, TRSL si WQFL, respecti v , pentru aceasta
fol osi ndu-se o abordare ori entat a-obi ect faci l i tat a de schemel e XML.
Ul ti ma anex a enumer a acroni mel e uti l i zate n cadrul acestui materi al .
Contribu tii
Di n cel e aproxi mati v 300 de referi n te bi bl i ograce al e l ucr ari i , peste
40 sunt contri bu ti i ori gi nal e al e autorul ui , ca uni c autor sau co-autor,
concreti zate n c ar ti ti p ari te, arti col e recenzate si publ i cate n revi ste
i nterna ti onal e de presti gi u sau n proceeding-uri l e unor conferi n te i n-
terna ti onal e, edi tate pe pl an mondi al de I EEE Computer Soci ety Press,
Spri nger-Verl ag (LNCS) sau I OS Press si pe pl an na ti onal de Pol i rom
sau de edi turi l e unor i nsti tu ti i academi ce di n Bucure sti , Crai ova, Ga-
l a ti , I a si ori Ti mi soara.
Lucrarea de fa t a se bazeaz a pe o seri e de cercet ari efectuate n ca-
drul unui num ar de 5 contracte nan tate de Academi a Romn a, ANSTI
si CNCSI S n peri oada 19992002, di ntre care se pot men ti ona:
6 Sabi n Cornel i u Buraga
grantul CNCSI S 283/2002 Tehnici avansatedec autarea docu-
mentelor hipermedia peWeb, di rector: Sabi n Buraga;
grantul CNCSI S 966/2001 Metodologii generativepentru proiec-
tarea ma sinilor abstracte, di rector: Gheorghe Gri gora s.
De asemenea, o parte di n con ti nutul l ucr ari i de fa t a se bazeaz a pe
experi en ta acumul at a de autor n cadrul comi tetel or sti i n ti ce al e unor
eveni mente i nterna ti onal e precum I nternational Symposiumon Paral-
lel and Distributed Computing I SPDC 2003, Ljubl jana, 2003, Agent-
Based Computing, sesi une speci al a n cadrul World Multiconference
on Systemics, Cybernetics and I nformatics SCI 2003, Orl ando, 2003
si I nternational Symposium on Parallel and Distributed Computing
I SPDC 2004, Cork, I rel and, 2004.
Destinatari
Cartea se adreseaz a tuturor cel or i nteresa ti de probl emati ci l e actual e
si de conti nua di nami ci tate a Web-ul ui semanti c, putnd consul tat a
de studen ti i di n ani i termi nal i , masteranzi sau doctoranzi , de speci a-
l i sti i n domeni ul sti i n tei cal cul atoarel or si de to ti cei care doresc s a si
formeze o pri vi re de ansambl u asupra temel or pri nci pal e de cercetare
referi toare l a Web.
P ar ti al e materi al ul ui de fa t a redactat i ntegral fol osi nd i nstru-
mente open-source(L
A
T
E
X si GI MP) rul ate pe pl atforme Li nux (Red Hat
si Mandrake) se bazeaz a pe cursuri l e Tehnologii Web si Tehnologii
Web I I , predate de autor studen ti l or anul ui I V ai Facul t a ti i de I nfor-
mati c a a Uni versi t a ti i Al . I . Cuza di n I a si .
A stept am reac ti i l e dumneavostr a pri n po sta el ectroni c a l a adresa
busaco@infoiasi.ro. Si tul Web dedi cat acestei l ucr ari este di sponi -
bi l l a http://www.infoiasi.ro/~sweb/.
Autorul
marti e 2004, I a si
C a p itolul 1
Arhite c tura sp a tiului WWW
Acest capi tol descri e succi nt conceptel e de baz a al e
spa ti ul ui Worl d-Wi de Web, trecnd n revi st a evol u ti a
di n mai mul te perspecti ve a l i mbajel or de marcare
pentru Web.
1.1 Prezentaregeneral a
U
NUL di ntre cel e mai i mportante si de succes servi ci i al e I nter-
netul ui , World-Wide Web-ul mai pe scurt, Web sau spa ti ul
WWW, a fost i nsti tui t l a CERN (Centrul European de Cercet ari Nu-
cl eare de l a Geneva) n anul 1989, gra ti e zi ci eni l or Ti m Berners-Lee,
Robert Cai l l au si echi pei acestora, scopul pri nci pal urm ari t i nd faci -
l i tarea accesul ui rapi d l a i nforma ti i l e tehni ce cupri nse n manual el e
de uti l i zare a cal cul atoarel or [Berners-Lee, 1989]. Web-ul reprezi nt a
un sistem de distribu tie local a sau global a a informa tiilor hiperme-
dia [Berners-Lee, 1999].
Spa ti ul Web pune l a di spozi ti e un si stem gl obal si standardi zat de
comuni care mul ti medi a, i nforma ti i l e i nd organi zate asoci ati v, Web-ul
8 Sabi n Cornel i u Buraga
func ti onnd conform model ul ui cl i ent/server si beneci i nd de faci l i t a ti -
l e oferi te de structurarea sub form a de hi pertext a resursel or. Cu toat a
dezvol tarea l ui spectacul oas a, Web-ul nu trebui e confundat cu I nter-
netul , ci poate consi derat drept cea mai di nami c a si spectacul oas a
component a software a acestui a.
Canti tatea de i nforma ti i di sponi bi l e n spa ti ul WWW, n ori care
domeni u, este copl e si toare si n conti nu a cre stere. Conceptul i ni ti al
al Web-ul ui a fost tocmai i ntegrarea unor si steme i nforma ti onal e di s-
parate (ca, de exempl u, si stemel e de gesti une a bazel or de date) ntr-un
mod uni tar, formndu-se un spa ti u abstract, n care di feren tel e di n-
tre di versel e surse de date s a nu mai exi ste. Actual mente, Web-ul cu-
mul eaz a ori ce ti p de i nforma ti e, i ndi ferent de pl atforma pe care exi st a
zi c.
I deea de a agrega si de a asoci a resurse de i nforma ti i di sponi bi l e
n mani er a di stri bui t a provi ne di n cercet ari l e ntrepri nse n domeni ul
hipertextului
1
, modal i tatea de a adresa resursel e text, i magi ni sta-
ti ce, mul ti medi a (audi o, ani ma ti i , vi deo) etc. real i zndu-se pri n i nter-
medi ul identicatorilor uniformi de resurse (URI Uniform Resource
I dentiers), prezenta ti n cadrul sec ti uni i 1.2.2. Ace sti i denti catori re-
prezi nt a o modal i tate exi bi l a si eci ent a de accesare a ori c arei resurse
I nternet, pri n ori care protocol de comuni care cel mai uti l i zat i nd
HTTP (HyperText Transfer Protocol) [Fi el di ng et al., 1997].
Li mbajul pri n care sunt structurate si prezentate i nforma ti i l e si , de
asemenea, sunt speci cate l eg aturi l e di ntre di verse resurse hi pertext
este popul arul l i mbaj de marcare sau de adnotare
2
HTML (Hy-
perText Markup Language) [Raggett et al., 1999]. n prezent, l i mbajul
HTML a fost rescri s n termeni i XML, ap arnd noul l i mbaj de marcare
a hi pertextul ui XHTML [Pemberton et al., 2002].
I denti catori i uni formi de resurse URI , protocol ul HTTP si l i mba-
1
A se consul ta si [Ni el sen, 1990], [Bal asubramani an, 1994], [Tr au san-Matu, 2000]
sau [Buraga, 2001a].
2
Ac ti unea de adnotare se real i zeaz a pri n i ntermedi ul unui limbaj deadnotare(sau
de speci care), care reprezi nt a un set de conven ti i de marcare uti l i zate pentru co-
di carea datel or, speci cnd mul ti mea de marcaje obl i gatori i , permi se, mani era de
i denti care a marcajel or si semanti ca ec arui marcaj di sponi bi l [Buraga, 2002a].
Arhi tectura spa ti ul ui WWW 9
jul HTML au reu si t s a ndepl i neasc a practi c scopuri l e pri nci pal e al e
spa ti ul ui Worl d-Wi de Web [Berners-Lee, 1999, Berners-Lee, 2002]:
independen ta de dispozitiv acel ea si i nforma ti i pot accesate
vi a o mul ti tudi ne de di spozi ti ve, precum mainframe-uri l e, cal cu-
l atoarel e personal e etc.;
independen ta de software forme di feri te de software cl i en ti
(navi gatoare, robo ti si agen ti Web etc.) si servere Web ofer a
si extrag i nforma ti i ntr-o mani er a uni versal a, f ar a ca ni ci un
produs-program s a reprezi nte o component a cri ti c a pentru spa ti ul
WWW, deoarece Web-ul nu reprezi nt a un program, ci un set de
protocoal e si speci ca ti i standardi zate, deschi se, redactate de Con-
sor tiul Web [W3C];
scalabilitatea dezvol tarea exponen ti al a a Web-ul ui este un exem-
pl u i nteresant al efortul ui i ntens depus de comuni tatea uti l i za-
tori l or I nternet-ul ui , i ndependent de resursel e hardware si soft-
ware di sponi bi l e;
caracterul multimedia documentel e di sponi bi l e pe Web, reg asi te
si sub denumi rea de pagini, pot i ntegra surse de i nforma ti e mul -
ti pl e, n di verse forme, de l a date di screte text, i magi ni stati ce,
precum fotograi , scheme, di agrame etc. pn a l a cel e conti nue
ani ma ti i , audi o si vi deo.
U suri n ta cre ari i si publ i c ari i pagi ni l or Web de c atre ori ce uti l i za-
tor avnd cuno sti n te mi ni me de marcare a datel or si de desi gn fol o-
si nd, eventual , mul ti tudi nea de edi toare HTML di sponi bi l e de cel e mai
mul te ori gratui t a condus l a apari ti a siturilor Web. Un si t Web repre-
zi nt a o col ec ti e de documente ori entate uzual c atre i nforma ti i uni tare
sau scopuri comune [Buraga, 2002a]. Vi rtual , ori ci ne de l a o persoan a
parti cul ar a pn a l a o organi za ti e guvernamental a, academi c a ori co-
merci al a si poate dezvol ta propri a i nterfa t a (si t) Web, publ i cnd-o si
i ntegrnd-o n spa ti ul Worl d-Wi de Web.
10 Sabi n Cornel i u Buraga
1.2 Componentedebaz aalespa tiului WWW
Spa ti ul Worl d-Wi de Web func ti oneaz a n practi c a datori t a
3
:
unei scheme consi stente de i denti care a resursel or, pri n i nterme-
di ul i denti catori l or uni formi de resurse [Berners-Lee et al., 1998]
(a se vedea sec ti unea 1.2.2);
unui mecani sm exi bi l de transfer de date, reprezentat de proto-
col ul HTTP [Fi el di ng et al., 1997];
unei descri eri l ogi ce a structuri i documentel or hi pertext, pri n con-
cursul unor l i mbaje de adnotare bazate pe meta-l i mbajel e SGML
(Standard General i zed Markup Language) [Gol dfarb, 1990] ne
referi m ai ci mai al es l a HTML [Raggett et al., 1999] sau, mai re-
cent, l a XML (Extensi bl e Markup Language) [Bray et al., 2004]
4
.
n conti nuare, vom prezenta caracteri sti ci l e esen ti al e al e acestor
componente de baz a al e spa ti ul ui WWW (a se vedea si gura 1.1).
1.2.1 Hipertextul
1.2.1.1 Deni tii
Conceptul de hipertext reprezi nt a o mani er a parti cul ar a de organi zare
versati l a a i nforma ti i l or. Termenul hipertext (text non-l i near) are o mul -
ti tudi ne de deni ti i , di ntre care se pot men ti ona
5
:
Hi pertextul reprezi nt a o form a nel i near a de document el ectroni c.
Hi pertextul este un mod de organi zare compl ex a a i nforma ti i l or
n care datel e sunt memorate ntr-o re tea (graf) de noduri si l eg a-
turi (a se vedea sec ti unea 1.2.1.2).
3
Pentru detal i i , a se consul ta [Berners-Lee, 1999] sau [Buraga, 2001a].
4
Datel e marcate n XML pot vi zual i zate sau transformate n al te formate pri n
uti l i zarea speci ca ti ei XSL (ExtensibleStylesheet Language) [Adl er et al., 2001].
5
Pentru detal i i , a se consul ta l ucr ari l e [Bal asubramani an, 1994], [Buraga, 2001a],
[Ni el sen, 1990], [Louka, 1994] sau [Tr au san-Matu, 2000].
Arhi tectura spa ti ul ui WWW 11
Figura 1.1: Rel a ti i l e di ntre o resurs a mul ti medi a, adresa ei vi a URI si
reprezentarea structurat a a resursei (adaptare dup a [Jacobs, 2003])
Hi pertextul reprezi nt a o form a de comuni care di ntre om si cal cu-
l ator, i nterfa ta i nd chi ar hi pertextul .
Documentel e hi pertext se numesc hipermedia n cazul n care l ocul
i nforma ti i l or text este l uat de cel e mul ti medi a.
1.2.1.2 Concepte
Componentel e central e al e hi pertextul ui sunt nodurile si leg aturile.
Un nod reprezi nt a un concept uni c, avnd n componen t a i nforma ti i
(di screte ori conti nue) sau programe genernd un anumi t con ti nut. Un
nod poate avea asoci at un ti p care ngl obeaz a o i nforma ti e semanti c a.
Noduri l e sunt conectate l a al te noduri pri n i ntermedi ul l eg aturi l or.
Nodul surs a al unei l eg aturi poart a numel e de referin t a, i ar nodul des-
ti na ti e se nume ste referent. Noduri l e referi n t a si referent sunt denu-
mi te si ancore.
Leg aturi l e reprezi nt a conexi uni ntre noduri (sau concepte) depen-
dente unul de al tul , putnd stabi l i te n cadrul acel ui a si document
si /sau ntre documente di feri te, stocate n mani er a di stri bui t a, permi -
tndu-se astfel o organi zare nel i near a a i nforma ti i l or.
12 Sabi n Cornel i u Buraga
Leg aturi l e, v azute drept arce al e (di )graful ui hi pertext, sunt bidi-
rec tionalesau unidirec tionale. Leg aturi l e pot de dou a ti puri , conform
naturi i rel a ti ei di ntre noduri [Louka, 1994]:
referen tiale non-i erarhi ce, uti l e pentru real i zarea referi n tel or
ncruci sate, i nd cel e care deosebesc cel mai bi ne hi permedi a de
cel el al te forme de stocare a i nforma ti ei ;
organiza tionale(denumi te i erarhi ce sau structural e) desemnea-
z a rel a ti i l e p ari nte-copi l di ntre noduri , i nd fol osi te l a organi -
zarea noduri l or n mani er a i erarhi c a ntr-o structur a stri ct a; acest
ti p de l eg aturi este esen ti al pentru l i neari zarea hi pertextul ui si
permi te autori l or s a veri ce coeren ta structuri i hi pertext.
De asemenea, l eg aturi l e pot statice (stabi l i te a-priori de autorul
documentul ui , l a momentul proi ect ari i re tel ei hi pertext) sau dinamice
(create n momentul parcurgeri i structuri i hi pertext, n func ti e de con-
text e.g., restri c ti i de acces sau de ceri n tel e/experi en ta uti l i zato-
ri l or).
1.2.1.3 Documentehipertext
n tel egerea unui document hi pertext si navi garea pri n acesta depi nd
de abi l i tatea uti l i zatorul ui de a proi ecta si construi o reprezentare men-
tal a coerent a a structuri i hi pertextul ui , creatorul acel ui document i nd
responsabi l s a asi gure aceast a coeren t a [Tr au san-Matu, 2000].
Un document hi pertext consi derat coerent este consti tui t di n trei
componente, prezentate pe scurt n conti nuare:
1. partea decon tinut
Noduri l or si l eg aturi l or l e pot asoci ate propri et a ti (semanti ci ),
n vederea asi gur ari i coeren tei i nforma ti ei . Partea de con ti nut
stocheaz a obi ecte purt atoare de i nforma ti e: noduri de con ti nut
care memoreaz a efecti v date si l eg aturi de con ti nut care
conecteaz a noduri l e de con ti nut pe baza unor rel a ti i semanti ce,
Arhi tectura spa ti ul ui WWW 13
i .e. fol osi ndu-se di verse ontol ogi i
6
. Noduri l e de con ti nut pot ato-
mi ce sau pot compuse di n al te noduri .
Modal i tatea de memorare a i nforma ti i l or n cadrul noduri l or de
ti p con ti nut vari az a de l a un si stem hi pertext l a al tul , n prezent
adoptndu-se meta-l i mbajul de marcare XML, pentru Web pre-
tndu-se mai al es di n punctul de vedere al mani erei de pre-
zentare l i mbajul HTML. Actual mente, se uti l i zeaz a un num ar
mare de l i mbaje bazate pe XML pentru marcarea di feri tel or i nfor-
ma ti i . Pentru a oferi doar cteva exempl e
7
, meta-l i mbajul XML
este fol osi t l a model area si adnotarea de:
prezent ari mul ti medi a si ncroni zate pri n SMI L (Synchronized
Multimedia I ntegration Language) [Ayars et al., 2001];
grac a vectori al a pentru Web fol osi nd SVG (ScalableVector
Graphics) [Ferrai ol o et al., 2003];
l i mbaje de i nterogare (query languages) pentru Web (a se
vedea [DeRose, 1998], [Shanmugasundaram et al., 1999],
[Ol i boni & Tanca, 2000] sau [Mal hotra et al., 2003]);
documente expri mnd construc ti i si ntacti ce al e unor l i mbaje
de programare func ti onal a [Bol ey, 2000];
ontol ogi i , pri n i ntermedi ul l i mbajul ui OWL (Web Ontology
Language) [Dean & Schrei ber, 2004].
n cadrul acestui context, men ti on am si cercet ari l e propri i n-
trepri nse n proi ectarea unor l i mbaje bazate pe XML pentru re-
prezentarea si stemel or Li ndenmayer (L-systems) [Buraga, 2000b,
Buraga et al., 2002b] n vederea vi zual i z ari i 3D n VRML (Vir-
tual Reality Modeling Language) sau pentru expri marea uxu-
l ui i nforma ti i l or hi pertext n cadrul ntrepri nderi l or vi rtual e
e-enterprise [Ci oca & Buraga, 2003a] [Ci oca & Buraga, 2003b]
[Ci oca & Buraga, 2003c].
6
Ontol ogi i l e reprezi nt a speci c ari al e unor conceptual i z ari [Gruber, 1993]. A se
vedea si cel e di scutate n capi tol ul 2.
7
A se consul ta si [Tr au san-Matu, 2001], [Oasi s] sau [W3C].
14 Sabi n Cornel i u Buraga
2. partea deorganizare
Noduri l e si l eg aturi l e de structur a stocate n cadrul acestei p ar ti
asi gur a documentul ui o coeren t a spori t a deoarece pri n i nterme-
di ul l or autorul si structureaz a re teaua hi pertext di n perspecti va
ci ti torul ui .
Noduri l e de structur a pot cl asi cate n noduri de secven t a
pri n care autorul dene ste o anumi t a secven t a de parcurgere a
con ti nutul ui hi pertextul ui si noduri de explorare care ofer a
uti l i zatorul ui posi bi l i t a ti de expl orare compl ex a, non-secven ti al a
a re tel ei hi pertext.
Noduri l e de secven t a mpreun a cu l eg aturi l e de secven t a pot oferi
di verse secven te (scenari i ) de prezentare a con ti nutul ui hi per-
text (ca de exempl u c ai de vi zi tare secven ti al e, arborescente sau
condi ti onal e).
3. partea deprezentare
Aceast a parte preg ate ste vi zual i zarea structuri i si con ti nutul ui
hi pertextul ui , oferi nd di verse mecani sme de navi gare (a se vedea
si sec ti unea 3.3.2.2 a capi tol ul ui 3). Autori i pot adopta di feri te
sti l uri de prezentare a i nforma ti i l or:
textual nu exi st a o vi zual i zare grac a a structuri i , prezen-
tarea i nd l i mi tat a l a a sarea con ti nutul ui unui a sau mai
mul tor noduri (uti l i zatorul nu este con sti ent c a traverseaz a
o structur a hi pertext);
grac exi st a o vi zual i zare grac a a structuri i hi pertext (e.g.,
harta l eg aturi l or di ntre noduri , arborel e de navi gare etc. a
se vedea modul de vi zual i zare a i nforma ti i l or g asi te de meta-
motorul de c autare Kartoo [Kartoo]);
combinat ofer a ambel e posi bi l i t a ti de prezentare.
Documentel e hi pertext sunt structurate asemenea re tel el or (grafu-
ri l or), f ar a a se i mpune restri c ti i n ceea ce pri ve ste m ari mea noduri l or
Arhi tectura spa ti ul ui WWW 15
sau modul de real i zare a l eg aturi l or di ntre el e. Pentru real i zarea unei
structuri hi pertext val i de si faci l de parcurs, pot adoptate di verse
pri nci pi i de structurare, ca de exempl u metafora c ar ti i ti p ari te, struc-
tura l i near a cu sal turi sau structura i erarhi c a [Bal asubramani an, 1994,
Louka, 1994].
De asemenea, trebui e men ti onat faptul c a di n punct de vedere for-
mal , structuri l e hi pertext pot model ate fol osi nd teori a grafuri l or.
1.2.2 Localizarea resurselor Web
1.2.2.1 Identicatori uniformi deresurse
Local i zarea resursel or Web se real i zeaz a pri n i ntermedi ul unor identi-
catori uniformi deresurse URI [Berners-Lee et al., 1998].
Este consi derat a resurs a ori ce enti tate avnd i denti tate (ca de exem-
pl u: un document el ectroni c, o i magi ne, un servi ci u i .e. servi ci ul de
po st a el ectroni c a , o col ec ti e de al te resurse). Sunt consi derate resurse
si cel e care nu pot accesate di rect vi a I nternet (e.g., i n tel e umane,
organi za ti i l e etc.). O resurs a se poate men ti ne constant a n ti mp, de si
con ti nutul ei enti t a ti l e c arora l e corespunde se poate modi ca.
n vederea unei organi z ari faci l e si uni tare, resursel e sunt desem-
nate pri ntr-un identicator. Pentru ca di verse ti puri de i denti catori de
resurse s a poat a uti l i zate n aceea si mani er a, se recurge l a fol osi rea
unor scheme uniforme de i denti catori . Acest pri nci pi u adoptat asi -
gur a i ndependen ta de mecani smul (protocol ul ) fol osi t pentru accesarea
resursel or, permi tndu-se astfel i nterpretarea n mod uni form a mai
mul tor conven ti i si ntacti ce desemnnd i denti catori ai unor resurse
eterogene. De asemenea, se pot i ntroduce noi ti puri de i denti catori de
resurse f ar a a modi cat modul de adresare a vechi l or ti puri .
A sadar, pentru ca o resurs a s a poat a numi t a, partajat a sau i nter-
conectat a cu al ta/al tel e n cadrul spa ti ul ui WWW, ea trebui e s a ai b a
ata sat un i denti cator uni form de resurse.
Mul ti mea URI este di vi zat a n:
localizatori uniformi de resurse URL (Uniform Resource Loca-
tor) care i denti c a resursel e pri ntr-o reprezentare a mecani smu-
16 Sabi n Cornel i u Buraga
l ui de accesare a l or (e.g., l ocal i zarea unor resurse pri n i nterme-
di ul adresei I P), nu pri n nume sau al te atri bute;
numeuniformederesurse URN (UniformResourceName) care
permi t referi rea unei resurse chi ar dac a resursa a di sp arut ori
a deveni t i naccesi bi l a, pri n i ntermedi ul unui nume persi stent si
uni c. URN-ul se uti l i zeaz a mai al es pentru a desemna enti t a ti
(componente, ti puri de date, servi ci i etc.) fol osi te de anumi te apl i -
ca ti i Web.
1.2.2.2 Sintaxa URI
Un i denti cator uni form de resurse poate reprezentat ca si r de ca-
ractere apar ti nnd unui al fabet l i mi tat (compus di n l i terel e al fabetul ui
l ati n, ci frel e si di verse caractere de punctua ti e). Un URI poate i ncl ude,
de asemenea, o seri e de caractererezervate[Berners-Lee et al., 1998].
Un i denti cator generi c este compus di n urm atoarel e componente:
schema "://" authority path "?" query
Exi stnd mai mul te metode de a accesa resursel e, vor di sponi bi l e
mai mul te schemepentru a l e i denti ca (i .e. http, mailto, ldap, urn
etc.) a se vedea si [Jacobs, 2003].
Componenta autoritate(authority) este deni t a de o l oca ti e de ser-
ver di sponi bi l l a ni vel ul I nternetul ui sau de o secven t a speci al a de n-
regi strare. Serverul poate speci cat e pri n adresa I P (de exempl u
193.231.30.225), e pri n adresa si mbol i c a (e.g. thor.infoiasi.ro)
vi a DNS (Domain NameSystem) [Nai k, 1998] , eventual i nd urmat
de un num ar de port.
Componenta cale (path) con ti ne date meni te a i denti ca o resurs a
l ocal i zat a pe serverul desemnat de componenta autoritatedescri s a mai
sus. Cal ea poate con ti ne secven te de segmente de cal e separate pri n
/, ecare secven t a putnd i ncl ude o secven t a de parametri .
Ul ti ma component a este cea de interogare(query), reprezentat a de
un si r de i nforma ti i ce vor i nterpretate de resurs a.
Ca exempl u de i denti cator uni form de resurse poate dat a urm a-
toarea adres a Web, n care sunt prezente pri mel e trei componente al e
unui URI :
Arhi tectura spa ti ul ui WWW 17
http://www.infoiasi.ro/~busaco/books.html
Pentru si ntaxa compl et a ( n forma EBNF [Jucan & Andrei , 2002]),
recomand am consul tarea l ucr ari l or [Berners-Lee et al., 1998] sau
[Buraga, 2001a].
Deoarece majori tatea documentel or (resursel or) Web sunt stocate n
mani er a arborescent a (i erarhi c a), n l ocul adres ari i absol ute se poate
fol osi o adresare rel ati v a. Aceasta permi te o i ndependen t a par ti al a a
l oca ti ei si a schemei de acces, i nd desemnat a si ntacti c pri n i nterme-
di ul identicatorilor uniformi deresurserelativi.
n pl us, un URI poate avea i ncl us un identicator defragment (frag-
ment identier) [Berners-Lee et al., 1998] pentru a se permi te i denti -
carea i ndi rect a a unei resurse secundare pri n i ntermedi ul referi n tei
l a resursa pri mar a si al i nforma ti i l or supl i mentare. Mai preci s, dac a
i denti catorul uni form de resurse U i denti c a resursa R si reprezen-
tarea resursei R este n formatul F, i ar conform speci ca ti i l or forma-
tul ui F se sti e c a i denti catori i de fragment i denti c a resurse secun-
dare n cadrul i nstan tel or l ui F, atunci i denti catorul pentru resursa
secundar a, i denti cat a n i nteri orul unei i nstan te a l ui F de un i den-
ti cator de fragment fid, este reprezentat de U#fid. [Jacobs, 2003,
Berners-Lee et al., 1998]
Drept exempl u, poate men ti onat a urm atoarea adres a, suxul ei
desemnnd i denti catorul de fragment public:
http://www.infoiasi.ro/~busaco/cv.html#public
I denti catori i uni formi de resurse ofer a suport pentru real i zarea de
l eg aturi ntre di verse noduri (resurse) al e spa ti ul ui WWW: cnd repre-
zentarea unei resurse refer a o al t a resurs a pri n i ntermedi ul unui i den-
ti cator URI , atunci acesta reprezi nt a o l eg atur a v azut a n termeni i
hi pertextul ui ntre cel e dou a resurse [Jacobs, 2003].
Dup a cum am ami nti t n cadrul sec ti uni i 1.1, accesul l a reprezenta-
rea resursel or se real i zeaz a pri n i ntermedi ul unui protocol de comuni -
ca ti e, n cazul Web-ul ui uti l i zndu-se protocol ul HTTP.
8
8
Pentru detal i i , se pot consul ta l ucr ari l e [Fi el di ng et al., 1997], [Buraga, 2001a],
[Buraga et al., 2002a] sau [Nai k, 1998].
18 Sabi n Cornel i u Buraga
1.3 Evolu tia spa tiului WWW
n prezent, Web-ul a deveni t f ar a ndoi al a uni versul i nforma ti i l or ac-
cesi bi l e n re tea, conform deni ti ei anti ci pati ve dat a de creatorul aces-
tui a, Ti m Berners-Lee [Berners-Lee, 1989]. Spa ti ul WWW s-a achi tat
de aceast a promi si une ntr-o mani er a spectacul oas a, di n dou a moti ve.
Pri mul di ntre el e este reprezentat de exi bi l i tatea si i ndependen ta fa t a
de con ti nut a protocol ul ui HTTP care se poate adapta pentru a trans-
fera ori ce format de document si , n pl us, de exi sten ta i denti catori l or
uni versal i de resurse (URI ) capabi l i de a reprezenta l eg aturi c atre ori ce
format de document. Un al doi l ea moti v este faptul c a sel ec ti a natural a
pare s a favori zat cteva formate care au fost dezvol tate pentru Web
n mod expl i ci t. n pei sajul de o prol i c a vari etate a sintaxei, stilului,
structurii si semanticii documentel or Web, observ am adoptarea prefe-
ren ti al a a l i mbajel or SGML, HTML, CSS si XML. Fi ecare di ntre aces-
tea aduce o strategi e evol u ti onar a l ent a, favori znd cod ari l e decl ara-
ti ve fa t a de formatel e bi nare (de cel e mai mul te ori propri etare), sti l u-
ri l e de a sare separabi l e de con ti nutul propri u-zi s fa t a de formatarea
di rect a, marcarea decl arati v a fa t a de cea procedural a si semanti ca bi ne
deni t a fa t a de comportamentul opera ti onal .
Evol u ti a Web-ul ui [Berners-Lee, 1999, Berners-Lee, 2002] se poate
remarca mai al es n urm atoarel e di rec ti i :
evolu tia sintaxei spreformatedeclarative;
evolu tia stilului (prezent arii): dela formatarela foi destiluri;
evolu tia structurii;
evolu tia semanticii;
evolu tia elementelor programabile.
Fi ecare di ntre acestea vor detal i ate n conti nuare, urmnd l i ni i l e
prezentate n [Buraga, 2002a] si [Al boai e & Buraga, 2002].
Arhi tectura spa ti ul ui WWW 19
1.3.1 Evolu tia sintaxei spreformatedeclarative
Pri mul compromi s se face n pri vi n ta opt ari i ntre l i mbajul ma si n a (bi -
nar) si l i mbajul natural (textual ). La o pri m a vedere, codi carea speci -
c a ma si ni i pare mai pu ti n costi si toare datori t a faptul ui c a ea reect a
di rect datel e n memori e. Totu si , transformarea datel or n format bi -
nar poate prea fragi l a pentru a fol osi t a pe pl atforme eterogene (de
exempl u, reprezentarea numerel or) si n versi uni de software mul ti -
pl e. Codi carea bi nar a poate, de asemenea, necesi ta mai mul t spa ti u
si ti mp pentru mpachetare si despachetare. Fi si erel e text pot l a fel
de eci ente, n pl us formatel e textual e (chi ar si cel e n forme par ti al
l i zi bi l e) sunt mai u sor de edi tat, corectat si exti ns.
Al doi l ea compromi s este l egat de amal gamul di ntre formatel e de-
cl arati ve si cel e procedural e. Poate mai u sor de el aborat un anal i zor
pentru un program care cal cul eaz a num arul dect de transmi s un
mi l i ard de ci fre al e sal e. Li mbajul T
E
X [Knuth, 1984], bazat pe mar-
caje, este un exempl u edi cator pri vi nd puterea oferi t a de formatel e
procedural e pentru conceperea si procesarea documentel or, fa t a de edi -
toarel e de texte fol osi nd formate bi nare propri etare (e.g., Word).
n ne, exi st a un compromi s ntre formatel e speci ce si cel e gene-
ri ce. n m asura n care refol osi rea i nforma ti ei este o preocupare ma-
jor a, o i mportan t a chi ar mai mare dect aceasta o are promovarea unei
fami l i i de gramati ci nrudi te. Puterea meta-l i mbajel or SGML si XML
este reectat a de exi bi l i tatea n gesti onarea documentel or de toate
ti puri l e, de l a manual e si comuni cate de pres a pn a l a contracte l egal e
si speci ca ti i de proi ecte, si de posi bi l i tatea de reuti l i zare a acestora
n vederea produceri i de c ar ti , rapoarte si edi ti i el ectroni ce (pentru
CD-ROM, Web, di spozi ti ve mobi l e etc.) porni nd de l a acel a si (acel ea si )
si er(e) surs a, fol osi nd marcaje decl arati ve si mi l are.
Exi st a o tensi une fundamental a ntre performan ta, costul si ca-
paci tatea de uti l i zare a strategi i l or de codi care u sor l i zi bi l e de c atre
ma si n a si , respecti v, de c atre om. Abordarea XML g ase ste un echi l i -
bru rezonabi l ntre cel e dou a. Faci l a l i zi bi l i tate pentru om i mpl i c a ro-
buste te, i ar desci frarea rapi d a de c atre ma si n a i mpl i c a val i di tate; am-
bel e cal i t a ti adaug a val oare i nforma ti ei si faci l i teaz a evol u ti a docu-
mentel or n ti mp.
20 Sabi n Cornel i u Buraga
1.3.2 Evolu tia stilului (prezent arii): delaformatare
la foi destiluri
De cnd au ap arut documentel e, exi st a autori si proi ectan ti care si -
au concentrat efortul de perfec ti onare tehni c a si sti l i sti c a pentru e-
care ati ngere de peni t a, ecare fragment de corp de l i ter a, ecare i ma-
gi ne pl asat a. n m asura n care sti l ul generi c al unei prezent ari poate
captat n vederea reuti l i z ari i ul teri oare, cu att mai mul t a val oare
cap at a desi gn-ul si documentul n si ne. I stori a evol u ti ei formatel or de
documente pentru Web favori zeaz a formatarea extern a n detri men-
tul di recti vel or ncapsul ate tocmai cu scopul ca i nforma ti a s a poat a
reprezentat a i ndependent de sti l si vi ceversa.
Pe parcursul i stori ei proces ari i computeri zate a datel or, au exi stat
numeroase abord ari al e reprezent ari l or ori entate spre format ari i n-
terne, de l a comenzi l e troff sau groff di n medi i l e UNI X pn a l a
di recti vel e formatul ui RTF (Rich Text Format), si l a marcajel e pen-
tru fonturi di n HTML (a se vedea, de exempl u, marcatorul <font>).
Aproape i nevi tabi l , acestea au fost compl etate cu scurt aturi de for-
matare reuti l i zabi l e: pachete de macro-uri , ri gl e si parametri pentru
a sarea n navi gator etc. Cl adi te pe aceast a experi en t a, formatel e ac-
tual e de documente Web HTML si XML permi t ca formatarea da-
tel or s a poat a real i zat a extern, pri n foi de sti l uri . Foi l e de sti l uri n
cascad a CSS (Cascading Style Sheets) [Bos et al., 1998] merg mai
departe si permi t compunerea unor sti l uri separate, cum ar propri e-
t a ti l e de cul oare si font, seturi l e de caractere, graca si prezentarea.
Mai mul t, control ul format ari i este di vi zat ntre autor si ci ti tor, acesta
di n urm a putndu- si i nterpune propri a sa nl an tui re de foi de sti l uri ,
deci contri bui nd l a mbun at a ti rea prezent ari i datel or, n func ti e de do-
ri n tel e sal e i ndi vi dual e [Buraga, 2001a, Buraga, 2002a].
Sti l uri l e nu sunt l i mi tate l a domeni ul vi zual el e pot control a re-
darea con ti nutul ui pentru moni toare, hrti e, audi o, medi i Brai l l e, ter-
mi nal e mobi l e si mul te al tel e. Acest l ucru este pre ti os ndeosebi dac a
se dore ste adaptarea prezent ari i documentul ui pentru uti l i zatori i cu
handi capuri zi ce, di sl exi e sau pentru anal fabe ti ca si n cazul a di -
verse pri va ti uni de ci rcumstan t a (uti l i zatori care vorbesc l a tel efon sau
l ucreaz a ntr-un medi u zgomotos). Fl uxuri l e audi o pot transcri se pe
Arhi tectura spa ti ul ui WWW 21
Web ca text pentru persoanel e cu deci en te de auz; navi gatoarel e audi o
(precum Web Gal axy, Vox Portal sau WI RE) ofer a faci l i tatea de a ci ti
pagi ni l e Web pentru uti l i zatori i care nu l e pot parcurge n mod di rect,
n conformi tate cu foi l e de sti l uri aural e.
Cu toate c a tehnol ogi a Web actual a suport a att formatarea i n-
tern a, ct si pe cea pri n i ntermedi ul foi l or de sti l uri , si stemel e pentru
gesti onarea unor canti t a ti mari de i nforma ti e de ti p hi pertext nece-
si t a de cel e mai mul te ori formatare extern a pentru ca i nforma ti a s a
r amn a u sor navi gabi l a si faci l de prel ucrat. Se recomand a, a sadar,
separarea datel or de modul l or de prezentare [Buraga, 2002a].
1.3.3 Evolu tia structurii
S a consi der am urm atorul exempl u:
Exemplul 1 n acti vi tatea de documentare, un cercet ator real i zeaz a o
l i st a de referi n te bi bl i ograce cupri nznd i nforma ti i despre publ i ca ti i l e
(el ectroni ce sau nu) reg asi te. Structura ec arui arti col sti i n ti c i ncl ude
un ti tl u, numel e autorul ui , corpul arti col ul ui si subsol ul .
Di versel e formate punnd l a di spozi ti e structuri concurente (e.g.,
SGML) de documente ncearc a s a surpri nd a aceast a structur a n ca-
drul reprezent ari i l or. Unel e descri u buc a ti di n document n termeni
l ega ti de prezentarea datel or: propri et a ti precum italic, indentat, sta-
bi l i rea unui anumi t corp de l i ter a (font) si a sa mai departe. La ceal al t a
extrem a, al te formate fol osesc termeni declarativi: ti tl u, adres a, i ntrare
de l a tastatur a etc. Mul te al te formate se a a undeva ntre aceste dou a
extreme, precum marcajel e XHTML [Pemberton et al., 2002] <em> si
<font>, n compara ti e cu <address> sau <abbr>.
Al t ti p de structuri decl arati ve pentru apl i ca ti i l e SGML si XML
sunt deni ti i l e de ti puri de documente DTD (Document Type De-
nition)
9
care i mpun documentel or val i de s a i ncl ud a mai mul te el e-
mente (marcaje) ntr-o ordi ne preci zat a (de exempl u, ecare apari ti e
9
Regul i l e si ntacti ce de speci care a deni ti i l or de ti puri de docu-
mente [Gol dfarb, 1990, Bray et al., 2004] urmeaz a teori a l i mbajel or formal e (a
se vedea [Jucan, 1999]).
22 Sabi n Cornel i u Buraga
a el ementul ui <oras> trebui e s a e precedat a de marcajul <adresa>
si urmat a de <cod_postal>). Actual mente, decl ara ti i l e DTD ti nd a
nl ocui te de schemel e XML [Fal l si de, 2001].
Luarea unei deci zi i nal e de-a l ungul acestei axe aduce dup a si ne
compromi suri ntre preci zi e si comprehensi bi l i tate: semanti ci l e ori en-
tate spre prezentare, mai l ejere, sunt n mod uni versal mai bi ne n te-
l ese dect cel e decl arati ve. Marcajul <address> a deveni t parte di n
repertori ul HTML, ns a <abstract> (desemnnd marcarea rezuma-
tul ui unei l ucr ari sti i n ti ce) nu. Marcarea decl arati v a, i ndi cnd n mod
cl ar rol ul di versel or p ar ti de document, are avantajul de a putea re-
fol osi t a mai trzi u. De exempl u, motoarel e de c autare (ca de exempl u,
Googl e [Googl e]) pot atri bui ntr-un mod mai semni cati v ponderi ter-
meni l or di ntr-un rezumat sau pot extrage automat numel e reporteri l or
di ntr-un set de t ai eturi di n zi are fol osi nd un i nstrument de captare a
i nforma ti ei .
Vom opta pentru descri erea structuri i unui document dup a func ti a
sa mai degrab a dect dup a form a. Aceasta conduce l a asi gurarea unui
suport pentru un set extensi bi l de marcaje, ceea ce HTML si CSS nu
pot oferi . Evol u ti a central i zat a a HTML mpi edi c a ntocmi rea unei l i ste
exhausti ve de marcaje r aspunznd tuturor i di omuri l or dori te de poten-
ti al i i autori de pagi ni Web. Un marcaj nou are n mod poten ti al o si n-
tax a ambi gu a, o semanti c a ambi gu a si o prezentare ambi gu a (mai al es
f ar a ad augi ri de foi de sti l ).
Comuni t a ti l e de i nterese de pe Web au nevoi e s a- si publ i ce propri i l e
deni ti i u sor, proces faci l i tat de fol osi rea meta-l i mbajul ui XML. Aceste
noi deni ti i pot chi ar s a mearg a mai departe de speci carea rol ul ui
ec arui marcaj, pentru a i ncl ude i nterpret ari si comportamente, i .e.
pentru a suporta noi semantici. De al tfel , navi gatoarel e Web actual e
ofer a un tot mai bun suport pentru documentel e XML.
1.3.4 Evolu tia semanticii
Testul suprem pentru ca un format de document s a supravi e tui asc a
pe Web este m asura n care con ti nutul s au suport a di versel e ti puri de
uti l i z ari . Documentel e exi st a ca artefacte al e unor procese mai l argi ,
precum achi zi ti onarea, raportarea sau dezvol tarea software-ul ui , i ar
Arhi tectura spa ti ul ui WWW 23
aceste uti l i z ari ata seaz a componentesemanticedi feri tel or p ar ti al e do-
cumentul ui .
Suportul pentru semanti c a al unui anumi t format se refer a nce-
pnd de l a comportamentul opera tional codi cat hard n procesel e care
mani pul eaz a con ti nutul si ajungnd pn a l a a binedenit, adi c a a da
deni ti i l arg di sponi bi l e si documentate al e con ti nutul ui .
S a consi der am un si er text constnd di ntr-o l i st a cu ac ti uni pl a-
ni cate pentru peri oada de ti mp i medi at urm atoare. Acest si er poate
fol osi t drept mi ni -agend a de acti vi t a ti descri se n l i mbaj natural de
c atre un uti l i zator. O versi une HTML cupri nznd termene-l i mi t a pen-
tru ecare acti vi tate ar putea anal i zat a de un program care proce-
seaz a con ti nutul si al erteaz a uti l i zatorul (eventual vi a un mesaj pe
tel efonul mobi l ) n preajma acestor termene. Mai mul t, o a trei a va-
ri ant a a acestui si er, n format XML, ar putea decl ara o cl as a de docu-
mente care s a deneasc a n mod expl i ci t un marcator <agenda> pen-
tru datel e dori te. Doar ul ti mul di ntre formate poate preti nde c a are o
semanti c a bi ne deni t a, l egat a de documentul nsu si pri n i ntermedi ul
ori c arei apl i ca ti i separate. Aceast a semanti c a poate ncapsul at a n
i nteri orul al tor documente XML si i nterschi mbat a cu al te comuni t a ti
de uti l i zatori , p astrndu- si totu si neambi gui tatea.
Li mbajul XML suport a eci ent ontol ogi i par ti al e
10
pri n i ntermedi ul
deni ti i l or ti puri l or de documente (DTD) sau al schemel or care pot
compuse n mod di nami c si referi te pri n i denti catori uni formi de
resurse, n acest fel descentral i znd, si pri n urmare accel ernd ci cl ul
publ i c ari i si adopt ari i noi l or formate de documente.
n mod fundamental , ontol ogi i l e reprezentnd speci c ari al e unor
conceptual i z ari , conform [Gruber, 1993] ntruchi peaz a pri nci pi ul pe-
ren care arm a faptul c a si stemel e autoreprezentati ve sau autodescri p-
ti ve reduc costul unui arti col . Pri n stabi l i rea unei adrese Web (dat a
si ntacti c pri ntr-un URI a se vedea sec ti unea 1.2.2) pentru un frag-
ment de cuno sti n te con ti nnd programe si /sau i nforma ti i , si apoi pri n
partajarea acel ei adrese cu al ti i , autori i pun n practi c a procesul demo-
crati c urm ator: ori ce persoan a apar ti nnd comuni t a ti i Web poate ar ata
10
A se vedea, pentru detal i i , l ucr ari l e [Davi es et al., 2003], [Tr au san-Matu, 2000]
sau [Tr au san-Matu, 2001].
24 Sabi n Cornel i u Buraga
c a anumi te i nforma ti i sunt i nteresante (bune) pri n crearea unei l eg a-
turi c atre resursa al c arei con ti nut i ncl ude respecti vel e i nforma ti i , pen-
tru o eventual a uti l i zare ul teri oar a. Uti l i zatori i nu copi az a documentul
i ni ti al , eventual opernd mi ci modi c ari , pentru c a ar prea costi si tor;
cel mai i efti n mod de a accesa si propaga i dei l e con ti nute de respecti vul
document este pri n i ntermedi ul adresei Web, real i zndu-se o l eg atur a
hi pertext c atre acel fragment de i nforma ti e. Aceasta al i menteaz a ci -
cl ul sel ec ti ei natural e n reprezentarea cuno sti n tel or: uti l i zarea deter-
mi n a comuni tatea, care raneaz a l a rndul ei , permanent, ontol ogi a
comun a.
Exemplul 2 Un al t exempl u, rel ati v mai compl ex, este urm atorul . S a
presupunem c a n ti mp ce parcurge aceast a l ucrare ci ti torul ntl ne ste
urm atoarea referi n t a bi bl i ograc a, scri s a astfel :
A Model for Accessi ng Resources of the Di stri buted Fi l e
Systems, Sabi n Buraga, LectureNotes in Computer Science
LNCS 2326, Spri nger-Verl ag: 224230 (2002)
Fol osi ndu- si i ntui ti a, ci ti torul ar putea stabi l i n tel esul acestei refe-
ri n te, pe cnd un anal i zor di gi tal e posi bi l s a nu e capabi l s a o fac a.
Mai mul t, di n cauza di versel or conven ti i de publ i care, al t edi tor ar
putea formata referi n ta n mani era urm atoare:
S. Buraga, A Model for Accessi ng Resources of the Di stri buted
Fi l e Systems, Lecture Notes in Computer Science LNCS
2326, Spri nger-Verl ag, 2002, pp. 224230.
Pn a si di feren tel e mi nore de punctua ti e si de nota ti e pot ncurca
un program de cal cul ator care ncearc a s a anal i zeze referi n ta; drept
rezul tat, automati zarea conversi i l or ntre di versel e formate reprezen-
tnd acel a si ti p de cuno sti n te este tentant a. Uti l i zarea unei si ntaxe
fragi l e, avnd doar o si ntax a de formatare si una opera ti onal a, de si
are destul a semni ca ti e pentru un uti l i zator uman, furni zeaz a pu ti ne
i nforma ti i pentru ma si n a.
Arhi tectura spa ti ul ui WWW 25
Pri n reformatarea referi n tei uti l i znd marcarea prezenta ti onal a a
l i mbajul ui XHTML [Pemberton et al., 2002], referi n ta devi ne mai acce-
si bi l a, cu toate c a regul i l e real e, taci te (cuvi ntel e scri se cursi v repre-
zi nt a publ i ca ti a) sunt i nvi zi bi l e:
<p>"A Model for Accessing Resources of
the Distributed File System", Sabin Buraga,
<i>Lecture Notes in Computer Science</i> --
LNCS <b>2326</b>, Springer-Verlag: 224--230 (2002)</p>
De si construc ti i l e XHTML permi t autorul ui o oarecare preci zare a
structuri i , i mpun n acel a si ti mp att autorul ui , ct si ci ti torul ui s a
cad a de acord asupra semanti ci i atri butel or, a val ori l or si a modul ui
l or de marcare. Aceast a structur a (ambi gu a) bazat a pe el ementel e de
prezentare a datel or permi te autorul ui si ci ti torul ui s a scoat a n evi -
den t a ceea ce este i mportant, dar reprezi nt a doar un stadi u i nci pi ent
pe drumul c atre o marcare structural a mai semni cati v a.
Pri n reformatarea referi n tei uti l i znd marcarea structural a (destul
de precar a si ea) a l i mbajul ui XHTML, regul i l e real e de i nterpretare
devi n ceva mai cl are (caracterel e i ncl use ntr-un el ement <cite> re-
prezi nt a un ti tl u de referi n t a si con ti nutul el ementul ui <h3> refer a
numel e unei publ i ca ti i ):
<cite>A Model for Accessing Resources of
the Distributed File Systems</cite>
<h3>Lecture Notes in Computer Science</h3>
<h4>Sabin Buraga</h4>
<ul>
<li>LNCS 2326</li>
<li>2002</li>
<li>224--230</li>
</ul>
Uti l i zarea structuri i de mai sus n referi n tel e bi bl i ograce poate
mbun at a ti si modul de formatare a i nforma ti i l or. Putem ami nti ai ci
si pe unul di ntre mecani smel e precursoare, reprezentat de si stemul
Bi bT
E
X [Knuth, 1984, Goossens et al., 1994].
26 Sabi n Cornel i u Buraga
Mergem mai departe pri n reformatarea referi n tel or bi bl i ograce
uti l i znd un document XML parti cul ari zat pentru astfel de referi n te.
Astfel , regul i l e real e de i nterpretare devi n preci se (mai al es dac a uti -
l i z am spa ti i de nume XML [Bray et al., 1999]):
<bibliografie>
<titlu>A Model for Accessing Resources of
the Distributed File Systems</titlu>
<publicatie numar="2326" abreviere="LNCS">
Lectures Notes in Computer Science
</publicatie>
<autor>
<prenume>Sabin</prenume>
<nume>Buraga</nume>
</autor>
<an>2002</an>
<pagini prima="224" ultima="230" />
</bibliografie>
Documentul di n acest exempl u este bi ne formatat chi ar n l i psa unei
deni ti i DTD sau a unei scheme XML. Ci ti torul uman poate n tel ege
semanti ca, i ar ma si ni l e pot manevra i nforma ti i l e marcate n XML (de
exempl u, se pot a sa toate publ i ca ti i l e pri n parcurgerea marcajel or si
sel ectarea caracterel or aate n i nteri orul ec arei i nstan te a el emen-
tul ui <publicatie>).
Acest ti p de marcare permi te model ul ui i nforma ti onal s a e mai
descri pti v, astfel nct o ma si n a s a poat a anal i za l ucruri l e pe care o co-
muni tate uman a l e n tel ege de l a si ne. Probl emel e si ntacti ce precum
codi carea caracterel or si punctua ti a sunt deni te uti l i znd adnot ari
structurate; mani pul area documentel or de exempl u restructurarea si
l trarea pot automati zate, i ar ecare component a a unui document
poate i denti cat a n mod preci s [Buraga, 2001a].
Putem conti nua ranarea marc ari i datel or, stabi l i nd un spa ti u de
nume pentru marcajel e deni nd referi n te bi bl i ograce ( n vederea evi -
t ari i ambi gui t a ti l or), pl us ata snd metadate recurgnd eventual l a
aser ti uni RDF (a se vedea si capi tol ul 2) ec arei i nforma ti i (de exem-
pl u, speci cnd faptul c a Sabi n Buraga este autorul acel ui arti col si
Arhi tectura spa ti ul ui WWW 27
traduc atorul arti col ul ui ntr-o al t a l i mb a, i ar drepturi l e de propri etate
i ntel ectual a asupra publ i ca ti ei sunt de ti nute de al tci neva etc.):
<rdf:Description
rdf:about="http://www.springer.de/LNCS2326/224-230.pdf">
<bib:titlu>A Model for Accessing Resources of
the Distributed File Systems</bib:titlu>
<bib:autor>
<rdf:Description
rdf:about="mailto:busaco@infoiasi.ro">
<bib:prenume>Sabin</bib:prenume>
<bib:nume>Buraga</bib:nume>
</rdf:Description>
</bib:autor>
</rdf:Description>
Conform [Berners-Lee et al., 2001, Davi es et al., 2003], acest ti p de
marcare face posi bi l a reprezentarea cuno stin telor pentru:
descoperi rea resursel or pri n furni zarea unor i ndi ci i uti l e motoa-
rel or de c autare;
catal ogarea computeri zat a a con ti nutul ui si rel a ti i l or sal e cu al te
date, n vederea consti tui ri i bi bl i oteci l or di gi tal e;
eval uarea con ti nutul ui pentru agregare si l trare;
codi carea, partajarea si schi mbul de cuno sti n te, ntr-o mani er a
i ntel i gent a.
Meta-l i mbajul XML reprezi nt a pri nci pal a speran t a si totodat a com-
ponenta de baz a pentru Web-ul semantic [Berners-Lee et al., 2001]
obi ectul studi ul ui de fa t a. Pri n i ntermedi ul unor mecani sme de de-
scri ere n XML a resursel or si rel a ti i l or di ntre acestea, se va oferi ca-
drul necesar pentru i nteroperabi l i tatea ntre di verse apl i ca ti i care rea-
l i zeaz a schi mburi i ntel i gente de i nforma ti i .
Conform creatorul ui spa ti ul ui WWW, Ti m Berners-Lee, Web-ul se-
manti c reprezi nt a o pnz a consi stent a si l ogi c a a tuturor resursel or de
pe Web, accentul punndu-se pe i nterpretarea datel or de c atre ma si n a
si nu pe reprezentarea l or (a se vedea capi tol ul 2).
28 Sabi n Cornel i u Buraga
1.3.5 Evolu tia elementelor programabile
Evol u ti a c atre formatel e decl arati ve (vezi tabel ul 1.1)
11
poate consta-
tat a nu numai n domeni ul documentel or, ci si n tendi n tel e comuni t a ti i
programatori l or. Acel ea si for te par s a ac ti oneze si n dezvol tarea suc-
cesi v a a l i mbajel or de programare de ti pul mai mul t decl arati v si mai
pu ti n opera ti onal : de exempl u, de l a cod-ma si n a evol u ti a a condus l a
l i mbajul de asambl are, apoi spre Pascal , C, C++, Perl , Java, Python,
Pi ke si C#.
De asemenea, Web-ul pri n evol u ti a conti nu a a l i mbajel or bazate
pe XML poate consi derat un veri tabi l sistemhipermedia distribuit
uti l i znd ca i nfrastructur a I nternetul . Pri n popul area acestei i nfra-
structuri cu seturi de componente ori entate-obi ect si g asi rea de mo-
dal i t a ti (semanti ce) de i ntegrare a acestora, Web-ul poate v azut ca
un medi u eterogen pentru dezvol tarea si expl oatarea de si steme obi ec-
tual e di stri bui te meni te a mani pul a componente mul ti medi a [WOI ].
I ni ti al , spa ti ul WWW era compus di n pagi ni (documente) stati ce (i n-
cl uznd text si i magi ni , apoi el emente mul ti medi a), i nterconectate pri n
i ntermedi ul l eg aturi l or hi pertext (a se vedea sec ti unea 1.2.1). Apl i -
ca ti i de ti p cl i ent (precum navi gatoare Web) erau fol osi te pentru acce-
sarea vi a adrese (URI ) a reprezent ari i acestor resurse, stocate pe
servere Web. Programe supl i mentare (plug-in-uri ), i ncl use n navi ga-
toarel e Web, erau meni te s a redea ti puri de con ti nuturi mul ti medi a
nestandardi zate, ca si ere Word, PostScri pt, PDF (PortableDocument
Format), Fl ash etc. Pentru a oferi con ti nut di nami c uti l i zatori l or, sunt
adoptate di verse modal i t a ti programati ce
12
, reprezentate pe partea ser-
ver de programe CGI (Common Gateway I nterface), servere de apl i -
ca ti i precum PHP (PHP: Hypertext Preprocessor) sau J SP (J ava Server
Pages), i ar pe partea cl i ent de programe JavaScri pt sau appl et-uri Java.
De remarcat faptul c a o seri e de el emente programabi l e func ti oneaz a
drept componente middleware[Bakken, 2001] (o arhi tectur a 3-tier, n
fapt), reprezentnd i nterfe te pentru accesarea unor servi ci i l a di stan t a
11
Se pot consul ta, de asemenea, si [Nai k, 1998], [Knuth, 1984],
[Goossens et al., 1994], [Lamport, 1994], [Buraga, 2001a] sau [W3C].
12
A se vedea l ucr ari l e [Buraga, 2001a], [Buraga et al., 2002a], [Buraga, 2003a],
[Tanas a et al., 2003] si [Tr au san-Matu, 2001].
Arhi tectura spa ti ul ui WWW 29
(e.g., si steme rel a ti onal e de baze de date).
Model ul cl i ent/server pe care se bazeaz a Web-ul nu ofer a suport
suci ent pentru dezvol tarea unor apl i ca ti i di stri bui te pe scar a l arg a,
l i psi nd o seri e de faci l i t a ti precum scal abi l i tatea, servi ci i l e de baz a (i .e.
servi ci i de nume, servi ci i de reg asi re a resursel or etc.) sau securi tatea.
Programel e CGI nu sunt scal abi l e deoarece ecare i nstan t a a acestora
necesi t a un proces separat, executat pe serverul Web pentru a procesa
cereri l e sol i ci tate de un cl i ent parti cul ar. Servi ci i l e sunt l i mi tate dese-
ori l a accesarea unui a sau mai mul tor si steme de gesti une a bazel or de
date, uzual tranzac ti i l e efectundu-se necri ptat. Aceea si si tua ti e per-
si st a chi ar si n cazul unor sol u ti i recente, ori entate-obi ect, bazate pe
i nfrastructuri precum CORBA/I I OP [OMG] sau OLE/DCOM [MSDN]
ori pe medi i de programare Java [Java].
Conti nua dezvol tare a unor metodol ogi i si i nstrumente obi ectual e
ori entate spre Web prezi nt a urm atoarel e avantaje pri nci pal e, conform
cu [Tanenbaum, 2001, Tanenbaum, 2003, Al boai e & Buraga, 2002]:
extensi bi l i tatea;
i nteroperabi l i tatea pe di verse pl atforme;
anal i za, proi ectarea si dezvol tarea de componente programabi l e;
reuti l i zarea componentel or software;
oferi rea de servi ci i di stri bui te (ca de exempl u, servi ci i pri vi nd nu-
mi rea, transparen ta, repl i carea, reg asi rea etc.);
mai buna uti l i zare a resursel or de si stem.
n strns a l eg atur a cu fami l i a de l i mbaje XML si cu metodol ogi i l e
obi ectual e, unul di ntre pa si i i mportan ti ai evol u ti ei spa ti ul ui WWW l
reprezi nt a serviciileWebbazate pe XML. Servi ci i l e Web [Gorman, 2001,
Vasudevan, 2001] permi t ca el emente programabi l e s a e pl asate pe
si turi l e Web, al ti programatori putnd accesa func ti onal i t a ti l e aces-
tor programe, n mani er a di stri bui t a si di rect a, pentru ori ce num ar
poten ti al de si steme i ndependente, pri n fol osi rea unor standarde pre-
cum XML si HTTP. Aceasta va conduce l a adoptarea unei al te vi zi uni
30 Sabi n Cornel i u Buraga
pri vi nd programarea Web si l a construi rea unei i nfrastructuri com-
pl exe pe baza c arei a s a se dezvol te di verse apl i ca ti i speci ce, precum
servi ci i Web semanti ce [Davi es et al., 2003] si agen ti [Bradshow, 1997,
Wool dri dge & Ci ancari ni , 2000] conform cel or detal i ate n capi tol ul 4.
O al t a di rec ti e n conti nu a dezvol tare este Gri d-ul , col ec ti e etero-
gen a de i nforma ti i si apl i ca ti i di stri bui te (e.g., baze de date, bi bl i oteci
di gi tal e, i nstrumente, servi ci i de control al uxul ui de date etc.), consi -
derat a drept resurs a uni c a, procesarea datel or decurgnd i ndependent
de pl atform a [Buyya, 2002, Foster & Kessel an, 1999]. Congura ti i l e
real i zate de componentel e unui Gri d sunt di nami ce, real i zate ad-hoc,
n func ti e de necesi t a ti sau atunci cnd sunt di sponi bi l e n I nternet.
1.4 Concluzii
Consor ti ul Web [W3C] for ta motri ce di n spatel e meta-l i mbajul ui XML
consi der a c a mi si unea sa este aceea de a di ri ja evolu tia spa ti ul ui
Worl d-Wi de Web.
De si a mp art a si t mai mul te i dei comune I nternetul ui [I SOC] ca
software-ul gratui t se r aspnde ste mai repede, protocoal el e proaste
i mi t a; protocoal el e bune fur a si si stemel e ASCI I prol i fereaz a mai ra-
pi d dect cel e bi nare Web-ul a i mpus o strategi e i novatoare:
autodescri erea. Spa tiul WWWpoate construit pesteel nsu si.
n esen t a, apari ti a meta-l i mbajul ui XML n spectrul formatel or de
date pentru Web pune cap at di sputei l egate de modal i t a ti l e de struc-
turare a documentel or n vederea real i z ari i vi zi uni i ori gi nare a crea-
tori l or Web-ul ui [Berners-Lee, 1999]. La ora actual a, XML reprezi nt a
uni ca modal i tate exi stent a pentru adnotarea compl ex a a datel or si pen-
tru oferi rea unui suport i ndependent de pl atforma hardware/software,
deschi s, n vederea real i z ari i de apl i ca ti i Web de mani pul are a resurse-
l or mul ti medi a.
Arhi tectura spa ti ul ui WWW 31
Format de
document
Si ntax a Sti l Structur a Semanti c a
ASN.1 Bi nar a Ti p-
l ungi me-
val oare
Dependent a
de apl i -
ca ti e
Text ASCI I ,
Uni code,. . .
Li ni i Li mbaj
natural
troff Text l i zi bi l Di recti ve
i nterne
Sec ti uni ,
pagi ni
Compunere
T
E
X Program
l i zi bi l
L
A
T
E
X Sec ti uni ,
pagi ni
Compunere
PostScri pt Li mbaj
de comenzi
Pagi ni Desenare
Ri ch Text
Format
Text opac Di recti ve
extensi bi l e
Caractere,
paragrafe
Formatare
HTML
Text l i zi bi l Di recti ve
i mbri cate
Prezenta-
ti onal a
Structur a
HTML
Text l i zi bi l CSS Decl arati v a Fi x a
(<address>)
XML Text l i zi bi l CSS, XSL Decl arati v a Extensi bi l a
RDF Text XML Decl arati v a Scheme
metadate,
descri eri
semanti ce
Tabela 1.1: Compara ti e ntre di verse formate de documente n evol u ti a spa-
ti ul ui Worl d-Wi de Web ([Buraga, 2002a])
C a p itolul 2
We b - ul se m a ntic
Capi tol ul de fa t a prezi nt a Web-ul semanti c si arhi -
tectura sa conceptual a, i nsi stnd asupra speci c ari i
metadatel or si ontol ogi i l or pri n i ntermedi ul l i mbajel or
RDF, OI L, DAML+OI L si OWL.
2.1 Prezentaregeneral a
2.1.1 Preambul
N cadrul acestui capi tol , vom face o trecere n revi st a a pri nci pal el or
aspecte referi toare l a Web-ul semanti c, i nsi stnd asupra modal i t a-
ti l or de expri mare att a rel a ti i l or stabi l i te ntre resursel e di sponi bi l e
pe Web, ct si a metadatel or pri vi toare l a aceste resurse.
Astfel , ne vom concentra asupra i l ustr ari i tr as aturi l or deni tori i al e
RDF (ResourceDescription Framework) component a i ndi spensabi l a a
Web-ul ui semanti c, pe baza c arei a vom putea model a rel a ti i l e spa ti o-
temporal e di ntre resursel e mul ti medi a al e unui si t Web. Acest model
va prezentat n cadrul capi tol ul ui 3, sec ti unea 3.2.3.3. De asemenea,
vom trece n revi st a mani erel e de asoci ere a metadatel or si l i mbajel e de
Web-ul semanti c 33
expri mare vi a XML a ontol ogi i l or, descri i ndu-se n speci al OWL (Web
OntologyLanguage).
2.1.2 Caracterizare si direc tii deinteres
Scopuri l e ori gi nare pri nci pal e al e spa ti ul ui WWW au fost acel ea de a
oferi o modal i tate de comuni care i nter-uman a pri n partajarea cuno s-
ti n tel or si posi bi l i tatea expl oat ari i n mani er a di stri bui t a a puteri i de
cal cul a computerel or conectate l a I nternet [Berners-Lee, 1989].
Spa ti ul ci berneti c a fost i ni ti al conceput pentru a u sura reg asi rea
de c atre cal cul ator a ori c arei date i ndi ferent de l ocal i zarea ei , f ar a a se
pune probl ema n tel egeri i semni ca ti ei acestei a de c atre ma si n a. Di n
cauza vol umul ui tot mai mare de i nforma ti i prezent pe Web este di ci l
de a automati za reg asi rea l or i ntel i gent a, cu att mai pu ti n de c atre
operatorul uman. Una di ntre pri ori t a ti l e Consor ti ul ui Web este aceea
de a pune l a di spozi ti e o modal i tate, bazat a pe actual el e tehnol ogi i
XML, de prel ucrare de c atre cal cul ator a i nforma ti i l or. Sol u ti a este
prezentat a n [Berners-Lee et al., 2001] pri n i ntermedi ul unui scenari u
despre ceea ce ar trebui s a e cunoscut sub numel e de Web seman-
tic. n cadrul acestui scenari u vi zi onar, di spozi ti ve i ntel i gente parta-
jeaz a cuno sti n te pri vi toare l a propri i l e func ti onal i t a ti si l a contextul n
care si desf a soar a acti vi tatea, uti l i znd regul i de i nferen t a si metadate
pentru a (re)g asi i nforma ti i sol i ti ci tate de uti l i zatori i umani .
I deea de baz a este aceea ca spa ti ul Worl d-Wi de Web s a reprezi nte
o pnz a consi stent a de rel a ti i stabi l i te ntre obi ecte i denti cabi l e (de
exempl u, n prezent pri n i denti catori uni formi de resurse, i ar ul teri or
pri n nume stabi l i te de uti l i zatori ), dezvol tarea vi i toare a Web-ul ui i nd
focal i zat a asupra ma si ni l or, nu numai asupra oameni l or.
Astfel , pri ntre dezi deratel e Web-ul ui semanti c se pot enumera (con-
form [Berners-Lee et al., 2001] si [Davi es et al., 2003]):
asoci erea de semanti ci l eg aturi l or di ntre resurse, cu posi bi l i tatea
exti nderi i acestor semanti ci ;
resursel e Web s a poat a exti nse si cl asi cate, pentru aceasta tre-
bui nd a adoptate speci ca ti i conceptual e;
34 Sabi n Cornel i u Buraga
Figura 2.1: n cadrul Web-ul ui semanti c, resursel e si l eg aturi l e au asoci ate
descri eri semanti ce
l a ni vel programati c, s a exi ste enti t a ti capabi l e s a proceseze n
mani er a i ntel i gent a i nforma ti i l e si s a poat a ra ti ona, oferi nd ma-
si ni l or si oameni l or servi ci i compl exe (e.g., c autarea datel or, reg a-
si rea unor ti puri de resurse, moni tori zarea acti vi t a ti i apl i ca ti i l or,
l trarea i nforma ti i l or etc.);
partajarea de c atre uti l i zatori a cuno sti n tel or, i ndi ferent de modul
de stocare si de reprezentare a acestora.
Dup a cum se va putea observa di n cel e prezentate n capi tol el e ur-
Web-ul semanti c 35
m atoare, tema l ucr ari i de fa t a se nscri e n sfera de i nteres a Web-ul ui
semanti c, cercet ari l e efectuate avnd n vedere oferi rea unor sol u ti i
att formal e, ct si de proi ectare si i mpl ementare exi bi l e, bazate
pe tehnol ogi i l e Web actual e, pentru descri erea si reg asi rea resursel or
mul ti medi a l ocal i zate pe Web.
Conform cel or descri se n l ucr ari l e [Baumgartner & Furbach, 2002],
[Davi es et al., 2003] si [Strang et al., 2003], una di ntre actual el e di rec-
ti i de i nteres al e comuni t a ti l or academi ce si i ndustri al e ci rcumscri se
Web-ul ui semanti c este aceea a managementului cuno stin telor (know-
ledge management), mai al es n contextul i ntranet-uri l or organi za ti i -
l or sau n domeni ul nv a t amntul ui vi rtual (e-learning). Probl emel e cu
care se confrunt a cercet atori i sunt cel e l egate de:
c autarea informa tiilor metodel e de c autare bazat a pe cuvi nte-
chei e conduc l a rezul tate nerel evante, nel undu-se n cal cul struc-
tura con ti nutul ui resursel or dori te sau rel a ti i l e acestora cu al te
resurse nrudi te
1
;
extragerea informa tiilor i nstrumentel e de extragere automat a a
i nforma ti i l or proveni nd di n surse mul ti pl e nu sunt nc a suci ent
de exi bi l e s a poat a prel ua i nforma ti i di n surse non-textual e sau
di n domeni i de cunoa stere di feri te;
mentenan ta depozitelor decuno stin te pentru ca i nforma ti i l e (or-
gani zate uzual n col ec ti i de documente XML) s a e consi stente,
corecte si faci l de actual i zat trebui e g asi te reprezent ari semanti ce
procesabi l e de c atre cal cul ator. Acest aspect va conduce l a veri -
carea formal a a consi sten tei cuno sti n tel or si l a i nsti tui rea unor
rel a ti i de ncredere n resursel e di sponi bi l e pe Web a sa-numi tul
Web of trust [Berners-Lee et al., 2001];
generarea automat a de documente acest aspect va conduce l a
recongurarea automat a a modal i t a ti l or de prezentare a con ti nu-
tul ui si turi l or Web, pe baza prol ul ui cogni ti v al vi zi tatori l or (e.g.,
preferi n te, moduri de operare, experi en t a etc.) sau al al tor factori
rel evan ti .
1
A se vedea si cel e di scutate n cadrul sec ti uni i 3.3.2.2.
36 Sabi n Cornel i u Buraga
2.1.3 Structura Web-ului semantic
n vederea sol u ti on ari i aspectel or prezentate mai sus, Web-ul semanti c
adopt a o vi zi une strati cat a (a se vedea gura 2.2), prezentat a i ni ti al
n [Berners-Lee, 2000].
Figura2.2: Ni vel uri l e de speci care a Web-ul ui semanti c [Berners-Lee, 2000]
Pentru ecare ni vel al arhi tecturi i strati cate a Web-ul ui semanti c,
Consor ti ul Web a standardi zat sau urmeaz a s a standardi zeze di feri te
l i mbaje bazate pe fami l i a XML. Vom di scuta pe scurt ecare di ntre
acestea.
2.1.3.1 Interschimbul inteligentdedatevia XML
Meta-l i mbajul XML [Bray et al., 2004] reprezi nt a ni vel ul de baz a pen-
tru real i zarea schi mbul ui de date n mani er a structurat a sau semi -
structurat a, cu concursul i denti catori l or uni formi de resurse si a spa-
ti i l or de nume. Dup a cum am putut vedea si n capi tol ul 1, fol osi nd
Web-ul semanti c 37
deni ti i al e ti puri l or de documente (DTD) sau scheme XML, datel e
marcate cu ajutorul el ementel or si atri butel or XML pot val i date for-
mal .
n ceea ce pri ve ste Web-ul semanti c, XML poate avea uti l i z ari mul -
ti pl e, cel e mai i mportante i nd prezentate n conti nuare, conform
[Davi es et al., 2003, Patel -Schnei der & Si meon, 2002]:
XML poate oferi o si ntax a seri al i zat a pentru al e l i mbaje de mar-
care, reprezentnd astfel lingua franca a Web-ul ui semanti c;
separarea formei de con ti nut fol osi nd transform ari XSL, un anu-
mi t vocabul ar XML poate tradus e n XHTML n vederea re-
prezent ari i l a ni vel ul cl i entul ui (navi gatorul ui ), e n al te l i mbaje
XML (e.g., pentru transl atarea ontol ogi i l or);
XML poate consi derat ca i nd un format uni versal de schi mb de
date ntre apl i ca ti i di stri bui te, al i ni ate Web-ul ui semanti c, pre-
cum agen ti i software; o astfel de sol u ti e este prezentat a n sec-
ti unea 4.4.2.1 si publ i cat a n l ucr ari l e [Al boai e & Buraga, 2003a]
si [Buraga & Al boai e, 2004].
Meta-l i mbajul XML nu poate expri ma semanti ci , ci doar reect a o
mani er a uni form a si ntacti c a de structurare a datel or. n fapt, schemel e
XML nu ofer a dect o descri ere formal a a conven ti i l or si ntacti ce de
modul ui de apari ti e a componentel or unui document XML.
2.1.3.2 Exprimarea metadatelor
Di n moment ce, fol osi nd numai marcatori XML, nu putem descri e re-
sursel e, un pri m pas este asoci erea de metadate, adi c a date pri vi toare
l a date. Forma de expri mare a metadatel or trebui e s a ai b a n vedere
ci ti rea si procesarea acestora de c atre ma si n a, ntr-o mani er a i ndepen-
dent a de apl i ca ti e sau de pl atform a.
De asemenea, trebui e s a se pun a l a di spozi ti e o modal i tate de aso-
ci ere (de dori t vi a unor mecani sme externe) a metadatel or resursel or
consi derate. Una di ntre sol u ti i este aceea de a expri ma di feri te aser-
ti uni pri vi toare l a resurse, metadatel e i nd consi derate propri et a ti al e
resursel or n cauz a.
38 Sabi n Cornel i u Buraga
Drept sol u ti e, Consor ti ul Web propune un cadru de descri ere a re-
sursel or, concreti zat n speci ca ti a RDF (ResourceDescription Frame-
work) [Lassi l a & Swi ck, 1999], n prezent recomandarea oci al a i nd
[Beckett, 2004]. A se vedea si [Manol a & Mi l l er, 2004].
Astfel , l a ni vel general RDF reprezi nt a un cadru meni t s a ofere su-
port pentru procesarea n mani er a i ntel i gent a a metadatel or, oferi nd
i nteroperabi l i tatea ntre di verse apl i ca ti i care real i zeaz a schi mb de i n-
forma ti i , n sensul n tel egeri i de c atre ma si n a a semanti ci i acestora.
Baz a pentru l i mbaje mai compl exe de reprezentare a datel or, RDF
si g ase ste l oc n uti l i z ari precum [Berners-Lee et al., 2001]:
inspectarea resurselor, oferi nd noi capabi l i t a ti motoarel or de c au-
tare, mai al es n ceea ce pri ve ste cl asi carea si turi l or Web;
catalogarea datelor pentru descri erea si /sau eval uarea con ti nu-
tul ui si rel a ti i l or ntre di verse i nforma ti i stocate de o bi bl i otec a
el ectroni c a, si t Web etc.;
agen ti inteligen ti, faci l i tnd schi mbul si partajarea cuno sti n tel or;
descrierea drepturilor deproprietateintelectual aa resursel or Web;
securitatepersonal a sau general a a datel or (oferi nd suport pentru
ata sarea de semn aturi digitaleuti l e n comer tul el ectroni c, tran-
zac ti i economi ce si juri di ce etc.).
RDF fol ose ste l i mbajul XML pentru reprezentarea si ntacti c a a me-
tadatel or. Unul di ntre scopuri l e cadrul ui este de a face posi bi l a speci -
carea semanti c a a datel or, bazat a pe XML [Bray et al., 2004], pri ntr-o
metod a standardi zat a, i ndependent a de ma si n a, extensi bi l a. RDF si
XML sunt compl ementare n acest sens.
I nuen ta RDF se poate ntrevedea n structurarea inteligent a a do-
cumentelor (real i zat a pri n i ntermedi ul l i mbajel or bazate pe XML), n
reprezentarea cuno stin telor (knowledge representation), n standardi-
zarea Web-ului. Al te ari i de i nteres ar l i mbajel e ori entate-obi ect si de
model are a cuno sti n tel or sau bazel e de date di stri bui te.
Vom detal i a l i mbajul RDF n cadrul subcapi tol ul ui 2.2.
Web-ul semanti c 39
Trebui e men ti onat faptul c a pentru domeni i restrnse pot aso-
ci ate metadate pri n i ntermedi ul unor construc ti i XML de genul cel or
expri mate de DCMI (Dublin CoreMetadata I nitiative) [Purl ], care pot
i ntegrate n cadrul construc ti i l or RDF
2
. DCMI dene ste o schem a
avnd 15 propri et a ti de baz a care pot uti l i zate pentru descri erea re-
sursel or Web.
Exemplul 3 Metadatel e asoci ate unui document PDF (PortableDocu-
ment Format) reprezentnd un arti col di sponi bi l on-line pot expri -
mate astfel , fol osi nd si contruc ti i DCMI :
<rdf:RDF
xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:iX=http://ns.adobe.com/iX/1.0/>
<!-- descrieri ale metadatelor Adobe (pentru PDF) -->
<rdf:Description
about=http://www.infoiasi.ro/~busaco/
publications/articles/regexp.pdf
xmlns=http://ns.adobe.com/pdf/1.3/
xmlns:pdf=http://ns.adobe.com/pdf/1.3/>
<pdf:CreationDate>
2002-07-16T13:13:03Z
</pdf:CreationDate>
<pdf:ModDate>
2002-09-18T15:10:22+04:00
</pdf:ModDate>
<pdf:Producer>
Acrobat Distiller
</pdf:Producer>
<pdf:Author>
Sabin Corneliu Buraga,
Victor Tarhon-Onu
</pdf:Author>
<pdf:Creator>
QuarkXPress(tm) 5.01
2
Pentru am anunte se poate consul ta [Kokkel i nk & Schwnzl , 2002].
40 Sabi n Cornel i u Buraga
</pdf:Creator>
<pdf:Title>
Expresii regulate in Perl
</pdf:Title>
<pdf:Keywords>
Perl, Linux, programare,
expresii regulate, limbaje formale
</pdf:Keywords>
</rdf:Description>
<!-- descrieri ale metadatelor Adobe (pentru XAP) -->
<rdf:Description
about=http://www.infoiasi.ro/~busaco/
publications/articles/regexp.pdf
xmlns=http://ns.adobe.com/xap/1.0/
xmlns:xap=http://ns.adobe.com/xap/1.0/>
<xap:CreateDate>
2002-07-16T13:13:03Z
</xap:CreateDate>
<xap:ModifyDate>
2002-09-18T15:10:22+04:00
</xap:ModifyDate>
<xap:Author>
Sabin Corneliu Buraga,
Victor Tarhon-Onu
</xap:Author>
<xap:MetadataDate>
2002-09-18T15:10:22+04:00
</xap:MetadataDate>
<!-- titluri alternative -->
<xap:Title>
<rdf:Alt>
<rdf:li xml:lang=x-default>
Expresii regulate in Perl
</rdf:li>
<rdf:li xml:lang=en-US>
Perl regular expressions
</rdf:li>
Web-ul semanti c 41
</rdf:Alt>
</xap:Title>
</rdf:Description>
<!-- descrieri folosind DCMI -->
<rdf:Description
about=http://www.infoiasi.ro/~busaco/
publications/articles/regexp.pdf
xmlns=http://purl.org/dc/elements/1.1/
xmlns:dc=http://purl.org/dc/elements/1.1/>
<dc:creator>
Sabin Corneliu Buraga,
Victor Tarhon-Onu
</dc:creator>
<dc:title>
Expresii regulate in Perl
</dc:title>
</rdf:Description>
</rdf:RDF>
De men ti onat faptul c a un al t exempl u de astfel de descri ere este
di sponi bi l n l ucrarea [Buraga, 2001a].
O speci ca ti e care permi te asoci erea de descri eri si turi l or Web, pri n
i ntermedi ul aser ti uni l or RDF, este RSS (Rich Site Summary) [RSS].
Speci ca ti i l e RSS sunt di sponi bi l e n mai mul te versi uni (0.9x, 1.0 si
2.0).
Exemplul 4 Nout a ti l e ap arute pe si tul Romanian Web Developers
http://rowd.org/ sunt stocate ntr-un si er RSS avnd urm a-
toarea structur a:
<?xml version="1.0" ?>
<rss version="0.91">
<channel>
<!-- informatii despre sit -->
42 Sabi n Cornel i u Buraga
<title>Noutati pe situl ROWD</title>
<link>http://rowd.org</link>
<description>Ultimele noutati aparute
pe situl Romanian Web Developers.
</description>
<language>ro</language>
<pubDate>10/25/03</pubDate>
<image>
<title>Romanian Web Developers</title>
<url>http://rowd.zuavra.net/img/logo/1a.gif</url>
<link>http://rowd.org/</link>
<width>100</width>
<height>31</height>
</image>
<!-- stirile -->
<item>
<title>Aplicatii Web la cheie.
Studii de caz implementate in PHP</title>
<link>http://www.infoiasi.ro/~phpapps/</link>
<description>...</description>
</item>
<!-- eventual, alte elemente item -->
</channel>
</rss>
Una di ntre probl eme n fol osi rea metadatel or o reprezi nt a reuti -
l i zarea metadatel or n contexte mul ti pl e. O sol u ti e prezentat a n l u-
crarea [Ohi a, 2001] este aceea de a modul ari za seturi l e de construc ti i
XML fol osi te pentru expri marea metadatel or si de a deni di verse re-
gul i pentru refol osi rea acestora.
2.1.3.3 Exprimarea ontologiilor
O deni ti e a conceptul ui de ontol ogi e este urm atoarea (conform l u-
cr ari l or [Gruber, 1993] si [Guari no & Gi aretta, 1995]):
Web-ul semanti c 43
Deni tia 1 O ontol ogi e reprezint a conceptualizarea unui domeniu de
cunoa stere ntr-un format destinat a procesat de calculator, format
modelnd entit a ti, atribute, rela tii si axiome.
Di n punct de vedere formal , conceptual i z ari l e se pot deni n ma-
ni era prezentat a n conti nuare, conform [Guari no, 1998].
Deni tia 2 Oconceptual i zare esteexprimat aprintr-ostructur aD, 1),
undeD reprezint a un domeniu, iar 1 desemneaz a o mul timederela tii
pesteD.
Dac a rel a ti i l e ordi nare sunt deni te pe un domeni u parti cul ar, re-
l a ti i l e conceptual e sunt speci cate peste un spa tiu dedomenii (domain
space).
Deni tia 3 Un spa ti u de domeni i este o structur a de forma D, W),
undeD esteun domeniu si W o mul timedest ari maximalealedome-
niului. W senume stemul timea l umi l or posi bi l e.
De exempl u, dac a D reprezi nt a pi esel e di spuse pe o tabl a de sah,
atunci W poate desemna mul ti mea tuturor congura ti i l or val i de al e
acestor pi ese pe tabl a consi derat a.
Deni tia 4 Dat un spa tiu de domenii D, W), rel a ti a conceptual a
n
dearitaten pesteD, W) sedene steca ofunc tietotal a
n
: W 2
D
n
de
la mul timea lumilor posibileW la o mul timederela tii n-areordinare
pestedomeniul D.
Deni tia 5 Pentru o rela tie conceptual a oarecare , mul timea E
=
(w), w W va con tineextensi i l e admi si bi l e alelui .
44 Sabi n Cornel i u Buraga
Deni tia 6 O conceptual i zare pentru domeniul D este un triplu C =
D, W, R), undeRreprezint a omul timederela tii conceptualepestespa-
tiul dedomenii D, W).
Ontol ogi i l e pot pune l a di spozi ti e conceptual i z ari compl exe al e do-
meni ul ui de l ucru a unei organi za ti i , reprezentnd conceptel e de baz a
si rel a ti i l e di ntre di versel e acti vi t a ti desf a surate de enti t a ti l e acel ei or-
gani za ti i .
Ca exempl e de ontol ogi i putem enumera ontol ogi a reprezentnd
domeni ul academi c meni t a a model a persoane, proi ecte, publ i ca ti i ,
eveni mente sti i n ti ce si subi ecte de cercetare , dezvol tat a de grupul
AKT (Advanced Knowl edge Technol ogi es) [OHara et al., 2001]. Un al t
exempl u provi ne di n domeni ul e-travel, dezvol tndu-se o ontol ogi e care
s a expri me conceptel e vehi cul ate n cadrul unui si stem on-lineoferi nd
formul e de petrecere a zi l el or de vacan t a [Wri ght et al., 2003].
Ontol ogi i l e pot de mai mul te ti puri , n func ti e de domeni ul de i n-
teres al comuni t a ti i cercet atori l or care denesc si uti l i zeaz a o anumi t a
ontol ogi e. Un pri m aspect i mportant este cel al nivelului de descriere
pe care l poate oferi o ontol ogi e (pl ecnd de l a si mpl e l exi coane si
ajungnd l a tezaure organi zate pe categori i de termeni sau taxonomi i
compl exe). Ontol ogi i l e pot di feri si n ceea ce pri ve ste scopul si con-
textul uti l i z ari i con ti nutul ui pe care-l model eaz a. De exempl u, se pot
crea ontol ogi i speci al i zate, fol osi te ntr-un domeni u de i nteres precum
chi rurgi a, dar si ontol ogi i general e n care i nforma ti i l e provi n di n ori ce
domeni u. Acest di n urm a caz poate ntl ni t l a procesarea l i mbajul ui
natural .
n ceea ce pri ve ste mani era de expri mare a unei ontol ogi i , exi st a
deni te di verse limbaje de specicare
3
, pl ecnd de l a l i mbaje de pro-
gramare l ogi c a precum Prol og sau deri vate di n Prol og (e.g., Gol og, Con-
Gol og) si mergnd pn a l a l i mbaje speci al i zate, cum ar KI F (Know-
ledge I nterchange Format) [Genesereth & Fi kes, 1992] sau succesorul
s au CL (Common Logic). Al te l i mbaje sunt bazate pe l ogi ci descri pti ve
este cazul l i mbajel or prezentate mai jos: OI L, DAML+OI L si OWL.
3
Pentru un studi u comparati v, se pot consul ta [Corcho & Gomez-Perez, 2000],
[Grosof et al., 2003] si [Horrocks & Patel -Schnei der, 2003].
Web-ul semanti c 45
Aspectel e formal e pri vi toare l a ontol ogi i si l a conceptual i z ari sunt
detal i ate n [Guari no, 1998].
RDF Schema
Speci ca ti a RDFS (RDF Schema) [Bri ckl ey & Guha, 2000] exti nde mo-
del ul RDF pentru a oferi posi bi l i tatea i nterpret ari i l a ni vel semanti c a
propri et a ti l or expri mate pri n i ntermedi ul model ul ui RDF, f ar a a i m-
pune constrngeri n ceea ce pri ve ste modul de expri mare si ntacti c a a
unei descri eri RDF asoci ate unei resurse.
Se permi t a sadar deni rea unui vocabul ar parti cul ar pri vi tor l a
datel e expri mate n RDF si speci carea ti puri l or de obi ecte care con-
sti tui e aser ti uni l e RDF/XML. n fapt, RDFS ofer a un si stem de ti puri
de baz a pentru model el e expri mate n RDF [Davi es et al., 2003], adi c a
ofer a premi sel e speci c ari i de ontologii si mpl e vi a pri mi ti ve de mode-
l are a cuno sti n tel or. Pri nci pal el e contri bu ti i al e RDFS sunt cel e l egate
de punerea l a di spozi ti e a unei si ntaxe standardi zate pentru speci -
carea de ontol ogi i si a unui set standard de pri mi ti ve de model are, pre-
cum rel a ti i de ti pul subclas a (subclass-of ) sau instan t a (instance-of ).
Mai mul te detal i i vor prezentate n subcapi tol ul 2.2 al capi tol ul ui
de fa t a.
Anumi te construc ti i compl i cate pentru expri marea unor ti puri com-
pl exe de cuno sti n te nu pot model ate fol osi nd RDF si /sau RDFS. De
exempl u, este di ci l a se expri ma exact ce ti puri de val ori pot l ua
di verse i nstan te de resurse (e.g., ti tl uri l e c ar ti l or stocate de o bi bl i o-
tec a di gi tal a sunt si ruri de caractere, i ar canti tatea de vol ume di ntr-un
anumi t domeni u este desemnat a de un num ar ntreg pozi ti v). Pri ntre
al te cri ti ci aduse model ul ui RDFS se pot enumera i mposi bi l i tatea ex-
pri m ari i propri et a ti l or al gebri ce rel a ti onal e (precum tranzi ti vi tatea ori
si metri a) sau l i psa unui mecani sm de procesare a i nterog ari l or referi -
toare l a aser ti uni l e RDF [Anutaryi a et al., 2001].
OIL (Ontology InferenceLayer)
Un pri m pas n rezol varea unor astfel de probl eme l -a consti tui t OI L
(Ontology I nferenceLayer) [Fensen et al., 2000], construi t pe baza l i m-
46 Sabi n Cornel i u Buraga
bajul ui XOL (XML Ontology Language). Scopuri l e proi ect ari i l i mbaju-
l ui OI L au avut n vedere, pri ntre al tel e:
model area unei ct mai l argi vari et a ti de ontol ogi i ;
oferi rea unei semanti ci formal e pentru a faci l i ta i nterpretarea de
c atre ma si n a a acestei semanti ci ;
oferi rea unor servi ci i de ra ti onament corect (sound) si compl et;
maxi mi zarea compati bi l i t a ti i cu standardel e deja exi stente (XML
si RDF).
Model ul formal de baz a l -a consti tui t l ogi ca cu predi cate, rel a ti i l e
di ntre resurse i nd model ate pri n i ntermedi ul predi catel or. Concep-
tul central se axeaz a asupra claselor (classes sau frames) avnd aso-
ci ate di verse propri et a ti denumi te atribute. Atri butel e pot apl i cate
numai asupra cl asel or pentru care au fost deni te. Putem asoci a ace-
l a si nume de atri but unor cl ase di feri te, i mpunnd anumi te restric tii
al e val ori l or atri butel or consi derate (rangerestrictions). O cl as a ofer a
un context pentru model area unui aspect speci c al unui domeniu (do-
main) [Horrocks et al., 2000, Davi es et al., 2003].
OI L se bazeaz a pe no ti unea de concept si pe deni rea de supercl ase
si atri bute. Rel a ti i l e pot deni te att ntre atri bute si cl asa di n care
fac parte, ct si ntre enti t a ti i ndependente avnd domeni i si val ori
speci ce. Ca si cl asel e, rel a ti i l e consti tui te pot grupate n i erarhi i .
n acest mod, OI L permi te speci carea de ontol ogi i , ecare ontol ogi e
expri mat a n OI L putnd adnotat a cu ajutorul metadatel or, fol osi nd
eventual DCMI . Si ntaxa de baz a uti l i zeaz a aser ti uni RDF(S).
Model ul OI L este organi zat l a rndul s au pe ni vel uri :
ni vel ul de baz a (Core OI L) coi nci de cu RDFS, pentru a faci l i ta
agen ti l or care proceseaz a construc ti i RDF i nterpretarea ontol o-
gi i l or expri mate n OI L;
ni vel ul standard (Standard OI L) i nten ti oneaz a s a ofere un set de
pri mi ti ve i ndi spensabi l e n model area cuno sti n tel or, permi tnd
Web-ul semanti c 47
formal i zarea semanti ci l or ontol ogi i l or consi derate pri n i nterme-
di ul unor mecani sme l ogi ce reprezentate de di verse logici descrip-
tive (Description Logics)
4
, di ntre care se poate men ti ona l ogi ca
oH1Q [Horrocks et al., 2001];
ni vel ul de i nstan ti ere (I nstanceOI L) ofer a posi bi l i tatea i ntegr ari i
di feri tel or i nstan te de ontol ogi i n al te si steme, precum si stemel e
de management al bazel or de date;
ni vel ul superi or (HeavyOI L) adaug a faci l i t a ti pentru reprezenta-
rea cuno sti n tel or fol osi nd l i mbaje bazate pe regul i .
O ontol ogi e este expri mat a n OI L pri n i ntermedi ul unui contai ner
de ontol ogi i (ontology container) si a unei deni ti i . La ni vel si ntacti c,
contai nerul este expri mat pri n el emente DCMI . Partea care dene ste
ontol ogi a const a di ntr-o di recti v a de i mport I op ti onal a, o regul a de
baz a R op ti onal a, o seri e de deni ti i de sl oturi (propri et a ti ) S si o seri e
de deni ti i de axi ome A.
O deni ti e de cl as a (class-def ) asoci az a unui nume de cl as a o de-
scri ere a acel ei cl ase. n RDFS, acest l ucru se speci c a pri n el ementul
<rdfs:Class>. Ti pul descri eri i poate unul primitiv (condi ti i l e spe-
ci cate pentru membri i cl asei sunt necesare, dar nu si suci ente) sau
denit (condi ti i l e sunt necesare si suci ente). n pl us, trebui e speci -
cate:
o di recti v a subclass-of dene ste o l i st a de expresi i de cl as a (nu-
me de cl ase, constrngeri de propri et a ti , expresi i l ogi ce).
Construc ti a RDFS anal oag a este <rdfs:subClassOf>.
O restri c ti e de sl ot (slot-constraint) reprezi nt a o l i st a de una sau
mai mul te restri c ti i care se vor apl i ca propri et a ti l or (sl oturi l or).
Ca exempl e de constrngeri se pot men ti ona has-value, value-type
sau max-cardinality.
o deni ti e de sl ot slot-def asoci az a unui nume de sl ot o descri ere
a sl otul ui care speci c a di verse restri c ti i gl obal e (domeni u, val ori ,
4
A se vedea si [Baader et al., 2002].
48 Sabi n Cornel i u Buraga
propri et a ti de tranzi ti vi tate sau si metri e etc.). Un sl ot l a rndul
s au poate i ncl ude sub-sl oturi (sub-constrngeri ).
o mul ti me de axi ome, ecare axi om a speci cnd fapte supl i men-
tare despre cl asel e ontol ogi ei (de exempl u, cl asel e Imagine si
Sunet sunt di sjuncte n cadrul unei ontol ogi i pri vi toare l a mul -
ti medi a). Pri ntre axi omel e val i de care pot uti l i zate se enumer a
disjoint si equivalent.
Axi omel e pot consi derate obi ecte, putnd astfel model ate n
RDF
5
.
Lucr ari l e [Horrocks et al., 2000] si [Fensen et al., 2000] prezi nt a de-
scri erea l a ni vel formal a model ul ui OI L. Al te consi dera ti i referi toare
l a formal i zarea l i mbajul ui sunt prezentate n [Kamps & Marx, 2002].
Exemplul 5 Prezent am un fragment de ontol ogi e model nd regnul
ani mal (dup a [Broekstra et al., 2001]):
(class-def defined ierbivor
subclass-of animal
slot-constraint
value-type (planta or
(slot-constraint este-fragment-din
has-value planta))
class-def elefant
sub-class-of ierbivor mamifer
slot-constraint consuma
value-type planta
slot-constraint culoare
has-filler "gri"
Fol osi nd XML si RDFS, cel e de mai sus se expri m a astfel :
<rdfs:Class rdf:ID="elefant">
<rdfs:subClassOf rdf:resource="#mamifer" />
<rdfs:subClassOf rdf:resource="#ierbivor" />
5
Detal i i n [Staab & Mdche, 2000] si [Broekstra et al., 2001].
Web-ul semanti c 49
<oil:hasPropertyRestriction>
<oil:ValueType>
<oil:onProperty
rdf:resource="#consuma" />
<oil:toClass rdf:resource="#planta" />
</oil:ValueType>
<oil:hasFiller>
<oil:onProperty
rdf:resource="#culoare" />
<oil:stringFiller>
gri
</oil:stringFiller>
</oil:hasFiller>
</oil:hasPropertyRestriction>
</rdfs:Class>
DAML+OIL
Succesor al OI L, DAML+OI L [Broekstra et al., 2001, DAML+OI L] re-
prezi nt a o i ni ti ati v a de a expri ma ontol ogi i l e di rect pri n mecani smel e
oferi te de speci ca ti i l e RDFS, dar pl ecnd de l a DAML (DARPA Agent
Markup Language) [Hendl er & McGui nness, 2001], l i mbaj meni t a de-
semna o mani er a standard de i nterschi mb de date ntre agen ti i i n-
tel i gen ti . Semanti ca DAML+OI L este deni t a fol osi nd un model bazat
pe KI F (Knowledge I nterchange Format) [Genesereth & Fi kes, 1992].
Construc ti i l e DAML+OI L pot expri ma un subset al cl auzel or propozi -
ti onal e Horn, aceste cl auze permi tnd speci carea constrngeri l or si
regul i l or de ra ti onament care pot mani pul ate de apl i ca ti i l e Web-ul ui
semanti c.
Li mbajul DAML+OI L descri e aser ti uni l e pri vi toare l a ti pul (cl asa)
unei enti t a ti sau l a rel a ti i l e stabi l i te ntre di ver si membri ai unei cl ase
pri n i ntermedi ul excl usi v al contruc ti i l or RDF. n DAML+OI L se poate
speci ca, n mani er a expl i ci t a, faptul c a dou a componente al e unei on-
tol ogi i sunt di feri te sau si mi l are, i ar n pl us nu e obl i gatori u s a se de-
neasc a o anumi t a rel a ti e ntre el e.
50 Sabi n Cornel i u Buraga
Ti puri l e de date care pot prezente ntr-un document DAML+OI L
sunt anal oage cel or di n XML Schema [Fal l si de, 2001] si pot fol osi te n
speci carea restri c ti i l or atri butel or (sl oturi l or) si a mul ti mi l or de val ori
permi se.
Li mbajul ui DAML+OI L i -a fost asoci at a o semanti c a axi omati c a,
formal i smel e i mpl i cate i nd detal i ate n [Fi kes & McGui nness, 2001].
Cercet ari l e s-au concentrat si asupra uti l i z ari i ontol ogi i l or expri mate
pri n DAML+OI L n contextul i ngi neri ei software [Davi es et al., 2003].
Exemplul 6 Fol osi nd fragmentul de ontol ogi e descri s a n exempl ul 5,
construc ti i l e DAML+OI L sunt:
<daml:Ontology rdf:about="">
<daml:versionInfo>1.0</daml:versionInfo>
</daml:Ontology>
<daml:Class rdf:about="#elefant">
<rdfs:subClassOf>
<!-- subclasa, vazuta ca intersectie
dintre clasele mamifer si ierbivor -->
<daml:Class>
<daml:intersectionOf
rdf:parsetype="daml:Collection">
<daml:Class rdf:about="#mamifer" />
<daml:Class rdf:about="#ierbivor" />
</daml:intersectionOf>
</daml:Class>
</rdfs:subClassOf>
<rdfs:subClassOf>
<daml:Restriction>
<daml:onProperty
rdf:resource="#consuma" />
<daml:hasClass rdf:resource="#planta" />
</daml:Restriction>
</rdfs:subClassOf>
<rdfs:subClassOf>
<daml:Restriction>
<daml:onProperty
rdf:resource="#culoare" />
Web-ul semanti c 51
<daml:hasValue>gri</daml:hasValue>
</daml:Restriction>
</rdfs:subClassOf>
</daml:Class>
OWL (WebOntology Language)
Pe baza DAML+OI L, Consor ti ul Web dezvol t a l i mbajul OWL (Web On-
tology Language) [Dean & Schrei ber, 2004], actual mente recomandare
oci al a.
Ca si precedentel e l i mbaje, OWL este structurat pe ni vel uri :
OWL Liteofer a posi bi l i tatea descri eri i unor i erarhi i de cl asi care
care nu posed a restri c ti i compl i cate. OWL Liteva putea fol osi t
pentru speci carea di c ti onarel or de termeni si a al tor taxonomi i .
OWL DL are drept scop pri nci pal oferi rea unei expresi vi t a ti cres-
cute, f ar a a se pi erde compl eti tudi nea computa ti onal a (se garan-
teaz a astfel c a toate decl ara ti i l or vor putea procesate de c atre
ma si n a). Model ul teoreti c al acestui ni vel este bazat pe l ogi ca de-
scri pti v a [Baader et al., 2002].
OWL Full ofer a un maxi mum de expresi vi tate si l i bertatea si n-
tacti c a a RDF, f ar a a se pune probl ema computabi l i t a ti i .
Remarca 1 Fi ecare di ntre subl i mbajel e prezentate este o extensi e a
cel ui aat pe ni vel ul i medi at i nferi or. Au l oc rel a ti i l e urm atoare (rel a-
ti i l e i nverse nu sunt sati sf acute):
Ori ce ontol ogi e expri mat a n OWL Lite poate expri mat a si n
OWL DL.
Ori ce ontol ogi e expri mat a n OWL DL poate expri mat a si n
OWL Full.
Ori ce concl uzi e val i d a deducti bi l a n OWL Lite este val i d a si n
OWL DL.
52 Sabi n Cornel i u Buraga
Ori ce concl uzi e val i d a deducti bi l a n OWL DL este val i d a si n
OWL Full.
O ontol ogi e OWL este compus a di n cl ase, i nstan te de cl ase si rel a-
ti i l e di ntre aceste i nstan te. Succesul unei ontol ogi i depi nde n mare
m asur a de abi l i tatea de a ra ti ona despre i ndi vi zi i unei cl ase. OWL
ofer a posi bi l i tatea descri eri i , vi a construc ti i XML, a cl asel or di n care
fac parte i ndi vi zi speci ci si a propri et a ti l or care-i caracteri zeaz a. n
OWL Full o cl as a reprezi nt a un obi ect di n l umea reprezentat a de on-
tol ogi a model at a.
Fi l osoa l i mbajul ui este di feri t a de aceea a unui si stem de baze de
date, nei mpunndu-se a-priori o cunoa stere compl et a a domeni ul ui de
i nteres. Cl asel e si propri et a ti l e pot speci cate n forme di feri te, i ar
decl ara ti i l e pri vi toare l a i ndi vi zi nu trebui e obl i gatori u s a e i ncl use n
acel a si document n care s-a speci cat o anumi t a ontol ogi e
6
.
O cl as a parti cul ar a poate deri vat a di n una mai general a pri n i n-
termedi ul unei construc ti i rdfs:subClassOf. Dac a X este subcl as a a
cl asei Y , atunci ori ce i nstan t a a l ui X este, de asemenea, i nstan t a a l ui
Y . Rel a ti a rdfs:subClassOf este tranzi ti v a.
Exemplul 7 Pentru a speci ca faptul c a Audio este subcl as a a cl asei
Multimedia vom scri e:
<owl:Class rdf:ID="Audio">
<rdfs:subClassOf rdf:resource="#Multimedia" />
</owl:Class>
n vederea form ari i cl asel or, OWL DL pune l a di spozi ti e construc ti i
meni te s a creeze expresii declas a [Dean & Schrei ber, 2004], operatori i
permi si i nd cei di n teori a mul ti mi l or: reuni une (owl:unionOf), i nter-
sec ti e (owl:intersectionOf), compl ementar a (owl:complementOf).
Cl asel e di sjuncte pot speci cate pri n owl:disjointWith.
6
A se vedea [Costel l o & Jacobs, 2003].
Web-ul semanti c 53
Exemplul 8 Pentru a deni faptul c a documentel e vi deo nu sunt l umi
vi rtual e si ni ci apl i ca ti i executabi l e, vom scri e:
<owl:Class rdf:ID="Video">
<rdf:subClassOf rdf:resource="#Multimedia" />
<owl:disjointWith rdf:resource="#LumiVirtuale" />
<owl:disjointWith rdf:resource="#Executabile" />
</owl:Class>
Cl asel e pot speci cate si pri n i ntermedi ul enumer ari i membri l or,
pentru aceasta fol osi ndu-se el ementul owl:oneOf.
Supl i mentar, al aturi de numi rea unei cl asei sau a referi n tel or l a
al te cl ase (eventual pri n i ntermedi ul rel a ti ei <rdfs:subClassOf>),
se poate speci ca o l i st a de restri c ti i pe care trebui e s a l e sasfac a
i ndi vi zi i cl asei deni te.
O construc ti e major a este reprezentat a de propriet a ti, rel a ti i bi nare
care pot speci ca fapte pri vi toare l a membri i unei cl ase sau l a i nvi di zi .
Propri et a ti l e se pot referi l a ti puri l e de date (rel a ti i ntre i nstan tel e de
cl ase si l i teral i i RDF sau ti puri l e de date XML Schema) ori l a obi ecte
(rel a ti i ntre i nstan tel e a dou a cl ase). Deni nd o propri etate, n fapt se
i mpune o restri c ti e. O propri etate poate deni t a ca i nd o subpro-
pri etate (speci al i zare) a unei propri et a ti deja speci cate. Domeni ul si
codomeni ul rel a ti ei (propri et a ti i ) pot si el e speci cate vi a construc-
ti i l e domain si range.
Propri et a ti l e pot i erarhi zate, si mi l ar cl asel or.
Exemplul 9 Pentru a speci ca o propri etate de ti p obi ect, pri vi toare
l a faptul c a un document mul ti medi a poate stocat pe un si t Web mul -
ti medi a, vom deni urm atoarel e:
<owl:ObjectProperty rdf:ID="stocat">
<rdfs:domain rdf:resource="#Multimedia" />
<rdfs:range rdf:resource="#sitMultimedia" />
</owl:Class>
Pentru a descri e faptul c a un document audi o poate stocat de m a-
car un si t Web mul ti medi a, vom putea scri e:
54 Sabi n Cornel i u Buraga
<owl:Class rdf:ID="Audio">
<rdf:subClassOf rdf:resource="#Multimedia" />
<rdf:subClassOf>
<owl:Restriction>
<owl:onProperty rdf:resource="#stocat">
<!-- indicam cardinalitatea minima -->
<owl:minCardinality
rdf:datatype="&xsd;nonNegativeInteger">
1
</owl:minCardinality>
</owl:Restriction>
</rdf:subClassOf>
</owl:Class>
Fi ecare i nstan t a de document audi o trebui e s a apar a m acar n cel
pu ti n o rel a ti e stocat. n acest exempl u se observ a si fol osi rea unei
propri et a ti referi toare l a ti puri de date (s-a uti l i zat un ti p de dat a XML
Schema).
Propri et a ti l e posed a di verse caracteri sti ci pri nci pal e (conform speci -
ca ti ei [Dean & Schrei ber, 2004]):
tranzitivitate:
pentru o propri etate P are l oc P(x, y) P(y, z) P(x, z), x, y, z;
simetrie:
pentru o propri etate P are l oc P(x, y) P(y, x), x, y;
invers a:
dac a propri etatea P
1
este eti chetat a cu owl:inverseOf P
2
, atunci
P
1
(x, y) P
2
(y, x);
func tional a:
pentru o propri etate P eti chetat a ca i nd func ti onal a are l oc
P(x, y) P(x, z) y = z.
Asupra propri et a ti l or pot i mpuse restri c ti i , i .e. di verse constrn-
geri pri vi toare l a i nterval ul de val ori al e unei propri et a ti n cadrul unui
Web-ul semanti c 55
context speci c. Aceste restri c ti i trebui e s a apar a deni te n cadrul el e-
mentel or owl:Restriction sau owl:onProperty.
Ca exempl e de restri c ti i i mpuse propri et a ti l or se pot men ti ona urm a-
toarel e: allValuesFrom, someValuesFrom si hasValue. Se pot speci -
ca si restri c ti i l egate de cardi nal i tate (e.g., minCardinality sau
maxCardinality), dup a cum s-a putut observa n exempl ul anteri or.
Echi val en ta di ntre cl ase se dene ste pri n owl:equivalentClass,
i ar cea ntre propri et a ti vi a owl:equivalentProperty. Aceste con-
struc ti i sunt uti l e pentru a conecta ontol ogi i i ndependente. Un meca-
ni sm si mi l ar se apl i c a si n cazul i ndi vi zi l or, pri n i ntermedi ul el emen-
tul ui owl:sameAs.
De asemenea, OWL ofer a posi bi l i tatea de a deni col ec ti i de i ndi vi zi
di sti nc ti vi a owl:distinctMembers.
Exemplul 10 Pentru a speci ca, n termeni fuzzy, di verse l ocal i z ari
l a ni vel l ocal , n i ntranet-ul sau n extranet-ul organi za ti ei al e unei
resurse mul ti medi a, vom punea scri e:
<owl:AllDifferent>
<owl:distinctMembers rdf:parseType="Collection">
<xf:Location rdf:about="#local" />
<xf:Location rdf:about="#intranet" />
<xf:Location rdf:about="#extranet" />
</owl:distinctMembers>
</owl:AllDifferent>
Mai mul te detal i i pri vi toare l a l i mbajul OWL sunt di sponi bi l e n
[Dean & Schrei ber, 2004], [Guha & Hayes, 2003] si [W3C].
2.2 RDF cadru dedescrierea resurselor
2.2.1 Prezentaregeneral a
RDF (Resource Description Framework) [Beckett, 2004] dene ste un
mecani sm de descri ere a resursel or i ndependent de domeni ul de fo-
l osi re a datel or, f ar a a speci ca a priori vreo semanti c a. Modal i t a ti l e
56 Sabi n Cornel i u Buraga
de descri ere a resursel or trebui e s a se real i zeze ntr-o mani er a neutr a,
dar general a.
Li mbajul RDF are drept scop pri nci pal reprezentarea i nforma ti i l or
pri vi toare l a resursel e Web. RDF poate uti l i zat, de asemenea, pentru
reprezentarea i nforma ti i l or care pot identicate pe Web, chi ar dac a
n mod di rect nu pot accesatevi a WWW.
Pri ma speci ca ti e se reg ase ste n [Lassi l a & Swi ck, 1999], actual -
mente Consor ti ul Web punnd l a di spozi ti e, ca recomand ari oci al e, o
seri e de documente care s a ofere suportul necesar fol osi ri i RDF ca fun-
da ti e pentru Web-ul semanti c (ghi d de uti l i zare, concepte de baz a, si n-
tax a abstract a, semanti c a, di verse studi i de caz si al tel e) [Beckett, 2004,
Manol a & Mi l l er, 2004].
Pentru a faci l i ta deni rea datel or RDF, va necesar un si stem de
cl ase si mi l ar cel ui di n programarea ori entat a-obi ect. O col ec ti e de cl ase
(dezvol tat a pentru un anumi t scop speci c) se nume ste schem a. Cl asel e
sunt organi zate i erarhi c oferi nd extensi bi l i tatea pri n ranarea sub-
cl asel or. Astfel , pentru crearea unei noi scheme, putem pl eca de l a o
schem a de baz a (pri vi t a ca o cl as a abstract a n termeni i program ari i
obi ectual e). Se asi gur a n acest mod si reuti l i zarea deni ti i l or de meta-
date. Datori t a caracterul ui extensi bi l , agen ti i software care proceseaz a
metadatel e vor capabi l i de versati l i tate n prel ucrarea schemel or.
Mo steni rea mul ti pl a permi te expl oatarea, n mani ere di verse, a ace-
l ea si i nforma ti i . Este posi bi l s a se creeze i nstan te de date RDF bazate
pe scheme proveni nd di n surse di feri te.
2.2.2 Modelul debaz a al RDF
Model ul de baz a se construi e ste cu ajutorul urm atoarel or ti puri de
obi ecte:
resurse
Datel e descri se de expresi i l e RDF sunt denumi te resurse. O re-
surs a poate o pagi n a Web compl et a de exempl u, un docu-
ment XHTML desemnat de un URI precum o adres a de genul
http://www.infoiasi.ro/~busaco/index.html , o parte a
unei pagi ni Web (un el ement speci c HTML sau XML prezent
Web-ul semanti c 57
n sursa documentul ui , i.e. o i magi ne) sau un obi ect care nu este
di rect accesi bi l vi a Web (e.g. o carte ti p ari t a). Resursel e sunt spe-
ci cate de URI -uri pl us un i denti cator de l eg atur a, op ti onal .
propriet a ti
O proprietate reprezi nt a un aspect speci c, o caracteri sti c a, un
atri but sau o rel a ti e pentru a descri e o resurs a. Fi ecare propri e-
tate posed a o semanti c a, un set de val ori permi se, o mul ti me de
ti puri de resurse pe care l e descri e si un set de rel a ti i (i nterdepen-
dente) cu al te propri et a ti .
declara tii
O anumi t a resurs a mpreun a cu o propri etate a sa avnd aso-
ci at a o val oare formeaz a o declara tie. Putem pri vi decl ara ti a ca un
tri pl u subiect, predicat, obiect. Obi ectul decl ara ti ei (val oarea pro-
pri et a ti i ) poate desemna o al t a resurs a (speci cat a de un URI ) sau
un literal (ti p pri mi ti v de dat a sau si r de caractere, conform speci -
ca ti i l or XML). n model ul RDF, un literal poate con ti ne marcaje
XML care ns a nu vor eval uate (anal i zate) de procesorul RDF.
2.2.3 Modul dereprezentare
Decl ara ti i l e se pot reprezenta astfel :
graf orientat noduri l e sunt e subi ecte, e obi ecte, i ar arcel e
semni c a un predi cat (a se vedea gura 2.3);
marcaje <subject> HAS <predicate> <object>
RDF/ XML dup a cum vom vedea n conti nuare.
Figura 2.3: Reprezentarea pri n grafuri a decl ara ti i l or RDF
58 Sabi n Cornel i u Buraga
O propri etate poate avea drept val oare o entitate structurat a. De
exempl u: I ndividul Sabin Corneliu Buraga, avnd adresa de e-mail
busaco@infoiasi.ro, este autorul resursei (paginii) Web
http://www.infoiasi.ro/busaco/pub.html.
n acest caz, obi ectul nu va un si r de caractere, ci o col ec ti e for-
mat a di n trei l i teral i :
individ, Sabin Corneliu Buraga, busaco@infoiasi.ro )
Pentru tri pl ul p, s, o apar ti nnd mul ti mi i de decl ara ti i RDF, putem
g asi i nterpretarea: s are propri etatea p cu val oarea o.
I nterpret ari l e date unor decl ara ti i RDF sunt rel ati ve l a o mul ti me
de referi n te de i denti catori uni formi de resurse (nota ti cu uriref ),
numi t a vocabularul i nterpret ari i consi derate [Manol a & Mi l l er, 2004,
Hayes, 2004].
Deni tia 7 Formal, oi nterpretare sedene sterecursiv astfel:
dac a E esteun literal simplu, atunci I(E) = E;
dac a E esteun literal cu tip, atunci I(E) = IL(E);
dac a E esteun uri ref, atunci I(E) = IL(E);
dac a E esteun triplu s, p, o, atunci I(E) = true dac a (I(s), I(o))
I
EXT
(I(p)) si I(E) = false n caz contrar;
dac a E esteun graf RDF, atunci I(E) = false dac a exist a un triplu
E