Sunteți pe pagina 1din 134

Dezvoltarea aplicațiilor Web

Dr. Sabin Buragawww.purl.org/net/busaco



Architectura aplicațiilor Web
gestionând date RDF. Linked Open Data
Dr. Sabin Buragawww.purl.org/net/busaco
„E mai ușor să negi lucrurile,
decât să te informezi despre ele.”

Mariano José de Larra


Dr. Sabin Buragawww.purl.org/net/busaco
Web attitude (Tim Berners-Lee)

anyone can say anything about anything

no one knows everything about anything

my system is most valuable


because of its interconnection to its peers
disponibilitatea datelor la nivel de Web

Dr. Sabin Buragawww.purl.org/net/busaco


A fi stocat pe Web
(“on the Web”)

ca document „opac”
– disponibil într-un format proprietar sau nu –
fără a referi, pe baza standardelor Web,
alte resurse de interes
disponibilitatea datelor la nivel de Web

Dr. Sabin Buragawww.purl.org/net/busaco


A fi descoperibil pe baza standardelor Web
(“in the Web”)

folosind modele/formate de date deschise


(e.g., HTML, XML, JSON, RDF etc.)
aliniate principiilor hipertextului/hipermedia,
procesabile independent de platformă
Dr. Sabin Buragawww.purl.org/net/busaco
Necesitatea modelării cunoștințelor

knowledge modeling
Dr. Sabin Buragawww.purl.org/net/busaco
Necesitatea modelării cunoștințelor

knowledge modeling

„instrumente” cognitive umane:


formal logic, rules, concepts, analogies,
images, neural connections
Dr. Sabin Buragawww.purl.org/net/busaco
Apare necesitatea managementului acestora

knowledge management
Dr. Sabin Buragawww.purl.org/net/busaco
Aspecte privind managementul cunoștințelor
Shadbolt & O’Hara, 2004

achiziția (acquiring)
modelarea (modelling)
obținerea (retrieving)
reutilizarea (reusing)
publicarea (publishing)
mentenanța (maintaining)
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Achiziția (acquiring)
aplicațiile Web trebuie să preia
informații și/sau cunoștințe,
nu date brute – lipsite de semnificație
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Achiziția (acquiring)
aplicațiile Web trebuie să preia
informații și/sau cunoștințe,
nu date brute – lipsite de semnificație
e.g., texte (formatate) preluate din formulare
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Achiziția (acquiring)
aplicațiile Web trebuie să preia
informații și/sau cunoștințe,
nu date brute – lipsite de semnificație

utilizatorii obișnuiți nu vor marca datele


în formate precum HTML sau JSON, XML, RDF etc.
Dr. Sabin Buragawww.purl.org/net/busaco
FRED: de la limbaj natural la modele
conceptuale modelate via RDF (F. Draicchio
et al., 2012) http://wit.istc.cnr.it/stlab-tools/fred
framework-ul Semargl
extragerea datelor

Dr. Sabin Buragawww.purl.org/net/busaco


modelate cu RDFa
(Lev Khomich, 2013)
github.com/levkhomich/semargl
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelat


riguros la nivel semantic

conform
expresivității dorite
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelat


riguros la nivel semantic

în practică, acest aspect este aproape imposibil


(vezi dificultățile de dezambiguizare a limbajului natural)
Dr. Sabin Buragawww.purl.org/net/busaco
existența modelelor și formatelor eterogene
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Modelarea (modelling)

pași de urmat:
identificarea categoriilor (claselor) de resurse,
definirea proprietăților + restricțiilor,
completarea – (semi)automată a – datelor despre indivizi:
input explicit, data mining, tagging,
microdate HTML5, RDFa etc.
detalii în
cursurile viitoare
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Obținerea (retrieving)

mecanisme de interogare și filtrare a cunoștințelor


managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Obținerea (retrieving)

oferirea de suport pentru efectuarea de agregări,


procesări și extrageri de date/informații/cunoștințe,
în manieră (semi)automată,
pe baza meta-datelor și relațiilor dintre entități
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Reutilizarea (reusing)

fiecare entitate trebuie definită doar o singură dată

identificată printr-un URI


managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


De ce este mai „bun” un URL precum
http://business.data.gov.uk/id/company/04285910
decât înregistrarea
SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST
Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/


managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


De ce este mai „bun” un URL precum
http://business.data.gov.uk/id/company/04285910
decât înregistrarea
SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST
Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

“because you can look it up; because you can refer to a URI
in any context, unlike 'Q30' which only means something
in a specific context”

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/


managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

http://ideasource.blankdots.com/2012/08/open-data-sources/
http://datahub.io/
https://github.com/caesar0301/awesome-public-datasets
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


CERN Open Data Portal
http://opendata.cern.ch/
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Reutilizarea (reusing)

aspecte importante:
disponibilitate în formate standardizate
politici de acces – copyright, proveniență, licențiere
confidențialitate (privacy)
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Reutilizarea (reusing)

depinde și de utilizabilitatea sistemului

formate alternative cu o sintaxă simplă, standardizată


interogări bazate pe exemple (query by example)
interacțiune naturală
flexibilitate – e.g., oferirea de sugestii sau exemplificări
etc.
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Open Data Monitor – vizualizarea și compararea unor indicatori de
calitate (licența de utilizare, formate procesabile, disponibilitate,
meta-date) privind sursele de date deschise: opendatamonitor.eu
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fi


publicate în formate standardizate deschise,
care să încurajeze refolosirea în alte contexte
managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fi


publicate în formate standardizate deschise,
care să încurajeze refolosirea în alte contexte

de considerat atât utilizatorii umani, cât și aplicațiile


managementul cunoștințelor

Dr. Sabin Buragawww.purl.org/net/busaco


Mentenanță (maintaining)

necesitatea existenței unor servicii care să asigure


consistența datelor/cunoștințelor

serviciile automate se pot baza pe instrumente


de efectuare a raționamentelor (reasoners)
realitate

Dr. Sabin Buragawww.purl.org/net/busaco


Existența unei/unor suite de formalisme,
specificații, limbaje, instrumente, servicii specifice
realitate

Dr. Sabin Buragawww.purl.org/net/busaco


Existența unei/unor suite de formalisme,
specificații, limbaje, instrumente, servicii specifice

cu grade de maturitate și adopție diferite


realitate

Benjamin Nowack, 2009

Dr. Sabin Buragawww.purl.org/net/busaco


Dr. Sabin Buragawww.purl.org/net/busaco
Care este arhitectura aplicațiilor
aliniate problematicilor Web-ului semantic?
Dr. Sabin Buragawww.purl.org/net/busaco
Arhitectura aplicațiilor bazate pe RDF
(Allemang & Hendler, 2011)
Ora Lassila & James Hendler (2007)

Dr. Sabin Buragawww.purl.org/net/busaco


aplicații rdf: SWAML

Dr. Sabin Buragawww.purl.org/net/busaco


Extragerea datelor din mesaje de e-mail, în vederea
interogării, reutilizării și publicării ulterioare
(Sergio Fernández et al., 2009)

procesează datele în format mailbox (RFC 4155) și


oferă descrieri RDF ale mesajelor, listelor de distribuție
și persoanelor, bazându-se pe SIOC

interogări via SPARQL, publicare folosind RDFa


aplicații rdf: SWAML

Dr. Sabin Buragawww.purl.org/net/busaco


export în format KML pentru realizarea de mash-up-uri
pe baza Google Maps (Fernández et al., 2009)
aplicații rdf: semantic mediawiki

Dr. Sabin Buragawww.purl.org/net/busaco


Management colaborativ al conținutului
modelat semantic (semantic wikis)

Semantic MediaWiki

extensie a sistemului MediaWiki:


permite adnotarea semantică a conținutului unui wiki

http://semantic-mediawiki.org/
aplicații rdf: semantic mediawiki

Dr. Sabin Buragawww.purl.org/net/busaco


Idee:
asocierea de perechi proprietate—valoare
fiecărui fragment de informație dintr-un wiki

The title of this book is '''[[Has Title::Cloud Atlas]]'''


aplicații rdf: semantic mediawiki

Dr. Sabin Buragawww.purl.org/net/busaco


Utilizări în special în e-science
(arheologie, biologie, biomedicină,…)
și în domeniul guvernamental, inclusiv în e-learning

http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications
aplicații rdf: dbpedia

Dr. Sabin Buragawww.purl.org/net/busaco


De la conținut colaborativ la adnotare semantică
(Christian Bizer et al.)

constituie o bază de cunoștințe via Wikipedia:


seturi de date (datasets) + model conceptual

versiunea în limba engleză:


descrieri RDF a peste 4.5 milioane de „lucruri” (things)

conținut disponibil în 125 limbi – 38 milioane de „things”


aplicații rdf: dbpedia

Dr. Sabin Buragawww.purl.org/net/busaco


De la conținut colaborativ la adnotare semantică
(Christian Bizer et al.)

recurge la diverse modele conceptuale (ontologii)


vizând mai multe domenii
aplicații rdf: dbpedia

Dr. Sabin Buragawww.purl.org/net/busaco


De la conținut colaborativ la adnotare semantică
(Christian Bizer et al.)

acces via SPARQL: http://wiki.dbpedia.org/OnlineAccess

versiune pentru download (aprilie 2015)


asocieri multilingve de concepte pentru 28 de limbi
http://wiki.dbpedia.org/Downloads2015-04

disponibilitate în cloud (în stil PAGO – Pay As You Go)


https://aws.amazon.com/marketplace/pp/B012DSCFEK/
aplicatii rdf: exemplificari

Dr. Sabin Buragawww.purl.org/net/busaco


surse de date care referă alte entități DBpedia
(Bizer et al., 2009)
vezi și http://svn.aksw.org/papers/2013/SWJ_DBpedia/public.pdf
aplicații rdf: dbpedia

Dr. Sabin Buragawww.purl.org/net/busaco


Extractori pentru procesarea tipurilor de conținuturi
oferite de Wikipedia

labelsrdfs:label, interlanguage links, redirects,


imagesfoaf:depiction, geo-coordinates,
disambiguationdbpedia:disambiguates,
external linksdbpedia:reference,
pagelinksdbpedia:wikilink etc.
aplicații rdf: dbpedia

Dr. Sabin Buragawww.purl.org/net/busaco


Extractori pentru procesarea tipurilor de conținuturi
oferite de Wikipedia

implementare:
DBpedia Information Extraction Framework
conceput inițial în PHP, actualmente în Scala

utilizat și în alte contexte, precum extragerea de fapte:


https://github.com/dbpedia/fact-extractor
aplicatii rdf: exemplificari

Dr. Sabin Buragawww.purl.org/net/busaco


OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
Dr. Sabin Buragawww.purl.org/net/busaco
DBpedia Live
responsabil cu sincronizarea datelor Wikipedia↔DBpedia
(implementare Java)
aplicații rdf: wikidata

Dr. Sabin Buragawww.purl.org/net/busaco


Inițiativă a fundației Wikimedia, oferind o bază de date
structurate multilingve în regim deschis și colaborativ,
pe baza proiectelor Wikipedia, Wikimedia Commons,…

www.wikidata.org
Surprinde și contextul specificării unor date de interes
(e.g., proveniența – cine, când, cum, de ce)
aplicații rdf: wikidata

Dr. Sabin Buragawww.purl.org/net/busaco


utilizează seturile de date/cunoștințe
oferite de DBpedia și Freebase (ex-proiect Google)

API propriu: https://www.mediawiki.org/wiki/Wikibase/API


Dr. Sabin Buragawww.purl.org/net/busaco
studii de caz: www.w3.org/2001/sw/sweo/public/UseCases/
Dr. Sabin Buragawww.purl.org/net/busaco
Cum publicăm datele pe Web
astfel încât să fie asigurate
reutilizarea și interoperabilitatea?
linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Paradigmă de publicare a datelor pe Web
care recurge la tehnologiile Web existente

Tom Heath & Christian Bizer, Linked Data: Evolving


the Web into a Global Data Space, Morgan & Claypool, 2011
http://linkeddatabook.com/book
linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Paradigmă de publicare a datelor pe Web
care recurge la tehnologiile Web existente

reducerea redundanței
facilitarea reutilizării
permiterea descoperirii
maximizarea inter-conectivității între „lucruri” înrudite
adoptarea unei viziuni pragmatice
linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Viziune:

Use the Web of Data as a Content Management System

Use the community at large as content editors

Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/


linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Ingrediente de bază:

identificare – URI
acces – HTTP
modelare – RDF
structurare – schema.org, RDFa, RDF Schema, OWL

cursurile viitoare
linked data

Dr. Sabin Buragawww.purl.org/net/busaco


un „nor” al datelor interconectate extrase din DBpedia
exemplu furnizat de R. Meymandpour & J. Davis (2013)
linked data: principii (Berners-Lee)

Dr. Sabin Buragawww.purl.org/net/busaco


Utilizarea URI-urilor pentru numirea „lucrurilor”

specificarea via URI a oricăror resurse


– informaționale sau non-informaționale –,
nu doar a documentelor

identitate unică la nivel global

http://www.w3.org/DesignIssues/LinkedData.html
linked data: principii (Berners-Lee)

Dr. Sabin Buragawww.purl.org/net/busaco


Folosirea de URI-uri ce pot fi vehiculate via HTTP

orice URI are un proprietar:


persoană, organizație, specificație,…

utilizatorii/aplicațiile pot localiza resursele


(oricine posedă un browser/client Web)

http://www.w3.org/DesignIssues/LinkedData.html
linked data: principii (Berners-Lee)

Dr. Sabin Buragawww.purl.org/net/busaco


Oferirea de informații utile în format RDF

atunci când o agent (entitate) accesează un URI,


poate „afla” (meta-)date de interes

http://www.w3.org/DesignIssues/LinkedData.html
linked data: principii (Berners-Lee)

Dr. Sabin Buragawww.purl.org/net/busaco


Includerea în reprezentarea RDF
a unor legături spre alte URI-uri

facilitarea descoperirii de informații înrudite


(network effect)

http://www.w3.org/DesignIssues/LinkedData.html
Dr. Sabin Buragawww.purl.org/net/busaco
date de 5 stele (5 ★ Open Data)

S. Buraga, “Towards 5-star Data in the E-university” (2014)


http://www.slideshare.net/busaco/towards-5star-data
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Publicarea pe Web a datelor interconectate
referitoare la whisky – conform (Tom Heath, 2009)
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Publicarea pe Web a datelor interconectate
referitoare la whisky – conform (Tom Heath, 2009)

existența unui magazin virtual destinat connoisseur-ului


afacere online – wiskii.com – fondată de Jeff
informații furnizate de experți ai domeniului
contribuții realizate și de către utilizatori obișnuiți
implementare bazată pe un server de aplicații Web
date stocate relațional
acces simultan la date în HTML și RDF
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


1. înțelegerea principiilor linked data
2. înțelegerea (conceptualizarea) datelor
3. stabilirea de URI-uri pentru entități (things)
4. stabilirea infrastructurii
5. relaționarea cu alte seturi de date existente
6. descrierea și publicarea datelor
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Care sunt aspectele principale care trebuie
considerate privind datele aplicației Web?
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Care sunt aspectele principale care trebuie
considerate privind datele aplicației Web?

persoane?
locații geografice?
artefacte culturale?
comentarii?
evaluări?
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Aspecte – concepte – de interes vizând
baza de cunoștințe utilizată de aplicația wiskii.com

distilerii, regiuni + localități geografice, fondatori,


proprietari, brand-uri, produse, fotografii,
evaluări (review-uri), comentarii, prețuri + oferte
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Descrierea datelor pe baza vocabularelor

principii:

reutilizarea, nu inventarea unui alt vocabular

combinarea vocabularelor existente


linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Descrierea datelor pe baza vocabularelor

potențiale modele conceptuale ce pot fi adoptate:


Geonames – http://www.geonames.org/ontology
GoodRelations – www.heppnetz.de/projects/goodrelations/
FOAF (Friend Of A Friend) – http://www.foaf-project.org/
Review – http://vocab.org/review/
Whisky – http://vocab.org/whisky/
diverse altele furnizate de schema.org
Term URI Description
Comment http://purl.org/stuff/rev#Comment A comment on a review.
Feedback http://purl.org/stuff/rev#Feedback Feedback on the review.
Review http://purl.org/stuff/rev#Review A review of an work.

Dr. Sabin Buragawww.purl.org/net/busaco


commenter http://purl.org/stuff/rev#commenter The commenter on the review.
hasReview http://purl.org/stuff/rev#hasReview Associates a work with a a review.
Used to associate a review with a
hasComment http://purl.org/stuff/rev#hasComment
comment on the review.
Associates a review with a feedback on
hasFeedback http://purl.org/stuff/rev#hasFeedback
the review.
maxRating http://purl.org/stuff/rev#maxRating A numeric value.
minRating http://purl.org/stuff/rev#minRating A numeric value.
Number of positive usefulness votes
positiveVotes http://purl.org/stuff/rev#positiveVotes
(integer).
rating http://purl.org/stuff/rev#rating A numeric value.
reviewer http://purl.org/stuff/rev#reviewer The person that has written the review.
text http://purl.org/stuff/rev#text The text of the review.
title http://purl.org/stuff/rev#title The title of the review.
totalVotes http://purl.org/stuff/rev#totalVotes Number of usefulness votes (integer).
type http://purl.org/stuff/rev#type The type of media of a work under review.

concepte și proprietăți definite de vocabularul Review


linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Descrierea datelor pe baza vocabularelor
vocabularele (tipurile de date) definite pot avea ulterior
atașate specificații formale
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Alegerea URI-urilor corespunzătoare

principii:
recurgerea la schema HTTP pentru facilitarea accesului

http://vocab.org/whisky/terms/Brand
versus
urn:whisky-vocab:brand
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Alegerea URI-urilor corespunzătoare

principii:
evitarea imixtiunii în alte spații de nume
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Alegerea URI-urilor corespunzătoare

principii:
abstractizare – evitarea detaliilor de implementare

http://dbpedia.org/resource/Romania
versus
http://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/
resources.php?id=Romania
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Alegerea URI-urilor corespunzătoare

principii:
folosirii unei singure convenții de referire
# (hash) sau / (slash)

http://undeva.info/foaf.rdf#me
versus
http://undeva.info/id/me
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


http://dbpedia.org/resource/Science Thing (concept)
http://dbpedia.org/data/Science Date RDF
http://dbpedia.org/page/Science Pagină HTML
http://revyu.com/people/tom Thing (concept)
http://revyu.com/people/tom/about/rdf Date RDF
http://revyu.com/people/tom/about/html Pagină HTML
http://undeva.info/concept Thing (concept)
http://undeva.info/concept.rdf Date RDF
http://undeva.info/concept.html Pagină HTML

șabloane de stabilire a URI-urilor


linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Exemplificări (clasă + instanță):

regiuni http://wiskii.com/regions/speyside
distilerii http://wiskii.com/distilleries/talisker
brand-uri http://wiskii.com/brands/talisker
produse http://wiskii.com/products/talisker-10-yo
persoane http://wiskii.com/people/william-matheson
fotografii http://wiskii.com/photos/58
review-uri http://wiskii.com/reviews/271
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Accesul la o anumită reprezentare – exemple:

concept  http://wiskii.com/brands/talisker
date RDF  http://wiskii.com/brands/talisker/rdf
pagină HTML  http://wiskii.com/brands/talisker/html
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Stabilirea infrastructurii

HTML RDF

aplicație
Web

date
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


HTML RDF

aplicație
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
Web

date
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


http://wiskii.com/brands/talisker

HTML RDF

aplicație
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
Web

date
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


HTTP GET

http://wiskii.com/brands/talisker

HTML RDF

aplicație
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
Web

date
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


HTTP 303 See Other
HTTP GET HTTP 303 See Other

http://wiskii.com/brands/talisker

HTML RDF

aplicație
http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf
Web

date content
negotiation
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Resurse utile sunt oferite de siturile de la adresele Web

http://www.w3.org/standards/semanticweb/data

http://www.w3.org/wiki/LinkedData
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Relaționarea cu alte seturi de date

de (re)considerat „norul” linked data


http://lod-cloud.net/
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Topic Datasets %
linked data: studiu de caz
Government 183 18.05%

Dr. Sabin Buragawww.purl.org/net/busaco


Publications 96 9.47%
Life sciences 83 8.19%
User-generated content 48 4.73%
Cross-domain 41 4.04%
Media 22 2.17%
Geographic 21 2.07%
Social Web 520 51.28%
Total 1014

cea mai recentă actualizare: august 2014


http://linkeddatacatalog.dws.informatik.uni-mannheim.de/state/
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Relaționarea cu alte seturi de date

informațiile privitoare la fiecare set de date RDF


pot fi explorate via CKAN
(Comprehensive Knowledge Archive Network)

http://ckan.org/
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Relaționarea cu alte seturi de date

aspecte de interes privind vocabularele publice:


gradul de utilizare
mentenanța
aplicabilitatea
expresivitatea
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Relaționarea cu alte seturi de date

predicate generice folosite uzual:


owl:sameAs

foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,


foaf:depiction, foaf:primaryTopic,…

rdfs:seeAlso
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


Relaționarea cu alte seturi de date – exemplificare:
Relații între diverse resurse din seturi de date diferite:

Dr. Sabin Buragawww.purl.org/net/busaco


<http://dbpedia.org/resource/Kolkata>
owl:sameAs <https://www.wikidata.org/wiki/Q1348> ;
owl:sameAs <http://sws.geonames.org/1275004> ;
owl:sameAs <https://viaf.org/viaf/123087580/> ;
...

<http://sws.geonames.org/1275004>
rdfs:seeAlso <http://dbpedia.org/resource/Kolkata>
wgs84_pos:lat "22.56263" ;
wgs84_pos:long "88.36304" ;
gn:parentCountry <http://sws.geonames.org/1269750> ;
...

adaptare după Ivan Herman (2013)


linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Adoptarea principiilor linked data la un domeniu dat

o serie de exemplificări:
COLINDA (Conference Linked Data) – www.colinda.org
Drug Encyclopedia – http://datlowe.org/drug-encyclopedia/
LBD (Linked Brain Data) – www.linked-neuron-data.org
Linked Life Data – http://linkedlifedata.com/
LOV (Linked Open Vocabularies) – lov.okfn.org/dataset/lov/
Linked Statistics – http://linked-statistics.gr/
Open PHACTS Discovery Platform – www.openphacts.org
linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Recurgerea la principiile linked data la nivel local
(privat) – i.e., depozite de date disponibile în cadrul
întreprinderilor (enterprises)

LLD (Linked Local Data)


kidehen.blogspot.com/2014/08/linked-local-data-lld-and-linked-open.html

exemple (European Linked Data Award, septembrie 2015):


http://semantics.cc/eldc-awards-given
linked data: inginerie – necesități

Dr. Sabin Buragawww.purl.org/net/busaco


Calitatea datelor
Disponibilitatea și stabilitatea setului de date
don’t repeat
yourself
Publicarea direct pe situl public
Claritate privind termenii de utilizare (licențiere)
Existența aplicațiilor
linked data: studiu de caz

Dr. Sabin Buragawww.purl.org/net/busaco


639 vs. 1048 vs. 9960 seturi de date
1.7 vs. 5.7 vs. 85.5 miliarde de triple RDF
49.8% vs. 64.9% vs. 65.6% date eronate

statistici vizând „norul” datelor interconectate


linked open data (ian. 2013 vs. nov. 2014 vs. 17 nov. 2015)
http://stats.lod2.eu/
linked data: inginerie

Dr. Sabin Buragawww.purl.org/net/busaco


Aspecte privind cele mai bune practici:

identificarea resurselor – identifier patterns


modelare – modelling patterns
publicare a datelor – publishing patterns
management al datelor – data management patterns
dezvoltare de aplicații – application patterns
linked data: inginerie – ldp

Dr. Sabin Buragawww.purl.org/net/busaco


Considerații metodologice și pragmatice

oferite de recomandarea W3C (februarie 2015)


Linked Data Platform 1.0

http://www.w3.org/TR/ldp/
linked data: inginerie – ldp

Dr. Sabin Buragawww.purl.org/net/busaco


Considerații metodologice și pragmatice

Linked Data Platform 1.0

orice client, server sau o combinație a acestora


care se conformează prevederilor LDP pentru a accesa
(containere de) resurse Web
– de dorit, reprezentabile prin RDF – via HTTP
linked data: inginerie – ldp

Dr. Sabin Buragawww.purl.org/net/busaco


Considerații metodologice și pragmatice

Linked Data Platform 1.0

o introducere în articolul lui Cody Burleson (2014)


http://www.dataversity.net/introduction-linked-data-platform/

diverse bune practici și reglementări:


http://www.w3.org/TR/ldp-bp/
linked data: inginerie – ldp

Dr. Sabin Buragawww.purl.org/net/busaco


Considerații metodologice și pragmatice

Linked Data Platform 1.0

exemple de implementări – unele încă în lucru:


Apache Marmotta (Java), Dydra (Ruby), Glutton (Python),
Gold (Go), LDP.js (Node.js), LDP4j (Java),
OpenLink Data Spaces (JavaScript), RWW.io (PHP)

http://www.w3.org/wiki/LDP_Implementations
linked data: inginerie – ldf

Dr. Sabin Buragawww.purl.org/net/busaco


Considerații metodologice și pragmatice

rezolvarea interogărilor SPARQL la nivel de client


Linked Data Fragments (inițiativă în lucru, 2015)

http://linkeddatafragments.org/
linked data: inginerie

Dr. Sabin Buragawww.purl.org/net/busaco


acces asincron la fragmente de triple RDF
(triple pattern fragments)
aici, un client Web recurgând la Ajax

soluții software (Java, JavaScript,


Perl, Python, PHP, Ruby):
http://linkeddatafragments.org/software/
linked data: inginerie

Dr. Sabin Buragawww.purl.org/net/busaco


Considerații metodologice și pragmatice

deservirea datelor via servicii: Linked Data-as-a-Service

date RDF „brute” (data dumps)


documente incluzând date interconectate
puncte-terminale (endpoints) SPARQL
fragmente de triple obținute asincron
alte API-uri
L. Rietveld et al., “Linked Data-as-a-Service: The Semantic Web Redeployed”,
ESWC 2015 – http://ruben.verborgh.org/publications/rietveld_eswc_2015/
linked data: testare & depanare

Dr. Sabin Buragawww.purl.org/net/busaco


Verificarea corectitudinii sintaxei RDF

W3C RDF Validator – www.w3.org/RDF/Validator/

Eyeball (instrument inclus în Apache Jena)

de experimentat și LOD Laundromat (Beek et al., 2014)


http://lodlaundromat.org/
linked data: testare & depanare

Dr. Sabin Buragawww.purl.org/net/busaco


Verificarea infrastructurii
(e.g., dereferențierea URL-urilor)

RDF:Alerts – http://swse.deri.org/RDFAlerts/
linked data: testare & depanare

Dr. Sabin Buragawww.purl.org/net/busaco


Depanarea (inspectarea triplelor) RDF

manuală

eventual, preluând datele – în stilul REST –


via cURL sau un instrument similar
linked data: testare & depanare

Dr. Sabin Buragawww.purl.org/net/busaco


Depanarea (inspectarea triplelor) RDF

recurgerea la un hyperdata (semantic) browser

e.g., instrumentul OpenLink Data Explorer ca extensie


a unui navigator Web actual – http://ode.openlinksw.com/
linked data: vizualizare

Dr. Sabin Buragawww.purl.org/net/busaco


Vizualizarea datelor interconectate

exemplificări:

platforma Callimachus – http://callimachusproject.org/

proiectul Web LodLive – http://en.lodlive.it/

aplicația Web LOD for all – http://lod4all.net/


Dr. Sabin Buragawww.purl.org/net/busaco
vizualizarea seturilor de date interconectate: LOD for all
linked data: vizualizare

Dr. Sabin Buragawww.purl.org/net/busaco


Descoperirea relațiilor dintre diverse date
oferite de sursele linked data

framework-ul Silk
http://silk-framework.com/

proiectul RelFinder
www.visualdataweb.org/relfinder.php
linked data: vizualizare

Dr. Sabin Buragawww.purl.org/net/busaco


Silk Workbench – un asistent Web oferind suport
pentru interconectarea diverselor surse de date
https://www.assembla.com/spaces/silk/wiki/Silk_Workbench
Dr. Sabin Buragawww.purl.org/net/busaco
Există aplicații Web reale
aliniate „curentului” linked data?
Ivan Herman (2013)
aplicația #1 aplicația #2

Dr. Sabin Buragawww.purl.org/net/busaco


HTTP(S)

linked data linked data


server #1 server #2
SPARQL / RDF API

Dr. Sabin Buragawww.purl.org/net/busaco


arhitectura stratificată a aplicațiilor bazate pe linked data
(Tom Heath & Christian Bizer, 2011)
linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


Revyu
Semantic Web reviewing and rating site
(T. Health & E. Motta, 2008)

permite integrarea datelor evaluate de utilizatori

review-urile sunt stocate + publicate transparent în RDF


(utilizatorii finali introduc datele în mod tradițional)
linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


Revyu

recurge la vocabulare ca Review, FOAF, SKOS

interogări pe baza unui punct terminal SPARQL

interconectare cu date de la DBpedia, OpenGuides etc.

implementare bazată pe RAP (RDF API for PHP)


linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


Proiectul Europeana

inițiativă de prezervare a conținutul cultural


reprezentativ din statele europene

acces deschis la date interconectate

detalii la http://labs.europeana.eu/api
Dr. Sabin Buragawww.purl.org/net/busaco
definește EDM (Europeana Data Model) bazat pe standarde
RDF și OWL + vocabulare ca DCMI, FOAF, Open Archive
linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


myExperiment (David De Roure et al.)

aplicație Web colaborativă – bazată pe Ruby on Rails –


pentru managementul workflow-urilor științifice
și a altor obiecte vizând cercetarea

modelarea datelor se bazează pe RDF:


http://rdf.myexperiment.org/

acces la date publice via SPARQL


linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


Inițiativele semantic (open) e-government

linked data în contextul informațiilor publice ale UK:


http://data.gov.uk/linked-data
de studiat și prezentările lui Richard Wallis: www.slideshare.net/rjw

câteva proiecte similare:


USA – www.data.gov/developers/
Franța – www.data.gouv.fr/fr/dashboard/
linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


SIGMA (SemantIc Government Mashup Application)
Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,
Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)

platformă Web extensibilă capabilă să creeze mashup-uri


oferind acces la date guvernamentale deschise

includerea unei soluții proprii de acces via un end-point


SPARQL la date guvernamentale preluate de la gov.ro
Dr. Sabin Buragawww.purl.org/net/busaco
film demonstrativ
https://vimeo.com/79785943
linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


Alte utilizări
(S. Decker et al., 2012; H. Quoc et al., 2014)

e-geografie (e.g., date spațiale interconectate)


http://www.semantic-web-journal.net/system/files/swj877.pdf

mass-media: BBC, Guardian, New York Times

publicații academice: CrossRef, Nature

biblioteci (digitale): Library of Congress, Franța, Vatican,…


linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


D. Le-Phuoc et al., “Enabling Live Exploration on The Graph of Things”
http://challenge.semanticweb.org/2014/submissions/swc2014_submission_8.pdf
http://graphofthings.org/
linked data: aplicații

Dr. Sabin Buragawww.purl.org/net/busaco


Pentru diverse exemplificări, a se consulta și lucrările
atelierelor de lucru LDOW (Linked Data on the Web)

http://events.linkeddata.org/ldow2015/
http://events.linkeddata.org/ldow2014/
http://events.linkeddata.org/ldow2013/
http://events.linkeddata.org/ldow2012/
linked data

Dr. Sabin Buragawww.purl.org/net/busaco


Amănunte în cartea disponibilă liber
Leigh Dodds & Ian Davis, Linked Data Patterns. A pattern
catalogue for modelling, publishing, and consuming
Linked Data, 2012:
http://patterns.dataincubator.org/

a se studia și School of Data Handbook (2013)


http://schoolofdata.org/handbook/
„concluzii”

Dr. Sabin Buragawww.purl.org/net/busaco


“Software – as a service or not – is just a container.
What makes software valuable has always been what
it does to data. Now, in the same spirit of SOA and SaaS,
a new concept is emerging, Data-as-a-Service – DaaS.”

Pete Soderling, august 2010


http://goo.gl/S4dYy
rezumat

Dr. Sabin Buragawww.purl.org/net/busaco



aplicații bazate pe Web of data
arhitectură, linked data, studii de caz
mulțumiri Claudiei Gheorghiu și lui Ștefan Negru – @blankdots
Dr. Sabin Buragawww.purl.org/net/busaco
episodul viitor:
modelarea cunoștințelor via RDF Schema

S-ar putea să vă placă și