WEB PODATAKA (WEB OF DATA) Jelena Jovanović Email: jeljov@gmail.com Web: http://jelenajovanovic.net
Današnji Web - problemi Omogućeno je: definisanje načina prikaza informacija, postavljanje linkova ka srodnim sadržajima Semantika sadržaja je dostupna ljudima, ali ne (direktno) i računarima 2
Današnji Web - problemi datum konferencije keynote WWW konferencija se ove godine održava u Lionu, Francuska Informacije dostupne ljudima informacije o radovima 3
Današnji Web - problemi W W W 2 0 0 2 T h e e l e v e n t h i n t e r n a t i o n a l w o r l d w i d e w e b c o n f e r e n c e S h e r a t o n w a i k i k i h o t e l H o n o l u l u, h a w a i i, U S A 7-1 1 m a y 2 0 0 2 1 l o c a t i o n 5 d a y s l e a r n i n t e r a c t R e g i s t e r e d p a r t i c i p a n t s c o m i n g f r o m a u s t r a l i a, c a n a d a, c h i l e d e n m a r k, f r a n c e, g e r m a n y, g h a n a, h o n g k o n g, i n d i a, i r e l a n d, i t a l y, j a p a n, m a l t a, n e w z e a l a n d, t h e n e t h e r l a n d s, n o r w a y, s i n g a p o r e, s w i t z e r l a n d, t h e u n i t e d k i n g d o m, t h e u n i t e d s t a t e s, v i e t n a m, z a i r e R e g i s t e r n o w O n t h e 7 t h M a y H o n o l u l u w i l l p r o v i d e t h e b a c k d r o p o f t h e e l e v e n t h i n t e r n a t i o n a l w o r l d w i d e w e b c o n f e r e n c e. T h i s p r e s t i g i o e v e n t S p e a k e r s c o n f i r m e d T i m b e r n e r s - l e e T i m i s t h e w e l l k n o w n i n v e n t o r o f t h e W e b, I a n F o s t e r I a n i s t h e p i o n e e r o f t h e G r i d, t h e n e x t g e n e r a t i o n i n t e r n e t Informacije dostupne programima 4
Današnji Web - problemi Razumljiv mašinama, koliko je nama razumljiv: 5 Slika preuzeta sa: http://goo.gl/yrs7yq
Današnji Web - problemi Ideja je mašinama omogućiti razumevanje sadržaja Slika preuzeta sa: http://chaxiubao.typepad.com/ 6 photos/uncategorized/pb060002.jpg
Današnji Web - karakteristike Dizajniran za: direktno korišćenje od strane ljudi Primarni objekti: dokumenti i multi-medija Stepen strukturiranosti objekata: prilično nizak Linkovi: između dokumenata (ili njihovih delova) Semantika sadržaja i linkova: implicitna Analogija: globalni fajl sistem 7
Današnji Web - problemi Fragmentacija podataka na Web-u: Dostupni samo u okviru Web sajta/aplikacije Nizak nivo ili potpuno odsustvo povezivanja podata iz razlicitih izvora (aplikacija/sajtova) Wall gardens, Data silos Slika preuzeta sa: http://www.economist.com/node/10880936 8
Današnji Web - problemi Današnji Web je mesto gde su računari zaduženi za prezentaciju sadržaja (jednostavno) ljudi zaduženi za integrisanje i interpretiranje sadržaja (teško) Zašto ne bi računari preuzeli da rade teži deo posla? 9
Današnji Web - izazovi Izazov 1: Integracija podataka Realizacija upita koji zahtevaju integrisanje podataka iz različitih izvora Npr.: prikaži mi sve blog postove mojih poslovnih kontakata koji su relevantni za studiju na kojoj trenutno radim 10
Današnji Web - izazovi Izazov 2: Razvoj naprednih servisa Npr. servisa za preporuku ho(s)tela Prikazi mi ho(s)tele u Lisabonu koji su bili visoko rangirani od strane ljudi koji imaju isti stil putovanja kao ja? [pri tome, uzmi u obzir podatke iz što većeg broja izvora na Web-u] 11
Današnji Web - izazovi Izazov 3: Kreiranje adaptivnih RSS feeds Iz bilo kog izvora, filtrirani proizvoljnim skupom kriterijuma Npr., prikaži mi sve blog postove čiji su autori moji omiljeni blogeri, i to samo one postove koji su imali više od 5 komentara 12
Web podataka Web podataka (Web of Data) je vizija Web-a kao jedne gigantske globalne baze podataka Glavne karakteristike: Podaci (na Web-u) su strukturirani i interlinkovani Semantika podataka i linkova je eksplicitno data Omogućeno je izvršavanje složenih upita nad više izvora 13
Web podataka primer pretrage Koji evropski gradovi imaju najvišu koncentraciju radova Caravaggio-a?...i pri tome, do njih postoji direktan let iz mog grada?...i to avio kompanijom koja je ocenjena kao dobra ili odlična?...i to uzimajući u obzir moje ocene i/ili ocene mojih prijatelja? Slika preuzeta sa: http://ceo.ca/caravaggio-and-the-myth-of-the-boring-painter/ 14
Web podataka Dizajniran za: ljude koje opslužuju mašine Analogija: globalna baza podataka Primarni objekti: stvari (things) i opisi stvari Linkovi: između stvari Stepen strukturiranosti (opisa) stvari: visok Semantika sadržaja i linkova: eksplicitna 15
Web dokumenata vs. Web podataka Dizajniran za Primarni objekti Web dokumenata Ljude Dokumenti (i njihovi delovi) Web podataka Linkovi između Dokumenata Resursa Stepen strukturiranosti (opisa) stvari Semantika sadržaja i linkova Analogija Prilično nizak Implicitna Globalni fajl sistem Ljude koje opslužuju mašine Resursi i opisi resursa Visok Eksplicitna Globalna baza podataka 16
Web podataka Preporuka: Pogledati video What is Linked Data? raspoloživ na: http://www.youtube.com/watch?v=4x_xzt5ef5q Zašto? Zato što će pomoći da još bolje razumete koncept linkovanih podataka na Web-u 17
Web podataka Otvoreni podaci Open Data Inicijativa Inicijativa svetskih razmera da se podaci učine javno dostupnim na Web-u, Inicijativa prisutna u najrazlicitijim domenima Politika, ekonomija, kultura, umetnost, obrazovanje, 18
Web podataka Otvoreni podaci Open Data inicijativa U New York-u je 2012. donet zakon ( Local Law 11 of 2012 ) koji zahteva da all internal city data that can be made public has to be made public takodje, u zakonu stoji da The city s open data has to be published in machinereadable format 19
Semantički Web Naredni korak u evoluciji Web-a podataka Inteligentni Web Rezonovanje nad podacima integrisanim iz različitih izvora Sistemi za preporuku na nivou čitavog Web-a Inteligentni agenti vrše pretragu i preporuku sadržaja 20
Scientific American, May 2001: http://www.sciam.com/article.cfm?id=the-semantic-web 21
The Semantic Web in 6 minutes 22
Tehnologije Semantičkog Web-a Tehnologije i otvoreni standardi Semantic Web Layer Cake 23
(Anonimni) upitnik za vaše kritike, komentare, predloge: http://goo.gl/cqdp3i 24