Twee betrekkelijk nieuwe ‘buzz words’ zijn Semantic Web en Web 3.0.
Zijn Semantic Web en Web 3.0 hetzelfde of toch niet? De meningen lopen uiteen. De één zegt: Het is hetzelfde. De ander zegt: Semantic Web is onderdeel van Web 3.0.
De technische discussie is niet echt een onderwerp voor dit blog. Wat voor u wellicht wél interessant kan zijn is het ontwikkelen van een visie voor de komende periode. Websites gaan bijvoorbeeld steeds langer mee. Toen wij 15 jaar geleden begonnen was de levenscyclus van een website nog ongeveer 1 jaar. We bouwden ook veel sites die maar één week meegingen. Maar tegenwoordig is 3 jaar toch wel de minimum “TTL”. Een site of een back-end die nóg langer meegaat is qua Return on Investment natuurlijk mooi meegenomen. Dus of de insteek nou het ‘buzz word’ is of het optimaliseren van het rendement op uw website-investering, het is tijd om een en andere eens op een rij te zetten:
Nova Spivack, een technisch visionair, predikte tijdens de laatste The Next Web bijeenkomst dat het semantic web in 2010 al ‘gewoon’ zal zijn. Hij gaf daarbij de volgende definitie van het begrip Web 3.0:
- het intelligente -semantic- web;
- altijd en overal, verbinding met het internet (ubiquitous of pervasive web);
- network computing, waarbij software als services wordt aangeboden en gebruikt;
- het gebruik van open technologieën: open API’s, open data formats, open source software;
- het gebruik van open identity zoals bijvoorbeeld OpenID.
Persoonlijk denk ik, en hier spreken mijn Direct Marketing ‘roots’ natuurlijk een rol in, dat daar nog een belangrijk stukje techniek bij zal komen:
We hebben in de Web 2.0 periode met zijn allen héél veel persoonlijke profiel-data op het internet gepubliceerd. We hebben persoonlijke voorkeuren achter gelaten op allerlei websites. Én daarmee weten de Google’s van deze wereld precies waar onze interesse naar uitgaat. Er is dus, versnipperd over verschillende locaties op (én aan) het web, een gigantische database vol met uw personal preferences ontstaan. Het kan haast niet anders of ál deze data gaat gebruikt worden om informatie ‘op maat’ aan te bieden. En dan niet, zoals nu nog het geval is, re-actief maar pro-actief.
Als die data inderdaad gebruikt gaat worden om u en mij gevraagd of ongevraagd te helpen datgene te vinden wat we zoeken, dan betekent dat automatisch een ’symantic web’.
Semantic
Laten we eens inzoomen op de gebezigde term Semantic (semantiek / semantisch). Wat wordt er in de Web 3.0 context bedoeld met de term?
Alle informatie op het web is in wezen ‘dom’. Informatie linked naar andere informatie. In de communicatie tussen computers op het internet staat de syntax min of meer centraal. Als je een internetpagina oproept dan doe je feitelijk een ‘request’ aan een webserver. Die webserver zoekt de pagina op en levert hem bij u af in HTML formaat. Uw browser weet die HTML syntax om te zetten in een pagina mét opmaak. Maar wát er in die pagina staat daar begrijpen zowel uw computer als de webserver geen woord van.
Daardoor is het web in de kern een vergaarbak vol domme en passieve informatie. Informatie die ‘on request’ beschikbaar is. Misschien is het woord ‘pull’ hier ook wel op zijn plaats.
Wanneer u in die enorme vergaarbak één woord clicked of zoekt dan is er niks aan de hand. Maar zodra u een combinatie van meerdere woorden zoekt dan start u daarmee een redelijk gecompliceerd proces:
Neem de woorden ‘Four Seasons’. Hoevaak komt deze combinatie van woorden wel niet voor? En hoeveel, totaal verschillende betekenissen kunnen die twee woorden hebben? Bent u een fanatieke outdoor liefhebber en toetst u deze woorden in op Google dan zult u bijvoorbeeld op zoek zijn naar een outdoor uitrusting. Wellicht zoekt u een 4 seizoenen slaapzak. Maar, bent u liefhebber van klassieke muziek dan zoekt u vermoedelijk naar het muziekstuk van Vivaldi. Reist u veel en houdt u van luxe dan betekenen de woorden “Four Seasons” vermoedelijk dat u de chique hotel-keten met die naam zoekt. De betekenis van de twee woorden kan dus verschillend worden opgevat.
‘Gelukkig’ voor u bewaart Google uw zoekgedrag. En door uw zoekgedrag-data te matchen met hetgeen u op dit moment als zoekwoord invoert zal Google u met een redelijke trefzekerheid voorschotelen wat u zoekt. Maar, dit impliceert wél dat hetgeen u invoert in de zoekmachine (online) gematched wordt met data in de zoekgedrag database (lokaal). Als u uitsluitend Google gebruikt dan is Google dus de enige die voor u de juiste match kan maken.
De informatie in de grote vergaarbak die wij internet noemen blijft ‘dom’. Het is de koppeling met de zoekgedrag-database die de Google service ’slim’ maakt. Daarmee is Google dan misschien wel ’slim’, het web is dat nog lang niet.
Stel nou dat we de zoekgedrag-database van Google zouden vervangen door een systeem dat de inhoud van uw persoonlijk Facebook, Hyves, en andere persoonlijke pagina’s toetst. Dan kan dit systeem op uw social pagina’s dus zien dat u volgende week op zaken-vakantie gaat naar Hollywood. Het kan zien dat u allerlei hobby’s heeft maar dat ‘outdoor’ daar niet bij hoort. Het kan zien dat u nog nooit een klassieke i-tune gedownload heeft en dús… bent u op zoek naar het Four Seasons Hotel.
Laten we nog één stap dieper de logica in duiken om de complexiteit en daarmee de technische uitdaging duidelijk te krijgen:
Als u ooit iets gedaan heeft met een database dan kent u de “if / then” query. Een database hangt in de basis van dergelijke “als / dan” scenario’s aan elkaar. -Als- dit de postcode is -dan- is dat de plaats. -Als- meneer geen outdoor liefhebber is -dan- zoekt meneer het hotel (en niét de 4 seizoenen slaapzak). Tot zover technisch allemaal nog geen probleem.
Om nog heel even in de logica van de database te blijven: -Als- de propositie: Ik ben geen man -is true- dus waar is, -dan- heeft dit automatisch tot gevolg dat de propositie – Niet iedereen is een man – ook waar is. Klopt? Klopt. Een technische redenering maar, nog steeds geen probleem.
Het probleem begint bij: “Ik zag de man met de verrekijker“… Tja, en toen? Keek ík door de verrekijker en zag ik een man? Of, was ik degene die met het blote oog keek en zag ik een man die een verrekijker in zijn bezit had? “Ik zag de man met de verrekijker” kan dus, net als de woorden “Four Seasons” verschillende betekenissen -semantiek- hebben terwijl de syntax gelijk is. In dit geval spreekt men overigens van ‘polysemantisch’. En dát is dus iets waar momenteel veel knappe koppen het hoofd op breken: Hoe krijg je dat uitgelegd aan een computer?
Men wil richting een Semantisch web waarin woorden gekoppeld zijn aan “waarden”, identiteiten genoemd. Maar het aanleggen van een semantisch woordenboek alléén is niet genoeg. Als gebruiker wil je, zij het onbewust, een slim web. Een web dat niet domweg een hyperlink koppelt aan een html-document maar één of meerdere betekenissen koppelt aan één woord of aan een combinatie van woorden. Dat slimme web moet bijvoorbeeld ‘leren’ dat -Marietje houdt van Pietje- en -Marietje houdt van tomatensoep- een andere lading geeft aan het woord ‘houdt’.
De kinderschoenen
Semantisch web is, zou je kunnen stellen, begonnen bij semantisch adverteren. Bij semantic advertising wordt eerst de inhoud van een webpagina semantisch geanalyseerd, zodat die begrepen en geïndexeerd wordt. De best passende advertenties worden gekoppeld aan de semantische informatie van dié pagina. Bij semantic advertising zullen bezoekers, als het goed is, eerder op een advertentie klikken. De pagina toont immers alleen advertenties die passen bij het onderwerp op de pagina. De Google Adwords methode.
Wat er nú, technisch, gebeurt
Steeds meer mensen hebben internet op hun mobiel, op hun SmartPhone, hun mini- of midi laptop. Nú sluiten we de internet-verbinding nog af als we die apparatuur niet gebruiken. Maar het zal niet lang meer duren of we zijn altijd en overal online. Is het niet met de laptop dan is het wel met de SmartPhone. Is het niet met de SmartPhone dan is het wel met de TomTom. Telefoonverkeer loopt al goeddeels over internetverbindingen. De distributie van TV-signalen gaat ook meer en meer die kant op. Binnenkort zijn we dus permanent online.
Zodra u, onafhankelijk van het medium-type, overal en altijd online bent dán gaat dat semantische web belangrijk voor u worden. Als het web weet wat u doet, doordat het bijvoorbeeld ‘ziet’ dat u op reis bent en ‘weet’ dat u normaal gesproken rond deze tijd luncht, dan zal dat ’slimme’ web op de NS site zien dat uw trein vertraging heeft en dat u dus 20 minuten tijd ‘over’ heeft. Datzelfde ’slimme’ web laat u, pro-actief, een plattegrond zien met daarop de dichtstbijzijnde eetgelegenheden. Voor uitgebreide lunches heeft u geen tijd en dus rubriceert het slimme web alleen ’snelle lunch’ locaties binnen de kaders van uw persoonlijke voorkeuren. Terwijl u een lunch-keuze maakt ontvangt uw webmail in de achtergrond een email-bericht. Het web ‘weet’ dat mailtjes van déze afzender door u belangrijk gevonden worden. En dus vraagt het web uw aandacht voor dit bericht… Het web wordt dus uw ‘personal assistant’.
Wat er qua marketing gebeurt
We komen hier binnenkort nog uitgebreider op terug maar Semantic Web heeft ook gevolgen voor de keuzes die consumenten maken en de manier waarop die keuzes gemaakt worden. De mening van vrienden en van andere consumenten wordt steeds belangrijker. En onderdeel van het semantisch web is het FOAF (Friend Of A Friend) principe waarmee je dus een ‘waarde’ kunt toekennen aan of en hoeveel je hecht aan iemands oordeel.
Voor zogenaamde Early Adaptors is de personal assistant technologie deels al realiteit. Voor anderen klinkt het wellicht als toekomstmuziek. Wat ons betreft is het nú en toekomst maar dan wel toekomst als in héél dichtbij. Zó dicht bij dat u er verstandig aan doet om er nu, in uw web-investeringen bijvoorbeeld, al wél rekening mee te houden.
Concreet
Het return on investment van úw website investering wordt mede bepaald door de vraag of u die website nu wél of niét voorbereid op Web 3.0. De keuze is natuurlijk aan u.
Nu en de komende periode zal de ene na de andere ‘convenience’ cq ‘personal assistant’ applicatie op de markt komen. Dat ziet u vandaag al gebeuren op de Apple App-Store maar, kijkt u wat dat betreft bijvoorbeeld ook eens naar wat er op het gebied van Augmented Reality allemaal gebeurt.
Voor investeerders: U weet waar u moet zijn met uw te investeren centjes.
Aan technische pioniers stellen we een vraag: Zijn de algoritmen van Google voorbereid op Web 3.0? En zo niet: Is het inmiddels kolossaal grote Google nog wel wendbaar genoeg om deze slag te maken? Voor knappe wiskundige koppen met kennis van semantiek is er een hoop denkwerk te verzetten!
Tot slot
Prospective is dus aanhanger van de gedachte dat Web 3.0 het ’semantic web’ ín zicht draagt. En terwijl u went aan het Web 3.0 idee denken wij, in uw en in ons belang, alvast na over Web 4.0. De tijd waarin het web ook een Operating System (OS) zal zijn.
Wordt vervolgd…









October 15th, 2009 at 02:07
two terms:
microformats and rdfa
those are the ones that are going to create a true semantic web.
October 15th, 2009 at 15:11
Voor diegenen die zich afvragen wat “RDFa” is:
RDFa is a specification for attributes to express structured data in any markup language. This document specifies how to use RDFa with XHTML. The rendered, hypertext data of XHTML is reused by the RDFa markup, so that publishers don’t need to repeat significant data in the document content. The underlying abstract representation is RDF [RDF-PRIMER], which lets publishers build their own vocabulary, extend others, and evolve their vocabulary with maximal interoperability over time. The expressed structure is closely tied to the data, so that rendered data can be copied and pasted along with its relevant structure…
De volledige tekst vindt u op W3.org: http://www.w3.org/TR/rdfa-syntax/