Blik bij de NOS, semantisch web nog ver weg ;-)
Saturday, February 20, 2010 at 10:46AM Het semantisch web wordt ons al lange tijd voorgespiegeld. Dat is het web dat slimmer met data omgaat. Dat onder meer rekening houdt met de context van de persoon. Het voorbeeld dat dan gegeven wordt is dat een zoekmachine snapt dat bij het zoeken naar Jaguar ondergetekende eerder op zoek is naar Apple systeem software dan naar een auto.
Ik volg veel diensten die beloven dat de toekomst mooi is, maar zie eerlijk gezegd nauwelijks vooruitgang. Het semantisch web maakt zijn belofte nog lang niet waar.
Dat een lange weg te gaan is, blijkt vandaag op de NOS site waar een database gerelateerde items bij videobijdragen voorschotelt.
Dit is het hoofditem:

Rechts ernaast schotelt de NOS onder de noemer 'Bekijk en beluister ook' gerelateerde inhoud voor.
Bij het eerste item kan ik me nog iets voorstellen.

Maar het tweede item heeft weinig met politiek te maken.

Om over het derde item maar te zwijgen.

Computers zijn mooie dingen. Maar als ze zaken aan elkaar koppelen, moeten ze wel blijven denken natuurlijk ;-)


Reader Comments (7)
Tja, hetzelfde probleem zie je bij die Google Ads. Bij een nieuwsbericht over een moord komen er gelijk advertenties voor uitvaartverzekeringen langs.
Het lijkt me dat dit voorbeeld met semweb weinig van doen heeft, als is dat ook je punt natuurlijk :) De NOS zoekt kennelijk even snel op keywords in de titel ('gevallen' in dit geval). Dus het demonstreert de volledige afwezigheid van semweb. Het doet me zelfs vermoeden dat de NOS zoiets basaals als (zoeken op) metadata nog niet regelt. En dat is het eerste stapje op weg naar sem web: bruikbare metadata.
Overigens gebeuren er al wel mooie semweb dingen. Veel daarvan is echter onzichtbaar in de presentatielaag die jij en ik dagelijks tegenkomen. Op het gebied van Linked Data gebeuren zeker bruikbare dingen.
Het semantisch web komt er wel, maar zal niet beginnen bij video. De tekstjes die bij online video geplaatst worden zijn meestal maar kort. Soms is het niet meer dan een lijstje trefwoorden. De computer moet wel iets hebben om mee te werken natuurlijk. Een computer snapt (nu nog) niet waar een video over gaat, dus kan hij ook geen inhoudelijk relevante koppelingen maken. De genoemde verbanden worden gelegd op basis van enkele trefwoorden ('gevallen'), en dan krijg je dus rare koppelingen.
Met andere woorden: the revolution won't be televised :-)
Het semantisch web komt er wel, maar de grootste hobbel is dat de meeste mensen nog niet snappen hoe het zou moeten werken en wat de voordelen zouden zijn. Ik heb zelf eens voor de website van een landelijk dagblad gezorgd dat er een systeem kwam dat artikelen aan elkaar relateerde op basis van de inhoud. Dat was behoorlijk vooruitstrevend voor zo'n site, maar het systeem is stopgezet nadat ik was weggegaan, omdat ze het niet begrepen. Erg jammer, maar het betekent alleen dat de techniek wat langer nodig heeft om door te dringen.
@ton Klopt, dat was mijn punt ;-)
@Jaap Zonde
En mijn ervaring is dat als de metadata door personen moeten worden meegegeven dat ook suboptimaal is ;-) Vraag maar aan de sites waar ze de schrijvers verplichten drie tags mee te geven.
Het Fast-forward widget onderaan ontkracht je blogpost: je hebt het over irrelevante aanbevelingen, en tataaa.. het fastforward widget toont ze ;-)
Wel erg makkelijk om op basis van 1, net gepubliceerde video dit soort conclusies te trekken. Iedereen die te maken heeft met zoeken weet dat de kwaliteit van de resultaten afhangt van o.a. de kwaliteit van de keywords, de overige metadata en het gebruikte algoritme. Ook gaat er soms even tijd over heen voordat er goede zoekresultaten worden gevonden.
De video die Erwin als voorbeeld gebruikt was op dat moment nog maar net gepubliceerd en nog niet van keywords voorzien, door de grote drukte voor een gemiddelde zaterdagochtend. Logisch dat er dan weinig relevante overige content gevonden wordt. Inmiddels heeft deze video een andere titel gekregen en is er metadata toegevoegd. De Bekijk en Beluister ook-rubriek suggereert nu dan ook veel relevantere onderwerpen.
Ik ben het dan ook niet met de conclusie van Erwin eens. Er is zeker vooruitgang in het geautomatiseerd aanbieden van relevante content en ik vind juist dat de kwaliteit van de gerelateerde artikelen en video's die wij (en anderen) aanbieden bij de meeste verhalen (tekst, audio en video) snel vooruit is gegaan de afgelopen tijd.
Roeland, het voorbeeld is een onderstreping. Juist omdat ik weet hoe moeilijk het is. Natuurlijk is dat probleem groter en breder dan de NOS. Het is alleen wel wat de bezoeker te zien kreeg. Als bezoeker moet je niet hoeven weten dat techniek moeilijk is toch? En daarbij: dat de NOS super bezig is, zeg ik vaak genoeg, een kleine kritische noot ter afwisseling moet kunnen :)