donderdag 20 januari 2000, jaargang 35, nr. 3
rubriek: Onderzoek

Zoeken op internet, promotie Arjen de Vries

Multimediasysteem met subjectieve trekken

Hoe pik je net dat ene plaatje van een ruig strand met woeste golven en donkere, sombere kleuren uit alle strandtaferelen op het Internet? Met alleen 'beach' intypen kom je vaak niet tot een bevredigend resultaat. Arjen de Vries ontwikkelde daarom een multimediazoeksysteem dat het uiteindelijk mogelijk moet maken om op subjectieve kenmerken te zoeken.

Mirror DBMS heet het zoeksysteem waar De Vries onlangs op promoveerde bij de afdeling Databases van de faculteit Informatica. Het systeem maakt het mogelijk bestaande zoekmodellen te integreren en houdt rekening met de subjectiviteit van de gebruiker.

De Vries demonstreert een zoektocht met de query 'tree'. De computer zoekt in eerste instantie alleen op tekst. Alleen beelden waar ook daadwerkelijk 'boom' bij staat verschijnen als resultaat. Maar beelden die de gebruiker misschien veel geschikter zal vinden maar die niet geannoteerd zijn verschijnen niet. Waar andere systemen vaak ophouden, ontstaat er met DBMS interactie met de gebruiker. 'De gebruiker moet de computer leren waarnaar hij op zoek is', legt De Vries uit.

Uit de tien verschenen bomen kan hij er bijvoorbeeld twee aanklikken die hij geschikt vindt omdat het bomen in de herfst zijn. De computer zoekt dan verder naar plaatjes die daarop lijken, qua kleur of qua texture. Dan vindt hij bijvoorbeeld ng een herfsttafereel dat bij de eerste ronde niet verscheen omdat het beeld niet geannoteerd is. Een texture gaat uit van lijnpatronen. Een foto van een bos bijvoorbeeld, heeft een andere texture dan een foto van een stad.

Om DBMS gebruiksvriendelijker te maken, wil De Vries dat het systeem ook op lange termijn kan leren. 'De interactie tussen gebruiker en systeem is leren op korte termijn. De gebruiker geeft een bepaald plaatje aan, de computer zoekt daar gelijksoortige bij. Maar als de gebruiker de week erna weer een beeld zoekt, moet hij helemaal opnieuw beginnen.' Daarom moet het systeem onthouden welke beelden bij welke query horen. Het probleem rijst dan dat het plaatje wat de ene gebruiker als somber betitelt ook bij een andere gebruiker tevoorschijn komt die het beeld misschien heel anders interpreteert.

Loepzuiver

Dat probleem is wat De Vries het meest interessant vindt aan zijn onderzoek. 'Het is een combinatie van harde techniek en cognitieve psychologie, hoe nemen mensen beelden waar. Ik ben natuurlijk geen psycholoog, maar ik vind het leuk om op deze manier moeilijke queries op te lossen.'

Hoewel het systeem verder gaat dan zoeken op tekst, zijn de resultaten niet altijd loepzuiver. De Vries demonstreert een probleem dat kan ontstaan bij het zoeken op alleen tekst. Zoekt de gebruiker verder op een vrouw met een zwarte jurk, dan kiest de computer ook de zwarte hond uit vanwege het overeenkomstige woord zwart.

Maar ook nadat DBMS op kleur en texture zoekt, verschijnt een fruitschaal met sinaasappels bij het resultaat, omdat de kleuren overeenkomen met de oranje achtergrond van het goedgekeurde plaatje. 'Dat wordt heel moeilijk om dat soort fouten eruit te halen', zegt De Vries.

Voetbal

Een paar jaar geleden ontwikkelde vakgenoot Daan Veldhausz bij het Telematica-instituut een dergelijk systeem voor sportredacteuren: ADMIRE. Met dat systeem is het mogelijk om met een simpele zoekactie net dat speciale doelpunt terug te vinden. Het verschil met het systeem van De Vries is dat het bij Veldhausz ging om een beperkt domein: alleen voetbalbeelden. Het onderzoek van De Vries richt zich op een generieke database. 'Bij het systeem van Veldhausz lagen de regels al meer vast. Een voetballer is groter dan een voetbal, het gras is groen, bij een doelpunt is er juichend publiek. Bij een grote database als het Internet kan dat niet.' Wel is hetde bedoeling een link tussen de systemen te leggen. Iemand zoekt bijvoorbeeld in Mirror DBMS een voetballer en wordt meteen doorgeschakeld naar die specifieke database.

Praktische toepassing kan het onderzoek krijgen in bedrijven die worstelen met een ontoegankelijk archief. 'Voor filmmakers is het tegenwoordig soms voordeliger om naar Parijs te rijden voor een shot van de Eifeltoren dan om het materiaal uit een database te zoeken. Nu kan je dus geld besparen door het hergebruiken van beelden.'

Het programma is nog niet commercieel. 'Op lange termijn wil ik dat wel. Het lijkt me leuk om het ook echt in de markt te zetten. Maar eerst moet er nog wel wat aan gedaan worden, het kan nog wat stabieler.'

Vooralsnog gaat De Vries zich bezighouden met een Europees project over video retrieval om ook het zoeken naar videobeelden te verfijnen. 'In Amerika zijn ze daar ver mee. Daar hebben ze 60 kanalen en dan gaat de video zelf van alles opnemen waarvan hij denkt dat het bij de smaak van de gebruiker past.'


Volgende artikel: Tilburgse economen vooraan in ranking
Vorige artikel: Tevreden


Copyright redactie UT-Nieuws. Page generated on woensdag 19 januari 2000, 20:57 by UT-Nieuws