Naar inhoud

Het antwoord op de filterbubbel heet artificial intelligence

De berichtgeving rondom het coronavirus heeft nog maar weer eens duidelijk gemaakt dat we de afgelopen jaren steeds meer in onze eigen filterbubbel leven. Omdat algoritmes op social media onze newsfeed bepalen en traditionele media ook meer en meer op personalisatie inzetten, krijgt iedereen alleen maar informatie te zien die zijn wereldbeeld bevestigt. Dat kan leiden tot nog meer polarisatie in de samenleving.

Universitair docent Computational Semantics Tommaso Caselli en het team Data Science van het Center for Information Technology (CIT) van de Rijksuniversiteit Groningen willen onze filterbubbel doorbreken – met behulp van… een algoritme.

Wanneer we het over filterbubbels hebben, denken we spontaan aan social media. Daar bepalen algoritmes welke berichten we te zien krijgen, afhankelijk van pagina’s die wij – of onze vrienden – leuk vinden. Zo creëren Facebook, Instagram en Twitter voor ieder van ons een gepersonaliseerde luchtbel met nieuws en informatie die in ons straatje past.

De filterbubbel is een gepersonaliseerde luchtbel met nieuws en informatie die in ons straatje past.

Doorbreken van de filterbubbels

Maar die personalisatie beperkt zich niet tot social media. Denk maar aan Blendle, dat artikelen aanraadt op basis van interesses of eerder gelezen artikelen. Ook traditionele media experimenteren sinds enkele jaren meer en meer met bijvoorbeeld gepersonaliseerde nieuwsbrieven, in een poging om lezers betrokken te houden. Welke gevolgen heeft dat voor de manier waarop we over de gebeurtenissen in wereld lezen?

Daar wil Tommaso Caselli met zijn project ‘Breaking Filter Bubbles’ beter inzicht in krijgen. Uniek aan het project is de interdisciplinaire samenwerking. De universitair docent betrekt niet alleen Marcel Broersma – hoogleraar Media & Journalism Studies aan de Rijksuniversiteit Groningen in het project – want hij ook op de hulp rekenen van het team Data Science van het CIT.

Een corpulent corpus

Als assistent-hoogleraar in de computationele taalkunde houdt Tommaso Caselli zich al langer bezig met het ontwikkelen van algoritmes om taalkundige verschijnselen te analyseren. “Bij een eerder project aan de Vrije Universiteit Amsterdam bekeek ik als senior researcher hoe tien verschillende bronnen hetzelfde verhaal vertelden”, legt hij uit. “Dat project wilde ik verder uitwerken met nieuwsberichten, maar dan op grote schaal.”

Dat kun je vrij letterlijk nemen. Data scientist Dimitrios Soudis van het CIT kan zich uitleven met een archief van The New York Times van twee decennia. Om het enigszins behapbaar te maken, beperken ze zich voorlopig tot nieuwsartikelen over natuurrampen. “Dat zijn relatief simpele verhalen”, zegt Tommaso Caselli. “Later willen we ook misdaadberichten en politieke berichtgeving bekijken, maar dan moeten we eerst een duidelijk beeld krijgen van hoe nieuwsverhalen in elkaar zitten.”

Manueel alle berichtgeving over natuurrampen halen uit het enorme archief van The New York Times is natuurlijk onbegonnen werk. Daarvoor doet Dimitrios Soudis een beroep op zijn expertise in artificial intelligence (AI). “We gaan naar de website van The New York Times en zoeken bijvoorbeeld artikelen in de categorie aardbevingen”, duidt de data scientist. “Die artikelen downloaden we en aan de hand van een wiskundig model berekenen we welke artikelen uit ons corpus daarmee overeenkomen.”

Taal blijft lastig

Tot zover het verzamelen van de artikelen. Volgens Dimitrios Soudis ligt de echte moeilijkheid van het project in het feit dat taal geen exacte wetenschap is. “Taal blijft moeilijk te begrijpen voor algoritmes”, geeft hij aan. “Denk alleen al aan hoe vaak woorden als wervelwind, tsunami of aardverschuiving in figuurlijke zin gebruikt worden. Die moeten we er dus uit filteren.”

Voorlopig zijn computers nog niet in staat om taal op een dieper niveau te begrijpen. Dus moet je als data scientist creatief zijn. Dimitrios Soudis bedacht om met frequenties te werken. “We creëren een soort woordenboek met termen die gerelateerd zijn aan natuurrampen”, verduidelijkt hij. “Dan kijken we hoe vaak bepaalde woorden in de geselecteerde artikelen voorkomen – en nog belangrijker, met welke woorden ze in verband staan. Zo kunnen we syntactische relaties tussen woorden ontrafelen.”
Filterbubbels creëer je zelf. Maar je moet mensen de mogelijkheid geven om het complete plaatje te krijgen en zelf een keuze te maken.

Patronen reconstrueren

Dit stelt de onderzoekers in staat om nieuwsberichten op een nieuwe manier te bekijken. In plaats van te kijken naar hoe een gebeurtenis verteld wordt in losse artikelen, kijken zij naar welke onderliggende patronen in alle nieuwsberichten over natuurrampen terugkomen. “Los van de individuele stijl van de journalist worden nieuwsberichten geschreven volgens bepaalde sjablonen”, schetst Tommaso Caselli. “Bij een aardbeving heb je het bijvoorbeeld over de grootte, de plaats waar het gebeurde en het aantal slachtoffers of hoe de hulptroepen in actie kwamen. Dat proberen wij te reconstrueren.”

Van klein naar groot

Als dat model eenmaal werkt, is het volgens Tommaso Caselli zaak om het corpus te verbreden. “Je moet klein beginnen”, licht hij toe. “Maar uiteindelijk willen we kijken hoe andere media verslag doen van dezelfde gebeurtenis – welke bronnen ze aan het woord laten en welke informatie ze eerst geven of eventueel weglaten. We kunnen bijvoorbeeld het verschil tussen tabloids en klassieke media meenemen in ons onderzoek, net als social media.”

Google News 2.0

Helemaal een einde maken aan filterbubbels lijkt Tommaso Caselli een utopie. “Mensen blijven altijd naar de nieuwsmedia gaan die ze vertrouwen”, verklaart hij. “Filterbubbels creëer je dus ook zelf. Je moet mensen echter de mogelijkheid geven om het complete plaatje te krijgen en zelf een keuze te maken. Wat wij dus willen, is een overzicht bieden: dit zijn de feiten en deze verschillende perspectieven houden de media erop na. Een soort Google News 2.0 zou je kunnen zeggen.”

Jorn Lelong is copywriter bij BijlesHuis en freelancecopywriter voor het team Data Science van het Center for Information Technology van de Rijksuniversiteit Groningen.

Bron: CustomerTalk
0

Reacties

Logo CustomerTalk

Cookie-instellingen

CustomerTalk maakt gebruik van cookies voor een optimale gebruikerservaring.

Graag vragen wij je toestemming voor het plaatsen van deze cookies.

Accepteren Meer informatie