Ik ben data-onderzoeker bij Data School en promovendus aan de afdeling Media- en Cultuurwetenschappen van de Universiteit Utrecht. In mijn onderzoek richt ik me op de toepassing van AI in onderzoeksjournalistiek.Daarnaast werk ik, als onderdeel van mijn promotie, aan datajournalistieke onderzoeken voor De Groene Amsterdammer. Daar bouw ik datasets en ontwikkel ik technieken om het maatschappelijke debat en de impact van technologie te onderzoeken.Hieronder een selectie van projecten waar ik aan heb gewerkt. Vragen, ideeën of samenwerkingen? Ik ben te
bereiken op: [email protected]
Projecten
2025

Kabinet-Schoof aanzienlijk minder productief dan eerdere kabinetten
Hoe productief is deze regering? Om daarachter te komen keken we naar de besluitenlijsten van de wekelijkse ministerraad, onderzochten we de Eerste Kamer-agenda en turfden we hoeveel ‘zelfstandige wetten’ er in voorbereiding zijn gezet. Uit al die data blijkt dat dit kabinet aanzienlijk minder produceert dan zijn voorgangers. Wie de senaat als peilstok neemt ziet zelfs dat er deze eeuw niet eerder een kabinet was dat zo weinig voortbracht.

Met community notes blijven de meest politiek-geladen onderwerpen ongecorrigeerd
Hoe werkt het community notes-systeem van X? We onderzochten de bijna negenduizend opmerkingen die sinds de introductie onder Nederlandstalige berichten op X zijn voorgesteld. Slechts 522 zijn daadwerkelijk geplaatst, over de rest is ofwel te weinig gestemd, of er is tussen ‘links’ en ‘rechts’ geen overeenstemming gevonden.
2024

PVV'ers overspoelen Facebook met AI-plaatjes tijdens verkiezingen
Radicaal-rechtse Facebookpagina’s verspreiden nepfoto’s van asielzoekers en migranten naast wervende PVV-slogans. In totaal identificeerden we op die pagina’s 672 politieke berichten die met kunstmatige intelligentie zijn gemaakt. Uit onderzoek blijkt: die pagina’s komen uit Wilders’ fractie zelf.

Hoe links een scheldwoord werd
Hoe werd ‘links’ omgeschreven in de Tweede Kamer en in krantenstukken, en hoe veranderde dat? En hoe ontstond nou precies dat eliteverwijt? Om daarachter te komen analyseerden wij drie decennia aan Kamerhandelingen en 32.464 journalistieke verhalen. Daaruit blijkt: de betekenis van ‘links’ is in dertig jaar ingrijpend veranderd.

Duizenden AI-boeken op bol.com
Met behulp van zelfontwikkelde software analyseerden we nieuwe titels in ruim tachtig genres die worden verkocht op de populairste online boekhandel van Nederland. In totaal ontdekten we meer dan 6500 aangeboden titels die grotendeels of volledig door kunstmatige intelligentie zijn geschreven. Ze zijn stukken goedkoper, richten zich op heel specifieke niches, en staan geregeld bovenaan in de zoekresultaten.

Gokbedrijven richten hun reclame illegaal op jongeren
Gokreclames zijn vorige zomer verdwenen van straat en tv, maar online zijn ze toegestaan en daar richten gokbedrijven hun reclame illegaal op kwetsbare jongeren. We vonden honderden online advertenties die expliciet op jongeren zijn gericht. In totaal worden de regels overtreden door vijf van de negentien onderzochte gokbedrijven

Geert Wilders heerst al jarenlang over de Kameragenda
Wie in Den Haag de agenda bepaalt, bepaalt het gesprek. Om de strijd om de Kameragenda in kaart te brengen, analyseerden we alle Regelingen van Werkzaamheden en Procedurevergaderingen sinds 2008. Welke partijen en politici bepalen de agenda in Den Haag? Daaruit blijkt: al vijf jaar, lang voor haar verkiezingszege, domineert de PVV het vergaderschema.
2023
.

Juist wijken die door campagneteams werden genegeerd stemden PVV
De campagneteams negeerden kiezers in gebieden die vaak op de PVV stemden. Sinds oktober besteedden Nederlandse partijen €2.436.329 aan 7.840 advertenties. Om dit te monitoren, richtten we vroeg in de verkiezingsstrijd een campagnemonitor op om de verspreiding van deze advertenties te volgen.

Lhbti-intolerantie neemt razendsnel toe
We leerden een model te herkennen of een tekst haatdragend is ten opzichte van lhbti+’ers. In totaal analyseerden we meer dan tien miljoen berichten die in de afgelopen tien jaar online zijn verschenen. Van Telegram tot Instagram en van Twitter tot YouTube: op alle platforms zien we dat de vijandigheid richting lhbti+-groepen razendsnel groeit.

Nederlandse trainingsdata voor chatbots vol auteurs-rechtenschendingen, privé-gegevens en nepnieuws
We onderzochten de grootste openbare Nederlandstalige collectie aan teksten waarop taalmodellen getraind worden: mC4. Het blijkt bol te staan van auteursrechtschendingen, privé-gegevens en nepnieuws. In de top-tweehonderd van meest geciteerde websites vonden we ongeveer elke grote Nederlandse krant, maar ook de neonazistische complotwebsite Stormfront.

Steeds minder specialistische ambtenaren
Het soort ambtenaar dat gezocht werd blijkt steeds minder specialistisch. In elf procent van de beleidsvacatures van vorig jaar werd vakinhoudelijke kennis of ervaring geëist, blijkt uit onze data-analyse. Het aantal gezochte ambtenaren met ‘politieke sensitiviteit’ en ‘politieke antennes’ bleef onverminderd hoog.

Binnen een half uur in een eetstoornisfuik
Wie graag kijkt naar video’s over afvallen, komt binnen een half uur terecht in een constante stroom van video’s over eetstoornissen, extreme diëten en magere vrouwen. Om te zien hoe snel je extreme filmpjes krijgt aangeboden, lieten we twaalf geautomatiseerde accounts vanuit verschillende interesses door de app scrollen.
2022

Telegramgroepen in Nederland
Extremisme is op Telegram geen probleem van de ‘fringes’, de randen van het debat. We brachten het openbare Nederlandstalige Telegram-landschap in kaart. Door steeds verwijzingen naar nieuwe groepen te volgen navigeerden we door dat landschap, tot we geen nieuwe groepen meer konden vinden. In totaal analyseerden we dertig miljoen berichten in ruim vierduizend groepen.
2021
.

Eén op de tien tweets aan vrouwelijke politici haatdragend
De campagneteams negeerden kiezers in gebieden die vaak op de PVV stemden. Sinds oktober besteedden Nederlandse partijen €2.436.329 aan 7.840 advertenties. Om dit te monitoren, richtten we vroeg in de verkiezingsstrijd een campagnemonitor op om de verspreiding van deze advertenties te volgen.
Projecten
2024
Wetenschappelijke publicaties
Veerbeek, J., & Diakopoulos, N. (2024). Using Generative Agents to Create Tip Sheets for Investigative Data Reporting. Proceedings of the Computation + Journalism Symposium 2024.
Veerbeek, J., van Es, K. F., & Müller, E. (2024). Professional follow-up communication as an indicator of public value: Analyzing Dutch PSM’s Role in Public Debates Through Topic Modelling Newspaper Coverage. Journal of Mass Communication Inquiry, 48(3), 468-489
Overig
Veerbeek, J., & Diakopoulos, N. (2024). How Teams of AI Agents Could Provide Valuable Leads For Investigative Data Journalism. Generative AI in the Newsroom.
2023
Wetenschappelijke publicaties
Lassche, A., Ros, R., & Veerbeek, J. (2023). (De)constructing binarism in journalism: Automatic antonym detection in Dutch newspaper articles. In Proceedings of the Computational Humanities Research Conference 2023 (Vol. 3558, pp. 63-77).
Pander Maat, H. L. W., de Glopper, C., Raaijmakers, K. M. J., Veerbeek, J., & Vermeulen, D. H. A. (2023). Fleshing out your text: How elaboration and contextualization moves differentially predict writing quality. Journal of Writing Research, 15(2), 363-393.
2022
Wetenschappelijke publicaties
Veerbeek, J., van Es, K. F., & Müller, E. (2022). Public Broadcasting and Topic Diversity in The Netherlands: Mentions of Public Broadcasters’ Programming in Newspapers as Indicators of Pluralism. Javnost, 29(4), 420-438
Overig
Veerbeek, J. (2022). Literaire kwaliteit voor detectives: Recensie van Het raadsel literatuur. Is literaire kwaliteit meetbaar? Vooys : tijdschrift voor letteren, 40(3), 72-75.