woensdag 11 december 2024

Verantwoording bij het data-onderzoek naar de AI-beelden van radicaal-rechts

Verantwoording

Verantwoording bij het data-onderzoek naar de AI-beelden van radicaal-rechts

De Groene Amsterdammer en Data School (Universiteit Utrecht) onderzochten een netwerk van radicaal-rechtse Facebookpagina’s die structureel AI-gegenereerde nepbeelden verspreiden. Welke methoden gebruikten we, en welke afwegingen maakten we bij het publiceren van onze bevindingen?

Eva Hofman en Joris Veerbeek

11 december 2024

Kort voor de afgelopen Europese verkiezingen, op 2 juni 2024, plaatste Geert Wilders voor het eerst een overduidelijk door AI gegenereerde afbeelding op sociale media. ‘De zon gaat weer schijnen in Nederland’, schreef hij bij een beeld van een hoogblond gezin. Tegelijkertijd kwamen uit andere landen signalen dat AI-beelden steeds vaker worden ingezet voor (rechts-radicale) politieke campagnes. Dit bracht ons ertoe om onderzoek te doen naar de vraag: hoe wijdverspreid is het gebruik van zulke nepbeelden voor politieke doeleinden in Nederland?

Aanvankelijk zochten we op verschillende sociale media naar afbeeldingen met algemene zoektermen zoals ‘politiek’ en ‘Nederland’. Al relatief vroeg leidde deze aanpak ons naar de Facebookpagina ‘Nederland is van ons’. Met meer dan zeventigduizend volgers bleek deze pagina een tijdlijn vol beelden te hebben die door AI gemaakt leken. Dit bracht ons weer op het spoor van een breder netwerk van minstens zes openbare Facebookpagina’s, waaronder ook ‘Ik stem op Geert Wilders & de PVV’ (ruim vijftigduizend volgers), die soortgelijke berichten deelden, vaak vergezeld van wervende slogans voor de PVV.

We identificeren deze pagina’s als een netwerk op basis van drie kenmerken: ze delen identieke teksten en afbeeldingen, volgen of linken naar elkaar, en verwijzen allemaal naar dezelfde Telegramgroep, gepresenteerd als ‘ons Telegramkanaal’. Later in ons onderzoek ontdekten we nog twee pagina’s die binnen dat netwerk vallen, waarmee het totaal op acht zou uitkomen. Omdat we die niet hebben meegenomen in onze data-analyse, tellen we die in het artikel niet mee.

Hoewel we in eerste instantie dus niet specifiek op zoek zijn gegaan naar PVV-gerelateerde pagina’s, richten we ons in het artikel wel primair op dit specifieke netwerk. Dat doen we vanwege het relatief grote bereik en de consistente, ogenschijnlijk gecoördineerde activiteit in het verspreiden van AI-gegenereerde beelden op Facebook. Tijdens ons onderzoek kwamen we geen vergelijkbare pagina’s tegen aan de andere kant van het politieke spectrum in Nederland. Dit komt overeen met internationaal onderzoek, zoals het recente rapport van AI Forensics, waaruit blijkt dat AI-afbeeldingen overwegend worden ingezet door rechtse of radicaal-rechtse partijen. Mochten er toch soortgelijke pagina’s zijn, al dan niet op andere sociale mediaplatforms, die aan andere partijen gelinkt kunnen worden, dan ontvangen we daar graag tips over.

Om een kwantitatief beeld te krijgen van het aantal AI-beelden, de momenten waarop deze werden ingezet en de bijbehorende onderwerpen, verzamelden we vanaf 2020 tot november 2024 de berichten van de pagina’s binnen het netwerk. De reacties namen we niet mee. Daarnaast verzamelden we berichten van de officiële pagina van Geert Wilders en die van de PVV Noord-Brabant, omdat de pagina’s in het netwerk regelmatig naar deze twee pagina’s verwijzen. Omgekeerd hebben we geen expliciete verwijzingen van de officiële pagina’s naar de pagina’s binnen dit netwerk gevonden. We namen die twee officiële pagina’s dus wel mee, maar die vormden voor ons geen structureel onderdeel van het netwerk. In totaal kwamen we uit op 33.703 berichten.

Omdat ons onderzoek gericht was op AI-beeld, verzamelden we bij al deze berichten ook alle bijbehorende afbeeldingen. Dat leverde in totaal 29.989 afbeeldingen op. Dit waren overigens geen unieke beelden, maar ook plaatjes die herhaaldelijk in verschillende pagina’s tegelijk werden gedeeld.

Om de unieke afbeeldingen te identificeren, gebruikten we een zogenaamd deduplicatie-algoritme (voor de liefhebbers: ‘Perceptual hashing’ via het Python-pakket imagededup). Het algoritme groepeert afbeeldingen die identiek zijn of sterk op elkaar lijken. Dit leverde een totaal van 12.856 unieke beelden op. In werkelijkheid ligt dat aantal iets hoger, omdat het algoritme minder gevoelig is voor tekst. Hierdoor werden vergelijkbare Twitter-screenshots met verschillende teksten samengevoegd. Aangezien ons onderzoek gericht was op beeld, en niet op tekst of screenshots, had dit geen invloed op onze resultaten.

Vervolgens wilden we achterhalen welk deel van deze afbeeldingen met behulp van AI is gemaakt. Hiervoor maakten we gebruik van gespecialiseerde AI-detectiesoftware, die het bedrijf Sightengine ons beschikbaar stelde. Voor elke afbeelding berekent deze software de kans dat de afbeelding met AI is gemaakt. De software onderzoekt niet alleen of de volledige afbeelding met AI is gegenereerd, maar ook of er in het algemeen sporen van AI in het beeld aanwezig zijn. Dit is gunstig voor ons onderzoek, juist omdat veel AI-beelden zijn voorzien van wervende teksten voor de PVV die later zijn toegevoegd, en we die beelden expliciet wilden meenemen.

Elke afbeelding die door Sightengine als AI-gegenereerd werd aangeduid, controleerden we vervolgens handmatig. AI-beelden zijn nog steeds relatief eenvoudig te herkennen als je weet waar je op moet letten (zie vooral deze uitgebreide handleiding gemaakt door de Northwestern University). Als we op basis van het beeld zelf niet konden bevestigen dat het door AI was gemaakt, namen we het niet mee in de telling. De afbeeldingen die door Sightengine als niet-AI werden aangemerkt, controleerden we steekproefsgewijs.

In totaal identificeerden we daarmee 282 unieke AI-gegenereerde afbeeldingen. Deze beelden werden samen 672 keer gedeeld in verschillende berichten. De meeste AI-afbeeldingen troffen we aan op de twee grootste pagina’s: ‘Ik stem op Geert Wilders & de PVV’ en ‘Nederland is van ons’. Geert Wilders zelf deelde drie van deze afbeeldingen. Op de pagina van de PVV Noord-Brabant vonden we veertig AI-afbeeldingen, voornamelijk van PVV-stemmers, maar ook vier nepbeelden van zogenaamde asielzoekers in Budel.

In de afgelopen laatste zes maanden is zo ongeveer een op de drie berichten op ‘Nederland is van ons’ en ‘Ik stem op Geert Wilders & de PVV’ door AI gegeneerd. Voor de kleinere pagina’s, zoals ‘PVV Fans’ en ‘Nee, geen AZC meer in Nederland’ zijn dit overigens bijna alle beelden.

Vervolgens deelden we de AI-afbeeldingen op een van zes categorieën:

1) Stemmers en doelgroep: Afbeeldingen die zogenaamd PVV-stemmers of de algemene doelgroep representeren, zoals het plaatje dat Wilders deelde.

2) Asielzoekers en migranten: Nepbeelden van (groepen) mensen die asielzoekers en migranten moeten voorstellen, uitsluitend negatief afgebeeld. Enkele AI-gegenereerde afbeeldingen in deze categorie hebben niet direct betrekking op asielzoekers of migranten, maar richten zich tegen mensen van kleur in het algemeen. Vanwege de overeenkomstige visuele stijl of het gebruik van identieke beelden, en omdat ze niet dienen als voorbeelden van “stemmers,” rekenen we deze afbeeldingen toch tot deze categorie.

3) Geert Wilders: Afbeeldingen waarin een AI-versie van Wilders wordt getoond.

4) Nederland: Geïdealiseerde beelden van het Nederlandse straatbeeld of hoe Nederland volgens de maker zou moeten zijn.

5) Propagandaposters: Afbeeldingen in de stijl van jaren dertig-propaganda, met een duidelijke oproep tot actie.

6) Overig: Afbeeldingen die niet in de bovenstaande categorieën passen.

Bijna de helft van de AI-afbeeldingen die we identificeerden – 45% – valt in de categorie ‘Asielzoekers en migranten’. Op de tweede plaats staan afbeeldingen van stemmers. Dit weerspiegelt een verschuiving in de afgelopen periode: terwijl rond de laatste Tweede Kamerverkiezingen voornamelijk beelden van stemmers werden gedeeld, richtte de aandacht zich in de meest recente maanden van dit jaar vooral op migranten, asielzoekers en mensen van kleur.

We onderzochten ook hoe goed AI-beelden ‘scoren’. Hiervoor analyseerden we het gemiddelde aantal likes per categorie op de twee grootste pagina’s en vergeleken we deze met niet-AI-beelden. Uit die analyse bleek dat AI-beelden niet per se meer likes opleveren. Sterker nog, in de meeste categorieën krijgen ze op beide pagina’s juist minder likes dan gemiddeld. Op één uitzondering na: beelden van asielzoekers en migranten als bedreiging. Deze AI-beelden krijgen wél meer likes dan niet-AI-beelden, waaronder vooral screenshots van X-berichten van Wilders vallen.

In het artikel hebben we er, ten slotte, voor gekozen om enkele van die beelden (met bijschrift) te tonen, een beslissing die we weloverwogen hebben genomen. Het risico bestaat immers dat door deze berichten te tonen, racistische retoriek onbedoeld verder wordt verspreid en daarmee een plek krijgt in het publieke debat. Toch hebben we, na zorgvuldige afweging, besloten deze beelden op te nemen, om meerdere redenen.

Allereerst gaat het hier niet om marginale pagina’s: de twee grootste pagina’s die we onderzochten hebben elk meer dan vijftigduizend volgers, evenveel als of zelfs meer dan dit weekblad. Maar bovenal wilden we met het tonen van de beelden de ernst ervan zichtbaar maken op een manier die met algemene beschrijvingen niet te vangen is. Iets ‘fotorealistisch’ noemen is één ding, maar het daadwerkelijk tonen van fotorealistische beelden is iets anders. Tijdens ons onderzoek zagen wij bovendien dat AI-beelden in de reacties niet als zodanig herkend werden. Door enkele van deze beelden te tonen, willen we bijdragen aan een groter bewustzijn over de impact en het gebruik van deze beelden. Nu AI-content steeds overtuigender wordt, is het des te belangrijker om mediageletterdheid te ontwikkelen waarmee je deze beelden kan beoordelen en herkennen.

Toen vijf van de zes pagina’s offline gingen, enkele uren nadat we de PVV om wederhoor hadden gevraagd, en bij een zesde pagina alle AI-beelden werden verwijderd, ontstond een nieuwe overweging. Is het passend om de beelden, juist nu ze verwijderd zijn, alsnog op de pagina’s van De Groene Amsterdammer te publiceren? Uiteindelijk versterkte dit vooral onze overtuiging om de beelden wél te publiceren. Het gaat hier immers om pogingen om met nepbeelden het publieke debat te beïnvloeden, op pagina’s die te linken zijn aan een Kamerlid in het hart van de grootste partij van Nederland – een verkozen volksvertegenwoordiger met een voorbeeldfunctie. Dat willen we zo zorgvuldig mogelijk documenteren en zichtbaar maken.

https://www.groene.nl/artikel/het-land-van-de-hoogblonde-gezinnetjes

Geen opmerkingen:

Een reactie posten

Opmerking: Alleen leden van deze blog kunnen een reactie posten.