Blog: De noodzaak voor een datavakbond

Blog door Tijs Sikma, lid inhoud werkgroep datavakbond

Als het besluitvormingsproces rondom de corona-apps een ding heeft laten zien, is het wel dat de Nederlandse politiek onvoldoende het belang van privacy en de risico’s van datamisbruik voor ogen heeft. De controverse is bovendien exemplarisch voor een veel breder probleem; het toenemende belang van data in politieke processen en het gebrek aan inspraak die de burger hierbij heeft.

Wij produceren allemaal op grote schaal data en deze data is vandaag de dag van grote (economische) waarde. Zoals een gewone vakbond de belangen van werknemers vertegenwoordigt omdat zij waarde produceren door middel van arbeid, is het niet meer dan logisch dat er een datavakbond is die de belangen van burgers vertegenwoordigt in hun waardeproductie door middel van data.

Aan de hand van verschillende Nederlandse voorbeelden zullen we in dit artikel laten zien hoe dit democratische tekort bij dataproductie leidt tot een fundamentele aantasting van de belangen van burgers. En waarom de organisatie van een democratische tegenmacht noodzakelijk is.

Wat zijn data?
In welke gevallen dreigen de belangen van burgers geschaad te worden en zou een datavakbond deze belangen kunnen behartigen? Om de problematische aspecten van (grootschalige)dataverzameling en de belangen van burgers hierin goed te begrijpen, is het nodig eerst in te gaan op de precieze betekenis van ‘data’.

Een veelgebruikte definitie van data is ‘de vastgelegde uitdrukking van een feit’. Dit klinkt misschien wat ingewikkeld, maar de achterliggende principes kennen we allemaal; bijvoorbeeld als we een foto maken op vakantie. Ook een vakantiefoto bestaat uit data. Door tijdens je vakantie bij een mooi gebouw op het knopje van je digitale camera te drukken, leg je een ‘feitelijke gebeurtenis’ vast. De digitale foto is een ‘vastgelegde uitdrukking’ van die feitelijke gebeurtenis.

De foto geeft letterlijk een momentopname weer van je vakantie. Niet alles van de feitelijke gebeurtenis laat de foto zien. Hoe de zon voelde, de geur van het restaurant om de hoek…. dit kun je er allemaal niet uit aflezen. Het is enkel een grove weerspiegeling van dat moment. De wijze waarop de foto de ‘feitelijke gebeurtenis’ vertegenwoordigt is bovendien onder andere afhankelijk van hoe de fotograaf de foto wenste te nemen, de instellingen van de camera op dat moment en het type of de kwaliteit van de camera. Kortom, data is altijd een reductie van de werkelijkheid waarvan de contouren worden bepaald door degene die de data produceert.

Het vastleggen van ‘de uitdrukking van een feit’ maakt het mogelijk om deze makkelijk en op grote schaal met anderen te delen. Aan de hand van de vakantiefoto kun je bijvoorbeeld heel gemakkelijk aan vrienden en familie, een indruk geven van je vakantie. Of je dit nu doet door de foto thuis op een computerscherm te laten zien, of door deze op Facebook en instagram te delen. Zij kunnen allemaal dat stukje data zien, de vastgelegde uitdrukking van jouw feitelijke vakantie.

Als je vrienden door hun tijdlijn scrollen en je foto langs zien komen, bepaalt dit stukje data hun beeld van jouw vakantie. Zij weten niet hoe de zon voelde, hoe het restaurant om de hoek rook, wie niet op de foto stonden of hoe je je op dat moment precies voelde. En naar gelang van tijd, vergeet je ook zelf steeds meer hoe de vakantie was. Dat stukje data blijft echter bestaan. Op je camera, of ergens op het internet. En op de momenten dat jij of je vrienden herinneringen wil ophalen aan de vakantie, kijk je weer naar de foto. Beetje bij beetje, omdat de foto wel blijft bestaan, vervangt de foto je herinnering. Beetje bij beetje zijn ze moeilijker van elkaar te onderscheiden. Beetje bij beetje wordt dat stukje data voor jou de feitelijke gebeurtenis.

Data zijn overal
Het nemen van een foto is slechts één manier waarop je een feit kunt vastleggen. Ook beschrijvingen, temperatuurmetingen, filmopnames en geluidsopnames vallen bijvoorbeeld onder data. En ook een notitie van een student die te laat komt op school, of de diagnose die de dokter invoert in zijn systeem, de info over welke sites iemand bezoekt[1], de waarnemingen die een wetenschapper tijdens een experiment verzamelt, zijn allemaal vormen van data. Het zijn allemaal vastgelegde feiten, die hun betekenis krijgen door gebruik (van data naar informatie).

En, om het nog ingewikkelder te maken, door het combineren van data kan weer nieuwe data gevonden worden. Het op lange termijn verzamelen van de locatiegegevens van een persoon kan bijvoorbeeld inzicht geven in wat diens vaste supermarkt is, of waar de persoon werkt, om maar iets te noemen.

De afgelopen jaren zijn de technologische mogelijkheden om data te produceren, combineren en analyseren onvoorstelbaar gegroeid. Non-stop zijn we in contact met systemen die continu data over ons verzamelen: de mobiele telefoon die we de hele dag bij ons hebben, websites waarop we ons begeven, smart devices in het huishouden, digitale informatiesystemen van de overheid, noem het maar op.

Er worden dus, om in de analogie van de foto te blijven, continu momentopnames van ons gemaakt. Echter in plaats van zelf aan de knoppen te zitten van het fototoestel, weten we vaak nagenoeg niets van wie ‘de foto’ maakt, wanneer, hoe vaak, met wie deze wordt gedeeld, waarom deze wordt gemaakt, wat voor ‘collages’ ervan worden gemaakt, met wie deze collages worden gedeeld en waarom, wat er wordt afgeleid uit de foto en hoe alles wat op de foto staat ook tegen ons kan worden gebruikt. En, evenals dat een vakantiefoto onze herinnering aan de feitelijke vakantie kan vervangen, dreigen, als we als burgers niet uitkijken, deze data ons steeds meer te vervangen. We dienen in ieder geval een stem te hebben in de productie ervan, zodat we ons kunnen vinden in de afspiegelingen die worden gemaakt.

Data-democratie
Data an sich is niet goed of slecht. De ‘wenselijkheid’ van data is onder andere afhankelijk van wie de data in bezit heeft, hoe deze ‘geconstrueerd’ wordt en wat er mee wordt gedaan. Het openbaar maken en delen van wetenschappelijke data biedt bijvoorbeeld nieuwe kansen voor wetenschappelijke vooruitgang; in de preventieve geneeskunde en bij het maken van klimaatmodellen. Aan de andere kant kan een grootschalige verzameling van persoonsgegevens worden ingezet om personen gericht te manipuleren en populaties te controleren, en daarmee de democratie te ondermijnen.

Doordat burgers op dit moment maar beperkt betrokken zijn bij de data die ze produceren, werkt het product maar al te vaak niet in hun voordeel. Terwijl de afgelopen decennia zowel de productie van data als de betekenis ervan in de maatschappij enorm is toegenomen, worden de belangen die burgers hierbij hebben echter niet evenredig vertegenwoordigd. Zij zijn vaak slechts beperkt in het bezit van (hun) data en hebben vaak geen stem in de constructie en de toepassing ervan. Met het oog op het toenemende belang van data[2], impliceert dit dus een democratisch deficit.

Multinationale ondernemingen en intransparante overheden hebben het voortouw in welke data verzameld wordt, hoe deze verzameld wordt en wat er mee gedaan wordt. De datavakbond is er om burgers te vertegenwoordigen in al de wijzen waarop het verzamelen, de extractie en delen van data tegen hun belang in gaat. Een tegenmacht dus. Waar moeten we precies aan denken als we het hebben over het belang van burgers op het gebied van data?

Acht problematische punten
Er zijn in ieder geval 8 punten te noemen waarbij het belang van burgers geschaad wordt bij de verzameling, analyse en gebruik van data. Om te laten zien dat het niet slechts gaat om Amerikaanse toestanden en het organiseren van tegenmacht urgent is, illustreren we elk punt aan de hand van een Nederlands voorbeeld.

Een eerste problematisch punt is dat burgers vaak niet weten wat over hen verzameld wordt en wat daar vervolgens mee wordt gedaan. Dit gaat tegen hun belang in; in feite is dit namelijk een kwestie van voorliegen. De burger of consument heeft, vaak zonder het te weten, een overeenkomst gesloten zonder de precieze kosten hiervan voor hem/haar te weten.

In Nederland is onder andere Talpa bezig om op grote schaal persoonsgegevens te verzamelen met als doel om van iedere Nederlander een zo gedetailleerd mogelijk persoonlijk profiel aan te leggen.[3] Gegevens die met derde partijen worden gedeeld. Weinig Nederlanders zijn hiervan op de hoogte, zeker als het gaat om de informatie die uit de combinatie van data kan worden gehaald. De grote vraag is burgers daarmee op de hoogte zijn van de daadwerkelijke kosten; persoonlijke data is immers geld waard.

Een tweede punt is dat veel van de classificaties die op basis van data worden gemaakt een grote invloed op het leven van burgers uitoefenen, terwijl zij geen zeggenschap hebben over de totstandkoming hiervan. De ‘feiten’ komen tot stand zonder democratische raadpleging, controle en transparantie. Het gevolg is de creatie van een digitale werkelijkheid waarin het perspectief van de burger niet is meegenomen en die daardoor vaak tegen het belang van deze is.

Onlangs bleek bijvoorbeeld dat incassobureau’s op basis van grootschalige dataverzameling, zonder hen te informeren, financiële profielen van miljoenen Nederlanders opstelden.[4] Burgers konden aan de hand van deze profielen geweigerd worden voor verzekeringen, bij energiemaatschappijen en sociale huurwoningen. Ook gegevens als ‘herkomst achternaam’ of de taalfouten die iemand maakte bij het invullen van een online formulier werden in sommige gevallen meegenomen. Niet alleen krijgen private partijen hierdoor de mogelijkheid om op arbitraire gronden burgers van sociale voorzieningen te ontzien, het feit dat de samenstelling van deze risicoprofielen voor burgers onbekend is, maakt het voor hen onmogelijk om er op te anticiperen en zich er tegen te verdedigen. Transparantie en voorspelbaarheid zijn echter fundamentele voorwaarden voor een uitoefening van het recht.

Een ander problematisch punt is dat er aan de hand van verzamelde data over burgers steeds meer surveillance plaatsvindt. Het gevolg hiervan is een toenemende asymmetrie van kennis en macht in de samenleving. Burgers moeten daarnaast privacy kunnen opeisen; recht hebben om niet bekeken en met rust gelaten te worden.

Talloze bedrijven en overheden in Nederland verzamelen op dit moment al op grote schaal gegevens over hun werknemers met als doel hun effectiviteit te vergroten.[5] De surveillance van werknemers gaat steeds verder, ook gemoedstoestand, gezondheid, burgerschap, stressniveau, psychologisch profiel worden steeds vaker gemonitord om het ‘menselijk kapitaal’ in te kunnen schatten. In sommige gevallen worden zelfs e-mails van werknemers gescand op taal die een emotionele lading heeft, of wordt hen gevraagd DNA af te staan. Zonder dat werknemers er inzicht en zeggenschap over hebben, of er zelfs maar van op de hoogte van zijn, worden dergelijke data gecombineerd in modellen die zogenaamd vertellen wat ze waard zijn. Het risico is dat werknemers zich in hun gedrag, verwoordingen en keuzes tot in de kleinste details gaan schikken naar de voorkeuren van hun superieuren.

Deze asymmetrie in macht is nog problematischer als het gaat om de organisatie van tegenmacht. De verwevenheid van datagiganten en overheden, onder andere in uitwisseling en informatie, is rijk gedocumenteerd.[6] Data zoals locatie, de plek van iemand in netwerken als Facebook en LinkedIn, iemands activiteit op het internet, bieden een schat aan potentiële informatie om activisten in de gaten te houden en hun activiteiten te voorspellen. De vraag in welke mate dit in Nederland al gebeurt is niet per se relevant, kern is dat er een gigantische ongelijkheid bestaat met betrekking tot wie de middelen hebben om dergelijke gevoelige data te produceren, analyseren en te kopen, en zij die dat niet hebben. Burgers en civil society delven hierbij op dit moment het onderspit tegenover Big Tech, grote bedrijven en overheden. Scheidslijnen hierin worden nog eens versterkt door de grote verschillen die er zijn tussen zij die wel hoogopgeleid, digi- en datavaardig zijn, en zij die dat niet zijn.

Dataficering van publieke diensten gaat vaak gepaard met een verkapte privatisering ervan. Het zijn met name grote bedrijven geweest die het voortouw hebben genomen in het benutten van alle mogelijkheden van (Big) data. Een gevolg hiervan is geweest dat grote delen van bijvoorbeeld onze sociale/kennis infrastructuur in handen liggen van deze partijen. Zaken als de weg vinden, informatie ergens opzoeken en films kijken gebeuren voor veel mensen via de ondernemingen van AlphaBet. Het onderhouden van vriendschappen en onderling contact gaat via Facebook en Whatsapp. Zij wisten op tijd een verdienmodel te vinden om de grootschalige dataverzameling bij deze praktijken te kapitaliseren.

Deze bedrijven lopen in de meeste gevallen voorop met betrekking tot de infrastructuur, kennis, opleidingen en technologie om data te verzamelen, te analyseren en te exploiteren. Deze voorsprong heeft er toe geleid dat ook vele overheden, publieke instanties en maatschappelijke organisaties bij dergelijke bedrijven aankloppen om gebruik te maken van de mogelijkheden van data. Het gevolg is dat deze bedrijven zich in toenemende mate geïntegreerd raken in publieke infrastructuren. Big Tech mengt zich bijvoorbeeld in de netwerken en apparatuur van ziekenhuizen in Nederland[7], Google laat zich in met de kennisinfrastructuur van kennisinstellingen[8] en Facebook wordt gevraagd de poortwachter te zijn over Fake News. Dit geeft hen invloed op talloze terreinen waar de belangen van de burger (in de hoedanigheid van bijvoorbeeld patiënt, student, onderwijzer, verdachte etc) in conflict komen met de particuliere belangen en het verdienmodel van deze bedrijven.

Deze ontwikkeling wordt versterkt doordat naïviteit en onwetendheid bij bestuurders en beleidsmakers ten aanzien van de mogelijkheden van data en hypes die spelen rondom aanverwante technologieën, zoals AI, er toe leidt dat, bijvoorbeeld, het sociale domein wordt vormgegeven door private partijen. Onder het mom van de hippe retoriek van Smart Cities zetten verscheidene Nederlandse gemeenten de privacy van hun bewoners in de uitverkoop.[9] Systemen, bijvoorbeeld rondom predictive policing, gebouwd in kortlopende projecten door private partijen, nemen de bevoogdende taken over van sociaal betrokken mensen.

Het feit dat slechts enkele bedrijven de beschikking en beheer hebben over het overgrote deel van data in de wereld, impliceert in vele gevallen dat zij op verschillende terreinen de meeste kennis in handen hebben. Dit creëert een eenzijdige afhankelijkheid van zowel burgers als overheden. Een afhankelijkheid waar deze bedrijven bewust gebruik van kunnen maken.

Een leven zonder Facebook, Whatsapp en Google is voor veel mensen moeilijk voor te stellen. Het gebruik ervan heeft zich ingenesteld in bestaande gewoonten en sociale structuren. Big tech zet bewust psychologische instrumenten als social pressure en inzichten uit de gokindustrie in om deze afhankelijkheid te vergroten.[10] De enorme hoeveelheid data die een bedrijf als Google produceert, zorgt er ook voor dat ze meer nog dan veel overheden inzicht hebben in zaken als de geografie van het land, de gezondheid of psychologische gesteldheid van een bevolking, de aankopen in de economie, culturele trends en de verbondenheid van verschillende sociale groepen. Voor veel partijen, zoals overheden, wordt het steeds verleidelijker om bij Big Tech aan te kloppen voor deze informatie. Het risico bestaat dat dergelijke intransparante bedrijven bestaande bronnen van kennis, zoals de wetenschap en kennisinstellingen vervangen als autoriteiten op het gebied van de waarheid en wijsheid.

Verregaande dataficering van het publieke domein reduceert burgers tot objecten. Het institutionaliseren van datagedreven beleid impliceert het uit de weg gaan van het contact en het gesprek tussen burgers en overheden. Dit versterkt een wederzijds wantrouwen en verwaarloost de menselijke component van onze verzorgingsstaat.

Verschillende gemeenten in Nederland experimenteren bijvoorbeeld met algoritmen die op basis van big data zaken als criminaliteit, schooluitval en huiselijk geweld zouden kunnen voorspellen.[11] In plaats van met betrokkenen, ervaringsdeskundigen en professionals in gesprek te gaan over de beste oplossingen, wordt beleid afgeleid op basis van modellen van bedenkelijke kwaliteit. Het is van essentieel belang, onder andere vanwege de complexiteit van sociale problemen en het belang van het blijven voeren van het gesprek tussen verschillende groepen onderling en met beleidsmakers, dat hier voorzichtig mee wordt omgegaan.

Dataverzameling en het trainen van AI worden geacht cruciaal te zijn voor het oplossen van grote opgaven van deze tijd, zoals de ecologische crises en stijgende gezondheidskosten vanwege vergrijzing.[12] In hoeverre is het wenselijk dat de technische mogelijkheden hiertoe enkelvoudig in handen wordt gelegd van enkele multinationale ondernemingen die een commercieel oogmerk hebben en die niet of slechts indirect verantwoording hoeven af te leggen aan kiezers of aan de internationale (humanitaire) verdragen, afspraken en akkoorden waar landen aan gebonden zijn?
Grootschalige dataverzameling vergroot de mogelijkheden om het gedrag van mensen te beïnvloeden. Door het gedrag van mensen in kaart te brengen en hier regelmatigheden in te onderscheiden, is het voor datamonopolisten ook mogelijk om steeds specifieker instrumenten te ontwikkelen om het gedrag te sturen.

Het schandaal van Cambridge Analytica maakte duidelijk dat dit gevaren kan opleveren voor de democratie, aangezien organisaties heel gericht content kunnen inrichten op basis van de onzekerheden en angsten van specifieke groepen. Sommige van deze groepen zijn bovendien extra vatbaar voor nepnieuws, wat kan zorgen voor gerichte politieke manipulatie.

Aangezien bovenstaande 8 punten raken aan fundamentele mensenrechten, zoals het recht op privacy en gelijke behandeling, en aan voorwaarden voor het functioneren van democratie, dan wel de rechtstaat, volgt het logischerwijze dat burgers hierbij een stem moeten krijgen. De datavakbond kan hieraan bijdragen.

Bronnen:

[1] https://medium.com/s/story/the-complete-unauthorized-checklist-of-how-google-tracks-you-3c3abc10781d

[2] https://www.economist.com/news/leaders/21721656-data-economy-demands-new-approach-antitrust-rules-worlds-most-valuable-resource

[3] https://www.groene.nl/artikel/allemaal-in-johns-dierentuin

[4] https://www.groene.nl/artikel/u-staat-op-een-zwarte-lijst

[5] https://www.groene.nl/artikel/privacy-achterhaald

[6] Zie bijvoorbeeld: https://www.wired.com/story/is-big-tech-merging-with-big-brother-kinda-looks-like-it/

[7] https://www.ad.nl/binnenland/ook-jouw-medische-data-liggen-nu-bij-google~abcb3f6a/?referrer=https://www.google.com/

[8] https://www.volkskrant.nl/columns-opinie/digitalisering-bedreigt-onze-universiteit-het-is-tijd-om-een-grens-te-trekken~bff87dc9/?referer=https%3A%2F%2Fwww.google.com%2F

[9] https://www.groene.nl/artikel/de-muren-hebben-sensoren

[10] https://www.theguardian.com/technology/2018/may/08/social-media-copies-gambling-methods-to-create-psychological-cravings

[11] https://www.groene.nl/artikel/niet-alles-wat-mogelijk-is-moet-je-willen