Kijk dieper in de data

Door Caroline Williams

In de wereld van data zou je kunnen denken dat het allemaal om de cijfers gaat. Hoe vaak zag je een kop zoals “89% van de Nederlanders denkt X”? Heb je jezelf ooit afgevraagd: “Hoe weten ze dat?” Als je zo’n zin ziet, accepteer je die dan als de waarheid?

Het klinkt overtuigend en heel feitelijk, nietwaar? Dat 89% van de Nederlanders, je medeburgers, allemaal X denken. Misschien is het een mening over het klimaat, de kosten van energie, immigratie, minimumloon of een ander onderwerp in het nieuws. Ze kunnen allemaal X zijn.

Volgens het Centraal Bureau voor de Statistiek (CBS) woonden er op 31 december 2022 ongeveer 17.815.508 mensen in Nederland. Hoeveel is 89% van dat aantal? Dat zouden 15.855.802,12 mensen zijn. Heeft iemand de tijd genomen om al die mensen hun mening over X te vragen? Is dat hoe ze tot de resultaten van hun artikel zijn gekomen?

Hoe groot acht je de kans dat meer dan 15 miljoen mensen het erover eens zijn om over één onderwerp op dezelfde manier te denken? Vergeet niet dat het 89% van de bevolking is, dus dat betekent dat je nog steeds de hele bevolking van het land de vragen moet stellen die je onderzoekt. Hoe lang denk je dat dat zou duren? Laten we zeggen dat het een zeer korte vragenreeks is, duurt 5 minuten per persoon. Het zou je 89.077.540 minuten of 1.484.625,67 uur of 37,12 weken fulltime (40 uur) werk kosten.

Kun je je voorstellen dat dit elke keer werd gedaan als iemand een artikel wilde schrijven over een bepaald onderwerp en hoe wij burgers ons daarbij voelden? Als je begint te zeggen “Ik geloof niet dat ze dat zouden doen”, dan begin je al te denken als een datamens. Het eerste dat ieder van ons kan doen als we een grote verklaring zoals de genoemde zien, is onszelf afvragen: “Ik vraag me af welke gegevens ze gebruiken?”

Het stellen van vragen over waar de gegevens vandaan komen, is de sleutel. Iemand die goede datavaardigheden beoefent, zal in zijn artikel zijn gegevensbronnen vermelden. Dit omvat gegevens die ze gebruiken van derden zoals het CBS. Hiertoe hoort ook informatie over de omvang van de onderzoekspopulatie. Bijvoorbeeld het totale aantal mensen dat ze hebben geïnterviewd, en hun leeftijdscategorieën. Bijvoorbeeld dat ze voor het artikel 2000 volwassenen tussen de 18 en 64 jaar vroegen naar hun mening over X. Er is een groot verschil tussen 89% van de 2000 ondervraagden en 89% van de bevolking van Nederland. De eerste groep is 1780 mensen, de tweede de meer dan 15 miljoen van hierboven.

Neem ook de tijd om te kijken waar de data echt vandaan komt. Is dit allemaal uit gegevens die zelf zijn verzameld of is het samengevoegd uit een aantal bronnen? De belangrijkste factor bij data is context. Dit betekent inzicht in de omstandigheden en omgeving waaruit de gegevens worden verzameld. Het gebeurt dat gegevens uit veel verschillende bronnen worden samengevoegd in één allesbeheersend model en dat zijn over het algemeen gegevens die context missen.

Wanneer je een artikel leest of hoort dat verwijst naar statistieken en gegevens, neem dan een moment en stel enkele vragen over de gegevens. Help anderen om je heen ook om die vragen te leren stellen. Wanneer we dat als samenleving doen, is de kans groter dat we nauwkeurigere gegevens en informatie krijgen. Als iemand niet bereid is om informatie over zijn gegevensbronnen te delen, dan hebben ze iets te verbergen. De vraag is alleen wat.

Datakluizen: een goed idee?

Door Peter Vieveen en Tijs Sikma.

Deze beschouwing is gebaseerd op een bijeenkomst van de werkgroep inhoud.  Wil je reageren? Stuur een mail naar inhoud@datavakbond.nl  

Is een datakluis een oplossing of een probleem?  De afgelopen maanden verschenen er verschillende artikelen in de media over datakluizen. NPO, RTL/Talpa en mediahuizen als DPG Media willen Nederlanders een datakluis aanbieden zodat iedereen individueel zijn eigen persoonsgegevens kan beheren. Is dit een goede manier om burgers meer zeggenschap over hun persoonlijke data terug te geven en het monopolie van Big Tech op dit gebied te doorbreken? De werkgroep Inhoud van de Datavakbond ging er vorige week over in discussie. Dit waren een aantal van de belangrijkste conclusies:


 
1. Datakluizen zijn niet nieuw 
Ten eerste is het goed om te beseffen dat het idee van datakluizen niet nieuw is. Op dit moment kunnen Nederlanders hun gezondheidsgegevens bijvoorbeeld delen in persoonlijke gezondheidsomgevingen (PGO). Met een PGO kan iedere Nederlander zijn gezondheidsgegevens beheren in een app of op een website. Bijvoorbeeld de gegevens die in het systeem staan bij het ziekenhuis, de huisarts en de verloskundige. Aan een PGO kunnen ook eigen gegevens worden toegevoegd, bijvoorbeeld uit gezondheidsapps. Gebruikers kunnen gegevens via de gezondheidsapps combineren en delen. Ze staan los van de reguliere uitwisseling van gegevens tussen zorginstellingen.

Bij deze omgevingen bestaat echter nog grote onduidelijkheid over hoe de eigenaarschap van de data en de kluizen en de bijbehorende financiering geregeld is.  Wie heeft er toegang tot de data en welke waarborgen worden er gegeven om misbruik en oneigenlijk gebruik te voorkomen? Hier zou eerst meer duidelijkheid over moeten komen, voordat nieuwe initiatieven rondom datakluizen worden omarmd.
 
2. Is de gemiddelde Nederlander voldoende datavaardig voor het gebruik van datakluizen? 
Het initiatief van datakluizen veronderstelt dat Nederlanders rationele keuzes zullen maken over de persoonsgegevens die in een dergelijke kluis staan opgeslagen. In de meeste huidige voorstellen zullen deze omgevingen in handen zijn van commerciële aanbieders. De handel in persoonsgegevens op basis van deze kluizen zal evident op basis van een commercieel belang gebeuren. Niet het belang van de burger staat centraal.

Er zal vermoedelijk worden geprobeerd om de gebruiker zoveel mogelijk te verleiden de eigen persoonsgegevens te delen. Een ‘consent’ is zo gegeven. Risico’s omtrent persoonsgegevens zijn echter complex en niet altijd direct te overzien. Eenmaal vrijgegeven kunnen deze bij wijze van spreken eeuwig en op grote schaal verder verspreid worden. En wat als bepaalde gegevens niet alleen gevoelige informatie over jezelf, maar ook over vrienden en familie verraden? Tot slot kan de koppeling van verschillende losse gegevens die op het eerste oog onschuldig lijken, gecombineerd toch grote risico’s met zich meedragen.
 
3. Welk probleem wordt precies opgelost met de datakluizen? 
Dat mediahuizen geïnteresseerd zijn in de persoonsgegevens van consumenten voor de verkoop van advertenties is logisch. Echter: welk maatschappelijk belang wordt hier mee gediend? Dat zorginstellingen ook datakluizen willen introduceren is minder logisch. De PGOs ondersteunen twee verschillende functies: toestemming geven welke zorginstellingen jouw persoonsgegevens mag gebruiken en inzicht in je patiëntgegevens zelf. De eerste kamerfractie van D66 heeft hierover vragen gesteld aan de minister:

‘De leden van de fractie van D66 constateren twee functies van een PGO: (1) het inzien van eigen patiëntgegevens en (2) het verlenen van toestemming voor gegevensuitwisseling. In dit licht willen zij weten waarom in PGO’s de medische gegevens niet losgekoppeld worden van de metadata (de contextuele patiëntgegevens) en het daarmee mogelijk maken om de medische gegevens alleen beschikbaar te stellen aan de patiënt en zorgverleners terwijl de metadata enkel regelen aan wie toegang tot de medische gegevens wordt verleend.

Het verdienmodel van persoonsgegevens kan op dit moment al op veel kritiek rekenen en heeft zijn tijd gehad. Daarnaast zien we een trend dat er meer handel komt in verkoop van profielen en andere metadata. Waarom zou er nog een infrastructuur opgetuigd worden die dit stimuleert?

In sommige artikelen wordt gesuggereerd dat op deze manier de monopoly-positie van Big Tech kan worden doorbroken. Dit lijkt ons een onzinnige stelling. Het schept immers alleen maar meer manieren waarop persoonsgegevens van individuen kunnen worden verkregen. Niets houdt bovendien deze mediabedrijven tegen om – als men heeft ingestemd om de eigen datakluis te openen – deze gegevens verder door te verkopen aan een Google of Facebook. Niets houdt commerciële aanbieders in de zorg tegen om gratis diensten aan te bieden als de gebruiker toestemming geeft voor gebruik van de data. Denk bijvoorbeeld aan DNA-testen. Leuk dat dat kan, maar is de burger voldoende beschermd voor de  negatieve aspecten hier van?

De datakluizen reduceren privacy wederom tot een individueel probleem. Dit terwijl de afgelopen jaren duidelijk is geworden dat de losse omgang met persoonsgegevens tot grootschalige collectieve problemen heeft geleid. Denk aan de profilering van activisten en het beïnvloeden van verkiezingen.

4. Meer data is niet per se beter 
Onderliggend aan het initiatief van datakluizen ligt ook een naïeve opvatting ten opzichte van data. Namelijk: hoe meer mogelijkheden er in de maatschappij bestaan voor mensen om hun data te delen, hoe beter. De fragmentatie van persoonsgegevens in verschillende omgevingen, maakt het echter niet alleen voor toezichthouders om voldoende controle te houden, het brengt ook allerlei extra kosten met zich mee. Moeten we echt nog meer kopieën van onze data in andere omgevingen hebben staan? Voor de uitwisseling van data binnen de zorg hoeft de burger geen toegang tot zijn patiëntengegevens. De metadata volstaat. Om een ziekenhuis of een andere zorginstelling toestemming te geven voor gebruik van jouw patiëntendata heb je geen detailgegevens nodig. Deze data is al beschikbaar in een electronisch patiëntendossier (EPD). Waarom dan toch de patiëntendatabase kopiëren naar een aparte omgeving waar commerciële aanbieders toegang toe kunnen krijgen?

Er is niet een tekort aan omgevingen die onze data opslaan, er is een tekort aan effectief en bewust gebruik van de data die we al hebben. Als we weer de PGO’s in de zorg erbij halen; mensen zijn best bereid om meer gezondheidsgegevens te delen om medisch onderzoek vooruit te helpen, waarom moet hier dan echter een nieuwe markt voor worden gecreëerd? Helpt dat de zorg echt vooruit?

In het antwoord op de vragen van D66 geeft de minister aan de problemen niet te herkennen. Hij geeft aan: “Ik deel deze opvatting niet. In ben voornemens, mocht uw Kamer instemmen met de Wegiz, bij AMvB onder de Wegiz te regelen dat zorgaanbieders de gegevens enkel aanbieden aan PGO leveranciers die zijn gehouden aan het MedMij-afsprakenstelsel via een MedMij certificaat. Hierin staat onder andere dat patiëntgegevens niet voor andere doeleinden mogen worden gebruikt door deze leveranciers. Cliënten kunnen wellicht op termijn zelf kiezen om hun gegevens, voor bijvoorbeeld onderzoek, beschikbaar te stellen, maar hiervoor zijn op dit moment geen technische mogelijkheden in PGO’s. Ook volgt uit de AVG dat niet meer persoonsgegevens mogen worden verwerkt dan noodzakelijk en dat persoonsgegevens niet zonder meer voor andere (commerciële) doelen kunnen worden gebruikt. “

De minister geeft geen enkel argument waarom de functies niet gescheiden zijn. Het gevaar van datalekken wordt volledig genegeerd. De minister legt de verantwoordelijkheid van het beheer van de patiëntengegevens volledig bij de burger.

Hij zegt: “Een PGO kent verder op dit moment geen aparte functie om toestemming te geven voor gegevensuitwisseling buiten een PGO om.” Wederom wordt er niet op de metadata ingegaan. In elke willekeurige privacy statement van een PGO-aanbieder is te lezen dat metadata verzameld gaat worden voor intern gebruik. Denk aan google analytics, maar ook verzoeken naar zorginstellingen. De handel in metadata is groeiende. Dat mag conform de AVG. Is het verstandig om dat ook met metadata uit een PGO te doen?
 
5. Kijk eerst naar bestaande systemen voor het veilig en doordacht delen van data 
Voordat we datakluizen willen omarmen als nieuw mechanisme om persoonlijke gegevens te beheren, is het belangrijk eerst te kijken naar de al bestaande privacy-vriendelijke initiatieven.

Het vrijwillig delen van je gegevens voor bijvoorbeeld kankeronderzoek kan al onder andere middels de common European Data Spaces. Een ander initiatief is het Vlaamse datanutsbedrijf, een omgeving die berust op privacy-by-design principes en dataminimalisatie. Hierin kan de gebruiker data delen, specifiek voor specifieke personen en voor een afgebakende periode. Bovendien wordt de omgeving beheerd door een agentschap van de Vlaamse overheid, en niet een private partij.

Een ander voorbeeld is AMdEX, waarbij een digitale notaris bemiddeld tussen de aanbieder en de afnemer van data, en daardoor het doordacht delen van data stimuleert.

Door het gebruik van metadata zullen we ook de vraag moeten stellen of de wet daar voldoende antwoorden op heeft. Uit onderzoek blijkt dat het combineren van metadata uit verschillende databronnen de identificatie weer in gevaar komt. Metadata is nu niet geregeld in de AVG.

6. Zowel de overheid als burgers zullen moeten leren accepteren dat datadiensten niet gratis kunnen zijn 
We zijn niet gewend om in economische termen na te denken over het beheer van onze data. Het is iets wat ongrijpbaar en onzichtbaar lijkt. Enorm grote technische infrastructuren van private partijen worden nu betaald met het geld dat wordt verdiend op basis van de advertentie-inkomsten uit onze persoonsgegevens. Er is meer maatschappelijke bewustwording nodig over het feit dat wat jij online prijsgeeft geld waard is en beschermd dient te worden.

Te vaak leunt de overheid op de digitale omgevingen waarvan de aanbieders hun investeringen koste wat koste terug moeten verdienen op basis van de verzameling van persoonsgegevens. Ook in het geval van de datakluizen van mediabedrijven schept dat geen goede duurzame samenwerking. Het is voor digitale omgevingen met een maatschappelijke functie – zoals ook de journalistiek – de moeite waard om de persoonsgegevens (en daarmee ook de rechten van mensen) te borgen. Willen we echt dat de journalistiek nog meer persoonsgegevens als verdienmodel gaat omarmen, is het niet belangrijk om een stabielere vorm van financiering hiervoor te hebben?

Onzichtbare vrouwen

Eens in de zoveel tijd lees je een boek dat je kijk op de wereld compleet op z’n kop zet. ‘Onzichtbare vrouwen; waarom we leven in een wereld voor en door mannen ontworpen’ geschreven door Caroline Criado Perez was voor mij zo’n boek. Het brengt de verborgen manieren in kaart waarop vrouwen over de hele wereld vergeten worden en welke impact dit heeft op hun leven. Datasets gebaseerd op mannen zijn de standaard en vrouwen de uitzondering. De default is man. Deze vorm van ongelijkheid kan bovendien alleen maar groter worden door de steeds grotere invloed van algoritmen en big data, mits we hier niet actief verandering in brengen. 

Een bizar en illustratief voorbeeld is het sneeuwschuiven in een stadje in Zweden. Tijdens een herziening van het beleid op gender ongelijkheid kwam het lokale bestuur erachter dat sneeuwschuiven vrouwen beduidend meer achterstelt dan mannen. In de winter werden namelijk eerst de autowegen ontdaan van sneeuw en daarna pas de stoepen. De autowegen werden echter merendeels door mannen gebruikt en de stoepen door vrouwen. Uit onderzoek van de data van het lokale ziekenhuis bleek dat er in de winter 79% meer ongelukken met voetgangers plaatsvonden dan in andere maanden. Daarbij werd tweederde van die ongelukken veroorzaakt door gladheid in combinatie met sneeuw. Er gebeurden naar verhouding drie keer zoveel ongelukken met voetgangers dan met motorvoertuigen. Vrouwen vormden ruim 70% van die voetgangers, doordat ze zich veel meer verplaatsen door het naar school brengen van kinderen, zorgtaken en boodschappen doen. Toen het stadje Karlskoga de volgorde van het sneeuwschuiven aanpaste en eerst voetgangerswegen ontdeed van sneeuw had dit een grote impact op de ziekenhuiscijfers. Ook leverde dit meer geld op, doordat er veel minder medische kosten als gevolg van ongelukken met uitglijden plaatsvonden. 

Bovenstaande voorbeeld illustreert de ‘genderdatakloof’. Deze ontstaat door een structureel gebrek aan gegevens over vrouwen. In het geval van het sneeuwschuiven bleek dat er onder het thema mobiliteit, jezelf verplaatsen voor het uitvoeren van zorg en voor het doen van boodschappen niet waren opgenomen. Dan wordt daar ook geen data voor verzamelt.  Mobiliteit werd voornamelijk begrepen als werk gerelateerde mobiliteit. Vrouwen bleken dus onzichtbaar in de data. Hoe kun je daar dan je beleid op aanpassen? Het probleem is niet dat vrouwen bewust worden achtergesteld, maar dat ze onbewust worden vergeten. Dit doordat degenen die het perspectief bepaalden voornamelijk een meerderheid vormen van witte mannen tussen de 25 en 40 jaar.  

Perez laat in haar boek aan de hand van vele wetenschappelijke onderzoeken zien hoe het vrouwelijk perspectief structureel mist in algoritmes en data. Denk bijvoorbeeld aan medische datasets waarin lichamelijke verschillen tussen mannen en vrouwen niet zichtbaar zijn.  Zo worden iPhones nog steeds gemaakt voor een gemiddelde mannelijke hand, ondanks dat Apple weet dat de meerderheid van iPhone bezitters vrouw is. Ook piano’s worden ontworpen voor de gemiddelde mannelijke handwijdte. Stemherkenning is ontworpen op de lagere stemmen van mannen en werkt bij vrouwen vaak niet (goed).

Daarnaast noemt Perez ook meer levensbedreigende voorbeelden als het ontbreken van testen van autostoelen op vrouwen en de invloed van medicatie. Een belangrijk voorbeeld van het verschil tussen het mannen- en vrouwenlichaam is het krijgen van een hartaanval. Lange tijd werd namelijk aangenomen dat de symptomen, zoals pijn op de borst, van een hartaanval voor mannen en vrouwen hetzelfde waren. Inmiddels weten we dat de symptomen wezenlijk verschillen. In Nederland hebben een aantal cardiologen zoals Prof. Angela Maas (Radboud UMC), Dr. Janneke Wittekoek (oprichter HeartLife Kliniek Utrecht) en Dr. Harriette Verwey (LUMC) bijgedragen aan meer bewustzijn over dit onderwerp en zetten zij zich actief in voor genderspecifieke geneeskunde. Het vrouwenlichaam is écht anders dan het mannenlichaam.

Ondanks dat we steeds meer aandacht is voor de genderdatakloof, blijft het vandaag de dag een urgent thema. Tijdens de COVID-19 pandemie waarschuwde de Gates foundation nog voor seksistische en onvolledige data. Vrouwen worden op een andere manier geraakt door de pandemie (o.a. stijging huiselijk geweld en een grotere kans op het verliezen van hun baan) en we kunnen dit niet eens volledig in kaart brengen door een gebrek aan data. Bovendien bevat minder dan de helft van de gemelde COVID-19 gevallen informatie over zowel gender als leeftijd. Een ander voorbeeld dat mij onlangs verbaasde was toen ik mij verdiepte in de hersenziekte waar ik zelf aan lijd: migraine. Deze ziekte komt veel vaker voor bij vrouwen dan bij mannen. Lange tijd is deze ziekte mogelijk hierdoor bestempeld als psychosomatisch en veel minder serieus genomen. Medisch onderzoek naar migraine bevatte ook nog eens voornamelijk mannelijke proefpersonen en proefdieren. Helaas staat hierdoor gedegen onderzoek naar migraine nog in de kinderschoenen. Dit terwijl het onze samenleving veel geld kan opleveren door minder ziekteverzuim wanneer er preventieve medicatie op de markt komt. 

We moeten echter niet vergeten dat het tegenovergestelde ook gebeurt; juist een teveel aan data kan ook tegen vrouwen worden gebruikt. Kijk naar de Verenigde Staten. Het hooggerechtshof trok de abortuswet van het land in, waardoor de wetten van de individuele staten weer van toepassing gaan zijn wat in sommige staten een verbod op abortus gaat betekenen Veel vrouwen houden hun menstruatie cycles bij met mobiele apps. Een zwangerschap en daarmee het uitblijven van menstruatie kan vervolgens uit die data worden afgeleid. Wat als deze data in verkeerde handen valt en vrouwen op basis hiervan worden aangeklaagd? In een land zonder privacy wetten zoals wij dat in Europe kennen is het niet verwonderlijk dat privacy experts daar nu groot alarm om slaan. 

Terug naar Perez. Naast alle medische verschillen beschrijft ze in haar boek ook een groot aantal economische verschillen te herleiden naar de genderdatakloof.  Denk bijvoorbeeld aan al het onbetaalde werk dat vrouwen uitvoeren voor zorg- en huishoudtaken. In Nederland besteden, ter illustratie, mannen 9.2% van hun tijd aan onbepaalde huishoud- en zorgtaken terwijl dit voor vrouwen 14.7% is. Dit verschil zie je zelfs terug in de top van de wetenschap. Vrouwelijke academici die meer onbetaald werk doen dan mannen zoals studenten coachen, notities maken en koffie halen. Ze worden namelijk minder goed beoordeeld als ze niet ‘aardig genoeg’ zijn. Schokkend is ook dat uit onderzoek blijkt dat papers die duidelijk door vrouwen geschreven worden 70% minder worden geciteerd. Een heel ander economisch voorbeeld wat ik zelf ook veel in het Nederlandse bedrijfsleven zie is dat er voor bedrijfsuitjes wel budget is voor een hotelovernachting zodat er gedronken kan worden, maar niet voor kinderopvang zodat een moeder ook mee kan. Hierdoor is het voor vrouwen moeilijker de top te bereiken. 

Met deze blog deel ik slechts een voorproefje van de vele wetenschappelijk onderbouwde voorbeelden die Perez aanhaalt. Het boek werd in 2019 dan ook winnaar van de science book prize. Lichtelijk ironisch wat mij betreft, aan de hand van wetenschappelijke data de genderdatakloof aantonen. Met veel humor en enthousiasme geschreven bracht dit boek mij vele nieuwe inzichten. Soms werkte het ontmoedigend, hoe kan ik mezelf opwerken in een wereld die mij zo tegenwerkt? Gelukkig is Perez ook duidelijk in het aandragen van een oplossing: luister en praat meer met vrouwen. En dat zie je ook in Nederland steeds meer gebeuren. Organisaties als Women Inc die zich actief inzetten voor dit thema helpen daar nog eens extra aan mee. 

Tot slot: waarom is dit een relevant onderwerp voor de Datavakbond? Wij komen op voor de belangen van dataproducenten en daar vallen vrouwen natuurlijk ook onder. Data inclusiviteit is wat ons betreft een belangrijk streven. De genderdatakloof laat zien dat we nog een lange weg te gaan hebben om deze vorm van discriminatie tegen te gaan. Het gaat tijd en energie kosten om onze datasets aan te vullen en beleid opnieuw in te richten. Een eerste stap is uiteraard een breder bewustzijn van het bestaan van dit probleem en hopelijk draagt deze blog daaraan bij. Wanneer we hier niets aan doen, gaat dit probleem alleen nog maar groter worden omdat onze wereld steeds meer data gedreven is. Met een incomplete dataset sla je dan al meteen een verkeerde afslag in. 

Mijn leestip voor deze zomer is uiteraard “Onzichtbare Vrouwen”. Hieronder nog de bronnen die ik heb gebruikt. Heb je commentaar op deze blog of heb je ideeën rondom dit thema voor de Datavakbond? Mail mij dan op laury@datavakbond.nl

Bedankt voor je aandacht,

 

Laury Buijs

Voorzitter de Datavakbond

 

 

 

 

Bronnen:

Boeken:

 • PEREZ, Caroline Criado, Invisible women: exposing data bias in a world designed for men. Vintage, 2019
 • CARRAY, Hans, Migraine is geen hoofdpijn. Brooklyn, 2022

Internet:

 • https://www.vnva.nl/media/rolmodel/prof-dr-angela-maas/
 • https://www.heartlife.nl/passie-preventie-vrouwenhart-2/janneke-wittekoek-2/
 • https://vrouwenhart.nl/nieuws-over-hartinfarct-bij-vrouwen-vrouwenhart/vrouwenhart-interview-met-harriette-verwey-voorvechter-van-het-vrouwenhart/
 • https://www.2doc.nl/documentaires/series/2doc/2020/april/de-slag-om-het-vrouwenhart.html
 • https://www.vox.com/recode/23059057/privacy-abortion-phone-data-roe
 • https://www.npr.org/2022/05/10/1097482967/roe-v-wade-supreme-court-abortion-period-apps?t=1656230519269
 • https://www.gatesfoundation.org/ideas/articles/stat-melinda-gates-sexist-covid19-data
 • https://www.womeninc.nl/
 • https://data.unwomen.org/country/netherlands
 • https://genderdata.worldbank.org/countries/netherlands/
 • https://www.theguardian.com/books/2019/sep/23/gender-data-gap-wins-royal-society-science-book-prize-caroline-criado-perez-invisible-women
 • https://www.nrc.nl/nieuws/2019/11/29/vrouwen-bestaan-of-ze-nu-moeilijk-zijn-of-niet-a3982159
 • https://reportersonline.nl/de-wereld-is-ontworpen-door-mannen-dat-kan-voor-vrouwen-zomaar-dodelijk-zijn/

Verslag ledenvergadering Datavakbond 2022

Op 14 mei vond de datadag plaats. In een zaaltje in Utrecht spraken onder andere Europarlementariër Paul Tang en Data-journalist Reinier Tromp, en werd er gestemd over de toekomst van de datavakbond.

Your Digital Footprint
De bijeenkomst begon met een presentatie van Daan Gerla over Your Digital Footprint. In dit project, gefinancierd door het SIDN-fonds, kan de digitale voetafdruk van gebruikers worden getoond. Elke voetafdruk die YDF visualiseert is een verzameling data van een bedrijf. Deze data kun je te weten komen door de data bij het bedrijf in kwestie op te vragen of door te kijken in de privacy voorwaarden van de website in kwestie. Op de vraag wat nu het vervolg van het project was, stelde Daan dat hij op zoek is naar vrijwilligers om de database te vullen. Er werd verder ook onder andere gevraagd of hij van tevoren ook marktonderzoek had gedaan. Daan zei wel contact met soortgelijke initiatieven – zoals cookiedatabase.org – te hebben gehad. Uit het publiek kwam nog het idee om een koppeling te maken tussen de gegevens die over je worden verzameld en de geschatte (maatschappelijke) schade die dit kan veroorzaken (bijvoorbeeld als je verzekeringspremie omhoog gaat, doordat de verzekering weet dat je aan een ziekte lijdt).

De ALV
Na deze eerste presentatie ging de ALV van start en volgden verschillende stemmingen. Achtereenvolgens werden de notulen van de vorige ALV en de agenda van de huidige ALV met grotere meerderheid aangenomen. Er volgden daarna nog enkele vragen over waar de statuten te vinden zijn en of de vergadering volgens de statuten eigenlijk wel in Utrecht mocht plaatsvinden (eigenlijk niet, maar niemand maakte bezwaar en Utrecht is vanwege de centrale locatie goed te verantwoorden).

Dan was het tijd voor de presentatie van het jaarverslag. De grote lijn was; na wisseling bestuur en gedurende coronaperiode is de organisatie van de datavakbond weer wat beter op orde. Er zijn vaste vergaderingen, twee werkgroepen lopen goed, sociale media is uitgebreid en ledenaantal blijft stijgen. Daarnaast is in het vorige jaar (2021-2022) oa het mooie project Data in Den Haag afgeleverd waarmee de datavakbond zich ook in de media weer even op de kaart zette.

Op de vraag of de datavakbond zich ook op alternatieve media wilde bewegen, was het antwoord dat het bestuur hier over wel wilde nadenken. Mastodon en Matrix zijn hiervoor mooie voorbeelden. Echter het zichtbaar blijven op de bestaande kanalen kost al moeite en er zijn ook goede redenen om juist op de grotere (en minder privacy-vriendelijke) mediaplatforms zichtbaar te blijven, zo stelde het bestuur.

Vervolgens stelden twee leden zich beschikbaar om als kascommissie de jaarrekening te controleren (spoiler: deze werd goedgekeurd). Terwijl dit werd gedaan, werd het afscheid van Daan Gerla als penningmeester van de datavakbond. Daan was er bij vanaf het prille begin en zal in het bestuur zeker worden gemist. Hopelijk blijft hij op andere manieren betrokken.

Hierna stelde de bestuurs-kandidaten zich voor waarop deze keer konden worden gestemd. Laury Buijs en Rogier Huurman wilden wisselen van hun rol als respectievelijk secretaris en voorzitter. Vanwege onder andere het krijgen van een kind, was de rol van secretaris voor Rogier een logische overstap. Laury stelde om als voorzitter zich vooral te willen richten op het verhelderen van de lange termijn doelen van de datavakbond en het verder uitbreiden van de zichtbaarheid en het ledenbestand.

En Arina Angerman stond kandidaat als nieuwe penningmeester. Arina vertelde nog kort over haar ervaring bij kascommissies en onder andere de Europese Vrouwen Lobby en hoe ze haar netwerkvaardigheden voor de datavakbond wenste in te zetten. Stabiele financiering door middel van bijvoorbeeld het verkrijgen van ANBI-status was haar belangrijkste uitgangspunt doel. Na onafhankelijke telling door twee leden, bleken alle drie de kandidaten 14 stemmen voor en 1 stem blanco. Kortom: welkom in het bestuur Arina en succes met jullie nieuwe rol Laury en Rogier.

Hierna een korte toelichting van het nieuwe jaarplan. Drie algemene doelen staan hierin centraal: vastere financiering, meer (actieve) leden en sterkere focus vinden. Ook werd kort de nieuwe website die op de planning staat belicht (en bevraagd). Door een van de leden werd bijvoorbeeld voorgesteld om na te denken over hoe de website toegankelijk te maken, bijvoorbeeld voor slechtzienden. Daarnaast was er nog een korte discussie over de vraag of het een goed idee is om een aparte pagina – afgesloten van de gewone bezoeker – te creëren. Immers; zijn we niet voor openheid van kennis en grootst mogelijke zichtbaarheid van onze artikelen? Het antwoord van het bestuur hierop was dat de gedachte was dat – zoals een gewone vakbond ook specifieke diensten levert voor diens leden – dit ook voor de datavakbond een aantrekkelijke manier kan zijn om leden te werven. Aan de andere kant was het bestuur er mee eens dat hier een goede balans in moet worden gevonden; voor sommige informatie wil je een zo groot mogelijke zichtbaarheid en openheid.

Daarnaast werden kort nog de plannen van de werkgroepen Actie, Inhoud en Tools toegelicht. Tijs Sikma vertelde over een aantal plannen die al uit de brainstorm van de werkgroep Inhoud waren gekomen, waaronder; visualiseren hoe verschillende partijen in het verleden hebben gestemd bij belangrijke privacywetten, een project over toegankelijkheid van websites voor slechtzienden en een project over plannen rondom een Europese digitale identiteit. Wat betreft Acties staat nog steeds op de planning om collectief gebruik te maken van bepaalde AVG-rechten, zoals het recht op Inzage en Verwijdering van eigen persoonsgegevens.

Bij de rondvraag kwamen nog een aantal ophelderingsvragen en ideeën naar voren, bijvoorbeeld om de eigen Nexctcloud-server ter dienste te stellen van leden voor opslag van bestanden voor leden zelf data opslag aan te gaan bieden. Dat zou een dienst kunnen zijn die de Datavakbond dan levert.

Presentatie Reinier Tromp
Vervolgens gaf Reinier Tromp – oud-oprichter van de datavakbond en op dit moment werkzaam als journalist bij Argos – een presentatie over zijn ervaringen als data-journalist. Ten eerste benadrukte hij hoe relevant de datavakbond nog steeds is; ‘Burgers zijn op datagebied geïndividualiseerd. Intenetgebruikers moeten zich organiseren om macht uit te oefenen’. Elk instituut zit volgens hem met hetzelfde probleem; wij willen iets met data maar met wie onderhandelen wij? Er is giga veel behoefte aan een organisatie die echt namens de burgers niet enkel als een groep experts kan spreken op dit thema.

Reinier onderzoekt momenteel het data-gebruik bij de overheid. Onder andere de Algemene Rekenkamer stelde dat je algoritmes eigenlijk niet transparant genoeg kan maken bij beslissingen van de overheid. Zijn er ervaring was dat die transparantie er nagenoeg niet is. “Ik ben al een jaar bezig, bijna alle ministeries en gemeenten op dit thema geWOBd… en ik heb pas drie modellen van gebruikte algoritmen toegestuurd gekregen”.

Omdat bestaande modellen en algoritmen elkaar kunnen versterken, was Reinier vooral bang dat er een grote ongelijkheid ontstaat. Nu al wordt in sommige modellen meegenomen in welke wijk je woont, welke taal je spreekt en of je psychische aandoeningen hebt. Dat kan dan gevolgen hebben of je wel of niet extra op fraude wordt gecontroleerd; waarmee je dus een zichzelf versterkende ongelijkheid creëert.
Gelukkig zijn er volgens Reinier ook goede voorbeelden. Hij prees bijvoorbeeld de gemeente Tilburg wat betreft het gebruik van data en algoritme.

Data Lokaal
Daarna vertelde Tijs Sikma kort over de totstandkoming en belangrijkste conclusies van het project ‘Data Lokaal’. Er werden vervolgens nog enkele vragen gesteld door leden, onder andere of er bij gemeenten nog feedback was gekomen op het rapport. Tijs vertelde dat verschillende gemeenten hadden gemaild dat het rapport was besproken en dat ook verschillende raadsleden positief hadden gemaild (helaas was de online bijeenkomst hierover toendertijd niet doorgegaan).

Hierna kwam nog de vraag over de politieke onafhankelijkheid van de Datavakbond, waarop werd uitgelegd dat sinds de oprichting (waarbij ook oa de Wiardi Beckman stichting betrokken was geweest) het bestuur actief een onafhankelijke positie had ingenomen.

Presentatie Max Passet
De presentatie die hierop volgde was van Max Passet die als stagair werkte aan een inventarisatie van privacy-tools. Max begon zijn verhaal met hoe vreemd het eigenlijk is dat sommige mensen stellen geen problemen te hebben met de verzameling van hun persoonsgegevens door Big Tech omdat ‘dat nu eenmaal zo is’ of ‘ze toch niets te verbergen hebben’. Als je dezelfde personen vraagt of je een app op hun telefoon mag installeren die alles wat ze doen op hun telefoon aan je doorstuurt, is men plots wat terughoudender.

Vervolgens liet hij aan de hand van het boek The Age of Surveillance Capitalism zien wat de essentie is bij de verzameling van persoonsgegevens door deze bedrijven; meer controle op gedrag, en betere kunnen voorspellen wat gebruikers in de toekomst zullen doen. Er is wetgeving – zoals de AVG – hiertegen maar deze blijft in de praktijk in gebreke. De privacy waakhond in Ierland moet – omdat veel bedrijven hier vanwege belastingen zijn gevestigd – 1 op de 5 van de grote privacyzaken afhandelen. En lukte echter slechts 2 procent van de aanvragen te behandelen. Dit terwijl bijvoorbeeld 94.7% van de websites zich maar niet aan de cookiewet houdt.

De privacy-toolbox die Max ontwikkelt heeft als doel dat internetgebruikers meer zicht hebben op de risico’s die zij bij het gebruik van verschillende diensten lopen, om hen vervolgens een overzicht te geven van de (digitale) instrumenten die er zijn om hierin verbetering te brengen. Hij maakt bij zijn risicoanalyse gebruik van de (sector-onafhankelijke) NAVI methodiek. Hij stelt de vraag: Hoe vindt de datatverzameling plaats? Wat kan men met deze data Welke dreigingen brengt dit met zich mee Hoe goed zijn beschermd tegen deze dreigingen? En na deze risicoafweging volgt het maatregelenpakket.

Onder de aanwezigen waren nog een aantal suggesties, bijvoorbeeld dat ook sommige gegevens die voor sommigen onschuldig zijn voor anderen grote risico’s met zich mee kunnen brengen. Een activist in een dictatuur loopt bijvoorbeeld meer risico’s wanneer zijn locatiegegevens worden gelekt. Ook kan bijvoorbeeld de informatie of je man of vrouw bent al gebruikt door financiële instellingen voor het aanbieden van hun producten (zoals een duurdere autoverzekering voor mannen, omdat zij gemiddeld risicovoller rijgedrag vertonen).

Presentatie Paul Tang
Paul Tang trapte zijn presentatie af met de (mogelijke) overname van Twitter door Elon Musk. Hij maakt zich zorgen over hoe het verdienmodel van sociale mediabedrijven schadelijke effecten heeft op de dynamiek van het publieke debat, Het zijn in feite reclameboeren die op basis van persoonsgegevens gepersonaliseerde advertenties verkopen. Het vasthouden van gebruikers op deze media gebeurt aan de hand van sensatie; hoe meer emotie hoe meer gebruikers met het platform interacteren. Op deze manier sturen deze platforms aan tot onenigheid en groepsvorming. Tang verwees hiervoor naar een artikel van de Amerikaans filosoof Jonathan Haidt. Tang relateert ook de versplintering van het politieke landschap in Nederland, de opkomst van complot-denken en het steeds heviger worden van het debat aan deze dynamiek.

Big tech zet daarbij tegelijkertijd een grote druk op de traditionele media. Van elke euro die wordt besteed aan digitale advertenties gaat 50 cent naar Google of Facebook. En terwijl juist de redacties in traditionele media van oudsher middels hun redactionele werk (zoals factchecks) beschermen tegen nepnieuws, zijn zij voor hun inkomsten steeds meer afhankelijk van digitale advertenties.

Vervolgens vertelde Tang over zijn inspanningen in het Europese parlement om gepersonaliseerde advertenties af te schaffen en de macht van Big Tech te doorbreken. Middels de Digital Markets Act en de Digital Sevices Act waren er namelijk wel een aantal successen geboekt. Zo mag er geen gebruik meer worden gemaakt van sensitieve gegevens van gebruikers, is het gebruik van gepersonaliseerde advertenties bij minderjarigen verboden. Een andere stap in de goede richting was de plicht op interoperabiliteit; verplicht gebruik van uitwisselbare standaarden. Vanwege Europese wetgeving moeten ook andere chatdiensten berichten naar bijvoorbeeld je whatsapp of Facebook Messenger gestuurd kunnen worden (zoals via Signal of Telegram).

Het doel van Paul Tang was geweest om dit ook voor bijvoorbeeld de tijdlijn van Facebook en Twitter voor mekaar te krijgen. Dat was uiteindelijke echter niet gelukt. Het verplicht mogelijk maken van een verplicht pluriform aanbod (zoals verschillende algoritmen waarvan je gebruik van kan maken voor het tonen van berichten op je Twitter-tijdlijn) zag hij als de belangrijkste strategie voor het doorbreken van de marktmacht van deze grote bedrijven.

Hierna kwamen nog enkele vragen uit het publiek. Een vraag was hoe hij aankeek tegen het voorstel van sommige activisten om bijvoorbeeld Google en Facebook als een nutsvoorziening te zien en dus (indirect) in handen van een publieke instantie, zoals een stichting, te stellen. Tang benadrukte het belang van pluriformiteit en redactionele onafhankelijkheid van media-aanbieders.

Na de presentatie van Paul Tang werd de Data-dag officieel beëindigd en begaf men zich in de zon naar een lunch-locatie nabij. Hopelijk zien we jullie volgend jaar weer!

Zet het in je agenda: datadag met ALV op 14 mei!

Op zaterdag 14 mei houden wij een Datadag, met onder andere europarlementariër (en mede-oprichter van de Datavakbond) Paul Tang als spreker! Diverse data-experts vertellen over hun professionele omgang met data, we presenteren nieuwe projecten, en in de Algemene Ledenvergadering discussiëren we over het jaarplan, jaarverslag en nieuwe bestuursleden. Op deze pagina lees je alles over deze dag en kun je je aanmelden. Zorg dat je erbij bent!