Datageletterdheid

Door Caroline Williams, lid van de Werkgroep Inhoud

Mensen vragen me vaak waarom we datavaardigheden aanleren in plaats van programmeren of andere IT-disciplines. Om hun vraag te beantwoorden, gebruik ik de vergelijking van datageletterdheid met een zwemdiploma. Dit is een handig voorbeeld voor een land dat bijna helemaal onder de zeespiegel ligt! Datavaardigheden bouwen voort op wat iemand al weet en stellen hen in staat hun datakennis toe te passen op hun werk. Data bestaat in elke branche. Net als een zwemdiploma is het een aanvulling op wat je kunt doen. Kunnen zwemmen vervangt je vermogen om te lopen niet. Het betekent dat je beide kunt doen en dat je ze kunt combineren zoals jij dat wilt.

De ontoegankelijkheid van statistiek
De wereld van data wordt vaak gezien als mysterieus, ingewikkeld en objectief. Als we zien dat mensen data gebruiken, denken we vaak dat ze een speciale intelligentie hebben en dat ze meer weten dan wijzelf. Sommige mensen zijn ervan overtuigd dat als iets op data gebaseerd is, het waar moet zijn. Dan voelt het soms ongemakkelijk om kritische vragen te stellen, om bij het verhaal achter de gegevens te komen. Om vast te kunnen stellen of de conclusies die worden getrokken echt kloppen. In werkelijkheid is data niet zo mysterieus of ingewikkeld.

Data, of gegevens, zijn op het meest basale niveau niet meer dan kleine stukjes informatie. Veel stukjes gegevens die bij elkaar worden gebracht, noemen we een dataset. Wanneer we het antwoord op een datagerelateerde vraag willen weten, verkennen we datasets en zoeken we naar patronen die we kunnen analyseren en visualiseren tot een meer oogvriendelijk formaat. Dit klinkt vrij gemakkelijk om te begrijpen, toch?

Een divers perspectief op data
Waarom gaat het zo vaak mis met data? Voornamelijk door menselijke factoren en menselijke beslissingen. Bijvoorbeeld als we niet de juiste vragen stellen en niet alle gegevens hebben. In plaats daarvan baseren we onze vragen op de gegevens die we wel hebben. Dit is een beetje alsof je fiets een lekke band heeft. Omdat je een winkel hebt die gespecialiseerd is in fietskettingen, ga je op zoek naar een setje waarmee je fietskettingen kan repareren. Dat is wat je op voorraad hebt. Het maakt niet uit hoeveel fietskettingen je vervangt, het zal je lekke band niet repareren. Hetzelfde met data. Stel je niet de juiste vragen en gebruik je geen relevante data, dan loop je tegen problemen aan.

Wat ook belangrijk is, is de achtergrond van de mensen die met data werken. Als iedereen die naar de dataset kijkt dezelfde achtergrond, geslacht, etnische identiteit en dergelijke heeft, dan mis je wat de gegevens mogelijk laten zien en verval je in plaats daarvan in groepsdenken. Als niemand in het datateam een ander perspectief kan bieden, kan de uitkomst van een analyse zelfs gevaarlijk zijn- zoals bij het programmeren van programma’s die zijn gemaakt om te voorspellen welke buurten meer kans hebben op hogere criminaliteitscijfers, op basis van gegevens over burgers. Of welke burgers eerder fraude plegen met overheidsprogramma’s. Niet op basis van feiten, maar op basis van het gebrek aan diverse perspectieven in het team dat met de gegevens werkt.

Wat gebeurt er met je data?
Als we gegevens gebruiken die door mensen zijn geproduceerd, hebben we ook de verantwoordelijkheid om ervoor te zorgen dat privacygevoelige gegevens op de juiste manier en met toestemming verwerkt worden. Mensen moeten weten welke gegevens ze produceren via hun apparaten, voorkeuren en acties. Ze moeten ook weten hoe deze gegevens gebruikt gaan worden en waarvoor ze het inruilen.
Zo is het handig om te weten dat een app van bijvoorbeeld een supermarkt je winkelgewoonten analyseert zodat je kortingen kan krijgen op de producten die je het meest koopt. Maar daar hoort ook bij dat je wellicht beïnvloed zult worden om vaker geld uit te geven in die winkel. Als je dit weet, kan je zelf veel beter beslissen of je hiermee akkoord gaat. Als je niet begrijpt hoe de app van de supermarkt werkt, worden je gegevens soms niet in jouw belang gebruikt.

Toegankelijkheid creëren
Het verhogen van het datageletterdheidsniveau van onze samenleving is een belangrijk instrument om ongelijkheid tegen te gaan. Als we beter begrijpen hoe data onze samenleving beïnvloedt met betrekking tot budgetten, goederen en diensten, beleid en onze dagelijkse gewoonten, dan blijft de kracht van data niet beperkt tot een kleine groep specialisten. In plaats daarvan wordt het iets dat open en toegankelijk is, in twijfel kan worden getrokken en kan worden gebruikt om “met elkaar te bouwen” in plaats van dat het “voor jou gebouwd wordt”. En daar hebben we als samenleving uiteindelijk allemaal profijt van.