“Datagestuurde beleidsvorming” kan lokale overheden intimiderend in de oren klinken. Maar achter de complexe term schuilt een eenvoudige waarheid. In dit artikel vind je tips van het CitizenLab-team om de kracht van data optimaal in te zetten, ongeacht de grootte van jouw gemeente.
Datagestuurde beleidsvorming heeft als doel om de efficiëntie en impact van beleid te vergroten door het te baseren op cijfers en gegevens. Het is een goede manier om te voorkomen dat er een mismatch is tussen verwachtingen en de werkelijke situatie, en daaruit voortkomende foute beleidskeuzes. Bovendien kan zowel een klein als een groter lokaal bestuur met data aan de slag.
Er zijn 3 belangrijke factoren die ervoor zorgen dat steeds meer gemeenten data gaan inzetten:
- Exponentiële datagroei: 90% van alle data in de wereld is gecreëerd in de afgelopen twee jaar. En elke dag komt er zo’n 2,5 miljard gigabyte aan data bij. Steden zijn geen uitzondering op die exponentiële regel. Denk bijvoorbeeld aan de luchtvervuilingsgegevens die je verzamelt via sensoren, parkeergegevens via slimme meters, prestatiegegevens via de verschillende afdelingen… En als het gaat om online engagement of burgerparticipatie, dan zijn er de bijdragen die bewoners delen op online platformen.
- Opkomende technologieën: Data op zichzelf zijn waardeloos. 80% ervan is ongestructureerd en ongeformatteerd: het gaat dan vooral om geschreven tekst, afbeeldingen, audio of video. Er zijn bepaalde technologieën nodig om die data te verzamelen, verwerken en analyseren om er relevante inzichten uit te halen. Artificiële intelligentie (AI) — en vooral NLP (Natural Language Processing, een subgroep van AI) — en machinelearning-technieken zijn van onschatbare waarde om data te begrijpen en vervolgens om te zetten in bruikbare resultaten.
- Ervaringen van burgers: Lokale overheden beschouwen de manier waarop burgers het beleid ervaren en hoe ze dat kunnen verbeteren steeds vaker als één van hun kernfuncties. Data van inwoners gebruiken om beslissingen te nemen is voor veel gemeenten belangrijk om diensten te kunnen leveren die voldoen aan individuele noden.
Onderzoek wijst uit dat de globale markt van slimme steden zo’n $463.9 miljard dollar waard zal zijn in 2027. Maar zoals elke nieuwe trend heeft ook datagestuurde besluitvorming enkele valkuilen. Hier ontleden we de 3 manieren waarop je die vermijdt.
1. Transparantie 2.0
Steeds meer overheden stellen (een deel van) de datasets die ze intern gebruiken open. Sommigen openen zelfs de broncode van de tools en algoritmes die ze op deze datasets toepassen—Amsterdam is daar een goed voorbeeld van. En in Frankrijk verplicht de Digital Republic Act de overheidsinstellingen om alle datasets volledig vrij te geven, tenzij ze gevoelige informatie bevatten.
Transparantie 2.0 gaat nog een stap verder. Terwijl open data en open source genoeg zijn voor datawetenschappers en ingenieurs om te begrijpen wat er gebeurt, is dat voor de meerderheid van de burgers niet het geval. Om de gebruikte data echt toegankelijk en informatief te maken, is het nodig ze te vertalen. Het gaat erom algoritmen en code om te zetten in tekst en afbeeldingen, die in mensentaal uitleggen wat er onder de motorkap gebeurt. Burgers komen zo te weten hoe de data worden verwerkt, op welke onderliggende veronderstellingen de code gebaseerd is, of welke input in de resultaten en conclusies verwerkt zit.
Transparantie zorgt voor een vertrouwensrelatie met burgers en kan ook samenwerkingsinitiatieven uit het maatschappelijke middenveld mogelijk maken. Dit soort initiatieven zijn een belangrijke drijfveer wanneer overheden complexe uitdagingen proberen aan te pakken, die bijvoorbeeld verschillende domeinen overspannen.
2. Voor goed beleid heb je goede data nodig
De kwaliteit van de datainvoer heeft een grote invloed op de automatiseringsoutput. En die kwaliteit wordt grotendeels bepaald door de manier waarop je gegevens verzamelt. Zorg ervoor dat de verzamelde data zo gestructureerd is dat het overeenkomt met wat je er uiteindelijk mee wil doen. Verzamel je data om die te combineren met een bestaande set? Zorg dan dat er een verband is, zoals bijvoorbeeld het moment van de meting. Eerder een ruimtelijke analyse nodig? Zorg er dan zeker voor dat je ook de locatie verzamelt, in een formaat dat makkelijk leesbaar is voor je geografische informatiesysteem (GIS).
Deze regel geldt zeker wanneer je met ongestructureerde gegevens werkt, zoals tekst, afbeeldingen, video of audio. Dat is de meerderheid van alle gegevens die via burgerparticipatie worden verzameld. Wil je die toch kunnen analyseren is het goed om je participatieproces zo op te zetten dat je semi-gestructureerde data verzamelt. Enkele voorbeelden:
- Ga voor open participatie en laat deelnemers interactief omgaan met de input van anderen. Geef deelnemers bijvoorbeeld de optie om te stemmen op een bestaand idee, in plaats van zelf een vergelijkbaar idee in te voeren. Zo zorg je ervoor dat je geen dubbele input moet verwerken. Bovendien blijken die interacties een nieuwe waardevolle bron van inzichten te zijn. Reacties zorgen voor nuance en verschillende perspectieven binnen een bepaald idee.
- Stel specifieke vragen. Een vraag als ‘Hoe vond je de workshop en het eten?’ moet je eigenlijk opsplitsen in 2 aparte vragen. Zo zorg je ervoor dat je voor elke vraag relevante en betrouwbare informatie verzamelt.
- Laat deelnemers de plek waarvoor ze een idee hebben aanduiden op een kaart of tags aan hun ideeën toevoegen. Zo kan je de input later makkelijk analyseren. We raden wel aan om zelf een set tags te bepalen. Het is makkelijker om aan de slag te gaan met ideeën die allemaal de tag “mobiliteit” dragen, dan alle ideeën met “auto”, “fiets”, “verkeer” en “rood licht” manueel in dezelfde groep te moeten plaatsen, bijvoorbeeld.
- Is een open vraag wel een goed idee? Om bovenstaande redenen kan het lastig en tijdrovend zijn om de resultaten van een open vraag te verwerken, zeker als je niet met een krachtige NLP-software werkt. Het is beter om open vragen te vervangen door een meerkeuzevraag of een ‘andere’ optie toe te voegen.
3. Vergeet de mensen niet
De wereld mag vandaag dan om data draaien, het is goed om voor balans te zorgen. Met andere woorden, machines zijn niet genoeg: we hebben nog altijd mensen nodig.
Een data-gestuurde conclusie kan overtuigend zijn, vooral als die visueel voorgesteld wordt. Als iets wordt uitgedrukt in getallen of grafieken lijkt het al snel geen verdere uitleg nodig te hebben. Maar een dataset kan onvolledig zijn, de algoritmes kunnen gebaseerd zijn op foute veronderstellingen, of de dataconversie kan met het verkeerde metrische systeem zijn gebeurd. Een menselijke interpretatie, expertise en kritische geest blijven dan ook onmisbaar.
Koppel terug naar alle betrokken partijen. Laat hen zien hoe je tot die conclusie kwam en vraag om hun feedback. In het geval van burgerparticipatie wil dit concreet zeggen dat de oorspronkelijke burgerinput gekoppeld wordt aan de conclusie, maar dat de tussenliggende stappen ook benadrukt worden. Zo kunnen deelnemers aangeven of ze het eens of oneens zijn met het proces en de conclusies, en kun je eventueel nog aanpassingen aanbrengen.
Eenvoudig gezegd draait het er allemaal om de sterke en zwakke punten van zowel datatechnologie als de menselijke expertise in te zien. Datatechnologie is haast onfeilbaar in het vinden van patronen en logische verbanden, waardoor uitkomsten minder gekleurd worden door (foute) menselijke veronderderstellingen. Als individu voeg je daar nuance en context aan toe. Maar terwijl de mens vroeger het monopolie had op de “waarom”-vraag, begint datatechnologie nu snel buiten zijn vroegere “wat-” en “waarom”-hokjes te breken.
Bij het analyseren van ongestructureerde data, zoals geschreven ideeën, moeten we ook erkennen dat de gebruikte technologieën als NLP (nog) niet 100% accuraat zijn. Tekst kan verkeerd geïnterpreteerd, ingedeeld of vertaald worden. Als een beslissing 100% accuraatheid vereist, is het dus goed om de datagedreven conclusie te controleren en waar nodig te corrigeren.
Vergeet grote cijfers en fraaie apps. Binnen lokale overheden begint data-gestuurde beleidsvorming met kleine, betrouwbare datasets en menselijke processen. Het kan een ontzettend positief effect hebben op zowel grote als kleine steden. Bij CitizenLab werkt ons ‘Insights’-team nauw samen met verschillende overheden om beleidskeuzes te nemen en te onderbouwen op basis van data.
Meer weten over hoe we overheden helpen om de besluitvorming te verbeteren? Aarzel niet om contact met ons op te nemen!