Waar komen onze data vandaan?

(For English Click Here)

Wij willen met dit observatorium zorgen voor meer transparantie rondom online politieke advertenties en het gebruik van (micro)targetingtechnieken in de aanloop naar de Tweede Kamerverkiezingen van 2021.

In twee blogposts, waarvan dit de eerste is, leggen we uit hoe ons dashboard ontstond en waar onze gegevens vandaan komen. In de tweede blogpost leggen we uit hoe we de gegevens verwerken en omzetten in de diagrammen die je terugziet in ons dashboard.

De website en het dashboard zijn nog volop in ontwikkeling. We blijven beide updaten en verbeteren, en schrijven regelmatig blogposts waarin we onze verkiezingsdata interpreteren en duiden.

Waar komen onze data vandaan?

Ons dashboard draait voornamelijk op gegevens die de sociale platformen aanleveren. Op dit moment gebruiken we gegevens van vijf platformen die hun gebruikers in staat stellen politieke advertenties te targeten.

  1. Facebook & Instagram
  1. Google & YouTube
  1. Snapchat

We richten ons op deze platformen omdat ze de bealangrijkste spelers zijn op het gebied van online advertenties. Wanneer nieuwe advertentiegegevens beschikbaar worden van andere platformen, breiden wij onze dataset uit.

Voor nu beperkt ons dashboard zich tot Facebook, Instagram, Google en YouTube. We tonen op dit moment alleen gegevens over advertenties van politieke partijen die na 1 september 2020 zijn vertoond.

Waarom een dashboard lanceren dat nog in de maak is?

Transparantie over politieke advertenties is belangrijk, geloven wij. Daar zijn principiële, maar ook andere redenen voor. Daarom vinden wij het lanceren van deze website en het dashboard in huidige vorm waardevol.

Transparantie en hoe dat georganiseerd is, is bij online advertenties namelijk voortdurend in ontwikkeling – zo wordt op dit moment de European Digital Services Act ontwikkeld. Tegen die achtergrond dient deze website om inzichtelijk te maken welke beperkingen en tekortkomingen er zijn in de instrumenten die op dit moment transparantie moeten bevorderen.

Een aantal problemen met de data van advertenties is bekend, zoals de gebrekkige documentatie, de instabiele API voor de toegang tot de openbare advertentiedata, en inconsistentie in de manier waarop online platforms toegang geven tot de data. Veel van deze problemen zijn al aan de orde gesteld in wetenschappelijke en/of populaire literatuur (zie voor voorbeelden de pagina met andere initiatieven op deze website). Om deze beperkingen bloot te leggen, laten wij zien tegen welke obstakels we in de praktijk aanlopen terwijl we het verkiezingsdashboard uitbreiden en verbeteren. We zullen dan ook steeds open bespreken welke ‘problemen’ we in de data tegenkomen en hoe we ze aanpakken.

Natuurlijk zijn wij niet het eerste team dat werk doet op het gebied van transparantie, advertenties en sociale media. Er zijn veel andere fantastische en belangrijke onafhankelijke initiatieven die zich richten op nauw verwante vraagstukken.

Met het lanceren van deze website hopen we een bijdrage te leveren aan de discussie over de huidige instrumenten die transparantie over politieke advertenties moeten bevorderen, over hun beperkingen en over mogelijke verbeteringen. Zo hopen we input te leveren voor de bredere discussie over het reguleren van deze online platforms.

Welke vragen beantwoorden we met ons dashboard?

Er zijn vier hoofdvragen die we met deze versie van het dashboard proberen te beantwoorden:

  • Hoeveel advertenties plaatsen Nederlandse politieke partijen op de platforms die we bekijken?
  • Hoeveel geld besteden deze politieke partijen op elk platform?
  • Hoeveel mensen worden bereikt door deze advertenties?
  • Hoe worden deze politieke advertenties getarget richting individuen?

Iedere vraag heeft een eigen diagram op het dashboard. In deel 2 van dit blog leggen we in meer detail uit wat deze diagrammen wel en niet kunnen zeggen over elk van deze vragen.

(Voor deel 2 klik hier)

Where we get our data

(Voor Nederlands klik hier)

We have created this observatory with the aim of bringing about more transparency around political advertising and the use of micro-targeting in the upcoming Dutch house of representatives elections in 2021.

This is the first blog post in a two-part series where in we first provide a brief explanation of how our election observatory dashboard came to be, and where our political advertising data comes from. In Part 2, we go into more detail and show how we process this data to create the plots and figures that you see in our dashboard.

While the website and dashboard are still a work in progress, we plan to regularly update and improve both, as well as update our followers with new posts about developments in the Dutch elections, as we see them happening through the lens of our data.

Where we get our data

Our dashboard primarily makes use of ad-transparency data provided by social media platforms themselves. For now, we are (or envision) using data from five (social media) platforms that allow targeted political ads to be placed on their platforms:

  1. Facebook & Instagram
  2. Google & YouTube
  3. Snapchat

We use data from these platforms partly because they are among the largest platforms. In future iterations we may expand this set to include data from additional social media platforms as more advertising transparency data becomes available and relevant. For now, the data shown in our dashboard is limited to Facebook, Instagram, Google, and YouTube’s data, specifically political advertisements that have been displayed on these platforms after September 1st, 2020 according each source.

Why share a website/dashboard that is still in the making?

Beyond normative reasons of why we think transparency around political advertising is important, there are also other reasons for why we think launching the website and our dashboard in its current form is valuable.

Ad transparency is very much a moving target, and with a backdrop of the European Digital Services Act in the making, this website also serves a secondary purpose of providing valuable insights into the shortcomings and limitations of ad transparency data in its current form.

Ad transparency data is notoriously difficult to work with for various reasons ranging from poor documentation, instability in the API for accessing the advertising transparency data, and even inconsistency in the way which platforms make advertisement data available to name a few examples. Many of these issues have already been discussed in scientific and/or popular literature (See some of the articles in the related work section of our website for instance).

In order to further highlight these limitations, we aim to demonstrate the obstacles that we run into in practice, and to transparently discuss the issues that we see with this data as we iteratively expand and improve our election dashboard and tackle these issues with each improvement.

Of course we are not the first team to be working in the areas of transparency, advertising and social media. Many other extremely useful and important independent initiatives are also investigating this data and looking at closely related topics.

With launching our website, we too aim to contribute to the discussions on what the limitations of current ad transparency data are, how ad transparency could be improved, and to provide input for the wider discussions on regulating online platforms.

What questions are we answering with our dashboard?

There are four main questions that we are trying to tackle with our current version of the dashboard:

  • How many ads are the Dutch political parties placing on the platforms that we look at?
  • How much money are the parties spending on each platform?
  • How many people are reached through these ads?
  • How are the political ads targeted towards individuals?

Each dashboard plot tackles one of these questions. In Part 2 of this blog post, we will go into more detail about each of these questions.

(For part 2 click here)