Analyseprivacy

Kennen Google en Facebook je beter dan je eigen partner?

Beeld Marthe van de Grift

Techreuzen als Google en Facebook zouden hun gebruikers zo goed kennen dat ze zelfs kunnen voorspellen wat iemand wil eten. We zochten uit in hoeverre dat klopt, met behulp van het Facebookspoor van een geliefde. 

Ken je dat gevoel? Dat je een advertentie ziet op je mobiel of computer die zó goed op je lijkt afgestemd, dat je denkt: ‘Ze zitten mijn gesprekken af te luisteren’?

Aan het begin van The Great Hack, een documentaire over een van de grootste privacyschandalen uit de geschiedenis: Cambridge Analytica, vraagt de New Yorkse technologiehoogleraar David Carroll zijn studenten of zij denken dat techbedrijven echt meeluisteren. Bijna alle handen gaan omhoog.

Carroll schiet in de lach. Dat techbedrijven ons dag in dag uit afluisteren is een hardnekkig broodje aap. Volgens hem bewijst het feit dat zoveel studenten hun hand opsteken bovenal hoe goed bedrijven als Facebook en Google hun zaakjes op orde hebben. Het digitale spoor dat we achterlaten op onze apparaten is alles wat ze nodig hebben om advertenties te tonen die persoonlijk op ons zijn toegesneden.

Volgens critici als Harvard-hoogleraar Shozanna Zuboff, die dit verdienmodel aanduidt als ‘surveillancekapitalisme’, verkrijgen bedrijven via onze data verregaande inzichten. ‘Simpel gezegd zouden ze kunnen voorspellen in welk eten je op dit moment zin hebt’, aldus de hoogleraar in de VPRO-documentaire De grote dataroof. ‘Zo van: we weten dat u vanavond zin hebt in een lekkere pasta.’

Technologiecriticus Douglas Rushkoff gaat in zijn nieuwste boek, Team Human, nog verder: sociale media kunnen volgens hem ‘met ongeveer 80 procent zekerheid’ bepalen wie gaat scheiden, de griep krijgt of twijfelt over zijn of haar seksuele oriëntatie. ‘Nog voor we het zelf weten.’

Leggen de techbedrijven op basis van ons achteloze surfgedrag onze intiemste verlangens bloot? Kennen Google en Facebook ons beter dan, zeg, onze eigen partner? We spraken erover met Facebook, Google, advertentiebedrijf WPP en onafhankelijke experts. En we vroegen de Facebook-data op van de partner van een van de auteurs. Met haar toestemming, vanzelfsprekend.

Wie kijkt er met ons mee, en wat zien ze dan?

Het digitale dossier dat we opvragen bij Facebook is honderden pagina’s dik. Het is een netjes gearchiveerde verzameling gegevens, ingedeeld in overzichtelijke mapjes, die Facebook dankzij de Europese privacywetgeving verplicht is te delen.

Veel ligt voor de hand: zo staan haar naam, geboortedatum, geboorteplaats, huidige woonplaats en elf van haar familieleden genoemd. Evenals evenementen waarvoor ze zich via Facebook heeft aangemeld (veelal verjaardagen) en haar opleidingen (met daarbij een aantal van haar klasgenoten uit het jaar 2012). Uit haar likes blijkt met welke mensen ze (vaak) interactie heeft.

Als je haar niet persoonlijk kent, valt er veel uit af te leiden. Dat ze betrokken was bij een studievereniging, bijvoorbeeld. Haar likes suggereren dat ze goed contact heeft met haar familie. Geen informatie waar je als partner steil van achterover slaat, maar het is indrukwekkend hoe compleet haar leven sinds 2010 – toen ze zich aanmeldde, op 21 juli om half zes ’s middags – is weergegeven. Eén mapje achten we te privé om zelfs als partner zomaar doorheen te scrollen: haar een-op-eengesprekken in chatapp Messenger. 

Dit is niet het enige bedrijf dat op deze manier persoonlijke dossiers bijhoudt. Gaat iemand die zijn locatiegeschiedenis via Maps deelt wekelijks naar de Wallen, dan houdt Google dat bij. Zo ook wanneer iemand via de zoekmachine zoekt naar ‘knobbeltje in borst’.

Sundar PichaiBeeld Studio V

Overal laten internetgebruikers een dataspoor achter. Toch is het tweetal Google en Facebook uitzonderlijk, stelt Eric Kramer, die de Nederlandse tak leidt van ’s werelds grootste communicatie- en advertentiebedrijf, WPP. 

Een van de belangrijkste voorsprongen die Google en Facebook hebben, legt hij uit, is dat hun gebruikers accounts hebben. Dat levert Google en Facebook al een hoop basisinformatie op, zoals naam, leeftijd en geslacht. De bedrijven weten dankzij die accounts bovendien van wie ze informatie verzamelen.

Dat terwijl andere adverteerders vaak alleen volgsoftware zoals trackingcookies tot hun beschikking hebben, die bijhouden welke websites iemand bezoekt. De gebruiker blijft vaak een anoniem nummer. Kramer: ‘Wat wij kunnen achterhalen, valt enorm tegen vergeleken met wat Facebook en Google weten.’

Maar een heleboel gegevens in een digitale lade stoppen, is nog iets anders dan iemand kennen. Hoe diep doorgronden de grote techbedrijven je met al die gegevens om tot advertenties of gepersonaliseerde nieuwsoverzichten en tijdlijnen te komen?

Beeld Marthe van de Grift

Hoe goed leren de bedrijven je hiermee kennen?

Het is een vaak aangehaalde anekdote, die over de boze vader die zich afvroeg hoe het warenhuis Target het in zijn hoofd haalde zijn 18-jarige dochter coupons voor luiers en wiegjes te sturen. Wilden ze haar soms een zwangerschap aanpraten? Om een paar dagen later schoorvoetend excuses te maken: ze bleek inderdaad in verwachting.

Het bedrijf kon dit voorspellen door te analyseren welke producten – van geurloze lotion tot voedingssupplementen – populair zijn onder zwangere vrouwen, schreef The New York Times in 2012. Een winkel die op basis van inkopen meer weet dan je eigen vader, een betere illustratie van de voorspellende kracht van data is nauwelijks denkbaar. 

Al snel volgden de relativerende reacties. We moeten niet denken dat ze bij Target gedachten lezen met data, zei data-analist Kaiser Fung tegen de Financial Times. Volgens hem is het onvermijdelijk dat Target ook een flink aantal niet-zwangere vrouwen aanbiedingen voor luiers stuurde.

Want zo werken dit soort analyses: koopt een vrouw producten die zwangere vrouwen relatief vaak kopen, dan is de kans groter dat ook zij zwanger is. Daarop aanbiedingen afstemmen kan lucratief uitpakken, maar ineens klinkt dit meer als een open deur dan als datamagie.

Het sluit aan bij de uitleg die Olav Lijnbach, marketingonderzoeker van Facebook, geeft in het Facebook-kantoor in Amsterdam. Het is niet zo dat een computermodel minutieus de data van elk individu doorloopt, een beeld van je persoonlijkheid en interesses construeert en daarop advertenties afstemt, zegt hij. Laat staan dat het vaststelt of je onzeker of juist zelfverzekerd bent, of de kans 60 procent acht dat je vanavond zin hebt om uit te gaan.

Dat blijkt ook wel uit de ‘advertentie-interesses’ die Facebook heeft bijgesloten in het datadossier van de eerdergenoemde partner. Sommige van de bijna honderd labels kloppen goed (‘Harry Potter’, ‘Friends’); andere zijn nogal algemeen (‘Europa’, ‘textiel’, ‘Facebook’). De verrassendste labels blijken domweg fout. ‘Nightmare (Japanse band)’? Het zegt haar niets.

In sommige gevallen is zeer specifiek adverteren zinnig – denk aan een restaurant dat personeel zoekt en daarvoor alleen 18- tot 30-jarigen uit de eigen gemeente wil benaderen – maar doorgaans zijn de data-analyses van het platform best grofmazig, zegt Lijnbach. 

Als onder duizenden gebruikers blijkt dat mensen die foto’s van auto’s bekijken vatbaarder zijn voor advertenties over auto’s, dan nemen de algoritmen dit bijvoorbeeld mee. Filmpjes die duizenden mensen bekijken zijn dan ook bruikbaarder dan individuele Facebookposts. Dat komt onder meer doordat lang niet elke actie iets zegt over je interesses  één keer verkeerd klikken en voor je het weet, registreert Facebook dat je interesse hebt in Japanse rockbands. 

We denken in te menselijke termen over de wijze waarop data worden gebruikt, vindt Maurits Kaptein, hoogleraar datawetenschappen aan de Universiteit Tilburg en betrokken bij diverse data- en marketingbedrijven. ‘Het doel van bedrijven is helemaal niet dat ze alles van je willen weten’, is zijn ervaring. ‘Ze willen dat de volgende advertentie of internetpagina net iets succesvoller is dan de vorige.’

Kaptein is mede-oprichter van databedrijf Science Rockstars, dat hij inmiddels heeft verlaten. Dit bedrijf belooft te achterhalen voor welke psychologische advertentietechnieken een bezoeker het gevoeligst is. Bijvoorbeeld de suggestie van schaarste (‘boek snel, er zijn nog maar twee kamers beschikbaar!’) of juist groepsdruk (‘meer dan tienduizend mensen boekten hier al een kamer’).

Dat klinkt alsof je een bezoeker goed moet doorgronden. ‘Dat was ook het marketingverhaal’, aldus Kaptein. De werkelijkheid is saaier. Het bedrijf gebruikt computermodellen die statistische verbanden zoeken tussen de data van bezoekers – van eerder bezochte websites tot welk apparaat ze gebruiken – in combinatie met het type links waarop zij hadden geklikt.

Als bezoekers van autowebsites gemiddeld gevoeliger zijn voor hoge ratings, heeft de volgende die vanaf een autowebsite komt meer kans diezelfde strategie te zien. Kaptein: ‘Kan ik dan zeggen dat ik je ken? Helemaal niet. Ik kan alleen na een paar klikken een nét iets betere pagina presenteren.’

Het zou zelfs niet commercieel rendabel zijn om elke gebruiker tot in detail te analyseren voor persoonlijke advertenties, zegt Chetna Bindra, verantwoordelijk voor privacy bij Google, in een videogesprek vanuit New York. Dus blijft de analyse relatief algemeen, stelt ze: ‘Dan leiden we op basis van taalgebruik en bezochte websites af dat iemand geïnteresseerd is in voetbal.’ Op de vraag of Google voorspelt of mensen vanavond trek zullen hebben in pizza, begint ze te grinniken. ‘Nee.’

Zulke intieme analyses vindt Google volgens haar ook onethisch. ‘We personaliseren ook bewust niet op gevoelige categorieën, zoals ras, seksualiteit en religie.’

Luisteren ‘ze’ ons af?

Het is een bekende complottheorie: Facebook en Google luisteren ons af via de microfoon in onze smartphone en schotelen ons op basis daarvan gerichte advertenties voor. Beide bedrijven hebben dit herhaaldelijk ontkend en onafhankelijke onderzoekers hebben er nooit bewijs voor gevonden. Ja, gesprekken met bijvoorbeeld Google Assistent worden opgenomen, maar dat is om de spraakherkenning te verbeteren. Waar komen dan al die verhalen vandaan die de theorie zouden bevestigen? Mogelijk speelt confirmation bias een rol: tussen de honderden advertenties valt precies die op van het merk waarover je het zojuist nog had, terwijl dit toeval is.

Wat als ze hun best zouden doen om je te leren kennen?

Ze noemden het de God View; de Goddelijke Blik. Het management van taxidienst Uber kon de exacte locatie van elke klant ermee zien. Daar kun je leuke dingen mee doen, zoals kijken waar politici, ex-vriendinnetjes of een beroemdheid als Beyoncé uithangen, bleek uit onthullingen van een ex-werknemer. Een topman van het bedrijf raakte in de problemen toen bleek dat hij een kritische journalist had gevolgd.

Ineens gaat het niet meer over abstracte statistiek, maar over mensen die gevoelige informatie inzien over andere mensen. Niet de bedoeling, natuurlijk. Uber zag zich gedwongen te schikken met de Amerikaanse consumentenwaakhond FTC. Ook bij Google en Facebook zullen medewerkers in principe niet door je dossier bladeren. 

Je moet er maar op vertrouwen dat je data inderdaad alleen maar worden gebruikt voor saaie computermodellen. Zeker omdat vaak onduidelijk is waar die blijven. Zo waarschuwde de Consumentenbond onlangs dat populaire datingapps als Tinder, Grindr, Happn en OKCupid persoonlijke gegevens doorverkopen aan datahandelaren. Houd er dan maar eens zicht op welke partijen kennisnemen van je liefdesleven.

Waar het ongemerkt delen van data toe kan leiden, blijkt uit het grootste digitale privacyschandaal tot nu toe: Cambridge Analytica. Dit Britse bedrijf verzamelde gegevens van een onlinepersoonlijkheidstestje genaamd Thisisyourdigitallife en combineerde die vervolgens met data van Facebook (wat overigens nu niet meer kan). Niet alleen gebruikten ze Facebook-data van gebruikers die meededen met de test, maar ook die van hun vrienden, zonder toestemming.

Cambridge Analytica claimde zo van tientallen miljoenen Amerikanen een fijnmazig individueel persoonlijkheidsbeeld te hebben opgebouwd, die adverteerders tegen betaling konden gebruiken om zeer nauwkeurig op Facebook te adverteren. Ook voor politieke campagnes, zoals die van Donald Trump in 2016.

Door kiezers op basis van hun persoonlijkheid te bestoken met afgestemde berichten en video’s, probeerde het bedrijf de balans in het voordeel van Trump te laten doorslaan. Zo kregen kiezers in het bakje ‘neurotisch’ filmpjes in hun tijdlijn die de chaos in de wereld benadrukten en de oplossing in de vorm van een sterke leider.

Hoe effectief de campagnes waren? Vaststaat dat berichten die we op Facebook zien ‘de macht hebben onze emoties te veranderen’, schrijft wiskundige Hannah Fry in haar boek Algoritmes aan de macht. Ze wijst op onderzoeken die aantonen dat advertenties of nieuwsberichten effectiever zijn als ze gericht zijn op bepaalde karaktereigenschappen.

Met als grote kanttekening: de effecten blijken telkens miniem. Een algemene advertentie voor make-up kreeg bijvoorbeeld 31 op de duizend mensen zover erop te klikken, een speciaal op introverte mensen gerichte advertentie bereikte een score van 35 op duizend.

Of neem een onderzoek uit 2014, uitgevoerd door Facebook zelf, waaruit blijkt dat gebruikers emotioneel te beïnvloeden zijn. Mensen die minder berichten met positieve uitdrukkingen te zien kregen, plaatsten bijvoorbeeld zelf minder vaak positieve berichten en juist vaker negatieve.

Er ontstond verontwaardiging omdat bijna 700 duizend gebruikers ongemerkt als proefkonijn van een psychologisch experiment waren gebruikt. Ondertussen toonde het onderzoek hoe weinig de subtiele manipulatie eigenlijk uithaalde. Want waar de controlegroep gemiddeld 53 positieve woorden per duizend schreef, plaatsten gebruikers bij wie positieve berichten werden weggehouden er 51. 

‘Het is niet zo dat bedrijven je alles kunnen laten doen wat ze maar willen’, concludeert ook Maurits Kaptein. ‘Ze kunnen bij een aantal mensen de kans verhogen dat ze iets doen.’ Daardoor werkt personaliseren ook alleen als het goedkoop kan bij heel veel mensen tegelijk, legt hij uit. Diepgaande psychologische analyses per internetgebruiker zijn domweg niet rendabel.

Maar wat als je wél geld en moeite steekt in het analyseren van persoonlijkheidskenmerken met Facebook-posts? Psychologen en computerwetenschappers van de universiteiten van Cambridge en Stanford onderzochten dit in 2015. Deelnemers aan hun onderzoek moesten een persoonlijkheidstest invullen. Aan de hand van honderd vragen plaatsten de onderzoekers de proefpersonen in een matrix volgens het Big Five-model: extraversie, vriendelijkheid, emotionele stabiliteit, zorgvuldigheid en openheid.

De scores werden vergeleken met de Facebook-likes van dezelfde proefpersonen. Zo kwamen verbanden naar boven tussen onderwerpen die iemand leuk vindt (zoals Obama, Ford of hardlopen) en de scores voor de vijf persoonlijkheidskenmerken. Na deze analyse kon de computer de persoonlijkheidsscores al na 10 ‘vind ik leuks’ beter inschatten dan collega’s, aldus de onderzoekers. Om vrienden en familieleden te verslaan, waren respectievelijk 70 en 150 likes nodig. Partners legden het af na 300 likes.

Beeld Studio V

Dat Google en Facebook dit soort psychologische analyses naar eigen zeggen niet toepassen voor personalisatie, wil niet zeggen dat dit nooit zal gebeuren, zegt Willemijn van Dolen, hoogleraar data en marketing aan de Universiteit van Amsterdam. ‘De datawetenschap gaat razendsnel’, zegt ze. ‘Wat nu niet gebeurt of rendabel is, kan dat ooit wel zijn. Zeker als ik zie dat mijn beste studenten bij Google en Facebook gaan werken.’

‘Nu gebruiken de bedrijven hun data vooral voor advertenties of om een nieuwsoverzicht wat anders in te richten’, voegt Maurits Kaptein toe. Stel dat we ooit niet meer in een vrije democratie leven en iemand benieuwd is naar de politieke opvattingen van een persoon, dan ligt er een weelde aan data waaruit je die kunt afleiden, waarschuwt hij. ‘Maar het verhaal dat techbedrijven iedereen persoonlijk kennen, is dystopisch en overdreven.’

Zes tips om je privacy te versterken

1. In de privacyinstellingen van Google en Facebook kun je aangeven wat ze wel en niet mogen verzamelen (bijvoorbeeld: geen locatiegeschiedenis)

2. Privacyvriendelijke browsers als Brave beschermen tegen volgsoftware

3. Installeer een advertentie- en cookieblocker, zoals Ghostery

4. Gebruik incognitomodus, dan worden cookies na afsluiten automatisch gewist

5. Beheer de machtigingen van telefoonapps, schakel op Android-telefoons gepersonaliseerde advertenties voor Google uit

6. Voor wie vol op het privacy-orgel wil: een virtueel privénetwerk (VPN) en het anonieme netwerk Tor verhullen je identiteit

Lees verder over dataverzamelaars

Zonder het te weten, doen we vaak onbetaald werk voor techbedrijven als Google en Facebook. Het wordt tijd dat mensen daar een vergoeding voor krijgen, vindt econoom Maarten Goos

Ook in de Verenigde Staten komt Silicon Valley niet meer overal mee weg. Lees hier waaruit dat blijkt, en wat dit betekent voor de techbedrijven.

Marleen Stikker is klaar met de constatering dat het dertig jaar oude world wide web stuk is, mede doordat een handjevol bedrijven het domineert. We interviewden haar over de oplossingen die ze aandraagt.

Douglas Rushkoff vreest dat we tijdens alle technologische ontwikkelingen onze menselijke waarden vergeten. We spraken hem erover in Den Haag.

Meer over