Wij zijn Big Data: de toekomst van onze informatiesamenleving.

Uitgebreide samenvatting van het gelijknamige boek van Sander Klous en Nart Wielaard.

Big Data en wetenschap
Big Data is in wezen niets anders dan een proces, een uniek mechanisme dat wij mensen gebruiken om de werkelijkheid om ons heen te duiden, en op basis waarvan we voorspellingen doen over onze toekomst die veel accurater zijn dan het koffiedik kijken uit het verleden.

In de loop van de tijd werden we ons bewust van de noodzaak de wereld rationeel te bekijken en te proberen haar op een systematische wijze te doorgronden. Dat is de kiem die tot bloei kwam tijdens de Verlichting en die werd geplant door o.a. Spinoza. Het resultaat was de zog. wetenschappelijke methode.

Maar tot voor kort was dat verzamelen van data tijdrovend en kostbaar. Dat was het tijdperk van de ‘Small Data’. Door de schaarste van data maakten we gebruik van o.a. steekproeven. Maar die schaarste is er steeds minder. Op de juiste manier toegepast kunnen Big Data – analyses het ‘wat’ ontdekken en daarmee een buitengewoon waardevol filter worden voor de daaropvolgende diepgravende causale analyses.

Daarmee wordt aangegeven dat Big Data analyses niet zo zeer gaan over het bewerken of interpreteren van data – de zogenaamde ‘big messy data’, maar veel meer over het slim combineren van data. Daarin relevante patronen te zoeken. Daarbij is het van het grootste belang dat het verschil tussen correlatie en causaliteit niet uit het oog wordt verloren. Bij causaliteit is er een statistisch verband (correlatie) dat ook nog te is te verklaren.

Box: couveusekinderen
Een van de grootste risico’s voor couveusekinderen is dat ze een infectie oplopen. Dan is het van het grootste belang dat medici tijdig kunnen ingrijpen. Onderzoekers waren in staat om patronen in data te ontwaren die er op wezen dat een baby een infectie opliep en konden daarmee 24 uur van tevoren voorspellen dat de infectie eraan kwam. Gek genoeg werden de elementaire levensfuncties daarbij juist stabieler dan instabieler. Het waarom van dat patroon is vooralsnog niet bekend maar de datapunten vormen vooralsnog voldoende aanknopingspunten om tot actie over te gaan.

Tegenwoordig zijn er bijna geen grenzen aan het verzamelen, analyseren en opslaan van miljarden data. Het resultaat is dat we de wereld op veel gedetailleerder niveau kunnen onderzoeken waardoor bijv. Google de verspreiding van griep kan voorspellen voordat dit heeft plaatsgevonden. Of neem diverse  Amerikaanse steden die al succes boeken met ‘voorspellend surveilleren’: op basis  van analyse van grote hoeveelheden data uit diverse bronnen bepalen algoritmes welke straten extra aandacht verdienen van de agenten. Het effect is meer arrestaties maar vooral ook lagere misdaadcijfers.

Maar ook in de marketing zie je Big Data toepassingen waardoor het klassieke marktonderzoek langzaam uitsterft. Er ontstaan nieuwe manieren om dichter op de huid te kruipen van groepen klanten of stakeholders. Elk apparaat dat je tegenwoordig gebruikt is tegelijkertijd een ‘sensor’ die data genereert door jouw gebruik. Daarmee wordt niet gemeten wat je denkt maar wat je daadwerkelijk doet.

We leggen onze dagelijkse realiteit – en die van onze vrienden – doorlopend vast via onze telefoons, zetten foto’s op Instagram en Flickr en video’s op Youtube. We zijn zelf onze eigen grootste Big Brother geworden waarbij talloze anderen meekijken met wat we doen. Verder hebben we de Open Data-ontwikkelingen bij de overheid waarbij talloze algemene data vrij worden gegeven voor het publiek.

Daarmee kan tevens een overheid worden gecontroleerd. Al die data ontstaan omdat digitaal het nieuwe normaal is geworden. Digitaal leven doen we niet alleen volstrekt routineus, we zijn er ook nog verslaafd aan geworden.

Box: Deep Mind
In januari 2014 kocht Google Deep Mind, een bedrijf dat is gespecialiseerd in kunstmatige intelligente. Het bedrijf ontwikkelt computertechnologie die als een mens kan denken en handelen. Naar verluidt stelde Deep Mind een harde randvoorwaarde bij de deal: Google moest een ethische commissie oprichten die zich bezig houdt met dit onderwerp. De commissie bewaakt de manier waarop Google de technologie mag inzetten.

Beleidsconsequenties
Naast robotisering en ‘the internet of things’ zijn Big Data een verdere factor die de werkgelegenheid ernstig kunnen gaan beïnvloeden. Het gaat het einde betekenen van de kapper, de tegelzetter, de makelaar, de magazijnmedewerker en talloze andere beroepen. E.e.a. met ontwrichtende maatschappelijke gevolgen. Steeds meer  taken worden volledig van ons overgenomen.

Dat zal ook kunnen betekenen dat werk weg wordt gehaald uit derde wereld landen omdat het kostentechnisch interessant is om het te robotiseren. Dat zou ook daar een grote weerslag kunnen hebben op de economie.

Tegelijkertijd schept de nieuwe technologie verwachtingen en dat maakt de nieuwe uitdaging voor bedrijven, overheden en andere organisaties simpel samen te vatten: onmogelijkheden moeten direct worden gerealiseerd, op wonderen mag een levertijd zitten van maximaal twee weken.

Het is voor o.a. overheden van belang te beseffen dat Big Data maatschappelijke problemen kan oplossen en bijdragen aan een betere samenleving. Denk daarbij aan het redden van mensenlevens, beter en goedkoper onderhoud van wegen en bruggen, betere oogsten, of slimmer investeren.
Bij mensenlevens dachten we vroeger in populaties. Iedereen met eenzelfde ziekte moest hetzelfde worden behandeld. Nu wordt er gekeken naar specifieke genen en wordt daar de behandeling op afgestemd. Pillen als individueel maatwerk. In de toekomst zal de arts toenemend worden ondersteund door systemen van artificiële intelligentie.

Verder begint ‘selfcare’ op te komen. De consument gaat dan zelf het heft in handen nemen waarbij je jezelf kan gaan monitoren om daar je voeding of medicijngebruik op af te stemmen. We worden ons eigen laboratorium gebaseerd op lab-on-a-chip-technologie. Het gebruik van een weegschaal zal worden vervangen door mogelijkheden om je eigen bloed te meten. Daarbij word je bijv. al vroeg gewaarschuwd of je door je levensstijl Diabetes type 2 ontwikkelt. In die zin kunnen Big Data ons helpen al in een vroegtijdig stadium nieuwe gewoontes aan te leren.

Box: Lerende zwerfkinderen
Een fascinerend voorbeeld van de manier waarop technologie een volstrekt vanzelfsprekend onderdeel is geworden van onszelf en de maatschappij, werd zichtbaar in het zog. ‘Hole in the Wall’ – project van professor Sugata Mitra van de universiteit van Newcastle. Hij maakte  in 199 simpelweg een gat in een muur in een sloppenwijk in New Delhi met daarin een computer met een internetverbinding. Hij wilde graag zien hoe zwerfkinderen, die nog nooit met een computer hadden gewerkt, – ermee omgingen. Tot zijn blijdschap bleken ze niet alleen in korte tijd de computervaardigheden onder de knie te krijgen, maar ook zichtzelf Engels en wiskunde te leren. Zonder dat een leraar er aan te pas kwam dus, en zonder aanmoediging van een projectmanager of wetenschapper. Het project is inmiddels uitgebreid naar diverse landen.

Dergelijke ontwikkelingen maken tevens dat het voor beleidsambtenaren zélf van belang wordt, zich af te vragen hoe Big Data op een verantwoorde manier kunnen bijdragen aan beter beleid.

De schaduwzijde
Natuurlijk heeft elke nieuwe technologie ook zijn schaduwzijde. Ze kan zowel ten goede als ten kwade worden gebruikt. Overheden en bedrijven krijgen hiermee middelen in handen om ongewenste elementen uit groepen mensen te pikken en vrijheden in te perken. Zelfs vóórdat ze iets hebben gedaan. Er ontstaat een enorme data-asymmetrie in informatie. De overheid leert ons steeds beter kennen, maar wij moeten gissen naar hun manier van opereren.

De vraag is hoe lang de maatschappij bereid is die asymmetrie te accepteren. Er is weinig fantasie voor nodig om te bedenken dat een groeiende groep bedrijven en overheden de komende jaren te maken zal krijgen met incidenten. Irritatie zal dan ook eerder toe- dan afnemen. Snowden opende menigeen de ogen. Dat zal ook weer bedrijven dwingen om open te worden over wat ze doen.

Bovendien zal er een grote druk gaan ontstaan op solidariteit. Tot nu toe bepaalde een zorgverzekeraar diens premie op een gemiddelde. Dat aloude concept van solidariteit is niet meer vanzelfsprekend. Zeker als je meetbaar meeverantwoordelijk wordt voor je eigen gezondheid. Rook je? Dan meer premie betalen.

Maar ook inbreuk op privacy ligt op de loer en de wijze waarop bedrijven geld kunnen verdienen met data die wij genereren. Volgens Roos Lindgren volgt informatie de tweede hoofdwet van de thermodynamica waarbij er maximale entropie ontstaat. Dat is een vorm van ‘wanorde’ waarin geen enkel gegeven meer is opgeslagen in een veilige container, maar waarin alle informatie vrijelijk in de openbare, ongecontroleerde ruimte circuleert. Informatie die tot voor kort beheersbaar was, wordt onbeheersbaar. En dat gaat niet meer veranderen.

Ook geld gaat ‘entropiseren’. Er ontstaan er nieuwe muntsoorten, zoals de Bitcoin met talloze nieuwe toepassingen. Dat betekent dat er een domein ontstaat dat onbereikbaar is voor beleidsmakers, wetgevers en toezichthouders.
Een verminderde invloed van beleidsmakers  wordt ook versterkt door de nieuwe zelforganisatiemogelijkheden voor burgers onderling waardoor die steeds vaker een lange neus trekken naar gevestigde partijen en politici. Die worden dan weer gedwongen burgers te laten participeren in de beleidsontwikkeling.

Minder nadenken en beperkt digivaardig 
De nieuwe technologieën maken dat we zelf minder nadenken. Technologie die ons vertelt dat we broccoli moeten eten, oefeningen doen etc. Eigenlijk worden we, als we niet oppassen, daardoor meer een zombi in omgevingen die intelligent reageren op ons.

Dat speelt ook bij de jongere generatie. De oude generatie wordt wel eens omschreven als de digitale naïevelingen terwijl dat voor de jonge generatie allemaal gesneden koek is. Toch blijkt de jonge generatie helemaal niet zo digivaardig en bewust. Een onderzoeker van YoungsWork verwees in dat kader naar een onderzoek in opdracht van Kennisnet en constateerde dat

[….] jongeren minder aandacht aan de kwaliteit en relevantie van gevonden informatie besteden dan oudere collega’s. In de praktijk komt het daarom voor dat ouderen werknemers denken dat jongeren alles kunnen met computers. Dit kan leiden tot overschatting van jongere medewerkers en onzekerheid bij oudere werknemers. Het is belangrijk deze mythe van de werkvloer te verbannen.”
http://blog.youngworks.nl/youngworks/digital-natives-op-de-werkvloer
 

‘In een tijd van drastische veranderingen zijn het de lerenden die de toekomst erven. De geleerden blijken meestal toegerust op een wereld die niet meer bestaat’, zo stelde de Amerikaanse schrijver Eric Hoffer. Het onderwijs stimuleert jongeren nauwelijks om probleemoplossend, kritisch en creatief na te denken. Het goed – fout denken (dichotoom) is dominant.  
De nieuwe samenleving zou in het onderwijs verder kunnen inzetten op:

  • Het verbinden van studenten met andere studenten en met de ideeën van anderen.
  • Het leggen van verbindingen met mensen van buiten de instelling.
  • Het stimuleren van communicatie, samenwerking en kennisdeling.
  • Het vergroten van de vaardigheid om informatie op haar waarde te beoordelen.
  • Het stimuleren van actief leren boven passief leren.
  • Het creëren van meer uitdaging.

De filterbubbel en neo-verzuiling
Toch wil al die open data niet zeggen dat we er ook kennis van nemen. In feite leidt ons gedrag op internet tot een nieuwe vorm van verzuiling: het web met talloze gemeenschappen waar vaak alleen gelijkgestemden welkom zijn en waar nauwelijks echte discussie plaatsvindt. Reeds in 2004 stelde de AIVD in een rapport over moslimextremisme vast dat internet in toenemende mate een rol speelt bij de radicalisering van Islamitische jongeren in Nederland. Mede naar aanleiding van dit rapport schreef NRC Handelsblad toen een treffende analyse:

“Wie zich in 2005 op het internet begeeft, komt niet terecht in een dorp waar de bewoners bij de pomp op de brink gezellig bij elkaar staan bij te kletsen, maar in een soort Los Angeles waar de verschillende bevolkingsgroepen wonen in hun eigen wijken, getto’s en gated communities. Internet is aan het begin van de 21-ste eeuw een grimmige, almaar uitdijende metropool geworden waar de bewoners van de ene enclave naar de andere gaan en zelden met elkaar in aanraking komen met anderen dan hun soortgenoten. Slechts af en toe dringt een niet-bewoner een getto binnen of staat hij aan het hek van een gated community te schelden en te tieren. Maar dit is voor enclavebewoners alleen maar een reden om zich verder te verschansen.”

Uiteraard geen nieuw verschijnsel. Als je vroeger een abonnement had op een bepaalde krant, las je ook niets anders. Alleen lagen die kranten destijds in de kiosk wél naast elkaar. Dit fenomeen wordt nog in de hand gewerkt doordat zoekmachines hun informatie-aanbod gericht op jou afstemmen. M.a.w. er is sprake van toenemende informatiegetto’s.

Een tegengif kan zijn dat een zoekmachine je niet alleen aanbiedt wat gelijkgestemden zeggen maar ook wat andersdenkenden lezen op terreinen die je interessant vindt. Een dergelijk algoritme is getest in Chili in november 2013 tijdens hevige debatten over het strenge abortusverbod. Het resultaat was bemoedigend: mensen bleken open te staan voor een écht inhoudelijk debat als ze werden geconfronteerd met de tegengestelde meningen van vergelijkbare individuen.

Tot slot: een nieuw (info) ecosysteem
De auteurs stellen dat we een nieuw ecosysteem nodig hebben waarin partijen zoals overheden, bedrijven, data scientists, programmeurs, juristen, belangengroepen en gebruikers optimaal kunnen samenwerken aan goede Big Data toepassingen. Een knooppunt waarin inzichten uit een veelheid van bronnen bij elkaar komen én waar geen onduidelijkheid is over de voorwaarden die er zijn voor iedereen die inzichten wil genereren of gebruiken. Dat kan ook alleen maar als we bereid zijn onze data (geanonimiseerd) beschikbaar te stellen ten behoeve van onderzoek waar de maatschappij van kan profiteren.

Dat ecosysteem heeft dan elementen van de bekende ‘App Store’, waar nuttige of leuke applicaties vanzelf komen bovendrijven en andere naar de achtergrond drijven dankzij een reviewmodel waarin gebruikers beoordelingen geven en recensies om hun ervaringen te delen. Dit systeem behoeft tevens een vorm van kwaliteitsbewaking welke door gecertificeerde personen (vgl. accountants) zou dienen te geschieden.

Max Herold
Februari 2016

Meer weten? Wij zijn Big Data: de toekomst van de internet samenleving Auteurs: Sander Klous & Nart Wielaard Uitgeverij: Business Contact, 2014.

Klik op:  https://www.managementboek.nl/boek/9789047007777/wij-zijn-big-data-sander-klous?affiliate=1910