Column: Big Recht
De big data-hype is nog niet over. Sterker, volgens Brocade worden big data en analytics nog belangrijker. Gaan we daar in 2016 iets van merken in het juridische domein? Tot nu toe wordt vooral veel gesproken over de juridische aspecten van big data, privacy voorop. Als er al iets over juridische data science-toepassingen wordt gezegd, dan gaat het vaak over Watson: het speeltje van IBM dat in de woorden van het bedrijf zelf een \\L3multitalented legal assistant gaat worden. Die Watson spreekt echter voorlopig alleen nog maar Engels (en naar het schijnt een beetje Portugees), dus de kans dat dit apparaat binnenkort het Nederlands recht kan doorgronden, lijkt niet al te groot.
Mayer-Schonberger en Cukier
Als we kijken naar big data door de brillen van Viktor Mayer-Schonberger en Kenneth Cukier die het \\L4boek Big Data schreven, dan zijn er drie aspecten die het landschap van gegevens en de analyse doen veranderen. Zij stellen daarbij dat deze veranderingen van invloed zullen zijn op de manier waarop we onze samenleving begrijpen en organiseren. Zal dat ook gaan gelden voor het recht? Zal de manier waarop we nu het recht begrijpen en organiseren ook veranderen?
Veel juridische digitale data
Een eerste verandering die Mayer-Schonberger en Cukier noemen, betreft de mogelijkheid om meer gegevens te kunnen analyseren. Moesten we in de analoge tijd genoegen nemen met een beperkte dataset voor onderzoek en waren de (informatie)technieken beperkt, in het digitale tijdperk is over heel veel kwesties heel veel (soms alles) makkelijk beschikbaar en vormen opslagmogelijkheden en analysetechnieken geen enkele drempel.
Als ik dat vertaal naar het juridische domein: op dit moment zijn zo goed als alle Nederlandse wetten en regels digitaal en publiek toegankelijk. Hetzelfde geldt voor verdragen waarbij Nederland partij is en voor de belangrijkste Nederlandse jurisprudentie. De enige niet-publiek beschikbare juridische gegevens zijn te vinden in vooral de tijdschriften en boeken. Die staan immers in de meeste gevallen nog achter een betaalmuur van een uitgever. Wel zijn veel van deze teksten ook digitaal beschikbaar.
Het feit dat juridische artikelen en annotaties niet online staan en daarom niet zomaar te analyseren zijn, is voor de juridische gemeenschap een onwenselijke situatie. Natuurlijk, een analyse van wetten, regels, uitspraken, richtlijnen, beleidsstukken levert ongetwijfeld interessante inzichten op (als we de big data-goeroes mogen geloven). Het in zo'n analyse opnemen van ook juridische artikelen, annotaties en zelfs boeken moet dan leiden tot een nirvana van juridische uitkomsten. In de wereld van big data geldt immers hoe meer, hoe beter. Het is voor de juridische wereld daarom uitermate belangrijk alle door wetenschappers, advocaten, rechters, overheidsjuristen gepubliceerde en geproduceerde data, daar waar dat kan, in eigen beheer te houden om deze te allen tijde te kunnen gebruiken voor data-analyses.
Niet exact, maar rommelig
Big data zijn niet exact, niet nauwkeurig. Ze zijn eerder rommelig, variëren in kwaliteit en bevinden zich verspreid over talloze servers. Dit betekent overigens niet dat in de wereld van big data de eis tot exactheid helemaal verdwijnt. Er wordt slechts afstand gedaan van de volledige trouw aan dat soort data, aldus Mayer-Schonberger en Cukier. Waar op microniveau aan precisie wordt verloren, wordt aan inzicht gewonnen op macroniveau. Dit betekent ook dat veel verschillende soorten data in een analyse gebruikt kunnen worden, of die data nu netjes gestructureerd zijn of niet.
Stel dat ooit alle uitspraken door Rechtspraak.nl worden vrijgegeven (dat is nu niet zo) evenals alle artikelen en annotaties, dan zou het een ondoenlijke klus zijn deze data allemaal netjes te structureren. Maar dat hoeft dus ook niet. Een ordening, een taxonomie, een thesaurus: het is allemaal niet meer (per se) nodig in de tijden van big data. Dat betekent ook dat dit soort ordeningen ook niet meer onderhouden hoeven te worden. En het betekent dat verschillende juridische gegevens met groot gemak bruikbaar zijn en gecombineerd kunnen worden in een data-onderzoek.
Van causaal verband naar correlatie
De derde verschuiving die de big data-goeroes noemen in hun boek betreft de omslag van causaliteit naar correlatie. Zij stellen dat wij mensen altijd op zoek zijn naar oorzaken, hoe moeilijk het soms ook is de achterliggende oorzaak van een gebeurtenis te vinden. In de wereld van big data kan ook de zoektocht naar oorzaken aan de kant geschoven worden. Het zijn de correlaties in gegevens die ons nieuwe en/of waardevolle inzichten kunnen geven. Big data houdt zich bezig met het wat en niet met het waarom. In hun boek noemen Mayer-Schonberger en Cukier een onderzoek waaruit naar voren komt dat een bepaalde combinatie van aspirine en sinaasappelsap tot gevolg heeft dat de ontwikkeling van kanker afremt. Waarom deze combinatie het remmen van kanker tot gevolg heeft, is (nog) onbekend, maar dat het gebeurt is overduidelijk.
Het opzij schuiven van het causale verband ten faveure van correlaties zou in het juridische domein wel eens een brug te ver kunnen zijn. Enige voorzichtigheid lijkt gepast met het zoeken naar correlaties in grote hoeveelheden juridische gegevens. Het terrein van correlaties is op zijn minst nogal diffuus. Zo lijkt er een correlatie te zijn tussen het geld dat de Amerikaanse overheid uitgeeft aan wetenschap, ruimtevaart en technologie en het aantal zelfdodingen door verhanging, wurging en verstikking. Maar is er oorzakelijk verband?
Toch kan ik me voorstellen dat data-analyses hun in intrede gaan doen in het juridische veld. Misschien niet om het oorzakelijke verband tussen een oorzaak en een gebeurtenis aan te wijzen, maar (in eerste instantie) toch wel ter ondersteuning van het aantonen van een mogelijk causaal verband. Zo moest in een recente zaak het oorzakelijk verband aangetoond worden tussen de werkzaamheden van een werknemer en de schade aan zijn gezondheid. Ik kan me zomaar voorstellen dat in de toekomst een data-analyse binnen enkele seconden aangeeft dat de werknemer een gezondheidsschade heeft opgelopen die alleen maar veroorzaakt kan zijn door blootstelling aan de stof waar hij mee werkte. Als deskundigen dit vervolgens bevestigen, dan is het verband aangetoond en wordt de schade vastgesteld; volgende zaak. Big recht!