08.06.2015

Column: Support lawyer wordt data scientist

Leo van der Wees, foto: Patrick Nagtegaal Het is bijna niet te geloven, maar we produceren vandaag de dag iedere tien minuten net zo veel data als in de gehele periode van de prehistorie tot aan 2003! Voor wat betreft juridische informatie loopt het niet zo'n vaart, maar ook in dit domein neemt de groei van de hoeveelheid data snel toe. Als we alleen al kijken naar het publieke juridische domein, is de hoeveelheid data inmiddels gigantisch. We kunnen langzaamaan spreken van een grote hoop juridische data: big legal data. Begon het met de komst van het \\L2world wide web nog bescheiden met wetsvoorstellen, memories van toelichting en andere Kamerstukken, daar kwamen eind vorige eeuw uitspraken bij, snel gevolgd door verdrags- en wetteksten. Vandaag de dag zien we dat steeds meer juridische artikelen, commentaren en proefschriften gewoon via het internet vrij toegankelijk zijn. Lang leve \\L9content marketing en \\L10open access!

Watson en big legal data
De googlende jurist wordt vanzelfsprekend heel blij van deze ontwikkeling. Een beetje zoekopdracht in een goede zoekmachine levert immers steeds betere juridische resultaten op. En dat voor niets!

Wie er ook blij van wordt, is Watson, het nieuwe speeltje van IBM dat het in zich heeft om de \\L11support lawyer van de toekomst te worden. Het is een kwestie van het voeden van Watson met de juiste gezaghebbende juridische gegevens om het systeem vervolgens te gaan trainen hoe om te gaan met deze gegevens. Aan de beschikbaarheid van de gegevens zal het niet liggen. Bijna al het juridische materiaal is immers rechtenvrij beschikbaar. Het op een juiste wijze voeden en trainen van het systeem zal ingewikkelder zijn, maar dat is natuurlijk niet echt iets nieuws in de wereld van de informatietechnologie. Geen goed systeem zonder goede inhoud.

Overigens hoeft niet per se Watson ingezet te worden voor het analyseren van juridische teksten. Ook andere \\L12data science tools kunnen gebruikt worden—en ook daarvoor geldt dat de beschikbaarheid van het gereedschap een ding is, maar het voeden en het bruikbaar inzetten ervan iets heel anders.

Aandachtspunten voor de juridische Watson
Er is een aantal zaken waarop de vullers van data science-systemen alert moeten zijn. Zo moet de dataset in een systeem van hoge kwaliteit zijn en zo compleet mogelijk. Men moet geen data toevoegen die er niet toe doen en tegelijkertijd mag men niets vergeten. Maar kan op voorhand bepaald worden of data relevant is? Kijkend naar gerechtelijke uitspraken zoals die beschikbaar zijn in het publieke domein, dan weten we van tevoren dat deze set niet compleet is. Rechtspraak.nl publiceert immers niet alle uitspraken van alle Nederlandse gerechten, maar slechts een selectie. Aan de andere kant, de rechtspraktijk weet nu ook dat niet alles gepubliceerd wordt en functioneert tot op heden prima.

Een ander punt van aandacht is of het data science-systeem de juiste verbanden legt en de informatie op waarde kan schatten. Een juridisch getraind data science-systeem moet natuurlijk wel weten dat de Hoge Raad onze hoogste gerechtelijke instantie is. En wat als de Hoge Raad om gaat? Los van het feit dat het systeem daarvan op de hoogte gebracht moet worden, is de vraag hoe het met die 'wijsheid' omgaat.

Datadeskundige en kennis van recht
Kortom, big legal data is mooi, maar het vergt nog wel de nodige aandacht om een echte betrouwbare digitale support lawyer te bouwen. Het lijkt hierbij onvermijdelijk dat de huidige ondersteunende jurist hulp krijgt van een of meer personen die technisch onderlegd zijn, die alles van juridische data weten, maar die ook zonder problemen met een jurist moeten kunnen communiceren. Zonder personen met deze skills heeft big data in het recht geen kans. Maar dan blijkt er toch nog een klein probleem te zijn. Tools om te graven in juridische data zijn er namelijk wel, evenals datadeskundigen, maar het ontbreekt nog aan juridische data-experts. Gelukkig wordt er hard gewerkt om dit probleem uit de wereld te helpen. In Tilburg zullen namelijk binnen afzienbare tijd de eerste juridische datadeskundigen van de universitaire band rollen.

Support lawyer wordt data scientist
En dan? Dan zullen support lawyers steeds meer datadeskundige zijn en steeds minder jurist; ze worden data scientists met juridische bagage. Dan zal het juridische werk sneller gaan zonder dat de kwaliteit afneemt—sterker, die wordt misschien wel beter. Data science tools kunnen immers heel snel verbanden leggen tussen juridische (en niet-juridische) gegevens—veel sneller en nauwkeuriger dan een mens dat kan. En het zou zomaar kunnen dat de Watsons ook het routinewerk van advocaten en juridisch adviseurs gaan overnemen. Werk dat nu nog, dag in dag uit, volgens dezelfde redeneerpaden loopt.

En zo blijft het spannend in het juridische informatielandschap.