‘Wij ontdekten dat de verdedigende invloed van Veltman erg groot is’
De ontwikkelingen in het mondiale voetbal volgen elkaar in rap tempo op en de rol van data begint een steeds grotere rol te spelen. Het Deense FC Midtjylland is een van de bekendste voorbeelden uit de laatste jaren en de club werd met behulp van statistiek voor het eerst in de geschiedenis kampioen. In Nederland is een aantal jaar geleden het bedrijf SciSports opgericht dat zich volledig focust op het combineren van wetenschap (science) en de voetbalsport. Afgelopen maand haalde het bedrijf 1,8 miljoen euro op in een investeringsronde en Voetbalzone ging op bezoek bij Chef de Mission en oprichter Giels Brouwer (27) bij hun nieuwe vestiging in Amersfoort. Eerder verscheen deel een van het driedelige interview over de totstandkoming van het bedrijf. Vandaag deel twee over hoe hun product SkiSkill werkt.
Waar haalden jullie de data vandaan waar jullie de modellen op baseren?
“In het begin gebruikten we alle data die we konden vinden zoals Transfermarkt, ORTEC, Wyscout, maar bijvoorbeeld ook Football Manager dat een leger van ruim 1.300 scouts rond heeft lopen. Al die verschillende databronnen koppelen we aan elkaar en gebruiken we om een gebalanceerd beeld te vormen. Vervolgens gebruiken we machine learning die automatisch patronen in de data vindt; een zelflerend mechanisme. Dat soort modellen gaan we vervolgens handmatig checken om te zien of het klopt. Fouten passen we weer aan en dat leert het systeem dan weer. We proberen daarna alle data voor een bepaalde kwaliteit in één getalletje te stoppen. Zo kunnen we ook vergelijkingen maken en bijvoorbeeld zoeken op soortgelijke spelers als Hakim Ziyech. Eigenlijk precies wat in Football Manager ook kan en dat proberen we terug te vertalen naar de wetenschap.”
Maar het voetbal hangt toch ook vaak van toevalligheden aan elkaar?
“Helemaal mee eens, daarom zal data zal ook altijd een radertje blijven in de motor van de voetballerij, maar het kan je wel helpen een paar procentjes extra te pakken. Ik denk dat een scout bij een wedstrijd meer kan zien dan wij uit de data kunnen halen, maar een scout moet eerst de keuze maken waar hij gaat kijken. Wij pakken die hele berg data, analyseren die en met de schaduwlijst die wij maken kunnen zij dan aan de slag. Een soort prescouting; het flaggen van de talenten. Het is toch eigenlijk raar dat ik voor ik iemand aanneem de kandidaat eerst uitgebreid test, maar dat clubs spelers soms amper kennen en tonnen of miljoenen neerleggen voor zo’n jongen.”
Maar jullie zijn je dus bewust van jullie eigen tekortkomingen?
“Zeker, data gaat scouting nooit vervangen en zal altijd een hulpmiddel blijven. Je moet ook niet pretenderen dat het meer is. Het kan een bijdrage kan leveren net zoals de spitsentrainer dat doet of een medisch professional. Speelstijlanalyse is bijvoorbeeld heel belangrijk en voor ons zijn door het gebrek aan historische data snelle wisselingen van de coach of zijn systeem erg lastig. Neem Louis van Gaal bij het Nederlands elftal die vlak voor het toernooi opeens het systeem omgooit: hoe ga je dat classificeren? Maar op de lange termijn zie je vaak wel patronen. Bij José Mourinho zie je duidelijk dat hij in alle modellen afwijkt van de standaardtrainer. De meeste teams gaan bij een 1-0 voorsprong proberen uit te bouwen, maar Mourinho vindt het allemaal best als hij niks tegen krijgt.”
Wat is voor jullie de grootste uitdaging?
“Het mooist en tegelijkertijd het moeilijkst is hoe je spelers onderling op verschillende posities en in andere competities met elkaar moet vergelijken. Hoe kun je scouten dat een speler uit de Jupiler League over drie jaar de potentie heeft in de Champions League te spelen? Dat is waar we steeds mee bezig zijn; clubs helpen bij het vinden van een speler als Vincent Janssen voordat ze te duur worden om te halen. Ons basisalgoritme berekent de invloed van een speler op zijn team. Dus bijvoorbeeld een team dat erg vaak wint als een bepaalde speler in het veld staat. Dat zag je bij Lasse Schöne een aantal jaren geleden. Hij speelde bijna niet, maar als hij speelde, had hij altijd een belangrijke rol in de resultaten van Ajax. Als je kijkt naar de invloed van spelers op een elftal kun je ook een goede inschatting maken van het talent dat iemand heeft.”
Maar het kan toch ook zijn dat Frank de Boer hem expres in specifieke wedstrijden gebruikte?
“Daarom is de trainer ook heel belangrijk en houdt het algoritme daar ook rekening mee. Zo zagen we dat als Lionel Messi speelt Barcelona minder punten haalt, maar constateerde het algoritme tegelijkertijd dat het team sterker was met Messi. Dit is eenvoudig te verklaren doordat hij mindere wedstrijden niet hoeft te spelen. Ook zagen we dat zowel Messi als Cristiano Ronaldo een grotere verdedigende invloed op hun elftal hebben dan veel verdedigers. Wellicht doordat veel spelers van de tegenstander druk met hen zijn, waardoor ze zelf minder toe komen aan aanvallen. De precieze reden is ook niet altijd relevant, maar als je het meet, kun je het testen en constateren. Zo is Toby Alderweireld cijfermatig een topverdediger, maar heeft hij ook een grote aanvallende invloed. Dat weten we wel uit zijn tijd bij Ajax natuurlijk, maar dat heeft hij blijkbaar nog steeds in zijn spel.”
Wat voor soort dingen testen jullie nog meer?
“Je kunt het zo gek niet bedenken of we onderzoeken het. Als het in de media gaat over Peter Bosz die in vijf seconden de bal terugveroverd wil hebben, kijken wij of we dat met data kunnen meten. We verzinnen veel statistieken die waardeloos blijken, maar dat zie je pas wanneer de lijst eruit rolt en de patronen ziet. Als we een model maken voor afwerken en Zlatan Ibrahimovic, Luis Suaréz, Robert Lewandowski en Sergio Agüero niet in de lijst staan, weet je dat het niet klopt. Dus zo probeer je eerst te valideren met veel trial en error. Laatst kwam er plotseling een zekere Jorge Resurrección naar voren. Dan ga onderzoeken we wie dat is en dan blijkt ie Koke te heten, haha. Zo proberen we steeds te kijken of onze bevindingen kloppen en als er een speler tussenstaat die we niet kennen, zoals Nathan Redmond bij Norwich City in 2014, gaan we hem verder onderzoeken.”
Zijn bepaalde kwaliteiten van spelers niet heel lastig te typeren?
“Absoluut. Zo worstelden we bijvoorbeeld met hoe we een type speler als David Silva, Alexis Sánchez of Mesut Özil konden karakteriseren. Daarvoor hebben we onder andere gekeken hoe lang iemand op het laatste derde van het veld, het gebied het dichtst bij het vijandelijke doel, de bal aan de voet kon houden en een succesvol vervolg kon geven. Waar we ook naar kijken is waarom clubhoppers het soms niet lukt om ergens te slagen nadat het elders wel lukte. Neem Finnbogason die het bij Heerenveen goed deed en het daarna nooit meer helemaal waar heeft gemaakt. Wij proberen er de vinger op te leggen waar dat aan ligt, want het zou prima kunnen dat hij in de Eredivisie of bij een andere club alsnog heel goed uit de verf zouden kunnen komen onder bepaalde omstandigheden.”
Kun je namen noemen van spelers die bij jullie heel hoog scoorden?
“Een speler die bij ons een half jaar geleden er al extreem hoog uitkwam was Sead Haksabanovic, een 17-jarige speler uit de tweede Zweedse divisie. Nu hoor je zijn naam regelmatig en zie je hem opkomen. Het is wel gaaf om dat soort talenten te ontdekken. Henry Onyekuru van Eupen is ook een van mijn andere favorieten. Ook spotten we Gianluigi Donnarumma en Alban Lafont al snel, maar dat soort jongens ziet iedereen wel. Verder doen de gebroeders Van Crooy het goed bij VVV en hebben Oleksandr Zinchenko en Václav Cerný groot potentieel. Een ander feitje: Veltman wordt regelmatig bekritiseerd, maar wij ontdekten dat zijn verdedigende invloed bij Ajax juist erg groot is.”