Zaterdag 23 oktober 2021

Game Theory: interview met een expert

Dieter van de Scheur GTO Game Theory Optimal

Game Theory is de wetenschappelijke modellering van strategische interacties tussen verschillende partijen, die elk hun eigen belangen nastreven. Vooral in het poker is het een veelgehoorde term. Vandaag een interview met Dieter van de Scheur, een Game Theory-expert.

Als je een spel speelt tegen andere spelers, heb je tegenovergestelde belangen. Iedereen wil namelijk winnen, terwijl er maar één kampioen kan zijn. Game Theory is de wetenschap over hoe je het spel optimaal speelt met inachtneming van jouw doelstelling. Het faciliteert het vinden van oplossingen en strategieën die een beste resultaat geven en stabiel zijn. Stabiel betekent dat anderen de gekozen strategie niet kunnen uitbuiten.

Game Theory is een veelgehoorde term in de wereld van poker. Voor spelers als Doug Polk is Game Theory (en de zogenaamde Game Theory Optimal-benadering; GTO) de basis van hun spel. Er zijn online tal van zogenaamde solvers en handige schema’s te koop, die je precies vertellen welke handen je wel wilt spelen en welke niet.

Game Theory is wat Van de Scheur predikt; of het nou om de aanschaf van een auto gaat als consument, de aanbesteding van een miljoenenproject door de overheid, of wanneer je als bedrijf in zee gaat met een nieuwe producent.

Game Theory heeft een bredere toepasbaarheid dan in poker. Hoewel de naam impliceert dat het alleen handig is als je spelletjes speelt, is Game Theory in veel meer situaties inzetbaar. Binnen Game Theory is een ‘Game’ dus de modellering van een strategische interactie tussen spelers.

Dieter van de Scheur was jarenlang onderhandelingsexpert voor Phillips en was in die rol verantwoordelijk voor de begeleiding van vele strategische inkooptrajecten. Tegenwoordig werkt hij voor TWS Partners, een bedrijf dat succesvol en exclusief Nobelprijs-winnende concepten vanuit de Game Theory toepast om de resultaten van bedrijven over de gehele wereld te verbeteren. Veelal zijn dit strategische inkooponderhandelingen. Game Theory is wat Van de Scheur predikt; of het nou om de aanschaf van een auto gaat als consument, de aanbesteding van een miljoenenproject door de overheid, of wanneer je als bedrijf in zee gaat met een nieuwe producent.

Wat is Game Theory Optimal? Waar komt het vandaan?

In de basis is Game Theory de analyse van strategische interactie tussen rationele spelers. Je zou het ook de wetenschap van strategische beslissingen nemen kunnen noemen. Het is op heel veel vlakken toepasbaar. Game Theory is niet specifiek iets voor gambling of gaming, hoewel het in poker wel nadrukkelijk aanwezig is. Maar ook in in het dagelijks leven kom je zo vaak voor strategische interacties te staan, al herkent niet iedereen die altijd voor wat ze zijn.

Heb je daarvan voorbeelden van in het dagelijks leven, zoals in de supermarkt?

In supermarkten gaat het meer om de prijsstelling van producten. Ik geef een paar keer per jaar gastcollege in de food retail. Binnen die branch zitten supermarkten bijvoorbeeld in een Prisoners Dilemma. Ze zijn intrinsiek gemotiveerd om de competitie te verslaan en lage prijzen aan te bieden. Binnen Game Theory noemen we dit een dominante strategie. Ze doen dit om marktaandeel te winnen en dit leidt tot prijsdruk en dus lage winst. Het liefst zouden ze met elkaar overleggen. Die mogelijkheid is er niet als ze slechts eenmalig zouden concurreren, hetgeen we binnen Game Theory een ‘one-shot game’ noemen. Echter in de praktijk heb je heel vaak repeated games en daardoor is coördinatie wel mogelijk. Dat stelt supermarkten bijvoorbeeld in staat om relatief stabiel een hoger prijsniveau te handhaven door een zogenaamde ‘tit-for-tat’ strategie te kiezen. Bij deze strategie ga je pas je prijzen verlagen als een ander dat ook doet. Dus als jij Albert Heijn bent en ik de Jumbo en jij gaat stunten met de prijs, dán ga ik dat pas ook doen en andersom. Maar dat willen we allebei niet.

“toch zie je dat zelfs grote bedrijven vaak niet super goede prijzen krijgen. En dat komt doordat leveranciers of verkopers prima in staat zijn om differentiatie te creëren.”

Twee jaar geleden gebeurde dat wel. Toen ging de PLUS stunten met groente en fruit en de rest volgde vrij snel. Dat was prima voor de consument, want die willen lagere prijzen. Maar de PLUS houdt er op de langere termijn niet veel meer aan over. Dan zie je op de lange termijn dat de prijzen weer langzaam omhoog kruipen omdat ze weer het vertrouwen in elkaar moeten hervinden en moeten inzien dat dit niet voor iedereen het beste is. Dat is dus coördinatie. Je mag elkaar niet opbellen en zeggen van “Hé, wat ben jij aan het doen?”, want dat krijg je de Autoriteit Consument en Markt op je dak. Maar ergens wil je als supermarkt ook allemaal een hogere prijs, want dan ben je beter af.

Er is een aantal publicatieplatforms waarbij je kunt zien wat de prijsniveau’s doen. Bijvoorbeeld websites die publiceren waar de kratten bier in de aanbieding zijn. Dan denk je als consument dat je goed kunt zien waar het het goedkoopst is. Maar het gevolg is dat supermarkten direct kunnen zien waar de prijs lager is en wie deze verlaagt. Zo heb je eigenlijk een prisoners dilemma binnen zo’n markt, maar weten partijen toch een coördinatie te vinden om eruit te komen en hun resultaat te verbeteren.

Binnen mijn tak van sport – inkooponderhandelingen – zijn leveranciers normaal gesproken intrinsiek gemotiveerd om te concurreren, want ze willen graag die business hebben. Toch zie je vaak dat zelfs grote bedrijven niet super goede prijzen krijgen. En dat komt doordat leveranciers of verkopers prima in staat zijn om differentiatie te creëren.

Bedrijven voeren doorgaans bilaterale onderhandelingen met leveranciers en proberen zo tot een zo goed mogelijk resultaat te komen. Bilateraal is één op één onderhandelen. Als wij een bedrijf adviseren in de onderhandelingen, kunnen we bijvoorbeeld multilaterale onderhandelingen voorstellen. We zetten dan de leveranciers als spelers binnen een Game Theory setting, waarbij zij moeten strijden voor de business. Eigenlijk ga jij één stap hoger staan en haal je jezelf uit dat spel.

Ik ken Game Theory vooral uit het poker. Sinds een aantal jaar bestaan er diverse programma’s die pokersituaties uitrekenen. Is eenzelfde ontwikkeling buiten poker ook zichtbaar in het bedrijfsleven?

Er zijn platforms die je kunnen ondersteunen bij verschillende veilingmodellen. Sommige elementen uit onze strategische aanpak zijn te automatiseren. Maar de meeste onderhandelingsmechanismen die we maken voor klanten, doen we face-to-face. Ik denk dat in 80-90% van de onderhandelingsmechanismen die wij voorstellen onze klanten die in een face-to-face setting uitvoeren en dus leveranciers op locatie uitnodigen.

De platforms die bepaalde zaken automatiseren zijn te vaak nog relatief basic, waardoor ze niet kunnen doen wat wij willen dat ze doen. Dus tenzij een klant specifiek vraagt naar een bepaald platform, kijken we naar de situatie zelf en schrijven we daar een eigen, optimale aanpak voor.

Bij de bedrijven waarmee we samenwerken, zien we situaties met veel specifieke afstemmingen. Het gaat niet puur om de ratio, gevoel speelt voor veel klanten ook mee. Een lange en goede relatie met iemand is lastig uit te drukken als element in een vergelijking, maar voor hen wel enorm belangrijk. Dat soort elementen zijn lastig in ‘sourcing advisors’ te vangen. Een model wordt dan zo complex en zo specifiek, dat het niet meer betrouwbaar is. Dan kan je het nog steeds beter aan een persoon overlaten. Maar ook daar zijn verschillende theorieën over. Aanbieders van dat soort sourcing tools zouden het fantastisch kunnen, maar die hebben vaak geen exacte expertise in onderhandelingstrajecten. Ze kunnen het dus niet helemaal overzien. Dan zie je dat dat soort dingen alleen goed zijn voor hele laagdrempelige, simpele situaties. Het zijn alleen niet dingen waarmee je de oorlog gaat winnen of waar je de echte waarde gaat creëren, dus waarom zou je je daar dan op focussen? Uiteindelijk creëer je de échte waarde op de echt strategische trajecten.

De beste manier om een auto te kopen: TCO en blind bieden

Een auto kopen is voor de meesten allesbehalve gemakkelijk. Autodealers hebben niet meer het louche imago van de jaren ’90, maar nog altijd kom je als koper in een wereld die je niet kent. Auto’s vergelijken is lastig en de beste prijs krijgen misschien nog wel moeilijker.

Toen er gezinsuitbreiding op komst was, bracht Van de Scheur eerst de totale waarde van de auto’s van zijn keuze in beeld. Na deze Total Cost of Ownership (TCO) verkenning schreef hij alle dealers aan met de vraag een laatste, bindend bod uit te brengen (First Price Sealed Bid).

Lees zijn hele aanpak en de uitkomst op zijn blog.

We hadden het al over de supermarkten, maar dat was een voorbeeld vanuit de business. Het kopen van een auto is een voorbeeld waar je als consument via game theory een optimale beslissing kunt maken. Dat heb je zelf meegemaakt.

Wij wisten niet specifiek welke auto we wilden, maar wel wat voor een soort auto het moest zijn; een automaat binnen een bepaalde prijsklasse. We hebben een aantal types proefgereden en toen zeiden mijn vrouw Esther en ik dat we wel gecharmeerd waren van de Toyota Auris.

Maar goed, daar zijn er 20 van als je gaat kijken op al die autotrackings-sites. Dan sta je voor de vraag welke je wilt hebben en hoe je dat gaat uitonderhandelen. Als de auto na een proefritje bevalt, dan ben je al snel geneigd om te denken “Nou, dat is toch prima.” Dan kun je er vast één op één nog wat vanaf onderhandelen, maar hoe weet je dan dat dat de beste keuze voor je was?

Als experiment ging ik de methodiek die wij vaak inzetten voor onze klanten hier ook op toepassen. Dus ik heb alles in waarde omgezet. Dan moet je denken aan de hoeveelheid kilometers die een auto heeft gereden, misschien de kleur, en of de auto achter wel parkeersensoren heeft of niet. Maar als relatieve leek zaken omzetten in waarde, is nog niet zo gemakkelijk. Ik heb toen een baseline gepakt en ben van daaruit gaan werken. Dit traject was alweer een aantal jaar geleden, maar als baseline zetten we dat de auto uit 2014 moest komen. Als een auto jonger was, dan had dat een meerwaarde voor ons. Als die ouder was, dan zat daar een penaltywaarde op. Hetzelfde ging op voor het aantal kilometers. Als ik een baseline van 50.000 kilometer wil en hij heeft 80.000 kilometer, dan heeft dat voor mij een x hoeveelheid afschrijving. Die zet ik vervolgens weer om in euro’s. Als je een basisauto voor ogen houdt, kan ik voor mezelf beslissen hoeveel euro hij goedkoper moet zijn als ik daarvan afwijk, of hoeveel meer ik wil uitgeven als de auto ergens beter in is. Dat hebben we voor alle elementen gedaan, waaronder de kleur en parkeersensoren. Sommige dingen kunnen je ook niet boeien, dus daar geef je dan geen waarde aan. Dus wij hebben dat allemaal vertaald en dat leverde voor ons een totale waarde op die iedere auto vertegenwoordigde.

Dan kun je vervolgens de auto pakken die met de omgerekende waarde het goedkoopst is, maar het liefst wil je er nog wat af onderhandelen. Dus ik heb toen een mail gestuurd naar al die autohandelaren en mijn methodiek uitgelegd, inclusief hoe hun auto er voor stond in mijn spreadsheet. De totale waarden van alle niet-prijselementen golden als de ‘bonus/penalty score’ voor de auto die zij te koop hadden. De bonus/penalty plus de prijs maakte voor ons de totale kosten en bepaalde de uiteindelijke keuze – die belofte deden we. Degene die de laagste totale kosten heeft, is voor ons de goedkoopste en die zouden we dan kopen. Binnen Game Theory noem je dit een ‘one shot game’, want deze specifieke auto’s ga ik in de toekomst niet vaker met de handelaren uitonderhandelen.

Van het achttal handelaren dat we hadden benaderd, waren er drie die helemaal niet reageerden. Die hadden dus geen zin in mijn methode. Maar er waren best wel een aantal die behoorlijke concessies deden. De reacties die we ontvingen waren in een range van 11% tot 18% verlaging ten opzichte van wat ze online hadden staan. Die online prijzen zijn vaak redelijk competitief, dus dat was best een leuk resultaat. Uiteindelijk vertegenwoordigde de auto die we gingen kopen de laagste kosten voor ons, maar dat was niet de goedkoopste.

Zo kun je op een hele rationele manier je beslissingen nemen en alsnog je resultaat verbeteren. Die methodiek pas ik in het dagelijks leven overal toe, met dingen in waarde omzetten. Dat kost wat meer tijd, maar als het wat extra’s oplevert, dan is dat weer prettig.

Als je in Las Vegas een casino binnenstapt, heb je niet veel onderhandelingsruimte helaas. Je kan niet zelf gaan onderhandelen over de odds die je krijgt.

Ik denk dat als je in Las Vegas kijkt hoeveel perks die high rollers krijgen, dat aangeeft dat er heel veel onderhandelingsruimte zit. Al die casino’s concurreren voor die grote klanten, de whales. De echte rijke mensen hebben daar heel veel waarde uit te halen. Ondanks het feit dat het voor hen nog steeds een verliesgevende propositie is, kunnen ze wel meer waarde uit hun entertainment halen.

Ik denk dat als je in Las Vegas kijkt hoeveel perks die high rollers krijgen, dat aangeeft dat er heel veel onderhandelingsruimte zit.

Kijk, op roulette hoef je geen Game Theory toe te passen. In dat spel zit geen strategische interactie dus dan is Game Theory niet relevant. Maar bij de zaken eromheen zit er misschien wel wat onderhandelingsruimte.

En blackjack? Daar zitten wel strategische interacties in.

Bij blackjack heb je sowieso een strategie. Je krijgt elke keer een optie, dus dat betekent dat er een strategie is over welke optie je neemt. Afhankelijk van wat de situatie is, kan je er een kansberekening op los laten welke strategie op de lange termijn een hogere verwachtingswaarde genereert. Onderaan de streep is het voor het casino nog steeds winstgevend, maar dat betekent wel dat je binnen die spelregels je eigen gedrag kunt optimaliseren. Dus daar is een analyse wel van toepassing; daar kun je Game Theory op loslaten.

Maar bij poker is het natuurlijk pas echt relevant. Daarbij speel je niet alleen tegen het casino zelf – doordat je rake betaalt – maar je kan het ook beter doen dan de anderen. Als je de rake buiten beschouwing laat, speel je één tegen één en als je beter speelt, ben je winnend. Binnen poker kom je heel vaak dezelfde situaties tegen. Je hebt bepaalde kaarten met bepaalde ranges, waardoor je binnen algoritmes hele game trees kunt maken. Hetzelfde geldt voor schaken. Als dit gebeurt, dan doen we dat. Zo kom je tot een analyse van een optimale strategie binnen elke situatie. Dat kunnen algoritmes en programma’s veel beter dan mensen. Je kan prima tegen iemand zeggen dat die een mixed-strategy moet spelen, maar als jij iets in 76% van de gevallen moet doen, dan kun je dat als mens niet behappen. Want identificeer die situatie maar eens adequaat en hoe kom je tot 76%? Als mens doe je altijd concessies, een algoritme programmeert dat er gewoon in.

Poker je zelf nog wel eens?
Nee. Online doe ik al jaren niks, daar heb ik ook nul motivatie voor. En live is het ook al jaren stil op dat gebied.

Je zou zeggen dat poker een spel naar jouw hart is door de link met GTO.

Het competitieve element vond ik ook altijd het leuke, het jezelf verbeteren en strijden met een ander. Dat vind ik ook leuk aan tennis als sport. Ik heb een tijdje Hearthstone gespeeld, ook een spel waar je veel strategische beslissingen moet maken. Wat dat betreft zijn er best wat parallellen met poker, al kon je er geen geld mee verdienen tenzij je het op een hoog niveau speelt. Dat was wel leuk met een heel groot stuk variantie, maar ook strategie. Dat soort spellen vind ik nog steeds leuk om te spelen, maar met twee kinderen en een drukke baan kom ik er niet veel aan toe.

Is een avondje monopoly spelen met jou gezellig, of is de sfeer ver te zoeken omdat jij alles extreem strategisch benadert?

In monopoly zit ook superveel variantie. Ik moet wel zeggen dat ik vroeger spelletjes altijd wilde winnen. Met een vriendengroep van de tennis deden we in het verleden heel vaak Risk, daar zit ook strategische interactie in. We hadden zelfs nog eigen spelregels gemaakt met ‘no-fly zones’ en dat soort onzin. Dat speelden we zo een hele middag op het terras. Maar ik won wel vaak.

Met een vriendengroep van de tennis deden we in het verleden heel vaak Risk, […] Maar ik won wel vaak.

Esther en ik speelden ook wel eens koehandelen met Johan (bekende pokerspeler Johan van Til, red.) en  zijn vrouw Daniëlle. Dat is een spel met onderhandelen, dus dat ligt mij wel en wil ik dan ook wel winnen. Maar mogelijk komt dat niet altijd de gezelligheid ten goede.

Het is niet erg als ik niet win, maar die banter tijdens het competitief spelen van een spelletje, vind ik wel echt mooi. Ik probeer altijd alles te optimaliseren, maar met Monopoly kan ik niet specifiek iedere keer gooien. Die kaartjes zijn ook al super random, al kan je daarna wel ver komen met goed onderhandelen.

Ik heb wat artikelen geschreven over Miljoenenjacht laatst. Ik ergerde me zo aan die mensen die meedoen, maar volledig irrationele keuzes maken. Ik neem aan dat jij daar hetzelfde in staat.

Ja, absoluut. Mensen maken zulke gigantische fouten daarin.

Dat soort programma’s komen eigenlijk neer op vragen als “Je hebt 80% kans op €1.000.000 of je krijgt zeker €300.000. Wat doe je?” Bijna iedereen zegt “Doe mij maar die €300.000.” Je hebt natuurlijk puur het berekenen van een verwachtingswaarde, maar je hebt ook je kosten van risico. Dat speelt een enorme rol daarin.

Ik geef vaak tweedaagse onderhandelingstrainingen. Daar zitten vaak één op één onderhandelingsspellen in. Eentje daarvan heet Ultimatum Game. Daarbij doet de één een voorstel en de ander heeft alleen de optie om dat aanbod te accepteren of niet. Stel dat jij een voorstel moet doen om €10 euro tussen ons twee te verdelen. Jij zegt dat ik €1 euro krijg en jij €9. Als ik ja zeg, heb ik €1 en jij €9. Maar als ik nee zeg, hebben we allebei niks. Rationeel gezien heb je dan of niks, of €1. €1 is natuurlijk altijd beter dan €0, maar toch zal niet iedereen ja zeggen op dat voorstel. Eerlijkheid speelt ook een rol. Als ik vind dat jij het niet eerlijk benadert en ik het geld niet nodig heb, dan zeg ik nee tegen alles totdat jouw aanbod €5 voor ons beiden is. Maar hoe hoger de bedragen worden, hoe meer de combinatie van eerlijkheid en risico een rol gaan spelen. Je kan niet altijd puur tot de bottom line gaan. Dat geldt bij die spellen ook voor hun verwachtingswaarde. Je kan niet één op één afgaan op de verwachtingswaarde, want voor elk persoon is het verschillend hoe je daarmee omgaat. Maar ik ben het wel met je eens dat er vaak hele slechte keuzes worden gemaakt.

Hoe sta jij daar zelf in? Wat zou jij doen als je zou meespelen?

Ik ben doorgaans niet heel erg risicomijdend. Ik zoek het niet heel erg op, maar gecalculeerd durf ik wel risico’s te nemen. Ik probeer wel het hoogste uit een verwachtingswaarde te halen.

Esther is bijvoorbeeld extreem risico-avers. Dat speelt wel een rol natuurlijk in privé situaties, want als zij blijer is, dan is dat ook goed voor mijn ‘happiness EV’. Dus de monetaire verwachtingswaarde is niet altijd doorslaggevend. De verwachtingswaarde van levensgeluk vind ik ook erg belangrijk in het geheel.

Dat geldt ook binnen mijn werk. We hebben sommige projecten waarbij de klant helemaal niet de kosten wil optimaliseren, maar juist de kwaliteit. Dan is dat hetgeen wat je dan veilt: zoveel mogelijk kwaliteit. En daarmee probeer je dan incentives te creëren voor leveranciers om dat te krijgen.

Dieter van de Scheur op de WSOP 2011 in Las Vegas

Jij bent natuurlijk altijd bezig met waarde optimalisatie. Kan je dan überhaupt plezier beleven aan gokspellen omdat je altijd -EV bezig bent?

Ik vind dat lastig, moet ik zeggen. Ik heb bijvoorbeeld helemaal niks met roulette, omdat ik weet dat ik eigenlijk altijd verlies als ik iets inzet.

Aan roulette beleef ik dat plezier helemaal niet. Bij blackjack soms wel omdat je jezelf uitdaagt om beter te spelen.

Het is alweer jaren geleden dat ik in Vegas was, maar daar had je toen videopoker waar je ongeveer break-even kon spelen. Ondertussen kreeg je wel gratis drank aan de bar, dus dat was eigenlijk wel +EV om te doen. Dat vond ik wel leuk om te doen; zo’n game dan strategisch zo foutloos mogelijk te spelen. Dan ga je aan het begin van de avond lekker zitten indrinken daar; dan haal je er best wel wat waarde uit.

Aan roulette beleef ik dat plezier helemaal niet. Bij blackjack soms wel omdat je jezelf uitdaagt om beter te spelen.

Maar bij casino’s vond ik eigenlijk alleen poker leuk. Er moet voor mij wel een uitdaging in zitten en dat heb ik niet zo snel bij andere spellen. Dus dan is het bij die casino games toch een stuk entertainment. Je zet iets kleins in en je kan iets groots als resultaat creëren. Dat is puur het gokelement. Daar zit geen Game Theory in, geen optimalisatie of analyse. Iets wat ik normaal juist wel leuk vind.

Maar je kunt het dus ook zien als puur entertainment. Je kunt ook naar de bioscoop gaan, voor sommige mensen is dat hetzelfde bij wijze van spreken. Kost ook geld, maar je krijgt wel entertainment. Maar jij hebt dat dus nooit gehad?

Nee, bij een casino heb ik dat echt nooit gehad. Het enige was dan videopoker, maar dat was dan ook omdat ik het zo fout mogelijk wilde doen. Het idee dat ik daar een soort waarde uit haalde vond ik ook wel grappig. Maar bij roulette voel ik er gewoon niks voor. En dat is ook niet als ik bijvoorbeeld €10 inzet en er komt €360 terug. Ja, misschien een paar seconden.

Laat een reactie achter