TANSTAAM
door
(there ain’t no such thing as a mismatch)

Elders op de website beschrijven Ed en Wim een voorstel voor het opdelen van de interne competitie in twee groepen. Dit omdat er sprake zou zijn van ontevredenheid bij sommige leden over het soms grote ratingverschil. In dit artikel wil ik hier inhoudelijk op reageren en wat meer data verschaffen betreffende onze huidige interne.

Het voorbeeld van Roel Polak, die zowel tegen Karel van der Weide als Leon Pliester moest schaken is een extreem voorbeeld en in mijn ogen een incident. Zo’n enorm eloverschil is nog nooit voorgekomen en nu ineens twee keer, en wel bij dezelfde persoon. Dat is gewoon botte pech. Ik ben overigens zeer benieuwd hoe Roel, Karel en Leon deze partijen hebben ervaren. Zien ze dat inderdaad als een verloren avond, of vonden ze het leuk om nader kennis te maken met een clubgenoot die ze nog niet kenden?

Natuurlijk is het vervelend als mensen ontevreden zijn vanwege de indeling, maar de vraag is hoeveel mensen dat zijn, en wanneer ze ontevreden zijn. Ed en Wim komen met de term “mismatch” zonder deze verder te definiëren. En dat begrijp ik ook, want voor iedereen is een mismatch iets anders. De een vindt 200 elopunten verschil al niet leuk meer, en de ander is blij als hij de kans krijgt tegen een veel sterkere te spelen en daar zelfs van te winnen (ik denk aan Jaap Tanja die won van Enrico Vroombout; en wat te denken van Johan van Hulst die Peter Doggers op remise hield). En als ik naar mezelf kijk: ik heb ooit een keer tegen Johan van der Klauw mogen spelen, en ik kan me deze avond nog goed herinneren. Deze herinnering aan Johan had ik niet willen missen.

Toen dit onderwerp eerder ter sprake kwam heeft toenmalig wedstrijdleider intern Cas Zwaneveld daar op 3 juni 2010 een goed en uitgebreid stuk over geschreven, getiteld mismatches en scheefpartijen. Ik raad iedereen aan dit nogmaals te lezen. Cas beschrijft daar een aantal mogelijke oplossingen voor de mismatches en “competitie op rating indelen in twee helften” is daar een van. Als voordeel beschrijft hij daar: het aantal scheefpartijen kan beperkt worden. En als nadelen geeft hij: (1) Spelers in het midden kunnen of niet meer tegen zwakkere of niet meer tegen sterkere spelers spelen, (2) Er zullen vaak twee spelers oneven zijn, (3) Elke avond opnieuw veel extra werk voor de interne wedstrijdleiding.

Terug naar het stuk van Ed en Wim. Ze geven een voorbeeld van één ronde uit de interne. Dat lijkt me vrij willekeurig. Er wordt gezegd dat er twaalf partijen waren met een “extreem ratingverschil” zonder aan te geven wat dat is. Als ik naar de elo’s in het voorbeeld kijk dan is het kleinste verschil 362 punten. Waarom daar de grens? Is 362 extreem? Wie bepaalt dat?

In een ander artikel op de website, getiteld mismatches?! toont weer Cas op 28 januari 2010 harde data. Ik heb deze data ook voor de eerste helft van de competitie van afgelopen seizoen beschikbaar gemaakt, zodat iedereen voor zich een oordeel kan vormen over de ernst van de zaak. Zie grafiek.

Data van eerste helft wintercompetitie 2011-2012

In deze grafiek staat horizontaal het eloverschil in een partij en verticaal hoeveel procent van de partijen in de competitie dit eloverschil had. Dat zijn de rode balken. De blauwe balken zijn deze percentages bij elkaar opgeteld. Dus als ik kijk in de zevende kolom, dan zie ik dat ongeveer 7 procent (rode balk) van de partijen een eloverschil hebben tussen de 300 en 350 punten . En totaal heeft 77 procent (blauwe balk) van de partijen een eloverschil dat kleiner is dan 350 punten.

Bepaal zelf aan de hand van deze data of er een probleem is of niet, en besluit ernaar.

  1. Ed Leuw

    Ed Leuw zei op :

    Even een persoonlijke noot hierbij. De schaakwereld mag zich gelukkig prijzen dat er zoveel personen met professionele/wetenschappelijke kennis van ICT en statistiek in rondlopen. Gelukkig vormt Caïssa daarop geen uitzondering. Dennis en de door hem geciteerde Cas zijn de levende voorbeelden.
    Zoals bekend kun je met statistiek wat betreft interpretatie veel kanten uit. Het is maar net hoe je de cijfertjes arrangeert en hoe je daar vervolgens een oordeel aan verbindt. Dat geldt zowel voor ons verhaal, als voor dit stuk van Dennis. Zoals Dennis constateert kent slechts 7% van de in de eerste turnus gespeelde partijen een eloverschil tussen de 300 en 350 punten. Wat er niet staat geschreven is dat nog eens 16% van de partijen een eloverschil kent van meer dan 350 punten. Het is inderdaad maar net hoe je waardeert dat bij de interne competitie van Caïssa in bijna een kwart van de gevallen een eloverschil van groter dan 300 elopunten bestaat. Volgens de elotabellen betekent dit dat het gaat om partijen waarbij de kans dat de hoger gerateerde wint minimaal 85% is!
    Daar komt nog bij dat de kans op dergelijke ‘mismatches’ gedurende de eerste vier à vijf ronden nog weer beduidend hoger zal zijn dan het gemiddelde over een hele competitie. Bovendien wordt de impact hiervan nog eens verdubbeld doordat Caïssa geen ongedeeld speeljaar kent, maar er twee turnussen op na houdt. Laten we er maar niet aan denken wat het effect op de vereniging zal zijn als spelers juist aan het begin van een speelhelft zo gefrustreerd raken dat ze het verder laten afweten.
    Wat zou er tegen zijn om de voor – en nadelen van de door ons voorgestelde oplossing maar eens één jaar te leren kennen en dan volgend jaar, geheel geïnformeerd, opnieuw hierover te beslissen.

Reactie achterlaten