Zwitsers Systeem ???

Henk de Witt · Post by **Henk de Witt** » Mon Aug 06, 2007 19:21

Jan Pieter wrote:Jij stelt dat de punten dan maar niet meer vermeld moeten worden, maar hoe stel je je dat voor? Op teletekst staan de uitslagen en iedereen kan tellen dat Thijssen 5 overwinningen en 3 remises heeft, en dat Valneris een zege minder en een remise meer heeft.

Grappig dat je teletekst noemt. Het schoot me vanmiddag te binnen dat teletekst altijd van wedstrijdpunten uitgaat. Zojuist keek ik even naar de uitslagen van Brunssum. Teletekst noemt vijf koplopers met 7 punten, dus zonder de weerstand te noemen.

Eigenlijk is dit al jaren zo. Waarschijnlijk heeft teletekst nooit de moeite genomen zich te laten voorlichten over Zwitsers en weerstandspunten en heeft de damwereld daar ook geen moeite voor gedaan.

Dit is even een zijlijntje. We blijven van mening verschillen over de puntentelling, het is inderdaad niet zo zinvol die dicussie opnieuw te voeren.

Giwdul · Post by **Giwdul** » Tue Aug 07, 2007 11:43

Bert Zwart wrote:Wouter,

Heb je aangetoond dat TPR* uniek is? Het lijkt me een vast punt van een niet-lineair stelsel vergelijkingen...

Het is natuurlijk duidelijk dat TPR* niet uniek is, omdat in ratings alleen verschillen van belang zijn. Dus laten we zeggen uniek op een constante na.

Helaas heb ik dat in die drie maandjes niet kunnen aantonen. Alles in mij zegt dat de oplossing (met bepaald gemiddelde) een vast punt is bij de FIDE- en VOLMAC-rating. Wanneer je de ratingfunctie gaat afkappen is het mij niet helemaal duidelijk. Het bewijzen hiervan is tamelijk lastig.

Wanneer we gebruik maken van een lineaire ratingfunctie is de oplossing uniek. Dat is aangetoond door een stel Spanjaarden.

Er is wel een belangrijke restrictie die nodig is voor een unieke oplossing. De spelers meoten met elkaar verbonden zijn. Maar dat lijkt me duidelijk.

Giwdul · Post by **Giwdul** » Tue Aug 07, 2007 11:54

Piet Bouma wrote:
Ik weet niet of je de link <a href=http://toernooibase.kndb.nl/rating/ranking.php target=blank>Uitleg</a> bij het onderdeel ranking van Toernooibase al eens hebt gelezen.
Daar staat het idee enigszins uitgelegd.
De exact goede uitleg en formules vind je op de site van Jeff Sonas: <a href=http://db.chessmetrics.com/CM2/Formulas.asp target=blank>Chessmetrics</a>.
Dan kun je concluderen dat Jeff Sonas voor zijn "weighted and padded simultaneous performance rating" de TPR* voor een periodieke berekening gebruikt.

Zelf heb ik dit idee dus gekunsteld vervangen. Ik heb als startpunt de KNDB-rating per 1-7-2005 (ipv een 1e TPR*) gebruikt en gebruik de - inderdaad - andere manier van TPR berekenen, zoals Jan Masselink die ook hanteert.
Wie de laatste rankinglijst per 31-7-2007 bekijkt, ziet ook gelijk de terkortkoming(en). S. Nasevich heeft een stijging gemaakt van plek 19 naar 2 op basis van zijn prestatie in Minsk 2007.
En dat is dus op m.i. te weinig datapunten gebeurt, vanwege het uitgangspunt: KNDB-rating per 1-7-2005.

Volgens mij betekent dit dus dat je gemiddelde tegenstanderrating meeneemt, en niet alle wedstrijden individueel benadert. Bereken eens wat je TPR is als je twee spelers hebt gehad van rating 1200 en rating 0 en je de score van 3 punten hebt behaald. Als er uit komt dat TPR onder de duizend ligt, is er dus iets mis. Als er uitkomt dat je ongeveer 1200 nodig hebt doe je het correct.

Wanneer je de methode met gemiddelde tegenstanderrating volgt kun je de TPR* eenvoudig met matrixberekeningen (vegen matrix naar Row Reduced Echelon Form) uitrekenen. Dit geeft de oplossing van een lineair stelsel. Helaas is de ratingfunctie niet lineair en mag dit dus eigenlijk niet. Het op deze manier berekenen van de TPR* gaat razendsnel.

Jeff Sonas, het brein achter ChessMetrics, gebruikt een lineaire ratingfunctie. Daardoor kan hij wel gebruik maken van het lineaire stelsel.

Henk de Witt · Post by **Henk de Witt** » Thu Aug 16, 2007 12:40

Wouter, op zondag 16 december (datum onder klein voorbehoud) organiseren wij een damtoernooi in Grandcafe Verderop in Delft. Er zijn drie groepen:
- recreanten
- jeugd (pupillen, welpen, nieuwelingen)
- clubspelers
De clubspelers zullen met neo-Delfts spelen, we verwachten hier zo'n 60 deelnemers. Is het mogelijk jouw score-systeem dan al uit te proberen?The proof of the pudding is in the eating, zoals je weet. Ik denk dat het voor de spelers ook leuk is om weer iets nieuws mee te maken. Dat maakt nieuwsgierig, prikkelt de geest en geeft de mensen iets om over te praten.

Theo Dijkstra · Post by **Theo Dijkstra** » Wed Jul 15, 2009 01:16

Is die test uitgevoerd?

De discussie op het den haag-open (DNC) forum is beter hier voort te zetten. [img]images/smilies/icon_smile.gif[/img]
Ik wil de test wel in Portugal uitvoeren. [img]images/smilies/icon_biggrin.gif[/img]
Hiermee bedoel ik de eerste 2 stappen van de Ludwig studie! (genuanceerd paren)

Jan Pieter · Post by **Jan Pieter** » Wed Jul 15, 2009 17:22

Giwdul wrote:Voor de liefhebber overigens mijn aanbevelingen voor de toernooiopzet van Den Haag. In maart ben ik afgestudeerd op het vergelijken van Zwitserse toernooisystemen, waarbij ik een versie van mijn eigen systeem getest heb dat ik 2 jaar geleden ontwikkeld heb.

Je kunt door mijn systeem te gebruiken na 6 rondes tot een ranglijst komen die een vergelijkbaar beeld van de krachtsverhoudingen in het deelnemersveld geeft als het huidige systeem na 9 rondes...

Wederom moet je kijken of je meer waarde hecht aan het wiskundig model of juist aan het plezier van de deelnemers. Ik ben van mening dat het systeem behoorlijke concessies moet doen aan de waardering van de deelnemers, waardoor het misschien geen praktische verbetering meer is van het huidige systeem.

Daarentegen kun je het huidige systeem wel enorm verbeteren met 2 simpele aanpassingen die goed te begrijpen zijn en niet moeilijker zijn dan WP en SB. Het enige nadeel is dat om het zelf na te rekenen je een applicatie nodig hebt, maar wie rekent er tegenwoordig nog zijn WP, SB of gemiddelde tegenrating na?

1. Verander de tegenrating door de prestatierating. Deze maakt gebruik van de ratings van je tegenstanders en je score. Deze kan vooraf berekend worden, met voor de drie mogelijke uitslagen van een partij 3 verschillende prestatieratings. De prestatierating is niet afhankelijk van prestaties van derden.

2. Rangschik niet op aantal punten en dan op prestatierating, maar rangschik op prestatierating. Iemand die beter presteert behoort simpelweg hoger te eindigen...

Wouter, waarom heb je in je scriptie bij de vergelijking van de verschillende Zwitserse systemen de TPR niet meegenomen? In je aanbevelingen neem je zonder meer aan dat STPR beter scoort dan TPR, maar ik kan niet vinden waarop je dat baseert. Zeker nu je pleit voor TPR ipv STPR ben ik wel benieuwd naar het antwoord op die vraag.
(voor de meelezers: ik houd nu de terminologie uit de scriptie aan. STPR is wat eerder in deze draad TPR* wordt genoemd)

Ik zou me kunnen voorstellen dat TPR betere resultaten oplevert dan STPR. Iemand die een blunder maakt, heeft daar bij TPR immers alleen zelf last van, terwijl bij STPR al zijn tegenstanders gestraft worden.

Giwdul · Post by **Giwdul** » Wed Jul 15, 2009 22:31

Dat heeft voornamelijk te maken met het theoretisch afstuderen en met prioriteiten. TPR is practisch beter, STPR is theoretisch beter.

Voor een afstudeerwerkstuk is theoretisch beter... Het bewijs van existentie van een unieke oplossing heeft me meer tijd gekost dan verwacht. Daardoor heb ik het werkstuk beperkt. Het berekenen van de resultaten van TPR laten liggen. Het werkstuk is theoretisch gezien nu in ieder geval goed in orde.

Ik had het niet direct op 20 maart online gezet omdat ik toen nog de illusie had dat ik er tijd in zou stoppen om de vooruitgang van de twee voorgestelde stappen te quantificeren.

Daarnaast wilde ik nog bepalen wat het effect is om de beginrating van iedereen gelijk te stellen. Als ik er de tijd voor vind wil ik dit nog wel doen, maar het is me de afgelopen maanden er niet van gekomen...

Ik zou me kunnen voorstellen dat TPR betere resultaten oplevert dan STPR. Iemand die een blunder maakt, heeft daar bij TPR immers alleen zelf last van, terwijl bij STPR al zijn tegenstanders gestraft worden.

Ondanks dat ik het wetenschappelijk niet aangetoond heb, lijkt het me zeer aannemelijk dat de resultaten tussen het huidige zwitsers op rating en STPR R (loting op rating) .

We hebben het hier over flierefluiters... een speler die tijdens het toernooi onder zijn kunnen presteert zijn vervelend voor zijn tegenstanders. Dit komt heel soms voor, wat pleit TPR

Daarentegen heb je ook spelers waarvan het niveau tijdens het toernooi daadwerkelijk lager ligt dan normaal: mensen die minder slapen dan normaal/meer alcohol consumeren etc. Ook heb je altijd (jeugd)spelers die veel sterker zijn dan hun rating weergeeft, wat regelmatig voorkomt en wat pleit voor STPR.

Giwdul · Post by **Giwdul** » Wed Jul 15, 2009 22:46

Theo Dijkstra wrote:Is die test uitgevoerd?

De discussie op het den haag-open (DNC) forum is beter hier voort te zetten. [img]images/smilies/icon_smile.gif[/img]
Ik wil de test wel in Portugal uitvoeren. [img]images/smilies/icon_biggrin.gif[/img]
Hiermee bedoel ik de eerste 2 stappen van de Ludwig studie! (genuanceerd paren)

Er is een test uitgevoerd in Delft. Deze is vrij goed verlopen. Probleem was dat ik volledig afhankelijk was van de programmatuur van Jan Masselink, waardoor ik weinig controles kon uitvoeren en dat het ging om sneldampartijen en er gebruik gemaakt werd van Delftse telling.

Wel zijn er nog wat dingen in de definitie van STPR aangepast om geen uitschieters te krijgen zoals in het begin van deze draad te zien was. Met de vernieuwde versie is nog geen test uitgevoerd. Ik zou het graag getest zien.

Ondertussen heb ik zelf het zwitsers geprogrammeerd in een simulatie-omgeving. Dat betekent dat de invoer van alles automatisch gaat, en dat alleen output weergegeven wordt. De software is in toernooimanager nog niet beschikbaar, de applicatie die ik gebruikt heb is niet geschikt om zelf gegevens in te voeren en kan alleen draaien op computers met de juiste software waarvoor een licentie nodig is.

Over het genuanceerd paren:

De paring is identiek aan het huidige zwitsers op rating. Dit zorgt ervoor dat het niet mogelijk is om met uitsluitend remises tegen sterke spelers hoog te eindigen. Er moet ook gewonnen worden!

Jan Pieter · Post by **Jan Pieter** » Fri Jul 17, 2009 01:09

Giwdul wrote:
Jan Pieter wrote: Ik zou me kunnen voorstellen dat TPR betere resultaten oplevert dan STPR. Iemand die een blunder maakt, heeft daar bij TPR immers alleen zelf last van, terwijl bij STPR al zijn tegenstanders gestraft worden.
Ondanks dat ik het wetenschappelijk niet aangetoond heb, lijkt het me zeer aannemelijk dat de resultaten tussen het huidige zwitsers op rating en STPR R (loting op rating) .

Gezien jouw rotsvaste vertrouwen in de STPR verbaast deze uitspraak me niet. Zelf denk ik dat bij toernooien over 7 of 9 rondes het toeval een zo grote rol speelt dat de TPR beter scoort dan de STPR.

Giwdul wrote:Daarentegen heb je ook spelers waarvan het niveau tijdens het toernooi daadwerkelijk lager ligt dan normaal: mensen die minder slapen dan normaal/meer alcohol consumeren etc. Ook heb je altijd (jeugd)spelers die veel sterker zijn dan hun rating weergeeft, wat regelmatig voorkomt en wat pleit voor STPR.

Dat de STPR een voordeel biedt bij dammers die structureel sterker/zwakker spelen dan hun rating aangeeft, klopt, maar ik vermoed dat dit voordeel (waarbij het om slechts enkele deelnemers gaat) het aflegt tegen het nadeel van het toeval (dat alle spelers treft). En daarnaast is het zo dat dit voordeel, als ik het goed begrijp, in jouw onderzoek niet zichtbaar wordt. Want het is toch zo dat jij in je simulatie random uitslagen genereert op basis van historische gegevens. Daardoor kan het voorkomen dat iemand met een lage rating wint van iemand met een hoge rating, maar de kans hierop is bij alle spelers even groot. Er zijn in jouw onderzoek geen spelers die consequent op een ander niveau spelen dan hun rating aangeeft.

Derhalve vermoed ik dat de TPR in het echt en zeker in jouw simulatie een beter resultaat behaalt dan de STPR. Zonder verder onderzoek blijft dit echter een welles-nietes-kwestie.

Giwdul · Post by **Giwdul** » Fri Jul 17, 2009 18:12

Jan Pieter wrote:
Giwdul wrote:
Jan Pieter wrote: Ik zou me kunnen voorstellen dat TPR betere resultaten oplevert dan STPR. Iemand die een blunder maakt, heeft daar bij TPR immers alleen zelf last van, terwijl bij STPR al zijn tegenstanders gestraft worden.
Ondanks dat ik het wetenschappelijk niet aangetoond heb, lijkt het me zeer aannemelijk dat de resultaten tussen het huidige zwitsers op rating en STPR R (loting op rating) .
Gezien jouw rotsvaste vertrouwen in de STPR verbaast deze uitspraak me niet. Zelf denk ik dat bij toernooien over 7 of 9 rondes het toeval een zo grote rol speelt dat de TPR beter scoort dan de STPR.

Giwdul wrote:Daarentegen heb je ook spelers waarvan het niveau tijdens het toernooi daadwerkelijk lager ligt dan normaal: mensen die minder slapen dan normaal/meer alcohol consumeren etc. Ook heb je altijd (jeugd)spelers die veel sterker zijn dan hun rating weergeeft, wat regelmatig voorkomt en wat pleit voor STPR.

Dat de STPR een voordeel biedt bij dammers die structureel sterker/zwakker spelen dan hun rating aangeeft, klopt, maar ik vermoed dat dit voordeel (waarbij het om slechts enkele deelnemers gaat) het aflegt tegen het nadeel van het toeval (dat alle spelers treft). En daarnaast is het zo dat dit voordeel, als ik het goed begrijp, in jouw onderzoek niet zichtbaar wordt. Want het is toch zo dat jij in je simulatie random uitslagen genereert op basis van historische gegevens. Daardoor kan het voorkomen dat iemand met een lage rating wint van iemand met een hoge rating, maar de kans hierop is bij alle spelers even groot. Er zijn in jouw onderzoek geen spelers die consequent op een ander niveau spelen dan hun rating aangeeft.

Derhalve vermoed ik dat de TPR in het echt en zeker in jouw simulatie een beter resultaat behaalt dan de STPR. Zonder verder onderzoek blijft dit echter een welles-nietes-kwestie.

Ik vind het leuk om te zien dat je je er een beetje in verdiept hebt. Wel een nuancering in je opmerking:

In mijn onderzoek krijgt een klein deel van de deelnemers een geschatte
rating, die consequent max 50 punten af kan wijken van de rating op basis waarvan hun prestaties zijn bepaald. Het voordeel zal in mijn onderzoek inderdaad nauwelijks naar voren zijn gekomen.

Vanwege het toevalselement zal daarom TPR bij weinig wedstrijden inderdaad wel eens nog beter kunnen scoren dan STPR in mijn onderzoek. Ik geef je voor de verandering eens een keer groot gelijk!

Wat alleen maar duideiljker wordt is dat de resultaten van STPR in mijn onderzoek in beide STPR gevallen zoveel beter is dan de huidige systemen, ligt volgens mij aan het feit dat niet meer gerangschikt wordt op puntenaantal. Het effect van het aanpassen van de rating (essentie van STPR) komt in het onderzoek maar heel beperkt naar voren.

Kun je je ondertussen wel vinden in het rangschikken op TPR ipv punten en dan TPR (of het huidige AOR)?

Jan Pieter · Post by **Jan Pieter** » Fri Jul 17, 2009 23:01

Giwdul wrote:Vanwege het toevalselement zal daarom TPR bij weinig wedstrijden inderdaad wel eens nog beter kunnen scoren dan STPR in mijn onderzoek. Ik geef je voor de verandering eens een keer groot gelijk!

Wat alleen maar duideiljker wordt is dat de resultaten van STPR in mijn onderzoek in beide STPR gevallen zoveel beter is dan de huidige systemen, ligt volgens mij aan het feit dat niet meer gerangschikt wordt op puntenaantal. Het effect van het aanpassen van de rating (essentie van STPR) komt in het onderzoek maar heel beperkt naar voren.

Kun je je ondertussen wel vinden in het rangschikken op TPR ipv punten en dan TPR (of het huidige AOR)?

Laat ik positief beginnen. Een klassering op TPR vind ik een stuk beter dan op STPR. TPR is transparanter, voor de doorsnee mens controleerbaar (zij het met hulpmiddelen), en het heeft als voordeel dat je klassering niet beinvloed wordt door de prestaties van je tegenstanders. Wat dat laatste betreft scoort het zelfs beter dan het huidige zwitsers, waar ongemotiveerde ex-tegenstanders je weerstand kunnen nekken. Zelfs ben ik bereid om aan te nemen dat TPR meer recht doet aan de geleverde prestaties dan het huidige zwitsers.

Betekent dit alles ook dat ik liever rangschik op TPR dan op punten annex TPR/AOR? Neen, zeker niet. Dammen is voor mij in de eerste plaats sport, en dus prefereer ik een aantrekkelijke toernooiformule boven een wetenschappelijk correcte. Stel dat jij morgen in Den Haag verliest en zondag niet verder komt dan remise. Dan is bij TPR je toernooi mislukt, zelfs wanneer je vanaf maandag als een wereldkampioen gaat dammen. Je hebt dan een grote achterstand op je concurrenten en doordat jouw overwinningen op laaggeplaatste spelers minder opleveren dan de overwinningen van je concurrenten op middenmoters, wordt die achterstand in de 3e en 4e ronde alleen maar groter. Kortom, wie slecht begint in een TPR-toernooi, zit de resterende rondes voor jandoedel te dammen. Bij het huidige zwitsers daarentegen kan iedereen tot ongeveer de 5e ronde nog dromen van een goede klassering. Mooi vind ik ook dat het er in de slotrondes echt om gaat, net als bijvoorbeeld bij het wk-voetbal, waar je in de voorronde wel een steekje mag laten vallen, maar waar je er in knock-outfase moet staan. Dat is inderdaad niet rechtvaardig, maar wel veruit het leukst voor spelers en toeschouwers.