K-factor in de KNDB rating

LastigeKnul
Posts: 148
Joined: Tue Oct 22, 2019 13:42
Real name: Eric van t Hof
Location: Valkenburg

Re: K-factor in de KNDB rating

Post by LastigeKnul » Sun Mar 06, 2022 14:02

Piet Bouma wrote:
Sun Mar 06, 2022 13:56
LastigeKnul wrote:
Sun Mar 06, 2022 13:43
clp wrote:
Sun Mar 06, 2022 12:22


Het is makkelijker om de stand van de aarde te veranderen dan een stukje rating-sofware.
In dit geval overigens wel terecht. Het probleem dat je aankaart speelt een rol bij lineaire ratings, zoals de voorganger van Elo, het Harkness-systeem.

Elo-ratings hebben hier geen last van omdat het verwachte scoringspercentage > 0 en < 100%. De Elo formule is (in Libre Calc):


Voor DP = 430 is het verwachte scoringspercentage P = 93,38%. De verwachte score is 2 * 93,38% = 1,87 dampunten, hetgeen nog steeds minder is dan 2.
Wat de oorzaak is van het probleem, weet ik niet. Maar ik heb het gewoon feitelijk geconstateerd, twee keer, dat dit effect optreedt.

Gisteren speelde een vriend van mij, Eelco Kuipers (811), tegen Cor van Dusseldorp (1443). Kuipers verloor natuurlijk, maar zijn virtuele rating steeg hierdoor van 902 naar 907. Of de virtuele rating van Van Dusseldorp is gedaald, weet ik niet want dan kun je achteraf niet meer zien.

Mijn eigen rating is 721 en ik oktober won ik van een jeugdspeler met rating 249, waarna met virtuele rating met 4 punten daalde.
In beide gevallen komt dit omdat jullie nog geen vaste rating per 1-1-2021 hebben (minder dan 25 partijen tegen spelers met een rating gespeeld).
Dat betekent dat er sprake is van een prestatierating gebaseerd op de gemiddelde tegenstandersrating (van vorig seizoen en dit seizoen). Per 1-7-2022 zullen jullie een vaste rating hebben, en komt dit niet meer voor. M.i. volkomen terecht.

De rating van Cor van Dusseldorp is met 5 x 0.06 (afgerond) = 0.30 ratingpunten gestegen.
Piet, bedankt voor de uitleg!

Piet Bouma
Posts: 3574
Joined: Sun Nov 02, 2003 13:05
Location: Harlingen

Re: K-factor in de KNDB rating

Post by Piet Bouma » Sun Mar 06, 2022 14:09

LastigeKnul wrote:
Sun Mar 06, 2022 14:02

In beide gevallen komt dit omdat jullie nog geen vaste rating per 1-1-2021 hebben (minder dan 25 partijen tegen spelers met een rating gespeeld).
Dat betekent dat er sprake is van een prestatierating gebaseerd op de gemiddelde tegenstandersrating (van vorig seizoen en dit seizoen). Per 1-7-2022 zullen jullie een vaste rating hebben, en komt dit niet meer voor. M.i. volkomen terecht.

De rating van Cor van Dusseldorp is met 5 x 0.06 (afgerond) = 0.30 ratingpunten gestegen.
Piet, bedankt voor de uitleg!
[/quote]

Zaten nog twee foutjes in mijn uitleg. Moet vaste rating per 1-7-2021 (ipv 1-1-2021) en (van vorige seizoenen en dit seizoen).
Overigens zij nog opgemerkt dat ook de rating van Cor van Dusseldorp nog kan veranderen inzake het resultaat met Eelco Kuipers. Als de (prestatie)rating veranderd van Eelco betekent dat ook het (kleine) resultaat van Cor tegen Eelco tussentijds ook kan wijzigen.... :)

Tja, het is allemaal niet zo eenvoudig als het lijkt.
https:toernooibase.kndb.nl More than 400.000 games on applet, more than 1.200.000 results, more than 20.000 games broadcasted (semi-)live, more than 12.600 inserted tournaments!

clp
Posts: 194
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: K-factor in de KNDB rating

Post by clp » Sun Mar 06, 2022 15:33

Piet Bouma wrote:
Sun Mar 06, 2022 14:09

Zaten nog twee foutjes in mijn uitleg. Moet vaste rating per 1-7-2021 (ipv 1-1-2021) en (van vorige seizoenen en dit seizoen).
Overigens zij nog opgemerkt dat ook de rating van Cor van Dusseldorp nog kan veranderen inzake het resultaat met Eelco Kuipers. Als de (prestatie)rating veranderd van Eelco betekent dat ook het (kleine) resultaat van Cor tegen Eelco tussentijds ook kan wijzigen.... :)

Tja, het is allemaal niet zo eenvoudig als het lijkt.
Dit is precies mijn punt. Aanraken is zetten. Doe het in één keer goed, zonder verwarrende correcties achteraf.

Piet Bouma
Posts: 3574
Joined: Sun Nov 02, 2003 13:05
Location: Harlingen

Re: K-factor in de KNDB rating

Post by Piet Bouma » Sun Mar 06, 2022 20:48

Kees,

Zou je eerst een antwoord op deze - eerder al - gestelde vraag kunnen geven?

Overigens snap ik de door Kees gegeven formule tot op heden niet:

De correctiefactor kan worden verhoogd naar 10:
• indien het positieve verschil tussen WP en NP als percentage van 2N, is 10% of meer; én
• het aantal gespeelde wedstrijden in die periode is 10 of meer
waarbij:
N - Aantal in de periode gespeelde partijen
WP - Werkelijk behaald aantal punten
NP - Norm punten
Bewering: Als gevolg van bovenstaande wijziging wordt de iRp-check overbodig.

Kan je mij dat in een praktisch voorbeeld uitleggen Een verschil tussen WP en NP als percentage van 2N? 10% of meer?

En even inhoudelijk op je laatste reactie.
De KNDB-rating wordt één keer per jaar vastgesteld door de wedstrijdcommissie/ratingcommissaris KNDB.
De virtuele rating in Toernooibase geeft tijdens het seizoen een indruk van de ontwikkeling van deze rating.
Niet meer en niet minder.
Bij 0,2% is de virtuele ratingberekening in Toernooibase fout. Maak je daar a.u.b. niet zo druk om.
https:toernooibase.kndb.nl More than 400.000 games on applet, more than 1.200.000 results, more than 20.000 games broadcasted (semi-)live, more than 12.600 inserted tournaments!

LastigeKnul
Posts: 148
Joined: Tue Oct 22, 2019 13:42
Real name: Eric van t Hof
Location: Valkenburg

Re: K-factor in de KNDB rating

Post by LastigeKnul » Mon Mar 07, 2022 09:00

Piet Bouma wrote:
Sun Mar 06, 2022 13:56
LastigeKnul wrote:
Sun Mar 06, 2022 13:43
clp wrote:
Sun Mar 06, 2022 12:22


Het is makkelijker om de stand van de aarde te veranderen dan een stukje rating-sofware.
In dit geval overigens wel terecht. Het probleem dat je aankaart speelt een rol bij lineaire ratings, zoals de voorganger van Elo, het Harkness-systeem.

Elo-ratings hebben hier geen last van omdat het verwachte scoringspercentage > 0 en < 100%. De Elo formule is (in Libre Calc):


Voor DP = 430 is het verwachte scoringspercentage P = 93,38%. De verwachte score is 2 * 93,38% = 1,87 dampunten, hetgeen nog steeds minder is dan 2.
Wat de oorzaak is van het probleem, weet ik niet. Maar ik heb het gewoon feitelijk geconstateerd, twee keer, dat dit effect optreedt.

Gisteren speelde een vriend van mij, Eelco Kuipers (811), tegen Cor van Dusseldorp (1443). Kuipers verloor natuurlijk, maar zijn virtuele rating steeg hierdoor van 902 naar 907. Of de virtuele rating van Van Dusseldorp is gedaald, weet ik niet want dan kun je achteraf niet meer zien.

Mijn eigen rating is 721 en ik oktober won ik van een jeugdspeler met rating 249, waarna met virtuele rating met 4 punten daalde.
In beide gevallen komt dit omdat jullie nog geen vaste rating per 1-7-2021 hebben (minder dan 25 partijen tegen spelers met een rating gespeeld).
Dat betekent dat er sprake is van een prestatierating gebaseerd op de gemiddelde tegenstandersrating (van vorig seizoenen en dit seizoen). Per 1-7-2022 zullen jullie een vaste rating hebben, en komt dit niet meer voor. M.i. volkomen terecht.

De rating van Cor van Dusseldorp is met 5 x 0.06 (afgerond) = 0.30 ratingpunten gestegen.
Hoewel ik door deze uitleg nu wel begrijp hoe het werkt, blijf ik de gekozen methode wat ongelukkig vinden.

Er wordt op twee gedachten gehinkt. De ene gedachte is dat de eerste 25 partijen de nieuwe rating nog niet stabiel is. Dat lijkt me prima. De andere gedachte is dat men deze stabiliteit slechts éénmaal per jaar vaststelt. Vooral dat laatste is vreemd.

In mijn geval speelde ik mijn 25ste ratingpartij op 13 augustus 2021. Logischerswijs zou je vanaf dat moment dat de "vaste rating" kunnen registreren en daarmee verder werken zoals met elke andere rating.

Dat gebeurt echter niet. Bij alle partijen die ik speel tussen 14 augustus 2021 en 30 juni 2022 wordt nog steeds gedaan alsof mijn rating niet stabiel is. Met als gevolg dat de rating van mijn tegenstanders ongeacht de uitslag van de partij invloed heeft op mijn rating. Dat is gewoon niet logisch.

Piet Bouma
Posts: 3574
Joined: Sun Nov 02, 2003 13:05
Location: Harlingen

Re: K-factor in de KNDB rating

Post by Piet Bouma » Mon Mar 07, 2022 21:49

Alles is technisch natuurlijk mogelijk Lastige Knul, maar je stapt af van het principe:
Situatie per 1-7-2021: rating oud
Situatie per 1-7-2022: rating nieuw.

Wat jij voorstelt is dat er tussentijds een rating nieuw per bepaalde datum wordt vastgesteld.
Dit op basis van het bereiken van 25 partijen.
Als je dit consequent zou doorzetten, zou je ook betreffende de ratingfactor 7,5 en 5 (grens 125 partijen) dit moeten gaan hanteren.
Dat wordt een enorme crime qua sorteren op datum (en eigenlijk op tijd want in sommige toernooien worden ook nog twee partijen op een dag gespeeld). Dus alle wedstrijden in Toernooibase zouden dan op datum en tijd (lekker voor al die invoerders) vastgelegd moeten worden. En dan maar hopen dat al die wedstrijdleiders wedstrijden die vooruitgespeeld worden op die juiste datumtijd zetten evenals wedstrijden die naar achteren verplaatst worden (in deze coronaperiode wel wat vaak voorkomend).

Daarnaast zit je dan nog met een fikser probleem van iteratie (terugkerende berekening). In die berekening zitten momenteel de spelers, die op ratingdatum oud minder dan zes partijen tegen tegenstanders met een rating hebben gespeeld. Iedereen krijgt een rating als hij zes partijen of meer heeft gespeeld.
Deze spelers komen niet op een A-lijst van KNDB maar moeten wel berekend worden en zodra ze zes partijen gespeeld hebben worden hun wedstrijden (en rating) ook meegerekend in de rating van hun tegenstanders.
Dat betekent dat tussentijds in een seizoen een speler een rating krijgt en ook met terugwerkende kracht dan in een ratingberekening van zijn tegenstander meerekent. En er zijn natuurlijk situaties dat hij gespeeld heeft tegen iemand met minder dan zes partijen en die ook
dan een rating krijgt en ook weer meerekent.
Ik meen dat ik in Toernooibase daarom een achttal iteratieslagen doorvoer, voordat de definitieve berekening van de volledige lijst gedaan is (hoeveel slagen KNDB/Jan Masselink doet weet ik niet).
In jouw situatie kan ook door het optreden van zo’n nieuwe rating, de datum van het bereiken van die 25 partijen (en dus ook 125 partijen) weer veranderen.
Dat betekent volgens mij weer extra iteratieslagen.

En, het grootste nadeel. De ratingberekening wordt ondoorzichtiger. Nu zijn er vier situaties.

1) op ratingdatum oud minder dan 25 partijen -> berekening op basis van prestatierating
2) op ratingdatum oud 25 partijen en minder dan 125 -> K-factor 7,5
3) op ratingdatum oud > 125 partijen -> K-factor 5.
4) grote ratingstijging door formule -> turbofactor afgeroomd op de IrP (en die kan ik in Toernooibase niet zichtbaar maken). Als er afgeroomd zou worden op de normale seizoensprestatie zou het mogelijk zijn. Maar het grote voordeel van de IrP is dat er bij een grote deviatie in rating (dus bijvoorbeeld tegenstanders tussen rating 500 en 1500 i.p.v. alles rond 1200) de IrP veel nauwkeuriger is dan de normale seizoenprestatie.

Jouw voorstel zou ook kunnen impliceren (want technisch is het mogelijk), dat je na elke wedstrijd een rating nieuw vaststelt. Dan maak je telkens een nieuwe rating, welke rating je in een volgende wedstrijd weer meeneemt.
Een tussenvariant kan ook zijn dat je van de laatste 25 partijen van een speler de ratingberekening doet (geen last van het verleden). Dat is iets meer richting Chessmetrics van Jeff Sonas).
En wat de FMJD doet (en ik dacht ook de Nederlandse schaakbond), is dat je na elk toernooi een rating nieuw vaststelt van de deelnemende spelers.
Nadeel is dat dit ook ondoorzichtig wordt, terwijl je wat in de knoop komt met de clubcompetities, die over een heel seizoen zijn uitgesmeerd.
Daarnaast heeft de FMJD de aparte gewoonte dat wanneer toernooiuitslagen heel laat binnenkomen, ze gewoon in de volgende periode gezet worden (zij hebben per kwartaal een rating).

Tot dusver vind ik dat het huidige systeem van KNDB best werkt.
De hele ratingperiode (het seizoen) wordt gezien als één toernooi. Je hebt vrijwel geen last van gebroken toernooien (clubcompetities lopen altijd in het seizoen).

Voordeel is ook dat de resultaten (tussentijdse voortgang van de rating) in Toernooibase op basis van de bovengenoemde vier situaties, (behalve die IrP-check, die bij 0,2% van alle spelers voorkomt) transparant kunnen worden weergegeven.

In alle andere door mij geschetste situaties (want wie ziet ooit een volledig transparante FMJD-ratingberekening?) zal mij dat in het huidige Toernooibase niet meer lukken.

Een sortering op datum/tijd is een flinke aanslag qua tijd op de database, terwijl mijn inschatting is dat ook de iteratieberekeningen toenemen. Nu loopt volgens mij aan het eind van het seizoen de dagelijkse (nachtelijke) cronjob wel eens drie kwartier. Als dat meer wordt zal de KNDB of meer capaciteit (nog snellere server met betere processoren en grotere geheugencapaciteit) moeten gaan inhuren of afzien van de ratingberekening in Toernooibase (zoals ik in een ver verleden ook al heb afgezien van die Chessmetrics berekeningen, aangezien dat ook uit de hand liep.) en uitsluitend met een standalone situatie moeten gaan werken.

Enfin, hier laat ik het maar even bij. :)
https:toernooibase.kndb.nl More than 400.000 games on applet, more than 1.200.000 results, more than 20.000 games broadcasted (semi-)live, more than 12.600 inserted tournaments!

LastigeKnul
Posts: 148
Joined: Tue Oct 22, 2019 13:42
Real name: Eric van t Hof
Location: Valkenburg

Re: K-factor in de KNDB rating

Post by LastigeKnul » Tue Mar 08, 2022 11:22

Piet, bedankt wederom voor je uitgebreide uiteenzetting.

Niet om negatief te doen, maar naar mijn gevoel stammen de ideeën achter de damrating-berekeningen nog uit de jaren '70. In die tijd kostte het verwerken van alle partijen en het uitrekenen van de ratings veel rekenkracht en was om die reden ook erg duur. Dat is allemaal verleden tijd.

Zoals jezelf ook aangeeft worden de nieuwe ratings tegenwoordig dagelijks opnieuw uitgerekend. Alleen worden die "virtueel" genoemd. Het is mij nog steeds niet duidelijk wat er nu precies virtueel is aan deze ratings, waarvan je zelf aangeeft dat ze een nauwkeurigheid hebben van 99,8%.

Ter vergelijking de schaakbond: die is vele jaren geleden al overgestapt op eerst kwartaalratings en tegenwoordig zijn het zelfs maandelijkse ratings. Ik meen me te herinneren dat ze ook afgestapt zijn van de iteraties in de berekeningen omdat die nauwelijks iets toevoegen.

Kortom, mijn pleidooi is om ook bij de dambond over te stappen op ratings die maandelijks opnieuw worden vastgesteld.

Daarmee is dan tevens het andere probleem, dat van die extreem hoge k-factoren, opgelost.

clp
Posts: 194
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Eliminate iRp in KNDB rating

Post by clp » Tue Mar 08, 2022 11:49

Piet Bouma wrote:
Sun Mar 06, 2022 20:48
Kees,

Zou je eerst een antwoord op deze - eerder al - gestelde vraag kunnen geven?

Overigens snap ik de door Kees gegeven formule tot op heden niet:

De correctiefactor kan worden verhoogd naar 10:
• indien het positieve verschil tussen WP en NP als percentage van 2N, is 10% of meer; én
• het aantal gespeelde wedstrijden in die periode is 10 of meer
waarbij:
N - Aantal in de periode gespeelde partijen
WP - Werkelijk behaald aantal punten
NP - Norm punten
Bewering: Als gevolg van bovenstaande wijziging wordt de iRp-check overbodig.

Kan je mij dat in een praktisch voorbeeld uitleggen Een verschil tussen WP en NP als percentage van 2N? 10% of meer?

En even inhoudelijk op je laatste reactie.
De KNDB-rating wordt één keer per jaar vastgesteld door de wedstrijdcommissie/ratingcommissaris KNDB.
De virtuele rating in Toernooibase geeft tijdens het seizoen een indruk van de ontwikkeling van deze rating.
Niet meer en niet minder.
Bij 0,2% is de virtuele ratingberekening in Toernooibase fout. Maak je daar a.u.b. niet zo druk om.
Piet,

Allereerst: gegeven de stabiliteit van het damcollectief, en het feit dat de meerderheid van de spelers alleen in teamcompetities speelt, is een update van één keer per jaar voldoende. Nu het "probleem"van de jeugdspelers. Dat probleem is niet groot, maar waarom zou je iets ingewikkelds doen als het ook eenvoudiger en beter kan?

In de rekenregels vinden we de volgende conditie:
het positieve verschil tussen de eigen rating op ratingdatum en de prestatierating over de ratingperiode is 100 punten of meer
Mijn intentie is om het begrip iRp (en de bijbehorende rekentijd) te elimineren, en de regels te formuleren in termen van W en NP. Op die manier is alles eenvoudig na te rekenen en hoeft er ook geen ongelijkloop te bestaan tussen TB en het KNDB ratingsysteem. De virtuele rating per 1-7 in TB is gelijk aan de KNDB rating.

Nu de uitleg. 2N is in dammen de maximale score. Dus W / 2N is de werkelijke score. En NP / 2N de normscore.
Als de werkelijke score 10% beter is dan de normscore en er zijn voldoende partijen gespeeld, dan is het resultaat uitmuntend. Uiteraard is de keuze van 10% willekeurig, maar je moet iets kiezen.

De conditie:
indien het positieve verschil tussen WP en NP als percentage van 2N, is 10% of meer;
vervangt derhalve de iRp in de rekenregels .

Een voorbeeld:

Code: Select all

Eigen rating = 1309, Rc = 1212, Rp = 1405, iRp = 1420 (als ik het goed heb berekend), verschil met de eigen rating = 111.
Pl     Rating N Pt  D    NP
S1     1256  1  2  53   1,15
S2     1048  1  2  261  1,64
S3     1307  1  1  2    1,01
S4     1173  1  2  136  1,37    
S5     1331  1  0  -22  0,94
S6     1289  1  1  20   1,06
S7     1223  1  2  86   1,24
S8     1067  1  2  242  1,60
Totaal 1212  8 12       9,99

N        = 8, max score 2N = 16
P        = 75%    (=12   / 16), DP = 193
NP/2N    = 62,24% (=9,99 / 16)
Verschil = 13% > 10%
Dus stel dat een beginner bovenstaande resultaat heeft behaald, dan zou hij/zij in aanmerking komen voor C = 10.
Misschien is het mogelijk / niet te veel werk om uit te zoeken hoeveel spelers met 25 partijen of minder "uitmuntend" hebben gescoord.
Last edited by clp on Tue Mar 08, 2022 17:13, edited 1 time in total.

LastigeKnul
Posts: 148
Joined: Tue Oct 22, 2019 13:42
Real name: Eric van t Hof
Location: Valkenburg

Re: K-factor in de KNDB rating

Post by LastigeKnul » Tue Mar 08, 2022 14:40

LastigeKnul wrote:
Tue Mar 08, 2022 11:22
Piet, bedankt wederom voor je uitgebreide uiteenzetting.

Niet om negatief te doen, maar naar mijn gevoel stammen de ideeën achter de damrating-berekeningen nog uit de jaren '70. In die tijd kostte het verwerken van alle partijen en het uitrekenen van de ratings veel rekenkracht en was om die reden ook erg duur. Dat is allemaal verleden tijd.

Zoals jezelf ook aangeeft worden de nieuwe ratings tegenwoordig dagelijks opnieuw uitgerekend. Alleen worden die "virtueel" genoemd. Het is mij nog steeds niet duidelijk wat er nu precies virtueel is aan deze ratings, waarvan je zelf aangeeft dat ze een nauwkeurigheid hebben van 99,8%.

Ter vergelijking de schaakbond: die is vele jaren geleden al overgestapt op eerst kwartaalratings en tegenwoordig zijn het zelfs maandelijkse ratings. Ik meen me te herinneren dat ze ook afgestapt zijn van de iteraties in de berekeningen omdat die nauwelijks iets toevoegen.

Kortom, mijn pleidooi is om ook bij de dambond over te stappen op ratings die maandelijks opnieuw worden vastgesteld.

Daarmee is dan tevens het andere probleem, dat van die extreem hoge k-factoren, opgelost.
Waar komt (kwam) de behoefte vandaan om in de berekening van ratings te itereren? Mijns inziens uit het feit dat de ratings slechts eenmaal per jaar opnieuw werden uitgerekend. En in één jaar kan veel gebeuren.

Neem de eerder genoemde Fleur als voorbeeld. Haar rating is 842, vastgesteld op 1 juli 2021. We zijn inmiddels 8 maanden en 42 partijen verder en het is volstrekt duidelijk dat die rating van 842 nu niet meer klopt. Haar prestatierating is momenteel 1096.

Dat betekent dus dat Fleurs vólgende tegenstander Mr. X iemand treft die op papier nog 842 heeft, maar in werkelijkheid ca. 1096. Dat is voor de ratingberekening van Mr. X niet "eerlijk", ongeacht het partijresultaat.

Welnu, dit probleem wordt dan "opgelost" op 30 juni 2022, waarbij door middel van iteratie achteraf getracht wordt te bepalen wat haar rating nu gemiddeld zou moeten zijn. Dit noem ik dus een probleem uit de jaren '70 van de vorige eeuw.

Die iteratie is nu, anno 2022, niet meer nodig, want de momentane rating van Fleur is eenvoudig uit te rekenen en dit wordt zelfs dagelijks reeds gedaan! (Los van het andere probleem met de extreemhoge k-factor die ook het gevolg is van de te lange termijn van een jaar).

clp
Posts: 194
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: K-factor in de KNDB rating

Post by clp » Tue Mar 08, 2022 16:27

LastigeKnul wrote:
Tue Mar 08, 2022 14:40
Waar komt (kwam) de behoefte vandaan om in de berekening van ratings te itereren? Mijns inziens uit het feit dat de ratings slechts eenmaal per jaar opnieuw werden uitgerekend. En in één jaar kan veel gebeuren.
Eric,

De iteratie heeft te maken met een ander fenomeen. Zo heb jij een partij gewonnen van een speler met een rating van 287. Die partij had je beter niet kunnen spelen. Dan was je gemiddelde tegenstanderrating 25 punten hoger geweest en evenzo jouw ratingperformance Rp.

De iRp, de ratingperformance op basis van iteratie, heeft hier geen last van. Immers de verwachte score is 1,96 tegen een werkelijke score van 2 punten. Winnen doet in ieder geval geen kwaad.

Het gemiddelde nemen van een reeks ratinggetallen is een lineaire benadering. Deze benadering is redelijk OK als de uitschieters beperkt zijn. Het gebruik van de gemiddelde rating in een ratingsysteem is verdacht, en een bron van problemen.

Ik ken voor de toepassing van de iRp in een ratingsysteem maar één andere bron: Rekenregels KNSB-Seniorenrating.

Piet Bouma
Posts: 3574
Joined: Sun Nov 02, 2003 13:05
Location: Harlingen

Re: K-factor in de KNDB rating

Post by Piet Bouma » Tue Mar 08, 2022 18:57

@Kees.
Het gaat niet om de spelers < 25 partijen, maar om spelers < 125 partijen.
Ik heb even gekeken, maar jouw formule gaat veel sneller werken dan de formule, die nu gehanteerd wordt. Zelf scoor ik ook al 7% beter dan verwacht (al heb ik wel meer dan die 125 partijen gespeeld, dus niet van toepassing). En dat zijn nominaal maar 2 wedstrijdpuntjes meer. Als ik één wedstijdpuntje meer had gescoord, zit ik boven 10%
Ik denk dat je sowieso in jouw formule ergens het verschil tussen Ratingprestatie en Ratingoud mee zou moeten nemen.
Dan richt je je beter op de doelgroep waar het om gaat, spelers (voornamelijk jeugdspelers), die in een ratingperiode een flinke speelsterktestijging vertonen.

@Lastige Knul.
Het systeem van iteratie is vooral gericht op het feit dat daardoor nieuwe spelers zoveel mogelijk ook snel een rating krijgen.
Bij een maandelijkse ratinglijst wordt dit wel enigszins opgelost, maar je zult altijd nog intredende spelers krijgen, die een meerdaags toernooi in een maand spelen, vijf wedstrijden tegen iemand met een vooraf al bekende rating hebben en ook tegen een speler hebben gespeeld, die in die periode een rating krijgt. En die speler gaat aan de bel trekken.
Dit probleem heb je met iteratie niet. Dus ook bij maandelijkse lijsten zal je iteratie moeten toepassen.

Opvallend is dat Kees een ratingperiode van een jaar voldoende vindt en jij naar een maandelijkse rating wil.
In feite levert Toernooibase dagkoersen van de ratingontwikkeling en dit noem ik dus virtuele rating.
In het verleden is er een discussie op dit forum gevoerd, of je niet beter een kwartaalrating zou moeten invoeren, waarmee je ook de turbofactor (ten behoeve van die (jeugd)spelers, die snel in speelsterkte stijgen) af zou kunnen schaffen.
Uit voorbeelden bleek dat dit wat negatiever voor deze groep uitpakte. Lager aantal wedstrijden in kwartaalperiodes, wat uiteindelijk op jaarbasis een lagere ratingstijging veroorzaakte.
Ach, zoveel mensen, zoveel wensen, zoveel meningen…..

Overigens heeft ook de schaakbond een uitzondering voor jeugdspelers. En die is niet op een formule gebaseerd:

9.1 Rating bonus Rb
Jeugdspelers worden sterker naarmate ze ouder worden. Om ratingdeflatie te
voorkomen worden aan spelers met een rating < 1600 ratingpunten toegevoegd. Per
lijst bepaalt de ratingcommissaris hoeveel ratingpunten aan een jeugdcategorie wordt
toegevoegd. Na het toekennen van de bonus kan Rn niet groter dan 1600 zijn.

Tja, zo kun je het ook benaderen. :D
https:toernooibase.kndb.nl More than 400.000 games on applet, more than 1.200.000 results, more than 20.000 games broadcasted (semi-)live, more than 12.600 inserted tournaments!

clp
Posts: 194
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Turbo K-factor in de KNDB rating

Post by clp » Tue Mar 08, 2022 22:21

Piet Bouma wrote:
Tue Mar 08, 2022 18:57
@Kees.
Het gaat niet om de spelers < 25 partijen, maar om spelers < 125 partijen.
Ik heb even gekeken, maar jouw formule gaat veel sneller werken dan de formule, die nu gehanteerd wordt. Zelf scoor ik ook al 7% beter dan verwacht (al heb ik wel meer dan die 125 partijen gespeeld, dus niet van toepassing). En dat zijn nominaal maar 2 wedstrijdpuntjes meer. Als ik één wedstijdpuntje meer had gescoord, zit ik boven 10%
Ik denk dat je sowieso in jouw formule ergens het verschil tussen Ratingprestatie en Ratingoud mee zou moeten nemen.
Dan richt je je beter op de doelgroep waar het om gaat, spelers (voornamelijk jeugdspelers), die in een ratingperiode een flinke speelsterktestijging vertonen.
@Piet,

Als R0 (ratingoud) laag is, dan zal ook NP laag zijn. En als Rp (ratingprestatie) hoog is, dan zal dat veroorzaakt worden door de gescoorde punten W. Met andere woorden: de informatie in R0 en Rp is gelijk aan de informatie in W en NP. Na enig puzzelen heb ik gevonden dat
(Rp - R0) ≈ 400(WP - NP) / N
De conditie (Rp - R0) > 100 komt overeen met:
Indien (WP - NP) / N > 0.25, dan turboversterking
In woorden: De werkelijke score moet gemiddeld per partij 0,25 punten boven de normscore liggen. Ik ben benieuwd hoeveel dammers met < 125 partijen hieraan voldoen.

De FIDE deelt al een definitieve rating uit na vijf! partijen, mits tenminste één punt is gescoord. Dit voorkomt ook veel correcties. Zie 8.2 Determining the Rating 'Ru' in a given event of a previously unrated player.
Last edited by clp on Wed Mar 09, 2022 16:22, edited 1 time in total.

clp
Posts: 194
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: K-factor in de KNDB rating

Post by clp » Tue Mar 08, 2022 23:44

Piet Bouma wrote:
Tue Mar 08, 2022 18:57
Opvallend is dat Kees een ratingperiode van een jaar voldoende vindt en jij naar een maandelijkse rating wil.
@Piet, Eric,
Ik zie het bepalen van ratings als een vorm van Meet- en regeltechniek. Als het signaal stabiel is, dan mag de bemonsteringsfrequentie (sampling rate) ook laag zijn. Het feit dat we met de computer iedere milliseconde alles kunnen herberekenen wil niet zeggen dat het ook een goed idee is. Zoals Piet betoogd is dat maar zeer de vraag.

Stel dat we ratings zouden bepalen voor een online toernooi dan ligt de situatie weer heel anders. In dat geval kan het verstandig zijn om de rating per gespeelde partij aan te passen.

Piet Bouma
Posts: 3574
Joined: Sun Nov 02, 2003 13:05
Location: Harlingen

Re: K-factor in de KNDB rating

Post by Piet Bouma » Wed Mar 09, 2022 21:07

Ik heb de situatie van gisteren betreffende rating in een download van Toernooibase naar Excel gezet en daar een aantal bewerkingen op uitgevoerd, om de formule(s) van Kees te bekijken.

In totaal zijn er 401 spelers, die nu > 24 en minder dan 125 partijen gespeeld hebben op ratingdatum oud en nu een virtuele berekening hebben.

Daarvan voldoen 49 spelers aan het 25% criterium wat Kees Pippel voorstelt.
Echter daar zitten ook flink wat spelers bij, die dit seizoen minder dan 10 partijen hebben gespeeld.
Filteren we die eruit (alleen spelers met 10 partijen of meer), dan voldoen nog maar 4 spelers aan het criterium van 25%.
Als we het eerdere criterium van Kees bij de 401 spelers hanteren (de 10%) dan zijn er 25 spelers, die dan de K-factor 10 mee zouden krijgen.
Momenteel zijn er 26 spelers, die aan de huidige formule van de Turbofactor voldoen.
Daarvan zijn er drie spelers, die m.i. afgeroomd worden op basis van de iRp-restrictie.
Er vallen ook drie spelers van die 26 af, omdat deze niet voldoen aan de 10%.
En er komen twee andere spelers met de nieuwe formule bij, die net niet aan het oude criterium voldoen van 100 punten verschil tussen Rp (Gemiddelde ratingprestatie) en Rating oud.

Op zich “raakt” de eerste formule van Kees (10%) vrijwel dezelfde doelgroep (met merendeels jeugdspelers) als bij de huidige formule.
Wel wordt de ratingstijging beperkt doordat iedereen nu de K-factor 10 krijgt terwijl in de oude situatie, dit 10 of meer is.
Dus de ratingstijging wordt afgevlakt.
Blijft dus wel de vraag wat de oude formule nou precies voor achterliggende gedachte heeft.

Want ook bij de Nederlandse schaaksite zie ik ergens een formule betreffende de K-factor, die ook wat apart lijkt:

“7. Bepaling verversingsfactor (k)
Deze factor is in de eerste plaats afhankelijk van het aantal gespeelde partijen Nv
waarop Ro is gebaseerd. Bij ratings tussen 2100 en 2400 speelt tevens de hoogte van
Ro een rol.
2100 < Ro < 2400 216 / √ Nv 25 – (Ro – 2100) / 20”

Daar komt die zelfde /20 naar voren, die ook in de formule van de KNDB betreffende de turbofactor zit:

“De correctiefactor kan worden verhoogd onder de volgende omstandigheden:
- het positieve verschil tussen de eigen rating op ratingdatum en de prestatierating over
de ratingperiode is 100 punten of meer; én
- het aantal gespeelde wedstrijden in die periode is 10 of meer.
In dat geval wordt de correctiefactor vastgesteld op (P – Ro + 100) / 20, waarbij P =prestatierating en Ro de rating op ratingdatum).
De correctiefactor kan echter niet hoger worden dan het aantal door de speler in de ratingperiode gespeelde wedstrijden.”

Overigens is het ook een overweging de iRp check, die dus momenteel bij drie spelers een bottleneck is om Toernooibase gelijk te laten lopen met de officiële KNDB-rating te vervangen door de minder nauwkeurige Rp-check.
Want het effect in Kees zijn berekening is dat twee in mijn ogen zeer talentvolle jeugdspelers in ratingstijging afgeremd worden.
Enfin, Kees moet eventuele voorstellen maar bij de KNDB-doen.

Onderstaand een print van een geanonimiseerde Excel-sheet (ik hoop dat de afbeelding wat overkomt) over de berekening van Kees en de huidige situatie.

Image
https:toernooibase.kndb.nl More than 400.000 games on applet, more than 1.200.000 results, more than 20.000 games broadcasted (semi-)live, more than 12.600 inserted tournaments!

clp
Posts: 194
Joined: Tue Jul 10, 2018 14:28
Real name: Kees Pippel
Location: IJmuiden

Re: K-factor (P – Ro + 100) / 20

Post by clp » Sat Mar 26, 2022 09:31

Piet Bouma wrote:
Wed Mar 09, 2022 21:07
Blijft dus wel de vraag wat de oude formule nou precies voor achterliggende gedachte heeft.
LastigeKnul wrote:
Tue Feb 22, 2022 14:25
clp wrote:
Sat Feb 12, 2022 22:12
In dat geval wordt de correctiefactor vastgesteld op (P – Ro + 100) / 20, waarbij P = prestatierating en Ro de rating op ratingdatum).
Ik herken het idee uit de schaakwereld. De gedachte is natuurlijk dat nieuwe, jonge, talentvolle spelers vaak snel groeien in speelsterkte en dat dit niet goed tot uitdrukking komt bij het gebruik van een normale correctiefactor.

De hier gehanteerde formule (P - Ro + 100) / 20 herken ik niet. Ik veronderstel dat hij ooit gewoon door iemand is verzonnen zonder verdere "wetenschappelijke" onderbouwing.

De ondergrens van deze "gecorrigeerde correctiefactor" is blijkbaar 10 en loopt dan lineair op naar mate de prestatierating hoger is. Voorbeelden:

Ro = 700 P = 800 C = 10
Ro = 700 P = 900 C = 15
Ro = 700 P = 1078 C = 23,9
Je kunt de formule herschrijven als:
  • 5 + (Rp - Ro) / 20, merk op dat de 5 voor dammers overeenkomt met een 10 voor schakers.
De formule loopt van 5 naar oneindig, en zal ontsporen als er "teveel" partijen in de ratingperiode worden gespeeld.

Elo (1976, p136) heeft al vastgesteld dat de nieuwe rating, op basis van ratingverandering K(WP-NP), in het betrouwbaarheidsinterval van de prestatierating valt als K = 800 / 2N. Dus stel de uitkomst van de formule is K = 20. Dan ligt het kantelpunt bij 400 / 20 = gespeelde 20 partijen. Vóór het kantelpunt zal de nieuwe rating kleiner zijn dan de prestatierating. Na (veel) meer partijen dan het kantelpunt, zal de nieuwe rating van de speler buiten het betrouwbaarheidsinterval van de prestatierating vallen.

Als de rating per event (toernooi), of per maand, wordt aangepast, dan is er geen probleem. Het aantal partijen zal niet snel veel groter worden dan 20, de door Piet opgemerkte magische constante. Maar in het KNDB systeem gaat het mis: er zijn spelers die zomaar 40 partijen of meer spelen. En dan is de bijbehorende K-factor 400 / 40 = 10, en niet 20.

Voor K = 5 is het kantelpunt 80 partijen. Dat is een veilige grens die niet snel overschreden zal worden.

Dit betekent overigens niet dat de frequentie van het KNDB ratingsysteem aangepast zou moeten worden.
Ik vind het KNDB systeem prima voor ons:
  • In toernooibase zien we de laatste stand, de virtuele rating
  • per 1 juli wordt de virtuele rating definitief, 1-op-1, in de ideale wereld zonder iteraties toe te passen.
Het betekent wel dat je de formules van de KNSB (update per maand), FIDE (update per event), en FMJD (update per event) niet klakkeloos kan kopiëren.

Of zoals ik ergens las: de ratingberekeningen zijn simpel, maar het inrichten van een ratingsysteem is dit niet.

Post Reply