Het tiebreaksysteem kent aan alle spelers een tiebreakrating toe. In de context van een tiebreaksysteem noemen we een speler X1 zwakker (<), even sterk (=) of sterker (>) dan X2, als de rating van X1 kleiner, gelijk of groter is dan de rating van X2.
X --> Y betekent: X wint van Y.
X <-> Y betekent: X wint van Y en Y wint van X.
Zelfconsistentie (SC) van een tiebreaksysteem komt neer op het volgende (zie: preferences, p.2).
Stel dat twee spelers een zelfde aantal partijen in een toernooi hebben gespeeld en de eerste speler:
- behaalt een beter resultaat tegen even sterke of sterkere tegenstanders of
- behaalt tegen sterkere spelers een gelijk resultaat
dan moet de eerste speler hoger worden geplaatst dan de tweede speler in de ratingvolgorde.
Om naast zelfconsistent ook monotoon
(SCM) te zijn, is het vereist dat als de eerste speler uitsluitend extra "overwinningen" behaalt en / of de tweede speler uitsluitend extra "verliezen" heeft, dan moet de eerste speler hoger blijven dan de tweede speler in de rating-volgorde.
Een ratingsysteem is niet-SCM als er tenminste één tegenvoorbeeld bestaat.
Omgekeerd, als er geen tegenvoorbeeld bestaat dan is de ratingmethode consistent en monotoon.
- Relatieve Elo-rating op een ondeelbaar domein, en de GRS-methode voldoen aan SCM.
- Directe methoden, zoals wedstrijdpunten, Buchholz en SB zijn tamelijk ongevoelig voor de kracht van de tegenstander en daarom onverenigbaar met zelfconsistentie.
- Recursieve buchholz, AVG 400 en de least-squares-methode voldoen aan zelfconsistentie, maar zijn niet monotoon. Als het ratingverschil groot genoeg is dan wordt winst beloond met ratingverlies, en verlies met ratingwinst.
- De Fide performance rating (Rp) wordt bepaald op basis van de gemiddelde tegenstanderrating. Een lage rating van een tegenstander kan de gemiddelde rating zover naar beneden halen, dat een overwinning daar niet tegenop kan wegen.
- Hetzelfde effect zien we in het moyenne systeem: overwinningen tegen spelers met een zwakker moyenne kunnen bestraft worden met verlies.
Nietmonotoon, verlies door winst
X1 --> X3,
X2 --> X3, X3 --> X4 (zie: fusion fig5).
De SCM-tiebreakvolgorde is gelijk aan: X1 = X2 > X3 > X4.
De AVG 400-rating is gelijk aan: 300, 300, -100, -500.
Stel nu dat X1 een extra partij speelt tegen X4 en wint. Als gevolg van deze overwinning duikelt X1 naar de tweede plaats en schuift X2 op naar de eerste plaats. De bijbehorende AVG 400-rating is gelijk aan: 167, 300, -100, -367. De winnaar verliest en de verliezer wint ratingpunten.
Dit onrecht wordt hersteld als ook X2 van X4 wint:
De AVG 400-rating wordt: 200, 200, -100, -300. Alle lineaire ratingen zijn behept met dit euvel. Elo heeft dit probleem opgelost door de "rechthoekige" verwachtingsfunctie te vervangen door een s-vormige kromme tussen 0 en 100%.
Wedstrijdpunten voldoen niet aan SCM
X1 X2
| |
v v
X3 --> X4
De wedstrijdpuntenvolgorde is gelijk aan: X1 = X2 = X3 > X4 (zie: fusion fig3).
Er geldt:
X1 > X2: X1 en X2 hebben beiden gewonnen. De tegenstander van X1 (X3) is sterker dan de tegenstander van X2 (X4).
X1 > X3: de tegenstander van X1 (X3) is sterker dan de tegenstander van X3 (X4). X3 heeft verder uitsluitend verloren.
X2 > X3: X2 en X3 hebben beiden gewonnen van X4, maar X3 heeft verder uitsluitend verloren.
Dit is in tegenspraak met X1 = X2 = X3.
De SCM-volgorde is gelijk aan: X1 > X2 > X3 > X4.
SCM: geen tegenvoorbeeld
Indien X1 --> X2 --> X3 --> X1 dan geldt X1 = X2 = X3.
Een rondtoernooi heeft een unieke SCM-volgorde
X1 <-> X3
| ^
v |
X2 ----+
In dit voorbeeld is de unieke SCM volgorde is gelijk aan: 1,2,3 voor X1, X2, X3 achtereenvolgens.
We kunnen dit (informeel) als volgt inzien: we voegen voor iedere speler een remise tegen zichzelf toe. Nu hebben alle spelers dezelfde tegenstanders ontmoet. De SCM volgorde is gelijk aan de volgorde van de wedstrijdpunten.
De SCM volgorde is niet per definitie uniek
Stel nu dat X2 in het vorige voorbeeld een twee extra partijen speelt tegen X3 en wint.
Pl Nn | X1 X2 X3| N + = - P s| Rk rElo| Rk GRS0| Rk GRS3| Rk GRS6 |
1 X1 | xxx 2 1 | 2 1 1 0 3 1| 1 153| 1 21/7| 1 2| 2 65/39|
2 X2 | 0 xxx 222| 4 3 0 1 6 2| 2 85| 2 12/7| 1 2| 1 80/39|
3 X3 | 1 000 xxx| 4 0 1 3 1 -3| 3 -238| 3 -33/7| 3 -4| 3 -145/39|
We zien drie toegestane SCM-volgordes:
(1) X1 > X2 > X3 (GRS, epsilon = 0, y = 9, =LSQ = rBhz = AVG 400)
(2) X1 = X2 > X3 (GRS, epsilon = 3, y = 12)
(3) X1 < X2 > X3 (GRS, epsilon = 6, y = 15)
Relatieve Elo op een deelbaar domein is niet strikt monotoon
Stel X1 en X2 winnen van X3. Dan zijn X1 en X2 "oneindig" sterker dan X3. Meer overwinningen voor X1 of X2 tegen X3 voegen niets toe.
Referenties
Pavel Chebotarev & Elena Shamis,
From Incomplete Preferences to Ranking via Optimization, arXiv:math/0602552v1, 1997.
Pavel Chebotarev & Elena Shamis,
Preference fusion when the number of alternatives exceeds two: indirect scoring procedures, arXiv:math/0602171v3 , 1999.