Page 15 of 19

Posted: Thu May 13, 2004 14:14
by Eric Sanders
Mark Hees wrote:forecast (met gebruik van de laatste 15 jaar):

32,5 2005
31,3 2032

dus het zal zo'n vaart niet lopen.
Een voorspelling voor over 18 jaar, met 15 zeer onnauwkeurige datapunten. Je durft nogal, Mark.

Statistiek

Posted: Thu May 13, 2004 14:20
by Kosmos
Eric Sanders wrote:
Koops wrote:Nu de huiskamervraag voor het lezerspubliek: hoe lang duurt het nog voor een match tussen twee topspelers een remisepercentage oplevert van 99% of meer? Graag zowel in het lineare als het polynome geval natuurlijk!
April 2326 voor het lineaire geval.
Toch hoeven we maar terug in de tijd te gaan om 2 matches aan te wijzen waarin alle partijen remise werden.
Gemeen hoor, Koops om statistieken te maken die Dieter niet bevallen.

Posted: Thu May 13, 2004 14:28
by Koops
Eric Sanders wrote:
Koops wrote:Nu de huiskamervraag voor het lezerspubliek: hoe lang duurt het nog voor een match tussen twee topspelers een remisepercentage oplevert van 99% of meer? Graag zowel in het lineare als het polynome geval natuurlijk!
April 2326 voor het lineaire geval.
Huh?

y = 0,86 + rating * 0,0494
y = 99 ==> rating is 1987

De rating van de topspelers (Baljakin en Tsjizjov) is momenteel ongeveer 1600. De rating stijgt met 2,95 punten per jaar:

1987 - 1600= 387
387 / 2,95 = 131,2

2004 + 131,2 = 2135

Posted: Thu May 13, 2004 14:41
by Eric Sanders
Koops wrote:
Eric Sanders wrote:
Koops wrote:Nu de huiskamervraag voor het lezerspubliek: hoe lang duurt het nog voor een match tussen twee topspelers een remisepercentage oplevert van 99% of meer? Graag zowel in het lineare als het polynome geval natuurlijk!
April 2326 voor het lineaire geval.
Huh?

y = 0,86 + rating * 0,0494
y = 99 ==> rating is 1987

De rating van de topspelers (Baljakin en Tsjizjov) is momenteel ongeveer 1600. De rating stijgt met 2,95 punten per jaar:

1987 - 1600= 387
387 / 2,95 = 131,2

2004 + 131,2 = 2135
Die formule voor ratingstijging per jaar was gebaseerd op de Nederlands kampioen (tussen 1911-1975). Het is niet gezegd dat je die op andersoortige spelers toe mag passen. Wat ik heb gedaan is de onbekende x oplossen als je de twee formules in elkaar schuift.

Overigens weten jij en ik allebei dat die formules met flinke korrels zout genomen moeten worden.

<edit>
In je formule
Rating kampioen = 762,33 + 2,9572 * (jaartal - 1911)
is de rating nog steeds op die andere rating gebaseerd.
Je kunt het raadseltje dus pas oplossen als je het verband tussen KNDB rating en die andere rating hebt.
</edit>

Posted: Thu May 13, 2004 14:43
by Jaap van Galen
Koops wrote: Image

In bovenstaande grafiek zien we de door mij verzamelde gegevens. Van de ratinggebieden buiten de 900 en 1500 had ik te weinig gegevens. Telkens is gekeken naar partijen van spelers die een rating hadden die 50 punten of minder verschilt. Ik heb het NK, de HF en de NC tot de 6e ronde meegenomen in de grafiek. Ook de vrouwenkampioenschappen.

Remisepercentage = 0,86 + KNDB-Rating * 0,0494


Bij een match om het Wereldkampioenschap kun je een rating verwachten van 1580. Dat zou een remisepercentage van 78,9 opleveren. In de praktijk valt dit echter nogal tegen, daarom vermoed ik een trendbreuk boven een bepaalde rating. Maar ik heb nog niet genoeg gegevens om dat te bewijzen/ontkrachten.
Dieter wrote:Nu krijg je een lijst van 15 jaar en nu ga je de gegevens weer in twijfel trekken of gaan we niet ver genoeg terug. Wat wil je eigenlijk Koops. Het is duidelijk dat je niet tevreden bent met het huidige percentage en anderen zoals Mark en ik wel. Nou dat weten we dan. Probeer vervolgens niet door allerlei aannames en veronderstellingen toch weer iets anders uit gegevens te halen.
Fraai stukje werk.
Met behulp hiervan zijn ook de remisepercentages in de NK's te corrigeren naar een voor ratingverschil gecorrigeerd getal.

En Dieter, helaas ben je nog steeds niet geslaagd voor je beginners-examen statistiek. Het zomaar zonder nuances een conclusie trekken uit een rijtje cijfers, zonder je daarbij af te vragen hoe elk cijfertje tot stand komt is ook erg dubieus. Pogingen om die cijfertjes beter vergelijkbaar te maken kunnen (hoeven natuurlijk niet, daar heb je helemaal gelijk in) tot veel zinvollere conclusies leiden. Elk cijfer, elk getal is een discussie waard is mijn (studie/werk)ervaring. Als je zoals jij doet wel direct conclusies durft te trekken uit een rij cijfertjes dan ben je ook statistiek aan het bedrijven. Dat anderen die enige nuance wil aanbrengen "iets anders uit de gegevens halen" is waar, maar suggereert ten onrechte dat de eerste indruk van een cijferrijtje iets veel beters uit die gegevens zou kunnen halen. Niet corrigeren van cijfers is vaak de meest dubieuze correctie die er is.

Posted: Thu May 13, 2004 15:12
by Mark Hees
Eric Sanders wrote:
Mark Hees wrote:forecast (met gebruik van de laatste 15 jaar):

32,5 2005
31,3 2032

dus het zal zo'n vaart niet lopen.
Een voorspelling voor over 18 jaar, met 15 zeer onnauwkeurige datapunten. Je durft nogal, Mark.
Ja. Goed hè. Het lijkt wel of je met statistiek kunt bewijzen wat je wilt. Goh, wat een nieuw inzicht.

Oh, en het is een voorspelling voor over 28 jaar.....

Posted: Thu May 13, 2004 15:12
by Koops
Eric Sanders wrote:
Die formule voor ratingstijging per jaar was gebaseerd op de Nederlands kampioen (tussen 1911-1975). Het is niet gezegd dat je die op andersoortige spelers toe mag passen. Wat ik heb gedaan is de onbekende x oplossen als je de twee formules in elkaar schuift.

Overigens weten jij en ik allebei dat die formules met flinke korrels zout genomen moeten worden.

<edit>
In je formule
Rating kampioen = 762,33 + 2,9572 * (jaartal - 1911)
is de rating nog steeds op die andere rating gebaseerd.
Je kunt het raadseltje dus pas oplossen als je het verband tussen KNDB rating en die andere rating hebt.
</edit>
Het enige verschil tussen de beide ratings is de absolute uitgangswaarde. Bakker stelde de gemiddelde rating van de deelnemers van het eerste NK in 1911 vast op 500 en heeft dat als ankerwaarde gebruikt. Voor de KNDB-rating is een andere waarde genomen. De stijging van de ratings is echter volledig over te nemen heb ik begrepen. Ik zou in ieder geval niet weten waarom niet. De stijging van 2,95 punten per jaar is toch onafhankelijk van de uitgangswaarde?

Overigens heb ik de benodigde rating voor 99% gelijke spelen ook eens in de polynome trendlijn gegooid:

0,0018 * x * x - 0,0011x + 0,4931 = 0,99

0,0018 * x * x - 0,0011x - 0,4969 = 0

x*x – 0,61 x – 276 = 0

x = 16,9

16,9 = (rating – 850) / 50

Rating = 1695


Dit niveau zouden we al binnen dertig jaar kunnen bereiken volgens de lineaire vergelijking voor ratinggroei!!

Om ook de polynome vergelijking voor de ratinggroei in te kunnen vullen zouden we inderdaad de relatie moeten kunnen bepalen tussen de rating van Bakker en die van de KNDB. Dat kan wel, maar daar heb ik even geen zin in want dat is heel veel werk. Ik geloof echter wel dat het goede mogelijk is dat er een vervlakking van de ratinggroei zal optreden. Maar dat zal ruimschoots gecompenseerd worden door de trendbreuk in de remisepercentages. Lijkt me.

Veelzijdig talent Koops

Posted: Thu May 13, 2004 15:22
by Kosmos
Koops wrote:
Eric Sanders wrote:
Die formule voor ratingstijging per jaar was gebaseerd op de Nederlands kampioen (tussen 1911-1975). Het is niet gezegd dat je die op andersoortige spelers toe mag passen. Wat ik heb gedaan is de onbekende x oplossen als je de twee formules in elkaar schuift.

Overigens weten jij en ik allebei dat die formules met flinke korrels zout genomen moeten worden.

<edit>
In je formule
Rating kampioen = 762,33 + 2,9572 * (jaartal - 1911)
is de rating nog steeds op die andere rating gebaseerd.
Je kunt het raadseltje dus pas oplossen als je het verband tussen KNDB rating en die andere rating hebt.
</edit>
Het enige verschil tussen de beide ratings is de absolute uitgangswaarde. Bakker stelde de gemiddelde rating van de deelnemers van het eerste NK in 1911 vast op 500 en heeft dat als ankerwaarde gebruikt. Voor de KNDB-rating is een andere waarde genomen. De stijging van de ratings is echter volledig over te nemen heb ik begrepen. Ik zou in ieder geval niet weten waarom niet. De stijging van 2,95 punten per jaar is toch onafhankelijk van de uitgangswaarde?

Overigens heb ik de benodigde rating voor 99% gelijke spelen ook eens in de polynome trendlijn gegooid:

0,0018 * x * x - 0,0011x + 0,4931 = 0,99

0,0018 * x * x - 0,0011x - 0,4969 = 0

x*x – 0,61 x – 276 = 0

x = 16,9

16,9 = (rating – 850) / 50

Rating = 1695


Dit niveau zouden we al binnen dertig jaar kunnen bereiken volgens de lineaire vergelijking voor ratinggroei!!

Om ook de polynome vergelijking voor de ratinggroei in te kunnen vullen zouden we inderdaad de relatie moeten kunnen bepalen tussen de rating van Bakker en die van de KNDB. Dat kan wel, maar daar heb ik even geen zin in want dat is heel veel werk. Ik geloof echter wel dat het goede mogelijk is dat er een vervlakking van de ratinggroei zal optreden. Maar dat zal ruimschoots gecompenseerd worden door de trendbreuk in de remisepercentages. Lijkt me.
Wat een veelzijdig talent die Koops!

Dammen
Stand Up comedian
Debatteren
Statistiek bedrijven
Stripverhalen
Damboeken schrijven en uitgeven
Experimenten met cannabis
Onderzoekjes
Verhalen

Xal nog wel het een en ander vergeten zijn.
Woensdag Koops op de planken in N-Joy te Drachten. Ga je mee blondegod?

Posted: Thu May 13, 2004 15:23
by Eric Sanders
Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.

Doet me denken aan die Amerikaanse wetenschappers die hadden uitgerekend wanneer vrouwen even hard zullen rennen als mannen (dat schijnt naar elkaar toe te groeien). Met gebruikmaking van hun formules zouden vrouwen aan het eind van de eeuw de marathon in 10 seconden lopen.

Posted: Thu May 13, 2004 15:32
by Koops
Eric Sanders wrote:Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.
Waarom denk je dat? Het verhaal van die Amerikanen gaat niet op omdat ik al gebruik maak van een afvlakkende groei.

Posted: Thu May 13, 2004 15:37
by Bert Zwart
Eric Sanders wrote:Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.

Doet me denken aan die Amerikaanse wetenschappers die hadden uitgerekend wanneer vrouwen even hard zullen rennen als mannen (dat schijnt naar elkaar toe te groeien). Met gebruikmaking van hun formules zouden vrouwen aan het eind van de eeuw de marathon in 10 seconden lopen.
Wat bedoel je "met formule niet correct"?

Vermoedelijk "de formule is waarschijnlijk niet geschikt om voorspellingen te doen".

Posted: Thu May 13, 2004 15:38
by Eric Sanders
Bert Zwart wrote: Wat bedoel je "met formule niet correct"?

Vermoedelijk "de formule is waarschijnlijk niet geschikt om voorspellingen te doen".
Exact.

Posted: Thu May 13, 2004 15:42
by Jan Pieter
Koops wrote:Om ook de polynome vergelijking voor de ratinggroei in te kunnen vullen zouden we inderdaad de relatie moeten kunnen bepalen tussen de rating van Bakker en die van de KNDB. Dat kan wel, maar daar heb ik even geen zin in want dat is heel veel werk. Ik geloof echter wel dat het goede mogelijk is dat er een vervlakking van de ratinggroei zal optreden.
Ik heb zelfs het gevoel dat er na 1975 helemaal geen groei meer is in de ratings van de nationaal kampioenen. Ik kan me tenminste niet voorstellen dat Kees Thijssen in 2004 ruim 80 punten sterker is dan Wiersma in 1975. Lijkt me toch wel belangrijk om dat even uit te zoeken, alvorens je voorspellingen doet.

Posted: Thu May 13, 2004 15:49
by Eric Sanders
Koops wrote:
Eric Sanders wrote:Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.
Waarom denk je dat?
Ik denk niet dat, kijkend naar de grillige lijn in de grafiek, uit de ratings van de Nederlands kampioen tussen 1911 en 1975 een formule gedestilleerd kan worden die de rating van de Nederlands kampioen van dit moment goed weergeeft, laat staan die van de Nederlands kampioen van 2135 goed voorspelt.
Koops wrote:Het verhaal van die Amerikanen gaat niet op omdat ik al gebruik maak van een afvlakkende groei.
Toch niet in die lineaire formule, lijkt me. Ook die polynome lijkt me, zoals gezegd, niet veel voorspellende kracht te hebben.

Posted: Thu May 13, 2004 15:50
by Koops
Jan Pieter wrote: Ik heb zelfs het gevoel dat er na 1975 helemaal geen groei meer is in de ratings van de nationaal kampioenen. Ik kan me tenminste niet voorstellen dat Kees Thijssen in 2004 ruim 80 punten sterker is dan Wiersma in 1975. Lijkt me toch wel belangrijk om dat even uit te zoeken, alvorens je voorspellingen doet.
Bij Baljakin kun je het je ook niet voorstellen?