Een voorspelling voor over 18 jaar, met 15 zeer onnauwkeurige datapunten. Je durft nogal, Mark.Mark Hees wrote:forecast (met gebruik van de laatste 15 jaar):
32,5 2005
31,3 2032
dus het zal zo'n vaart niet lopen.

Weg met gelijke spelen
- Eric Sanders
- Posts: 1211
- Joined: Fri Sep 19, 2003 10:30
- Location: Nijmegen
- Contact:
Statistiek
Toch hoeven we maar terug in de tijd te gaan om 2 matches aan te wijzen waarin alle partijen remise werden.Eric Sanders wrote:April 2326 voor het lineaire geval.Koops wrote:Nu de huiskamervraag voor het lezerspubliek: hoe lang duurt het nog voor een match tussen twee topspelers een remisepercentage oplevert van 99% of meer? Graag zowel in het lineare als het polynome geval natuurlijk!
Gemeen hoor, Koops om statistieken te maken die Dieter niet bevallen.
Heaven is no location, but a state of mind
Huh?Eric Sanders wrote:April 2326 voor het lineaire geval.Koops wrote:Nu de huiskamervraag voor het lezerspubliek: hoe lang duurt het nog voor een match tussen twee topspelers een remisepercentage oplevert van 99% of meer? Graag zowel in het lineare als het polynome geval natuurlijk!
y = 0,86 + rating * 0,0494
y = 99 ==> rating is 1987
De rating van de topspelers (Baljakin en Tsjizjov) is momenteel ongeveer 1600. De rating stijgt met 2,95 punten per jaar:
1987 - 1600= 387
387 / 2,95 = 131,2
2004 + 131,2 = 2135
- Eric Sanders
- Posts: 1211
- Joined: Fri Sep 19, 2003 10:30
- Location: Nijmegen
- Contact:
Die formule voor ratingstijging per jaar was gebaseerd op de Nederlands kampioen (tussen 1911-1975). Het is niet gezegd dat je die op andersoortige spelers toe mag passen. Wat ik heb gedaan is de onbekende x oplossen als je de twee formules in elkaar schuift.Koops wrote:Huh?Eric Sanders wrote:April 2326 voor het lineaire geval.Koops wrote:Nu de huiskamervraag voor het lezerspubliek: hoe lang duurt het nog voor een match tussen twee topspelers een remisepercentage oplevert van 99% of meer? Graag zowel in het lineare als het polynome geval natuurlijk!
y = 0,86 + rating * 0,0494
y = 99 ==> rating is 1987
De rating van de topspelers (Baljakin en Tsjizjov) is momenteel ongeveer 1600. De rating stijgt met 2,95 punten per jaar:
1987 - 1600= 387
387 / 2,95 = 131,2
2004 + 131,2 = 2135
Overigens weten jij en ik allebei dat die formules met flinke korrels zout genomen moeten worden.
<edit>
In je formule
Rating kampioen = 762,33 + 2,9572 * (jaartal - 1911)
is de rating nog steeds op die andere rating gebaseerd.
Je kunt het raadseltje dus pas oplossen als je het verband tussen KNDB rating en die andere rating hebt.
</edit>
Last edited by Eric Sanders on Thu May 13, 2004 14:59, edited 1 time in total.
Why does it happen? Because it happens. - Neil Peart
-
- Posts: 713
- Joined: Wed Dec 17, 2003 10:51
Koops wrote:
In bovenstaande grafiek zien we de door mij verzamelde gegevens. Van de ratinggebieden buiten de 900 en 1500 had ik te weinig gegevens. Telkens is gekeken naar partijen van spelers die een rating hadden die 50 punten of minder verschilt. Ik heb het NK, de HF en de NC tot de 6e ronde meegenomen in de grafiek. Ook de vrouwenkampioenschappen.
Remisepercentage = 0,86 + KNDB-Rating * 0,0494
Bij een match om het Wereldkampioenschap kun je een rating verwachten van 1580. Dat zou een remisepercentage van 78,9 opleveren. In de praktijk valt dit echter nogal tegen, daarom vermoed ik een trendbreuk boven een bepaalde rating. Maar ik heb nog niet genoeg gegevens om dat te bewijzen/ontkrachten.
Fraai stukje werk.Dieter wrote:Nu krijg je een lijst van 15 jaar en nu ga je de gegevens weer in twijfel trekken of gaan we niet ver genoeg terug. Wat wil je eigenlijk Koops. Het is duidelijk dat je niet tevreden bent met het huidige percentage en anderen zoals Mark en ik wel. Nou dat weten we dan. Probeer vervolgens niet door allerlei aannames en veronderstellingen toch weer iets anders uit gegevens te halen.
Met behulp hiervan zijn ook de remisepercentages in de NK's te corrigeren naar een voor ratingverschil gecorrigeerd getal.
En Dieter, helaas ben je nog steeds niet geslaagd voor je beginners-examen statistiek. Het zomaar zonder nuances een conclusie trekken uit een rijtje cijfers, zonder je daarbij af te vragen hoe elk cijfertje tot stand komt is ook erg dubieus. Pogingen om die cijfertjes beter vergelijkbaar te maken kunnen (hoeven natuurlijk niet, daar heb je helemaal gelijk in) tot veel zinvollere conclusies leiden. Elk cijfer, elk getal is een discussie waard is mijn (studie/werk)ervaring. Als je zoals jij doet wel direct conclusies durft te trekken uit een rij cijfertjes dan ben je ook statistiek aan het bedrijven. Dat anderen die enige nuance wil aanbrengen "iets anders uit de gegevens halen" is waar, maar suggereert ten onrechte dat de eerste indruk van een cijferrijtje iets veel beters uit die gegevens zou kunnen halen. Niet corrigeren van cijfers is vaak de meest dubieuze correctie die er is.
Ja. Goed hè. Het lijkt wel of je met statistiek kunt bewijzen wat je wilt. Goh, wat een nieuw inzicht.Eric Sanders wrote:Een voorspelling voor over 18 jaar, met 15 zeer onnauwkeurige datapunten. Je durft nogal, Mark.Mark Hees wrote:forecast (met gebruik van de laatste 15 jaar):
32,5 2005
31,3 2032
dus het zal zo'n vaart niet lopen.
Oh, en het is een voorspelling voor over 28 jaar.....
Het enige verschil tussen de beide ratings is de absolute uitgangswaarde. Bakker stelde de gemiddelde rating van de deelnemers van het eerste NK in 1911 vast op 500 en heeft dat als ankerwaarde gebruikt. Voor de KNDB-rating is een andere waarde genomen. De stijging van de ratings is echter volledig over te nemen heb ik begrepen. Ik zou in ieder geval niet weten waarom niet. De stijging van 2,95 punten per jaar is toch onafhankelijk van de uitgangswaarde?Eric Sanders wrote:
Die formule voor ratingstijging per jaar was gebaseerd op de Nederlands kampioen (tussen 1911-1975). Het is niet gezegd dat je die op andersoortige spelers toe mag passen. Wat ik heb gedaan is de onbekende x oplossen als je de twee formules in elkaar schuift.
Overigens weten jij en ik allebei dat die formules met flinke korrels zout genomen moeten worden.
<edit>
In je formule
Rating kampioen = 762,33 + 2,9572 * (jaartal - 1911)
is de rating nog steeds op die andere rating gebaseerd.
Je kunt het raadseltje dus pas oplossen als je het verband tussen KNDB rating en die andere rating hebt.
</edit>
Overigens heb ik de benodigde rating voor 99% gelijke spelen ook eens in de polynome trendlijn gegooid:
0,0018 * x * x - 0,0011x + 0,4931 = 0,99
0,0018 * x * x - 0,0011x - 0,4969 = 0
x*x – 0,61 x – 276 = 0
x = 16,9
16,9 = (rating – 850) / 50
Rating = 1695
Dit niveau zouden we al binnen dertig jaar kunnen bereiken volgens de lineaire vergelijking voor ratinggroei!!
Om ook de polynome vergelijking voor de ratinggroei in te kunnen vullen zouden we inderdaad de relatie moeten kunnen bepalen tussen de rating van Bakker en die van de KNDB. Dat kan wel, maar daar heb ik even geen zin in want dat is heel veel werk. Ik geloof echter wel dat het goede mogelijk is dat er een vervlakking van de ratinggroei zal optreden. Maar dat zal ruimschoots gecompenseerd worden door de trendbreuk in de remisepercentages. Lijkt me.
Veelzijdig talent Koops
Wat een veelzijdig talent die Koops!Koops wrote:Het enige verschil tussen de beide ratings is de absolute uitgangswaarde. Bakker stelde de gemiddelde rating van de deelnemers van het eerste NK in 1911 vast op 500 en heeft dat als ankerwaarde gebruikt. Voor de KNDB-rating is een andere waarde genomen. De stijging van de ratings is echter volledig over te nemen heb ik begrepen. Ik zou in ieder geval niet weten waarom niet. De stijging van 2,95 punten per jaar is toch onafhankelijk van de uitgangswaarde?Eric Sanders wrote:
Die formule voor ratingstijging per jaar was gebaseerd op de Nederlands kampioen (tussen 1911-1975). Het is niet gezegd dat je die op andersoortige spelers toe mag passen. Wat ik heb gedaan is de onbekende x oplossen als je de twee formules in elkaar schuift.
Overigens weten jij en ik allebei dat die formules met flinke korrels zout genomen moeten worden.
<edit>
In je formule
Rating kampioen = 762,33 + 2,9572 * (jaartal - 1911)
is de rating nog steeds op die andere rating gebaseerd.
Je kunt het raadseltje dus pas oplossen als je het verband tussen KNDB rating en die andere rating hebt.
</edit>
Overigens heb ik de benodigde rating voor 99% gelijke spelen ook eens in de polynome trendlijn gegooid:
0,0018 * x * x - 0,0011x + 0,4931 = 0,99
0,0018 * x * x - 0,0011x - 0,4969 = 0
x*x – 0,61 x – 276 = 0
x = 16,9
16,9 = (rating – 850) / 50
Rating = 1695
Dit niveau zouden we al binnen dertig jaar kunnen bereiken volgens de lineaire vergelijking voor ratinggroei!!
Om ook de polynome vergelijking voor de ratinggroei in te kunnen vullen zouden we inderdaad de relatie moeten kunnen bepalen tussen de rating van Bakker en die van de KNDB. Dat kan wel, maar daar heb ik even geen zin in want dat is heel veel werk. Ik geloof echter wel dat het goede mogelijk is dat er een vervlakking van de ratinggroei zal optreden. Maar dat zal ruimschoots gecompenseerd worden door de trendbreuk in de remisepercentages. Lijkt me.
Dammen
Stand Up comedian
Debatteren
Statistiek bedrijven
Stripverhalen
Damboeken schrijven en uitgeven
Experimenten met cannabis
Onderzoekjes
Verhalen
Xal nog wel het een en ander vergeten zijn.
Woensdag Koops op de planken in N-Joy te Drachten. Ga je mee blondegod?
Heaven is no location, but a state of mind
- Eric Sanders
- Posts: 1211
- Joined: Fri Sep 19, 2003 10:30
- Location: Nijmegen
- Contact:
Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.
Doet me denken aan die Amerikaanse wetenschappers die hadden uitgerekend wanneer vrouwen even hard zullen rennen als mannen (dat schijnt naar elkaar toe te groeien). Met gebruikmaking van hun formules zouden vrouwen aan het eind van de eeuw de marathon in 10 seconden lopen.
Doet me denken aan die Amerikaanse wetenschappers die hadden uitgerekend wanneer vrouwen even hard zullen rennen als mannen (dat schijnt naar elkaar toe te groeien). Met gebruikmaking van hun formules zouden vrouwen aan het eind van de eeuw de marathon in 10 seconden lopen.
Why does it happen? Because it happens. - Neil Peart
Waarom denk je dat? Het verhaal van die Amerikanen gaat niet op omdat ik al gebruik maak van een afvlakkende groei.Eric Sanders wrote:Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.
-
- Posts: 2199
- Joined: Tue Sep 30, 2003 01:52
Wat bedoel je "met formule niet correct"?Eric Sanders wrote:Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.
Doet me denken aan die Amerikaanse wetenschappers die hadden uitgerekend wanneer vrouwen even hard zullen rennen als mannen (dat schijnt naar elkaar toe te groeien). Met gebruikmaking van hun formules zouden vrouwen aan het eind van de eeuw de marathon in 10 seconden lopen.
Vermoedelijk "de formule is waarschijnlijk niet geschikt om voorspellingen te doen".
- Eric Sanders
- Posts: 1211
- Joined: Fri Sep 19, 2003 10:30
- Location: Nijmegen
- Contact:
- Jan Pieter
- Posts: 2432
- Joined: Sat Sep 27, 2003 05:37
- Real name: Jan Pieter Drost
Ik heb zelfs het gevoel dat er na 1975 helemaal geen groei meer is in de ratings van de nationaal kampioenen. Ik kan me tenminste niet voorstellen dat Kees Thijssen in 2004 ruim 80 punten sterker is dan Wiersma in 1975. Lijkt me toch wel belangrijk om dat even uit te zoeken, alvorens je voorspellingen doet.Koops wrote:Om ook de polynome vergelijking voor de ratinggroei in te kunnen vullen zouden we inderdaad de relatie moeten kunnen bepalen tussen de rating van Bakker en die van de KNDB. Dat kan wel, maar daar heb ik even geen zin in want dat is heel veel werk. Ik geloof echter wel dat het goede mogelijk is dat er een vervlakking van de ratinggroei zal optreden.
- Eric Sanders
- Posts: 1211
- Joined: Fri Sep 19, 2003 10:30
- Location: Nijmegen
- Contact:
Ik denk niet dat, kijkend naar de grillige lijn in de grafiek, uit de ratings van de Nederlands kampioen tussen 1911 en 1975 een formule gedestilleerd kan worden die de rating van de Nederlands kampioen van dit moment goed weergeeft, laat staan die van de Nederlands kampioen van 2135 goed voorspelt.Koops wrote:Waarom denk je dat?Eric Sanders wrote:Er is dus een constante tussen Bakkers rating en de KNDB rating. Als je die hebt achterhaald, kun je heel eenvoudig kijken of die formule voor ratingstijging goed is, door de rating van de Nederlands kampioen van de afgelopen jaren te bereken. Waarschijnlijk klopt daar niet veel van en kan de formule de prullebak in.
Toch niet in die lineaire formule, lijkt me. Ook die polynome lijkt me, zoals gezegd, niet veel voorspellende kracht te hebben.Koops wrote:Het verhaal van die Amerikanen gaat niet op omdat ik al gebruik maak van een afvlakkende groei.
Why does it happen? Because it happens. - Neil Peart
Bij Baljakin kun je het je ook niet voorstellen?Jan Pieter wrote: Ik heb zelfs het gevoel dat er na 1975 helemaal geen groei meer is in de ratings van de nationaal kampioenen. Ik kan me tenminste niet voorstellen dat Kees Thijssen in 2004 ruim 80 punten sterker is dan Wiersma in 1975. Lijkt me toch wel belangrijk om dat even uit te zoeken, alvorens je voorspellingen doet.