Page 16 of 19

Posted: Thu May 13, 2004 15:58
by Jan Pieter
Koops wrote:
Jan Pieter wrote: Ik heb zelfs het gevoel dat er na 1975 helemaal geen groei meer is in de ratings van de nationaal kampioenen. Ik kan me tenminste niet voorstellen dat Kees Thijssen in 2004 ruim 80 punten sterker is dan Wiersma in 1975. Lijkt me toch wel belangrijk om dat even uit te zoeken, alvorens je voorspellingen doet.
Bij Baljakin kun je het je ook niet voorstellen?
Nee, nog steeds niet. Baljakin heeft op dit moment 71 punten meer dan Wiersma, maar ik vermoed dat Wiersma in 1975 aanzienlijk sterker speelde dan nu.

En bovendien, we hadden het over de kampioen. Dan kun jij wel zeggen dat de speler met de hoogste rating nu niet kampioen is geworden, maar dan kan ik in het verleden soortgelijke situaties aanwijzen. Ik geloof bijvoorbeeld niet dat Pieter Bergsma in 1968 de sterkste Nederlandse dammer was.

Posted: Thu May 13, 2004 16:12
by Koops
Jan Pieter wrote:Nee, nog steeds niet. Baljakin heeft op dit moment 71 punten meer dan Wiersma, maar ik vermoed dat Wiersma in 1975 aanzienlijk sterker speelde dan nu.

En bovendien, we hadden het over de kampioen. Dan kun jij wel zeggen dat de speler met de hoogste rating nu niet kampioen is geworden, maar dan kan ik in het verleden soortgelijke situaties aanwijzen. Ik geloof bijvoorbeeld niet dat Pieter Bergsma in 1968 de sterkste Nederlandse dammer was.
Ja, natuurlijk. Maar de vergelijking geeft de trend weer, niet het exacte aantal punten. Soms is het in de praktijk meer, soms is het minder.

Verder denk ik zelf dat het wel zou kunnen kloppen. In 1975 waren een aantal spelprincipes minder ver (of niet) ontwikkeld en werden ze dus ook minder goed begrepen dan nu. (Spel met opgedrongen randschijven, Tsjizjov-kanon en bijbehorende strategie etc.) Het ligt dus voor de hand om te denken dat de kampioenen van vandaag een beter en breder spelinzicht hebben dan die van vroeger.

Posted: Thu May 13, 2004 16:12
by Koops
...

Posted: Fri May 14, 2004 00:03
by Jaap van Galen
Koops wrote: Image

In bovenstaande grafiek zien we de door mij verzamelde gegevens. Van de ratinggebieden buiten de 900 en 1500 had ik te weinig gegevens. Telkens is gekeken naar partijen van spelers die een rating hadden die 50 punten of minder verschilt. Ik heb het NK, de HF en de NC tot de 6e ronde meegenomen in de grafiek. Ook de vrouwenkampioenschappen.

Remisepercentage = 0,86 + KNDB-Rating * 0,0494
Jammer dat de discussie met name over die andere m.i. veel minder interessante vergelijking gaat. Wat te zeggen over dit grafiekje. Ziet er vrij overtuigend uit.
Lambert-Jan, op hoeveel partijen per ratingklasse is dit gebaseerd? Wie weet er een snelle methode om de analyse-periode uit te breiden tot b.v. de afgelopen 10 jaar? Hoe anders wordt het plaatje als je bijvoorbeeld een grens van 100 punten neemt?

Posted: Fri May 14, 2004 01:35
by Koops
Jaap van Galen wrote: Jammer dat de discussie met name over die andere m.i. veel minder interessante vergelijking gaat. Wat te zeggen over dit grafiekje. Ziet er vrij overtuigend uit.
Lambert-Jan, op hoeveel partijen per ratingklasse is dit gebaseerd? Wie weet er een snelle methode om de analyse-periode uit te breiden tot b.v. de afgelopen 10 jaar? Hoe anders wordt het plaatje als je bijvoorbeeld een grens van 100 punten neemt?
Ik pomp hier de gegevens onder, maar ik heb nog niet de hele nationale competitie er in zitten. Bovendien wordt het niet echt mooi weergegeven.



900 13 15 28 0,464285714
950 32 27 59 0,542372881
1000 40 49 89 0,449438202
1050 57 52 109 0,52293578
1100 68 51 119 0,571428571
1150 54 37 91 0,593406593
1200 81 50 131 0,618320611
1250 53 40 93 0,569892473
1300 61 46 107 0,570093458
1350 33 13 46 0,717391304
1400 18 10 28 0,642857143
1450 29 13 42 0,69047619
1500 20 3 23 0,869565217

Respectievelijk de ratinggroep van de speler met de laagste rating.
Remisepartijen.
Winstpartijen.
Totaal aantal partijen.
Remisepercentage.

Mocht je opmerkingen hebben over de betrouwbaarheid, dan hoor ik die graag.

Posted: Fri May 14, 2004 10:34
by Eric Sanders
Koops wrote:
Jaap van Galen wrote: Jammer dat de discussie met name over die andere m.i. veel minder interessante vergelijking gaat. Wat te zeggen over dit grafiekje. Ziet er vrij overtuigend uit.
Lambert-Jan, op hoeveel partijen per ratingklasse is dit gebaseerd? Wie weet er een snelle methode om de analyse-periode uit te breiden tot b.v. de afgelopen 10 jaar? Hoe anders wordt het plaatje als je bijvoorbeeld een grens van 100 punten neemt?
Ik pomp hier de gegevens onder, maar ik heb nog niet de hele nationale competitie er in zitten. Bovendien wordt het niet echt mooi weergegeven.



900 13 15 28 0,464285714
950 32 27 59 0,542372881
1000 40 49 89 0,449438202
1050 57 52 109 0,52293578
1100 68 51 119 0,571428571
1150 54 37 91 0,593406593
1200 81 50 131 0,618320611
1250 53 40 93 0,569892473
1300 61 46 107 0,570093458
1350 33 13 46 0,717391304
1400 18 10 28 0,642857143
1450 29 13 42 0,69047619
1500 20 3 23 0,869565217

Respectievelijk de ratinggroep van de speler met de laagste rating.
Remisepartijen.
Winstpartijen.
Totaal aantal partijen.
Remisepercentage.

Mocht je opmerkingen hebben over de betrouwbaarheid, dan hoor ik die graag.
Bij 95 % betrouwbaarheid zijn de intervallen van remispercentages:

900: 28 - 65
1200: 53 - 70
1500: 65 - 97

Dus nog wat meer getallen graag.
Het zal niemand verbazen dat er uit komt wat er uit komt, maar het is altijd leuk dat bevestigd te zien.

Posted: Fri May 14, 2004 10:38
by Bert Zwart
Hoe heb je die BI's geconstrueerd, Eric?

Posted: Fri May 14, 2004 10:40
by Eric Sanders
Bert Zwart wrote:Hoe heb je die BI's geconstrueerd, Eric?
Ik heb daar een tooltje voor.
Daar vul ik het aantal tests in, het percentage en de betrouwbaarheid. Dan komt ie met de grenzen op de proppen.
Eigenlijk zou ik dat werk aan econometristen over moeten laten, want ik heb nauwelijks verstand van statistiek.

Posted: Fri May 14, 2004 11:11
by Bert Zwart
Eric Sanders wrote:
Bert Zwart wrote:Hoe heb je die BI's geconstrueerd, Eric?
Ik heb daar een tooltje voor.
Daar vul ik het aantal tests in, het percentage en de betrouwbaarheid. Dan komt ie met de grenzen op de proppen.
Eigenlijk zou ik dat werk aan econometristen over moeten laten, want ik heb nauwelijks verstand van statistiek.
goed idee!

Posted: Fri May 14, 2004 11:27
by Eric Sanders
Bert Zwart wrote:
Eric Sanders wrote:
Bert Zwart wrote:Hoe heb je die BI's geconstrueerd, Eric?
Ik heb daar een tooltje voor.
Daar vul ik het aantal tests in, het percentage en de betrouwbaarheid. Dan komt ie met de grenzen op de proppen.
Eigenlijk zou ik dat werk aan econometristen over moeten laten, want ik heb nauwelijks verstand van statistiek.
goed idee!
Nou, kom op dan met die cijfers.

Posted: Fri May 14, 2004 11:44
by Bert Zwart
Eric Sanders wrote:
Bert Zwart wrote:
Eric Sanders wrote: Ik heb daar een tooltje voor.
Daar vul ik het aantal tests in, het percentage en de betrouwbaarheid. Dan komt ie met de grenzen op de proppen.
Eigenlijk zou ik dat werk aan econometristen over moeten laten, want ik heb nauwelijks verstand van statistiek.
goed idee!
Nou, kom op dan met die cijfers.
ok dan... ff snel tussendoor voor
voor de 1500 categorie:

de maximum-likelihood schatter van de variantie van het winstpercentage
is (1/(n-1)) p^*(1-p^*)

waarbij n=23 en p^*=3/23=0.130

nemen we daar de wortel van dan krijg je een standaardafwijking van 0.0718.

die standaardwijking zegt me hier weinig lijkt me omdat p ontzettend klein is.

een standaard BI neemt aan weerskanten van p^* tweemaal de standaardafwijking.
ik ben ik elk geval voorlopig redelijk gerustgesteld dat jouw tool dat niet doet.

Posted: Fri May 14, 2004 13:04
by Eric Sanders
Die tool gebruikt de volgende formules:

bovengrens =

(#r + .5 +kv*kv/2 + kv*^sqr(kv*kv/4 + ((#r - .5)(#t - #r - .5))/#t))/(#t + kv*kv)

ondergrens =

(#r - .5 +kv*kv/2 - kv*^sqr(kv*kv/4 + ((#r - .5)(#t - #r + .5))/#t))/(#t + kv*kv)

waarbij #r aantal remises, #t aantal partijen en kv 1,96 de kwantiel voor 95% betrouwbaarheid.

Stelt dat nog meer gerust?

Posted: Fri May 14, 2004 13:40
by Bert Zwart
Eric Sanders wrote:Die tool gebruikt de volgende formules:

bovengrens =

(#r + .5 +kv*kv/2 + kv*^sqr(kv*kv/4 + ((#r - .5)(#t - #r - .5))/#t))/(#t + kv*kv)

ondergrens =

(#r - .5 +kv*kv/2 - kv*^sqr(kv*kv/4 + ((#r - .5)(#t - #r + .5))/#t))/(#t + kv*kv)

waarbij #r aantal remises, #t aantal partijen en kv 1,96 de kwantiel voor 95% betrouwbaarheid.

Stelt dat nog meer gerust?
nee, hier was ik al bang voor. ik zou hier geen symmetrisch betrouwbaarheidsinterval willen zien omdat je dan over de 100 precent kan schieten.

Posted: Fri May 14, 2004 13:57
by Eric Sanders
Bert Zwart wrote:
Eric Sanders wrote:Die tool gebruikt de volgende formules:

bovengrens =

(#r + .5 +kv*kv/2 + kv*^sqr(kv*kv/4 + ((#r - .5)(#t - #r - .5))/#t))/(#t + kv*kv)

ondergrens =

(#r - .5 +kv*kv/2 - kv*^sqr(kv*kv/4 + ((#r - .5)(#t - #r + .5))/#t))/(#t + kv*kv)

waarbij #r aantal remises, #t aantal partijen en kv 1,96 de kwantiel voor 95% betrouwbaarheid.

Stelt dat nog meer gerust?
nee, hier was ik al bang voor. ik zou hier geen symmetrisch betrouwbaarheidsinterval willen zien omdat je dan over de 100 precent kan schieten.
Geen idee wat er in die formule gebeurt, maar symmetrisch is het interval niet. Heb je de tekenwisseling in die wortel wel gezien?
<edit> oeps. ik had er zelf ook een gemist:
bovengrens =

(#r + .5 +kv*kv/2 + kv*^sqr(kv*kv/4 + ((#r + .5)(#t - #r - .5))/#t))/(#t + kv*kv)
</edit>

De uitkomsten zijn ook asymetrisch.

Posted: Fri May 14, 2004 14:45
by Klareveld
Eric Sanders wrote: Geen idee wat er in die formule gebeurt, maar symmetrisch is het interval niet. Heb je de tekenwisseling in die wortel wel gezien?
<edit> oeps. ik had er zelf ook een gemist:
bovengrens =

(#r + .5 +kv*kv/2 + kv*^sqr(kv*kv/4 + ((#r + .5)(#t - #r - .5))/#t))/(#t + kv*kv)
</edit>

De uitkomsten zijn ook asymetrisch.
Misschien een idee om eens op te houden met dit geestelijke gemasturbeer over formules.

Elke boerenlul begrijpt dat het aantal remises stijgt naarmate de rating toeneemt. Verder eindigen in praktijk 70-80% van de partijen tussen topgrootmeesters in remise. Klopt dus allemaal prima met grafiek van Koops en met de werkelijkheid.

De vraag is of dit hoge percentage een probleem is en zo ja, wat een oplossing is.

Er is vast wel een ander forum wat de (a-)symmetrie van een betrouwbaarheidsinterval behandelt.