Page 17 of 19

Posted: Fri May 14, 2004 15:08
by Eric Sanders
Klareveld wrote:Misschien een idee om eens op te houden met dit geestelijke gemasturbeer over formules.
Fijne binnenkomer Klareveld. Welkom.
Klareveld wrote:Elke boerenlul begrijpt dat het aantal remises stijgt naarmate de rating toeneemt. Verder eindigen in praktijk 70-80% van de partijen tussen topgrootmeesters in remise. Klopt dus allemaal prima met grafiek van Koops en met de werkelijkheid.

De vraag is of dit hoge percentage een probleem is en zo ja, wat een oplossing is.

Er is vast wel een ander forum wat de (a-)symmetrie van een betrouwbaarheidsinterval behandelt.
Er wordt op verschillende fora al jaren gediscussieerd over de vraag of het remisepercentage te hoog is en wat de oplossing is. Lees dat maar even allemaal door.
Koops geeft cijfers en vraagt naar betrouwbaarheid. Ik geef die, Bert vraagt hoe ik daar aan kom, ik geef de formule.
Stoort het je? Dan lees je het niet. Er zijn vast heel veel fora die nooit de (a-)symmetrie van een betrouwbaarheidsinterval behanden.

Vorm

Posted: Fri May 14, 2004 15:42
by Kosmos
Eric Sanders wrote:
Klareveld wrote:Misschien een idee om eens op te houden met dit geestelijke gemasturbeer over formules.
Fijne binnenkomer Klareveld. Welkom.
Klareveld wrote:Elke boerenlul begrijpt dat het aantal remises stijgt naarmate de rating toeneemt. Verder eindigen in praktijk 70-80% van de partijen tussen topgrootmeesters in remise. Klopt dus allemaal prima met grafiek van Koops en met de werkelijkheid.

De vraag is of dit hoge percentage een probleem is en zo ja, wat een oplossing is.

Er is vast wel een ander forum wat de (a-)symmetrie van een betrouwbaarheidsinterval behandelt.
Er wordt op verschillende fora al jaren gediscussieerd over de vraag of het remisepercentage te hoog is en wat de oplossing is. Lees dat maar even allemaal door.
Koops geeft cijfers en vraagt naar betrouwbaarheid. Ik geef die, Bert vraagt hoe ik daar aan kom, ik geef de formule.
Stoort het je? Dan lees je het niet. Er zijn vast heel veel fora die nooit de (a-)symmetrie van een betrouwbaarheidsinterval behanden.
Eric, je bent in vorm!

Posted: Fri May 14, 2004 15:46
by Bert Zwart
eindelijk valt er weer wat le lagge op dit forum [img]images/smilies/icon_lol.gif[/img] [img]images/smilies/icon_lol.gif[/img] [img]images/smilies/icon_lol.gif[/img] [img]images/smilies/icon_lol.gif[/img] [img]images/smilies/icon_lol.gif[/img] [img]images/smilies/icon_lol.gif[/img]

Posted: Fri May 14, 2004 15:50
by Rein Halbersma
Koops wrote: Geweldige statistiek, dit vooral die laatste opmerking. Heb je wel eens gehoord van uitschieters?

Als we ons fixeren op de laatste 15 jaar is de dalende trend misschien minder duidelijk dan over het geheel. Maar zelfs als je op basis hiervan een grafiekje uitzet in Excel moet je toch tot de trendlijn y = -0,0443x + 33,241 kunnen komen. Let op het minteken. Als we verder teruggaan wordt de daling duidelijker.
Statistisch gezien is y = -0,0443x + 33,241 bullshit. De -0.0443 is niet significant verschillend van nul, maar ligt met 95% betrouwbaarheid in het interval van -0.8 tot + 0.7.

De regressielijn verklaart minder dan 1% van de fluctuaties rondom de trendlijn. Kortom, er is geen enkele significante neergaande trend te bespeuren in de laatste 15 jaar.

Als je zo'n analyse statistisch verantwoord wilt doen, dan zou je alle 1365 partijen uit de afgelopen 15 NK's moeten pakken, en dan een model schatten waarmee je de uitslag (winst, remise, verlies) verklaart uit de ratings van de tegenstander, het jaar waarin het toernooi gespeeld werd en eventueel of er 2 of 3 punten voor de overwinning waren.

Je kunt dan netjes toetsen of er a) een neergaande lijn is, b) of er een verband is met speelsterke, en c) of de 3-puntentelling effect heeft gehad.

Rein

Posted: Fri May 14, 2004 15:53
by Vengaboy
Rein Halbersma wrote:
Koops wrote: Geweldige statistiek, dit vooral die laatste opmerking. Heb je wel eens gehoord van uitschieters?

Als we ons fixeren op de laatste 15 jaar is de dalende trend misschien minder duidelijk dan over het geheel. Maar zelfs als je op basis hiervan een grafiekje uitzet in Excel moet je toch tot de trendlijn y = -0,0443x + 33,241 kunnen komen. Let op het minteken. Als we verder teruggaan wordt de daling duidelijker.
Statistisch gezien is y = -0,0443x + 33,241 bullshit. De -0.0443 is niet significant verschillend van nul, maar ligt met 95% betrouwbaarheid in het interval van -0.8 tot + 0.7.

De regressielijn verklaart minder dan 1% van de fluctuaties rondom de trendlijn. Kortom, er is geen enkele significante neergaande trend te bespeuren in de laatste 15 jaar.

Als je zo'n analyse statistisch verantwoord wilt doen, dan zou je alle 1365 partijen uit de afgelopen 15 NK's moeten pakken, en dan een model schatten waarmee je de uitslag (winst, remise, verlies) verklaart uit de ratings van de tegenstander, het jaar waarin het toernooi gespeeld werd en eventueel of er 2 of 3 punten voor de overwinning waren.

Je kunt dan netjes toetsen of er a) een neergaande lijn is, b) of er een verband is met speelsterke, en c) of de 3-puntentelling effect heeft gehad.

Rein

Ik moet zeggen dat er schijbaar nogal veel experts zijn op dit gebied binnen de damwereld.

Posted: Fri May 14, 2004 15:57
by Koops
Rein Halbersma wrote: Statistisch gezien is y = -0,0443x + 33,241 bullshit. De -0.0443 is niet significant verschillend van nul, maar ligt met 95% betrouwbaarheid in het interval van -0.8 tot + 0.7.
Hehe.

Posted: Fri May 14, 2004 16:00
by Rein Halbersma
Vengaboy wrote:
Rein Halbersma wrote:
Koops wrote: Geweldige statistiek, dit vooral die laatste opmerking. Heb je wel eens gehoord van uitschieters?

Als we ons fixeren op de laatste 15 jaar is de dalende trend misschien minder duidelijk dan over het geheel. Maar zelfs als je op basis hiervan een grafiekje uitzet in Excel moet je toch tot de trendlijn y = -0,0443x + 33,241 kunnen komen. Let op het minteken. Als we verder teruggaan wordt de daling duidelijker.
Statistisch gezien is y = -0,0443x + 33,241 bullshit. De -0.0443 is niet significant verschillend van nul, maar ligt met 95% betrouwbaarheid in het interval van -0.8 tot + 0.7.

De regressielijn verklaart minder dan 1% van de fluctuaties rondom de trendlijn. Kortom, er is geen enkele significante neergaande trend te bespeuren in de laatste 15 jaar.

Als je zo'n analyse statistisch verantwoord wilt doen, dan zou je alle 1365 partijen uit de afgelopen 15 NK's moeten pakken, en dan een model schatten waarmee je de uitslag (winst, remise, verlies) verklaart uit de ratings van de tegenstander, het jaar waarin het toernooi gespeeld werd en eventueel of er 2 of 3 punten voor de overwinning waren.

Je kunt dan netjes toetsen of er a) een neergaande lijn is, b) of er een verband is met speelsterke, en c) of de 3-puntentelling effect heeft gehad.

Rein

Ik moet zeggen dat er schijbaar nogal veel experts zijn op dit gebied binnen de damwereld.
Wie kan mij een (Excel, tekst) bestandje sturen met daarin de uitslagen, witspeler, zwartspeler, jaar uit de laatste 15 NK's? Gewoon een uitdraai uit TurboDambase of zo. Ratings vanaf 1994 heb ik nog uit de programmaboekjes van de KNDB clubcompetite. Dan wil ik wel zo'n model schatten.

Rein

Posted: Fri May 14, 2004 16:40
by Koops
Rein Halbersma wrote:
Wie kan mij een (Excel, tekst) bestandje sturen met daarin de uitslagen, witspeler, zwartspeler, jaar uit de laatste 15 NK's? Gewoon een uitdraai uit TurboDambase of zo. Ratings vanaf 1994 heb ik nog uit de programmaboekjes van de KNDB clubcompetite. Dan wil ik wel zo'n model schatten.

Rein
Ik heb geen uitslagen. De gegevens die ik heb gebruikt zijn met de hand gesorteerd.
Wat vind je overigens van het verband tussen rating en remisepercentage?

Posted: Fri May 14, 2004 17:02
by Rein Halbersma
Koops wrote:
Rein Halbersma wrote:
Wie kan mij een (Excel, tekst) bestandje sturen met daarin de uitslagen, witspeler, zwartspeler, jaar uit de laatste 15 NK's? Gewoon een uitdraai uit TurboDambase of zo. Ratings vanaf 1994 heb ik nog uit de programmaboekjes van de KNDB clubcompetite. Dan wil ik wel zo'n model schatten.

Rein
Ik heb geen uitslagen. De gegevens die ik heb gebruikt zijn met de hand gesorteerd.
Wat vind je overigens van het verband tussen rating en remisepercentage?
Ja, ik vind dit wel interessant. Overigens gaat de ratinglijst (net als bij het schaken) ervan uit dat alleen het *verschil* in rating er toe doet bij het voorspellen van de partij-uitslag. Ook wordt er geen rekening gehouden met remises.

Voor het voorspellen van voetbaluitslagen is er wel een verbeterd systeem bedacht dat ook rekening houdt met gelijke spelen. De makers ervan hebben heel veel geld verdiend door hun voorspellingen bij de bookmakers vast te laten leggen. Maar ook deze modellen houden alleen rekening met het verschil in rating. De benodigde econometrische theorie om ook met ratingniveaus rekening te houden staat nog in de kinderschoenen.

Posted: Fri May 14, 2004 17:30
by Bert Zwart
Ben je fan van klassieke of bayesiaanse statistiek, Rein?

Het kan verschil uitmaken. Met klassieke statistiek kun je bewijzen dat Lucy B schuldig is, terwijl je met Bayesiaanse statistiek kunt bewijzen dat ze onschuldig is...

Posted: Fri May 14, 2004 17:57
by Rein Halbersma
Bert Zwart wrote:Ben je fan van klassieke of bayesiaanse statistiek, Rein?

Het kan verschil uitmaken. Met klassieke statistiek kun je bewijzen dat Lucy B schuldig is, terwijl je met Bayesiaanse statistiek kunt bewijzen dat ze onschuldig is...
tja wat is klassiek en wat is Bayesiaans... ik interpreteer statistiek in elk geval altijd als uitspraken over de waarschijnlijkheid van uitkomsten, *gegeven* de nulhypothese. het gebruik van Bayes stelling om tot een omgekeerde uitspraak te komen over de waarschijnlijkheid van een theorie, *gegeven* de uitkomsten, daar blijf ik liever bij uit de buurt... [img]images/smilies/icon_twisted.gif[/img]

gegeven de nulhypothese dat Lucy B onschuldig is (die in een rechtstaat zoals Nederland geldig is) en dat de kansen van veel doden tijdens haar werktijden onafhankelijk zijn, is het onwaarschijnlijk dat dit toch gebeurd is...

Ik doe dus liever uitspraken over de waarschijnlijkheid van data/bewijs/remisepercentages, en niet over de waarschijnlijkheid van hypotheses/schuldigheid van Lucy B/strijdlust van dammers [img]images/smilies/icon_lol.gif[/img]

wat is jouw mening?

Posted: Fri May 14, 2004 18:08
by Bert Zwart
Mijn mening is dat je statistiek pas moet gebruiken wanneer het gezond verstand tekort schiet.

Je hoeft weinig verstand van statistiek te hebben om te begrijpen dat het remisepercentage in en match Georgiev - Tsjizjov groter is dan in een match tussen Mark Hees en Henk Fokkink.

Daminquisitie

Posted: Fri May 14, 2004 19:18
by Kosmos
Rein Halbersma wrote: Gegeven de nulhypothese dat Lucy B onschuldig is (die in een rechtstaat zoals Nederland geldig is)
Toen ik voor de Dam-Inquisitie moest verschijnen ging men er anders a priori vanuit dat ik schuldig was...

Posted: Fri May 14, 2004 19:27
by Ben Anoniem
"a priori" klinkt buitengewoon wetenschappelijk maar is volstrekt overbodig

Posted: Fri May 14, 2004 19:41
by Kosmos
Ben Anoniem wrote:"a priori" klinkt buitengewoon wetenschappelijk maar is volstrekt overbodig
Buitengewoon is overbodig.