DeepMind
DeepMind
Now also Go on the menu of AI and ML.
http://www.sciencemag.org/news/2016/01/ ... al-game-go
So another reason to only focus on ML in Computer Draughts.
And next to that, bascially Im in favor to change towards the killer option (also in Computer Draughts Tournamants) , to defeat the many draws.
Bert
http://www.sciencemag.org/news/2016/01/ ... al-game-go
So another reason to only focus on ML in Computer Draughts.
And next to that, bascially Im in favor to change towards the killer option (also in Computer Draughts Tournamants) , to defeat the many draws.
Bert
Re: DeepMind
That's one major breakthrough!
I wasn't expecting that so soon already.
At some point there will be deep learning modules that you can simply add to your game source code, just as easy it is now to include for example a linear algebra dll. In a couple of years deep learning will be everywhere.
Michel
I wasn't expecting that so soon already.
At some point there will be deep learning modules that you can simply add to your game source code, just as easy it is now to include for example a linear algebra dll. In a couple of years deep learning will be everywhere.
Michel
-
- Posts: 299
- Joined: Tue Jul 07, 2015 07:48
- Real name: Fabien Letouzey
Re: DeepMind
Unfortunately, as Michel stated somewhere I think, it doesn't solve the draw problem; it only makes it smaller. I wouldn't be surprised to still witness 90% draws between equally-strong programs in tournament conditions (perhaps only at top level, I don't know). In testing however, it's down to 30-50% which gives enough leftover (as draws don't bring any information) for efficiency.BertTuyt wrote:And next to that, bascially Im in favor to change towards the killer option (also in Computer Draughts Tournamants) , to defeat the many draws.
I have another, intuitive, reason to favour killer draughts. Testing code changes was much more in line with what I experience in other games (e.g. regarding what should be an improvement), whereas normal draughts seemed to just "erase" everything like a black hole. That was an unpleasant feeling.
-
- Posts: 299
- Joined: Tue Jul 07, 2015 07:48
- Real name: Fabien Letouzey
Re: DeepMind
I have something in-between. I implement the rules and start generating games, as search is mostly the same between games. Then I provide evaluation features and the system does the weighting. It's not optimal due to search/eval interactions being ignored, but probably better than manual guesses even in games I already know well. I might try in chess just to check that.MichelG wrote:At some point there will be deep learning modules that you can simply add to your game source code, just as easy it is now to include for example a linear algebra dll. In a couple of years deep learning will be everywhere.
As I understand, deep learning replaces manual feature selection with many ANN layers (human time/knowledge -> computation power). They can also handle interacting features, which we usually ignore.
It's still unclear how well deep networks do in alpha-beta games though, due to the large computation cost. In chess, Giraffe was still 1000 Elo (I think) below the top engines despite the claim that eval was state-of-the-art.
-
- Posts: 1722
- Joined: Wed Apr 14, 2004 16:04
- Contact:
Re: DeepMind
the AlphaGo algorithm seems to be very much a blend between search and eval. AFAICS, they use human game to fit a CNN model for move predictors, then they play that move predictor in a Reinforcement Learning module to produce a value model. Then they use this value model to generate moves during MCTS playouts. Their neural net used in the search evaluates in the 1 ms timeframe, so their search is very slow compared to traditional (even Scan/Dragon style) alpha-beta searchers. They add several hundreds of ELO points by parallelism of the MCTS search (1200 CPUs for the search and hundreds of GPUs for the NN eval).Fabien Letouzey wrote:I have something in-between. I implement the rules and start generating games, as search is mostly the same between games. Then I provide evaluation features and the system does the weighting. It's not optimal due to search/eval interactions being ignored, but probably better than manual guesses even in games I already know well. I might try in chess just to check that.MichelG wrote:At some point there will be deep learning modules that you can simply add to your game source code, just as easy it is now to include for example a linear algebra dll. In a couple of years deep learning will be everywhere.
As I understand, deep learning replaces manual feature selection with many ANN layers (human time/knowledge -> computation power). They can also handle interacting features, which we usually ignore.
It's still unclear how well deep networks do in alpha-beta games though, due to the large computation cost. In chess, Giraffe was still 1000 Elo (I think) below the top engines despite the claim that eval was state-of-the-art.
One could no doubt apply the same techniques to draughts. The major obstacle might be the much stronger role of forced tactics in draughts that can trip up the MC rollouts. But the parallelism for MCTS is much easier to scale than parallel alpha-beta searches.
I was also pretty critical of the Giraffe claims (see viewtopic.php?f=53&t=4013&start=315), but now that AlphaGo is there, perhaps using a ML eval + MCTS and scaling it to hundreds of CPUs, it might be possible to scale ML for chess also to the level of Stockfish or beyond.
- Klaas van der Laan
- Posts: 898
- Joined: Wed Sep 24, 2003 13:19
- Real name: Klaas van der Laan
Re: DeepMind
Voor de liefhebbers:
Save the date!
Van 9 t/m 15 maart speelt een computerprogramma van Deepmind, een Engels bedrijf van Google, een wedstrijd van 5 partijen tegen Lee Sedol 9p uit Korea. De partijen worden gespeeld in Korea. Door het tijdsverschil zal de partij zich waarschijnlijk in de nacht afspelen. Op dit moment is er nog niet bekend hoe laat de partijen gespeeld worden. Lee wint $ 1.000.000 als hij 5 uit 5 scoort tegen AlphaGo. Het programma heeft Fan Hui, de Europees kampioen, al geveegd met 5 uit 5.
De Nederlandse Go Bond gaat, i.s.m. het Europees Go Centrum en de Europese Go Federatie, de eerste partij live volgen in het Europees Go Centrum te Amstelveen. Naast een livestream met commentaar van Michael Redmond 9p, nodigen wij een Europese prof uit voor commentaar. Voorafgaand aan deze partij worden inleidingen gehouden door een professor in de AI en een go prof die een analyse geeft van de eerder door AlphaGo gespeelde partijen. Ook willen we een forum organiseren over de gevaren en kansen van AI computertoepassingen in onze maatschappij. Tijdens het evenement wordt de stream zowel in een zaal als in het café vertoond.
Zet de datum van woensdagnacht 9 maart alvast in je agenda. Zodra we een aanvangstijd weten maken we die direct bekend.
Vooraanmelding sturen naar: office@go-centre.nl onder vermelding van AlphaGo 9 maart
Save the date!
Van 9 t/m 15 maart speelt een computerprogramma van Deepmind, een Engels bedrijf van Google, een wedstrijd van 5 partijen tegen Lee Sedol 9p uit Korea. De partijen worden gespeeld in Korea. Door het tijdsverschil zal de partij zich waarschijnlijk in de nacht afspelen. Op dit moment is er nog niet bekend hoe laat de partijen gespeeld worden. Lee wint $ 1.000.000 als hij 5 uit 5 scoort tegen AlphaGo. Het programma heeft Fan Hui, de Europees kampioen, al geveegd met 5 uit 5.
De Nederlandse Go Bond gaat, i.s.m. het Europees Go Centrum en de Europese Go Federatie, de eerste partij live volgen in het Europees Go Centrum te Amstelveen. Naast een livestream met commentaar van Michael Redmond 9p, nodigen wij een Europese prof uit voor commentaar. Voorafgaand aan deze partij worden inleidingen gehouden door een professor in de AI en een go prof die een analyse geeft van de eerder door AlphaGo gespeelde partijen. Ook willen we een forum organiseren over de gevaren en kansen van AI computertoepassingen in onze maatschappij. Tijdens het evenement wordt de stream zowel in een zaal als in het café vertoond.
Zet de datum van woensdagnacht 9 maart alvast in je agenda. Zodra we een aanvangstijd weten maken we die direct bekend.
Vooraanmelding sturen naar: office@go-centre.nl onder vermelding van AlphaGo 9 maart
Flow with the Go
- Klaas van der Laan
- Posts: 898
- Joined: Wed Sep 24, 2003 13:19
- Real name: Klaas van der Laan
Re: DeepMind
see: http://www.theguardian.com/technology/2 ... pockethits for interview with builder Demis Hassabis.
Flow with the Go
- Klaas van der Laan
- Posts: 898
- Joined: Wed Sep 24, 2003 13:19
- Real name: Klaas van der Laan
Re: DeepMind
Derde Update
Ons programma rond de eerste partij van de tweekamp Lee Sedol vs AlphaGo ziet er als volgt uit:
Dinsdagavond 8 maart speelt de club De Twee Ogen vanaf 19:45 in het Europees Go Centrum.
Aansluitend kan er ook van 23:00 tot 04:00 go worden gespeeld.
Bij voldoende belangstelling maken we daar het Omega Rapid Toernooi van, met vijf ronden.
Er zullen luchtmatrassen beschikbaar zijn in een aparte zaal, waarop overblijvers eventueel een dut kunnen doen.
Woensdagochtend 9 maart is er vanaf 04:30 tot 05:00 een ontvangst van alle belangstellenden met koffie en thee.
Om 05:00 (13:00 in Korea) begint de partij (2 uur bedenktijd en 3x 1 minuut byo-yomi).
We zullen een scherm openen waarop de live broadcasting met commentaar van Michael Redmond te volgen zal zijn.
Maar we voeren ook onze eigen gesprekken over de partij en over de toegepaste technologie.
Tussen 05:00 en 07:00 zullen Peter Brouwer en onder voorbehoud Merlijn Kuin de inhoudelijke discussie leiden over de opening.
Rond 06:00 legt Erik van der Werf uit hoe AlphaGo werkt.
Vanaf 07:00 zal Guo Juan haar commentaar op de partij geven.
Onder voorbehoud zal Jaap van den Herik een discussie inleiden over AI en de programmeerbaarheid van intuïtie.
Om 07:30 bieden wij een ontbijtbuffet aan. Als je daar gratis gebruik van wilt maken moet je je aanmelden voor de bijeenkomst, zo spoedig mogelijk maar uiterlijk 6 maart.
De derde AI-discussie zal Mathijs Romans inleiden, over de kansen en gevaren die meer in het algemeen kleven aan de nieuwe technologie van “deep learning”.
De slotdiscussie zal gaan over hoe de (professionele) praktijk van go spelen en leren wordt beïnvloed door de (misschien wel superieure) go-machines.
De eindtijd is afhankelijk van de duur van de partij, maar zal waarschijnlijk tussen 09:00 en 10:00 liggen.
Vriendelijke groet,
William
Ons programma rond de eerste partij van de tweekamp Lee Sedol vs AlphaGo ziet er als volgt uit:
Dinsdagavond 8 maart speelt de club De Twee Ogen vanaf 19:45 in het Europees Go Centrum.
Aansluitend kan er ook van 23:00 tot 04:00 go worden gespeeld.
Bij voldoende belangstelling maken we daar het Omega Rapid Toernooi van, met vijf ronden.
Er zullen luchtmatrassen beschikbaar zijn in een aparte zaal, waarop overblijvers eventueel een dut kunnen doen.
Woensdagochtend 9 maart is er vanaf 04:30 tot 05:00 een ontvangst van alle belangstellenden met koffie en thee.
Om 05:00 (13:00 in Korea) begint de partij (2 uur bedenktijd en 3x 1 minuut byo-yomi).
We zullen een scherm openen waarop de live broadcasting met commentaar van Michael Redmond te volgen zal zijn.
Maar we voeren ook onze eigen gesprekken over de partij en over de toegepaste technologie.
Tussen 05:00 en 07:00 zullen Peter Brouwer en onder voorbehoud Merlijn Kuin de inhoudelijke discussie leiden over de opening.
Rond 06:00 legt Erik van der Werf uit hoe AlphaGo werkt.
Vanaf 07:00 zal Guo Juan haar commentaar op de partij geven.
Onder voorbehoud zal Jaap van den Herik een discussie inleiden over AI en de programmeerbaarheid van intuïtie.
Om 07:30 bieden wij een ontbijtbuffet aan. Als je daar gratis gebruik van wilt maken moet je je aanmelden voor de bijeenkomst, zo spoedig mogelijk maar uiterlijk 6 maart.
De derde AI-discussie zal Mathijs Romans inleiden, over de kansen en gevaren die meer in het algemeen kleven aan de nieuwe technologie van “deep learning”.
De slotdiscussie zal gaan over hoe de (professionele) praktijk van go spelen en leren wordt beïnvloed door de (misschien wel superieure) go-machines.
De eindtijd is afhankelijk van de duur van de partij, maar zal waarschijnlijk tussen 09:00 en 10:00 liggen.
Vriendelijke groet,
William
Flow with the Go
- Klaas van der Laan
- Posts: 898
- Joined: Wed Sep 24, 2003 13:19
- Real name: Klaas van der Laan
Re: DeepMind
Vierde Update
Beste belangstellenden,
Er hebben zich inmiddels 36 personen aangemeld voor de bijeenkomst op de vroege ochtend van 9 maart.
En er is meer nieuws:
- De prijsvraag die Bobby van den Hoek heeft uitgeschreven, gesponsord door Het Paard en een anoniem ICT-bedrijf, maakt ook ons evenement weer wat spannender. Jullie hebben zijn bericht op de mailinglist al gezien. We rekenen erop dat jullie allemaal een voorspelling doen!
Voor wie zich trouwens goed wil voorbereiden op de inhoudelijke bijdragen over AI, raden wij Bobs artikel aan (opgenomen in het bulletin van de bond, maar ook op deze blogspot: http://deeplearningskysthelimit.blogspo ... phago.html, waar zeer belangwekkende links bij staan).
- We hebben de bevestiging binnen van Prof. Dr. Van den Herik dat hij komt.
Hij concludeerde in zijn afscheidsrede aan de Universiteit Tilburg, begin dit jaar:
"(...) ik ben ervan overtuigd dat we vanuit geregistreerde intuïtieve gedragingen
elementen kunnen halen, die we vervolgens als programma-bouwstenen
kunnen implementeren in de AI-programma’s van de toekomst. Het betekent
niets meer en niets minder dan dat intuïtie valt te programmeren." (De link gaven we in de eerste update.)
Is dit nu feitelijk al gebeurd met AlphaGo? Of ligt het net anders?
Is hier de intuïtie van go-spelers gevat?
Zo ja, op de manier die van den Herik verwachtte?
Zo nee, wat is dan wel geprogrammeerd?
Zijn de menselijke intelligentie en de hier gerealiseerde kunstmatige intelligentie goed vergelijkbaar of juist niet?
Hierbij de meest recent bijgewerkte versie van het programma:
04.30 u - 05.00 u: Ontvangst van alle belangstellenden met koffie en thee.
05.00 u - 10.00 u: Live broadcasting van de match met commentaar van Michael Redmond 9p. De partij begint om 13.00 u Koreaanse tijd met 2 uur bedenktijd per persoon/computer en 3x 1 minuut byo-yomi.
05.00 u - 07.00 u: Commentaar op de opening door afwisselend Peter Brouwer 6d, Nederlands kampioen Rapid, en (onder voorbehoud) Merlijn Kuin 6d, huidig en meervoudig Nederlands kampioen.
06.00 u - 07.00 u: Uitleg over de werking van AlphaGo door Erik van der Werf 1d, wetenschapper en programmeur van vier go-programma's.
07.00 u - 10.00 u: Commentaar op de match door Guo Juan 5p, go professional en -docent.
07.30 u – 08.00 u: Discussie over AI (kunstmatige intelligentie) en de programmeerbaarheid van intuïtie ingeleid door Prof. Dr. Jaap van den Herik, AI specialist, ook op denksportgebied.
07.30 u - 08.30 u: Ontbijtbuffet, gratis bij vooraanmelding, zo spoedig mogelijk maar uiterlijk 6 maart.
08.30 u - 09.00 u: Discussie over de kansen en gevaren van 'deep learning' ingeleid door Mathijs Romans 1d, software-architekt
09.00 u - 10.00 u: Slotdiscussie over hoe de (professionele) praktijk van go spelen en leren wordt beïnvloed door de (misschien wel superieure) go-computers.
Wat betreft de overnachting voor diegenen die al op dinsdagavond arriveren, voor alle duidelijkheid: we hebben genoeg luchtmatrassen. Maar alles wat je verder nodig hebt om in, op of onder te dutten dien je zelf mee te brengen. Je kan in plaats daarvan ook de hele nacht go blijven spelen.
Voor wie zich nog niet heeft aangemeld:
Deze partij wordt misschien wel de meest baanbrekende in de geschiedenis van go. Daar wil je bij zijn, gezellig met geestverwanten en kritisch ten aanzien van zowel menselijk kunnen als computertechniek.
Vriendelijke groet,
William
Beste belangstellenden,
Er hebben zich inmiddels 36 personen aangemeld voor de bijeenkomst op de vroege ochtend van 9 maart.
En er is meer nieuws:
- De prijsvraag die Bobby van den Hoek heeft uitgeschreven, gesponsord door Het Paard en een anoniem ICT-bedrijf, maakt ook ons evenement weer wat spannender. Jullie hebben zijn bericht op de mailinglist al gezien. We rekenen erop dat jullie allemaal een voorspelling doen!
Voor wie zich trouwens goed wil voorbereiden op de inhoudelijke bijdragen over AI, raden wij Bobs artikel aan (opgenomen in het bulletin van de bond, maar ook op deze blogspot: http://deeplearningskysthelimit.blogspo ... phago.html, waar zeer belangwekkende links bij staan).
- We hebben de bevestiging binnen van Prof. Dr. Van den Herik dat hij komt.
Hij concludeerde in zijn afscheidsrede aan de Universiteit Tilburg, begin dit jaar:
"(...) ik ben ervan overtuigd dat we vanuit geregistreerde intuïtieve gedragingen
elementen kunnen halen, die we vervolgens als programma-bouwstenen
kunnen implementeren in de AI-programma’s van de toekomst. Het betekent
niets meer en niets minder dan dat intuïtie valt te programmeren." (De link gaven we in de eerste update.)
Is dit nu feitelijk al gebeurd met AlphaGo? Of ligt het net anders?
Is hier de intuïtie van go-spelers gevat?
Zo ja, op de manier die van den Herik verwachtte?
Zo nee, wat is dan wel geprogrammeerd?
Zijn de menselijke intelligentie en de hier gerealiseerde kunstmatige intelligentie goed vergelijkbaar of juist niet?
Hierbij de meest recent bijgewerkte versie van het programma:
04.30 u - 05.00 u: Ontvangst van alle belangstellenden met koffie en thee.
05.00 u - 10.00 u: Live broadcasting van de match met commentaar van Michael Redmond 9p. De partij begint om 13.00 u Koreaanse tijd met 2 uur bedenktijd per persoon/computer en 3x 1 minuut byo-yomi.
05.00 u - 07.00 u: Commentaar op de opening door afwisselend Peter Brouwer 6d, Nederlands kampioen Rapid, en (onder voorbehoud) Merlijn Kuin 6d, huidig en meervoudig Nederlands kampioen.
06.00 u - 07.00 u: Uitleg over de werking van AlphaGo door Erik van der Werf 1d, wetenschapper en programmeur van vier go-programma's.
07.00 u - 10.00 u: Commentaar op de match door Guo Juan 5p, go professional en -docent.
07.30 u – 08.00 u: Discussie over AI (kunstmatige intelligentie) en de programmeerbaarheid van intuïtie ingeleid door Prof. Dr. Jaap van den Herik, AI specialist, ook op denksportgebied.
07.30 u - 08.30 u: Ontbijtbuffet, gratis bij vooraanmelding, zo spoedig mogelijk maar uiterlijk 6 maart.
08.30 u - 09.00 u: Discussie over de kansen en gevaren van 'deep learning' ingeleid door Mathijs Romans 1d, software-architekt
09.00 u - 10.00 u: Slotdiscussie over hoe de (professionele) praktijk van go spelen en leren wordt beïnvloed door de (misschien wel superieure) go-computers.
Wat betreft de overnachting voor diegenen die al op dinsdagavond arriveren, voor alle duidelijkheid: we hebben genoeg luchtmatrassen. Maar alles wat je verder nodig hebt om in, op of onder te dutten dien je zelf mee te brengen. Je kan in plaats daarvan ook de hele nacht go blijven spelen.
Voor wie zich nog niet heeft aangemeld:
Deze partij wordt misschien wel de meest baanbrekende in de geschiedenis van go. Daar wil je bij zijn, gezellig met geestverwanten en kritisch ten aanzien van zowel menselijk kunnen als computertechniek.
Vriendelijke groet,
William
Flow with the Go
Re: DeepMind
DeepMind won the first game, 4 to go.
Bert
Bert
-
- Posts: 859
- Joined: Sat Apr 28, 2007 14:53
- Real name: Ed Gilbert
- Location: Morristown, NJ USA
- Contact:
Re: DeepMind
I watched the first 1-1/2 hours of the game last night. I have never played go, and it was well past my usual bed time, but it was fascinating to watch history being made.
-- Ed
-- Ed
-
- Posts: 67
- Joined: Wed Aug 12, 2015 17:45
- Real name: Jelle Wiersma
Re: DeepMind
Three wins in a row for alphago - match over...!