Nieuws
Metriek voor generalisatie in versterkend leren
OpenAI introduceert CoinRun, een trainingsomgeving die een metriek biedt om te meten hoe goed een agent ervaringen kan overdragen naar nieuwe situaties. CoinRun is eenvoudiger dan traditionele platformers zoals Sonic the Hedgehog, maar biedt toch een uitdagende generalisatieprobleem voor state-of-the-art algoritmen. De studie toont aan dat overfitting optreedt bij minder dan 4.000 trainingsniveaus en dat technieken zoals dropout en batchnormalisatie de generalisatie aanzienlijk verbeteren.