Nieuws

Evolved Policy Gradients: een nieuw metalearning-algoritme van OpenAI

OpenAI introduceert Evolved Policy Gradients, een experimenteel metalearning-algoritme dat het verliesfunction van leeragenten evolueert, waardoor ze sneller kunnen trainen op nieuwe taken. Getrainde agenten kunnen succesvol presteren op taken die buiten hun opleidingsregime liggen, zoals het navigeren naar een object aan de andere kant van de kamer. Het algoritme gebruikt twee optimalisatielussen en heeft betere generalisatiecapaciteiten dan traditionele RL-methoden.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel