Nieuws

OpenAI introduceert twee nieuwe Baselines: ACKTR en A2C

OpenAI heeft twee nieuwe implementaties vrijgegeven binnen de OpenAI Baselines: ACKTR en A2C. A2C is een synchrone, deterministische variant van A3C die evenveel prestaties oplevert. ACKTR is efficiënter in het gebruik van samples en vereist slechts licht meer rekenkracht per update dan A2C. Beide algoritmen zijn ontwikkeld voor verbeterde prestaties in versterkend leren.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel