Nieuws
Leren van een hiërarchie
OpenAI heeft een algoritme ontwikkeld voor hiërarchisch versterkend leren dat hoge-niveau acties leert die nuttig zijn voor het oplossen van een breed scala aan taken. Het algoritme, toegepast op navigatieproblemen, ontdekt acties voor lopen en kruipen in verschillende richtingen, waardoor de agent snel nieuwe navigatietaken kan meesteren. Het algoritme, genaamd meta-learning shared hierarchies (MLSH), leert een hiërarchische policy waarbij een master-policy wisselt tussen sub-policies.