Nieuws
Leren samenwerken, concurreren en communiceren
OpenAI heeft een nieuw algoritme ontwikkeld genaamd MADDPG voor centrale leerprocessen en gedecentraliseerde uitvoering in multiagentomgevingen. Het algoritme laat agents leren samenwerken en concurreren, en is getest op verschillende taken waarbij het beter presteerde dan bestaande methoden. De techniek maakt gebruik van een centrale critic die informatie over observaties en acties van alle agents biedt, waardoor het mogelijk wordt om complexe interacties en communicatie te leren.