Nieuws

Leren samenwerken, concurreren en communiceren

OpenAI heeft een nieuw algoritme ontwikkeld genaamd MADDPG voor centrale leerprocessen en gedecentraliseerde uitvoering in multiagentomgevingen. Het algoritme laat agents leren samenwerken en concurreren, en is getest op verschillende taken waarbij het beter presteerde dan bestaande methoden. De techniek maakt gebruik van een centrale critic die informatie over observaties en acties van alle agents biedt, waardoor het mogelijk wordt om complexe interacties en communicatie te leren.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel