Nieuws
Leren complexe doelen met iteratieve versterking
OpenAI introduceert een nieuwe AI-veiligheidstechniek genaamd iteratieve versterking, die het mogelijk maakt om complexe doelen en gedragingen te specificeren die buiten menselijke schaal vallen. In plaats van gelabelde data of beloningsfuncties te gebruiken, ontbindt de methode taken in eenvoudigere onderdelen. Hoewel de techniek nog in een vroege fase is en alleen getest is op eenvoudige algoritmische domeinen, wordt ze als schaalbaar beschouwd voor AI-veiligheid.