Nieuws
RL-Teacher: open-source tool voor het trainen van AIs via menselijke feedback
OpenAI heeft RL-Teacher vrijgegeven, een open-source tool om AIs te trainen via gegevens van menselijke feedback in plaats van handgemaakt beloningsmechanisme. Het systeem bestaat uit een beloningsvoorspeller, een voorbeeldagent en een webapp voor menselijke input. Het gehele systeem is geschreven in minder dan 1.000 regels Pythoncode.