Nieuws
Verbetering van modelveiligheid met regelgebaseerde beloningen
OpenAI heeft een nieuwe methode ontwikkeld en toegepast die regelgebaseerde beloningen (RBRs) gebruikt om modellen veilig te laten gedragen zonder uitgebreid gebruik van menselijke data. Deze aanpak kan het proces van veiligheidsonderwijs van AI-modellen efficiënter maken.