Nieuws

Verbetering van modelveiligheid met regelgebaseerde beloningen

OpenAI heeft een nieuwe methode ontwikkeld en toegepast die regelgebaseerde beloningen (RBRs) gebruikt om modellen veilig te laten gedragen zonder uitgebreid gebruik van menselijke data. Deze aanpak kan het proces van veiligheidsonderwijs van AI-modellen efficiënter maken.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel