Nieuws

Het meten van Goodhart’s law

OpenAI bespreekt hoe Goodhart’s law, die stelt dat een maatstaf die als doel wordt gesteld, niet meer een goede maatstaf is, van toepassing is op het optimaliseren van complexe doelen zoals het alignen van modellen zoals GPT-3 met menselijke waarden. Het bedrijf legt uit hoe proxy-doelen worden gebruikt en hoe de werkelijke doelen worden geoptimaliseerd, met aandacht voor technieken zoals best-of-n sampling en hun invloed op de KL-divergentie.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid