Nieuws

Weak-to-strong generalization

OpenAI presenteert een nieuw onderzoeksrichting voor superalignment, met aanzet tot veelbelovende resultaten. Het onderzoek onderzoekt of de generalisatie-eigenschappen van diepe leermodellen kunnen worden gebruikt om sterke modellen te beheren met zwakke supervisors. Het team laat zien dat een GPT-2-niveau model de meeste capaciteiten van GPT-4 kan activeren, bijna op GPT-3.5-niveau. Dit biedt een nieuwe aanpak om toekomstige superhumane modellen te alignen, terwijl er vandaag al iteratieve empirische vooruitgang wordt gemaakt.

Bron: OpenAI News

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid