Nieuws
Weak-to-strong generalization
OpenAI presenteert een nieuw onderzoeksrichting voor superalignment, met aanzet tot veelbelovende resultaten. Het onderzoek onderzoekt of de generalisatie-eigenschappen van diepe leermodellen kunnen worden gebruikt om sterke modellen te beheren met zwakke supervisors. Het team laat zien dat een GPT-2-niveau model de meeste capaciteiten van GPT-4 kan activeren, bijna op GPT-3.5-niveau. Dit biedt een nieuwe aanpak om toekomstige superhumane modellen te alignen, terwijl er vandaag al iteratieve empirische vooruitgang wordt gemaakt.