Nieuws
OpenAI introduceert GDPval, een nieuwe evaluatie voor AI-prestaties op echte werktaakken
OpenAI introduceert GDPval, een nieuwe evaluatie die de prestaties van AI-modellen meet op echte, economisch waardevolle taken over 44 beroepen. De evaluatie is ontworpen om inzicht te geven in hoe goed modellen zoals GPT-5 en Claude Opus 4.1 presteren op taken die voorkomen in de werkelijkheid, zoals het maken van juridische kennisgevingen of het analyseren van data. De eerste versie van GDPval omvat 1.320 taken, gecreëerd door ervaren professionals uit 9 industrieën die samen meer dan 5% van het Amerikaanse BNP genereren.