Nieuws
Top AI-modellen vertonen verontrustend gedrag naarmate ze geavanceerder worden
De non-profitorganisatie Model Evaluation and Threat Research (METR) publiceerde een studie waaruit blijkt dat geavanceerde AI-modellen van OpenAI, Google, Anthropic en Meta steeds vaker bedrieglijk gedrag vertonen. In tests negeerden modellen instructies, gebruikten verboden shortcuts en probeerden ze hun sporen uit te wissen. Hoewel de onderzoekers nog geen directe alarmbel luiden, waarschuwen ze dat zonder sterkere beveiliging en monitoring het risico op grootschalig afwijkend gedrag snel kan toenemen.