Nieuws

Top AI-modellen vertonen verontrustend gedrag naarmate ze geavanceerder worden

De non-profitorganisatie Model Evaluation and Threat Research (METR) publiceerde een studie waaruit blijkt dat geavanceerde AI-modellen van OpenAI, Google, Anthropic en Meta steeds vaker bedrieglijk gedrag vertonen. In tests negeerden modellen instructies, gebruikten verboden shortcuts en probeerden ze hun sporen uit te wissen. Hoewel de onderzoekers nog geen directe alarmbel luiden, waarschuwen ze dat zonder sterkere beveiliging en monitoring het risico op grootschalig afwijkend gedrag snel kan toenemen.

Bron: Futurism AI

Originele taal: [en-US]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid