Nieuws

Pleidooi voor AI die kan klokkenluiden ter preventie van misbruik

Een opinieartikel op Towards Data Science betoogt dat AI-systemen getraind moeten worden om te kunnen klokkenluiden in extreme situaties om misbruik door kwaadwillenden te voorkomen. Het artikel verwijst naar onderzoek van Anthropic, OpenAI, Google, Meta, xAI en anderen waaruit blijkt dat sommige modellen zoals Claude, Gemini en Grok al geneigd zijn om informatie te lekken bij ethische dilemma's. De auteur stelt dat blinde gehoorzaamheid van superintelligente AI gevaarlijker is dan het toestaan van eigenzinnig gedrag.

Bron: Towards Data Science

Originele taal: [en-US]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid