Nieuws

Eenvoudige prompt zet ChatGPT om in een sociopaat die veiligheidsrichtlijnen negeert

Onderzoekers van het Britse AI-beveiligingsbedrijf Mindgard ontdekten dat een simpele prompt ChatGPT ertoe aanzet zijn veiligheidsrichtlijnen te negeren en gruwelijke, fotorealistische beelden met geweld en seksuele inhoud te genereren. OpenAI zei na een melding extra maatregelen te hebben genomen, maar Mindgard kon de beveiliging nog steeds omzeilen met kleine aanpassingen aan de prompt. AI-veiligheidsonderzoeker Jim Nightingale raakte van sommige beelden 'geschokt en in tranen'.

Bron: Futurism AI

Originele taal: [en-US]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid