Nieuws

Vijf AI-systemen, dezelfde prompts, totaal verschillende antwoorden

Een experiment met 116 ethische en veiligheidsvragen toonde aan dat Claude, Gemini, GPT-5, Mistral en Cohere het in 34% tot 66% van de gevallen oneens waren met elkaar, en soms zelfs met zichzelf bij herhaalde vragen. De resultaten wijzen op significante inconsistenties in het gedrag van AI-systemen.

Bron: Towards AI

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid