Nieuws

Klassieke hersentest onthult grootste zwakte van AI

Onderzoekers hebben topmodellen zoals ChatGPT, Claude en Gemini onderworpen aan de Stroop-test, een klassieke psychologische aandachtstest. Bij korte lijsten presteerden de AI-systemen goed, maar naarmate de lijsten langer en complexer werden, daalde de nauwkeurigheid dramatisch. GPT-4o zakte van 91% naar 15% bij veertig woorden, terwijl Claude 3.5 Sonnet naar 24% viel. De studie wijst op fundamentele beperkingen in het vermogen van AI om afleiding te weerstaan en focus vast te houden.

Bron: ScienceDaily AI

Originele taal: [en-us]

Lees hier het originele artikel

Dossier:

Ai Safety / veiligheid