Nieuws
Ontwerp loops, niet prompts
Een artikel van Towards Data Science onderzoekt de effectiviteit van self-critique versus bron-verankerde verificatie in AI-agent loops. Uit een experiment met Claude Opus 4.8 blijkt dat self-critique de hallucinatiegraad niet verlaagt, terwijl een deterministische, bron-verankerde verifier (gebaseerd op geometrische metingen) de foutmarge met de helft reduceert. De auteur waarschuwt dat loops alleen betrouwbaar zijn als de verificatie extern en reproduceerbaar is.