Nieuws

AI-zoekagents bevestigen vaak wat ze al weten in plaats van echt onderzoek te doen

Uit onderzoek van het Harbin Institute of Technology blijkt dat toonaangevende AI-zoekagents zoals GPT-5.4 en Kimi K2.6 op bestaande benchmarks vooral hun geheugen gebruiken in plaats van daadwerkelijk het web te onderzoeken. Met een nieuwe tijdsgevoelige benchmark, LiveBrowseComp, die alleen vragen stelt over gebeurtenissen van de afgelopen 90 dagen, dalen de prestaties dramatisch. Dit leidt tot een volledige herschikking van de ranglijsten.

Bron: The Decoder

Originele taal: [en-US]

Lees hier het originele artikel