Nieuws

AI-codeeragenten vinden het juiste bestand maar missen de exacte regels die ertoe doen, zo blijkt uit onderzoek

Een nieuwe benchmark genaamd SWE-Explore toont aan dat AI-codeeragenten zoals Claude Code en GitHub Codex wel het juiste bestand vinden, maar slechts 14 tot 19 procent van de kritieke regels binnen dat bestand identificeren. De studie, uitgevoerd door een internationaal team waaronder Shanghai Jiao Tong University, isoleert de codezoekfase van de reparatiefase. Zonder voldoende context, onder een drempel van 50 tot 75 procent dekking, falen reparaties meestal.

Bron: The Decoder

Originele taal: [en-US]

Lees hier het originele artikel

Dossier:

AI-coding agents: Cursor, Claude Code, Copilot