Nieuws
AI-codeeragenten vinden het juiste bestand maar missen de exacte regels die ertoe doen, zo blijkt uit onderzoek
Een nieuwe benchmark genaamd SWE-Explore toont aan dat AI-codeeragenten zoals Claude Code en GitHub Codex wel het juiste bestand vinden, maar slechts 14 tot 19 procent van de kritieke regels binnen dat bestand identificeren. De studie, uitgevoerd door een internationaal team waaronder Shanghai Jiao Tong University, isoleert de codezoekfase van de reparatiefase. Zonder voldoende context, onder een drempel van 50 tot 75 procent dekking, falen reparaties meestal.