Nieuws
Stop met het legen van de KV-cache: hoe GitHub VRAM inruilt voor rekenkracht om agentische workflowkosten 10x te verlagen
GitHub introduceert een methode om de KV-cache niet te legen, waardoor VRAM wordt ingeruild voor extra rekenkracht. Dit zou de kosten van agentische workflows met een factor 10 kunnen verlagen. Het artikel beschrijft hoe stateless agents met 'goudvisgeheugen' intelligentie kunnen opbouwen.