Nieuws

Stop met het legen van de KV-cache: hoe GitHub VRAM inruilt voor rekenkracht om agentische workflowkosten 10x te verlagen

GitHub introduceert een methode om de KV-cache niet te legen, waardoor VRAM wordt ingeruild voor extra rekenkracht. Dit zou de kosten van agentische workflows met een factor 10 kunnen verlagen. Het artikel beschrijft hoe stateless agents met 'goudvisgeheugen' intelligentie kunnen opbouwen.

Bron: Towards AI

Originele taal: [en]

Lees hier het originele artikel