Nieuws

8-bit quantisatie met Lightning Fabric

Lightning Fabric biedt een eenvoudige manier om 8-bit quantisatie toe te passen, wat het geheugengebruik van grote modellen zoals Llama 2 en SDXL verlaagt. Dit wordt gedaan door een modeflag in een plugin in te stellen. 8-bit quantisatie vereist een nieuwe representatieschema en kan invloed hebben op modelprestaties, vooral bij edge devices. De techniek is belangrijk voor productieomgevingen waarbij hardware met een kleinere geheugengebruik, zoals consumer-grade apparatuur, wordt gebruikt.

Bron: Lightning AI

Originele taal: [en-US]

Lees hier het originele artikel