Nieuws

Google DeepMind brengt Gemma 4 QAT-checkpoints uit: Q4_0 en een nieuw mobiel formaat verlagen geheugengebruik op apparaten

Google DeepMind heeft Quantization-Aware Training (QAT) checkpoints voor de Gemma 4-familie uitgebracht, gericht op lokale uitvoering op edge-apparaten en consumenten-GPU's. Het nieuwe mobiele QAT-formaat verkleint het E2B-model tot ongeveer 1 GB, terwijl Q4_0 QAT het geheugen reduceert tot 3,2 GB voor E2B en 5 GB voor E4B. Google claimt hogere kwaliteit dan standaard post-training kwantisatie, maar publiceerde geen benchmarkscores voor Gemma 4. De gewichten zijn beschikbaar op Hugging Face met ondersteuning voor meerdere frameworks.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel

Dossier:

Open models, lokale AI en privacy