Nieuws

Google verkleint Gemma 4 met 72% en Unsloth lost 4-bit bug op op één 4090

Google heeft Gemma 4 met 72% verkleind, waardoor een 26-miljard parametermodel in 15GB geheugen past en 193 tokens per seconde produceert op één RTX 4090. Unsloth heeft een 4-bit bug opgelost die niemand anders had ontdekt.

Bron: Towards AI

Originele taal: [en]

Lees hier het originele artikel

Dossier: