Nieuws
Google verkleint Gemma 4 met 72% en Unsloth lost 4-bit bug op op één 4090
Google heeft Gemma 4 met 72% verkleind, waardoor een 26-miljard parametermodel in 15GB geheugen past en 193 tokens per seconde produceert op één RTX 4090. Unsloth heeft een 4-bit bug opgelost die niemand anders had ontdekt.