Nieuws

Zyphra brengt Zamba2-VL uit: hybride visie-taalmodel met veel lagere latentie

Zyphra heeft Zamba2-VL aangekondigd, een familie van open vision-language modellen in drie formaten: 1,2B, 2,7B en 7B parameters. De modellen combineren Mamba2 state-space lagen met gedeelde transformerblokken, wat de time-to-first-token met een orde van grootte verlaagt ten opzichte van vergelijkbare dense transformermodellen. Zamba2-VL presteert sterk op tellen en documentbegrip, maar blijft achter op kennisintensieve redeneertaken. De gewichten en code zijn openbaar beschikbaar onder de Apache 2.0-licentie.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel

Dossier: