Nieuws

VibeThinker-3B: compact redeneringsmodel presteert evenaart grote modellen op wiskunde en code

Onderzoekers van Sina Weibo Inc hebben VibeThinker-3B gepresenteerd, een dicht model met 3 miljard parameters gebaseerd op Qwen2.5-Coder-3B. Het model scoort 94,3 op AIME26 en haalt 96,1% acceptatie op onbekende LeetCode-problemen. Dankzij de Spectrum-to-Signal post-training pipeline presteert het model vergelijkbaar met modellen die honderden keren groter zijn.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel