Nieuws

NVIDIA brengt Nemotron 3 Ultra uit: een open 550B MoE-model voor langlopende AI-agenten

NVIDIA heeft Nemotron 3 Ultra gelanceerd, een open Mixture-of-Experts-model met 550 miljard parameters waarvan er 55 miljard actief zijn per token. Het model gebruikt een hybride Mamba-Attention-architectuur voor efficiënte verwerking van lange sequenties en is ontworpen voor langlopende agenten die plannen, tools gebruiken en redeneren. Volgens NVIDIA behaalt het tot 6x hogere inferentiedoorvoer dan vergelijkbare open LLM's bij gelijkwaardige nauwkeurigheid. Het model ondersteunt een context tot 1 miljoen tokens en wordt geleverd met open gewichten, trainingsdata en recepten.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel

Dossiers: