Nieuws

NVIDIA AI brengt Nemotron-Labs-Diffusion uit: een driemodus-taalmodel met 6× tokens per forward vergeleken met Qwen3-8B

NVIDIA-onderzoekers hebben Nemotron-Labs-Diffusion uitgebracht, een taalmodel dat autoregressieve, diffusie-gebaseerde en zelf-speculatie decodering verenigt. Het model is beschikbaar in varianten van 3B, 8B en 14B parameters en behaalt tot 6× tokens per forward pass. In zelf-speculatie-modus presteert het tot 2,4× sneller dan Qwen3-8B-Eagle3 op GB200-hardware.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel