Nieuws

NVIDIA brengt Nemotron-Labs-TwoTower uit: een open-gewichten diffusie-taalmodel

NVIDIA heeft Nemotron-Labs-TwoTower uitgebracht, een diffusie-taalmodel met open gewichten onder de NVIDIA Nemotron Open Model License. Het model behoudt 98,7% van de kwaliteit van de autoregressieve baseline, maar verdubbelt de doorvoer naar 2,42×. De architectuur splitst diffusie in een bevroren autoregressieve contexttoren en een getrainde denoisertoren, gebaseerd op de Nemotron-3-Nano-30B-A3B backbone.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel