Nieuws

Waarom video-agentmodellen de volgende stap zijn – Ethan He van xAI over Grok Imagine

In een aflevering van Latent Space vertelt Ethan He, voormalig lead van NVIDIA Cosmos en nu bij xAI, dat video-agentmodellen de toekomst zijn. Hij stelt dat videomodellen hun intelligentie vooral ontlenen aan LLM's en niet aan videodata, en dat de volgende stap interactieve, realtime wereldmodellen zijn. He bouwde in drie maanden Grok Imagine bij xAI en deelt inzichten over het trainen van video- en multimodale modellen, het belang van iteratiesnelheid en de rol van synthetische captions.

Bron: Latent Space

Originele taal: [en]

Lees hier het originele artikel