Nieuws

Generaliseren van een LLM van 8k naar 1M context met Qwen-Agent

Alibaba Cloud heeft een agent ontwikkeld met behulp van Qwen2-modellen met een 8k contextgrootte om documenten met 1M tokens te begrijpen, wat beter presteert dan RAG en native lange-contextmodellen. Deze agent wordt ook gebruikt om data te genereren voor het trainen van nieuwe lange-context Qwen-modellen.

Bron: Alibaba Cloud / Qwen

Originele taal: [en]

Lees hier het originele artikel