Nieuws
Qwen2.5-1M: Deploy Your Own Qwen met Context Length tot 1 Miljoen Tokens
Alibaba Cloud introduceert de open-source Qwen2.5-1M modellen, die contextlengtes van tot 1 miljoen tokens ondersteunen. De release omvat twee nieuwe modellen, Qwen2.5-7B-Instruct-1M en Qwen2.5-14B-Instruct-1M, en een geoptimaliseerde inferentie-framework gebaseerd op vLLM. De modellen presteren aanzienlijk beter dan hun 128K-variante en bieden een robuuste open-source alternatief voor lange contexttaken.