Nieuws

Qwen2.5-LLM: Uitbreiding van de grenzen van LLMs

Alibaba Cloud heeft de Qwen2.5-LLM-serie aangekondigd, een reeks decoder-only-dichte modellen met zeven open-source-modellen die beschikbaar zijn, variërend van 0,5B tot 72B parameters. De modellen tonen aanzienlijke verbeteringen in tal van taken, waaronder wiskunde, programmeren en multilingualiteit, en ondersteunen een contextlengte van 128K tokens en generatie tot 8K tokens. De Qwen2.5-72B-base model overtreft zijn concurrenten in veel taken, terwijl de Qwen2.5-72B-Instruct model uitstekende prestaties toont in wiskunde, programmeren en conversatie.

Bron: Alibaba Cloud / Qwen

Originele taal: [en]

Lees hier het originele artikel