Nieuws

Qwen2.5-VL: nieuw flagship visuele taalmodel van Qwen

Alibaba Cloud heeft Qwen2.5-VL, het nieuwste flagship visuele taalmodel van Qwen, aangekondigd. Het model biedt verbeterde visuele herkenning, ondersteuning voor lange video’s en geavanceerde documentverwerking. Het is beschikbaar in drie modellen (3B, 7B en 72B) via Hugging Face en ModelScope. Qwen2.5-VL kan objecten in beelden lokaliseren, tekst en diagrammen begrijpen en zelfs als visueel agent functioneren.

Bron: Alibaba Cloud / Qwen

Originele taal: [en]

Lees hier het originele artikel