Nieuws
Qwen2.5-Omni: zie, hoor, praat, schrijf, doe alles!
Alibaba Cloud heeft Qwen2.5-Omni, een nieuw multimodell model in de Qwen-reeks, vrijgegeven. Het model kan tekst, beelden, audio en video verwerken en biedt real-time reacties via tekstgeneratie en natuurlijke spraaksynthese. Het is beschikbaar op Hugging Face, ModelScope, DashScope en GitHub. Het model gebruikt de Thinker-Talker architectuur en presteert uitstekend in meervoudige modale taken.