Nieuws

Qwen2.5-Omni: zie, hoor, praat, schrijf, doe alles!

Alibaba Cloud heeft Qwen2.5-Omni, een nieuw multimodell model in de Qwen-reeks, vrijgegeven. Het model kan tekst, beelden, audio en video verwerken en biedt real-time reacties via tekstgeneratie en natuurlijke spraaksynthese. Het is beschikbaar op Hugging Face, ModelScope, DashScope en GitHub. Het model gebruikt de Thinker-Talker architectuur en presteert uitstekend in meervoudige modale taken.

Bron: Alibaba Cloud / Qwen

Originele taal: [en]

Lees hier het originele artikel