Nieuws

Qwen2.5-Turbo ondersteunt nu contextlengte van 1 miljoen tokens

Alibaba Cloud heeft de Qwen2.5-Turbo versie van hun AI-model aangekondigd, die een contextlengte van 1 miljoen tokens ondersteunt. Dit is een aanzienlijke verbetering ten opzichte van de vorige versie, die slechts 128k tokens ondersteunde. De nieuwe versie biedt betere prestaties bij het verwerken van lange contexten, zoals het herkennen van verstrekte informatie in lange teksten en het uitvoeren van complexe taken zoals het samenvatten van romans of het analyseren van code. Daarnaast is de inferentiesnelheid aanzienlijk verbeterd, met een versnelling van 4,3 keer bij het verwerken van 1 miljoen tokens. De prijs blijft gelijk op ¥0,3 per 1 miljoen tokens, waardoor Qwen2.5-Turbo 3,6 keer zoveel tokens kan verwerken als GPT-4o-mini bij dezelfde kosten.

Bron: Alibaba Cloud / Qwen

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Open models, lokale AI en privacy