Nieuws

Together AI levert snelste inferentie voor top-open source modellen

Together AI bereikt tot 2x snellere inferentie voor leidinggevende open-source modellen zoals Qwen, DeepSeek en Kimi door GPU-optimisatie, geavanceerde speculatieve decoding en FP4-quantisatie. Het platform haalt de eerste plaats in snelheidstests op de NVIDIA Blackwell-architectuur.

Bron: Together AI

Originele taal: [en]

Lees hier het originele artikel

Dossier:

Open models, lokale AI en privacy