Nieuws
Together AI levert snelste inferentie voor top-open source modellen
Together AI bereikt tot 2x snellere inferentie voor leidinggevende open-source modellen zoals Qwen, DeepSeek en Kimi door GPU-optimisatie, geavanceerde speculatieve decoding en FP4-quantisatie. Het platform haalt de eerste plaats in snelheidstests op de NVIDIA Blackwell-architectuur.