Nieuws

Cursor werkt samen met Together AI om real-time, lage-latentie-inferentie op schaal te leveren

Cursor, een AI-gestuurde codeplatform, werkt samen met Together AI om een real-time inferentiestapel te bouwen die in-editor agents snel en betrouwbaar houdt. Ze hebben de NVIDIA Blackwell-architectuur (B200/GB200) ingezet en hebben ARM-hosts, kernels en FP4/TensorRT-quantisatie afgestemd voor lage latentie en snelle modelimplementaties.

Bron: Together AI

Originele taal: [en]

Lees hier het originele artikel