Nieuws

MiniMax M3 decodeert 1M tokens 15x sneller

Op 1 juni heeft een laboratorium in Shanghai stilletjes het MiniMax M3-model uitgebracht. Het decodeert een context van 1 miljoen tokens 15,6 keer sneller dan de vorige generatie. Opvallend is dat het model ook nog eens zeer goedkoop is.

Bron: Towards AI

Originele taal: [en]

Lees hier het originele artikel