Nieuws

Flash-KMeans: IO-bewuste exacte k-means tot 200× sneller dan FAISS op GPU's

Onderzoekers van UC Berkeley en UT Austin hebben Flash-KMeans uitgebracht, een open-source bibliotheek die Lloyd's k-means op GPU's versnelt door de datastroom te herstructureren. De implementatie behaalt tot 17,9× snelheidswinst ten opzichte van de beste baseline, 33× versus NVIDIA cuML en meer dan 200× versus FAISS op een H200 GPU, terwijl de exacte output behouden blijft. Flash-KMeans gebruikt FlashAssign en Sort-Inverse Update kernels om de geheugenknelpunten van de toewijzings- en centrumupdatefasen te omzeilen.

Bron: MarkTechPost

Originele taal: [en-US]

Lees hier het originele artikel