K-means je jednoduchý. Dělat to rychlé na GPU není. Proto jsme vytvořili Flash-KMeans — IO-uvědomělou implementaci přesných k-průměrů, která přehodnocuje algoritmus kolem moderních GPU úzkých míst. Přímým útokem na úzká místa paměti dosahuje Flash-KMeans 30násobného zrychlení oproti cuML a 200násobného zrychlení oproti FAISS — se stejným algoritmem, jen navrženým pro dnešní hardware. V milionovém měřítku mohou Flash-KMeans dokončit iteraci k-středů během milisekund. Klasický algoritmus — přepracovaný pro moderní GPU. Článek: Kód: