K-înseamnă simplu. Să faci rapid pe plăci video nu este. De aceea am construit Flash-KMeans — o implementare conștientă de IO a k-means exacte care regândește algoritmul în jurul blocajelor moderne ale GPU-urilor. Atacând direct blocajele de memorie, Flash-KMeans obține o accelerare de 30x față de cuML și de 200x față de FAISS — cu exact același algoritm, doar că proiectat pentru hardware-ul de astăzi. La scara unui milion, Flash-KMeans pot finaliza o iterație k-media în milisecunde. Un algoritm clasic — redesenat pentru GPU-urile moderne. Hârtie: Cod: