Алгоритмы K-средних - это специализация знаменитого алгоритма квантования Lloyd I для случая эмпирических распределений. (см. Lloyd)
Обнаружено, что алгоритм Ллойда I дает последовательность квантователей с уменьшающимся квадратичным искажением. Однако, за исключением специального случая одномерных лог-вогнутых распределений, он не всегда сходится к квадратичному оптимальному квантователю. (Существуют локальные минимумы для ошибки квантования, особенно при работе с эмпирическим распределением, т.е. для задачи кластеризации.)
Метод, который сходится (всегда) к оптимальному квантователю, является так называемыми алгоритмами CLVQ, которые также обобщаются на проблема более общего квантования L^p. Это своего рода метод Стохастический градиент. (см. Pagès)
Существуют также некоторые подходы, основанные на генетических алгоритмах. (см. Hamida et al.) и/или классические процедуры оптимизации для одномерного случая, который сходится быстрее (Pagès, Printems).
Будет ли новая вычислительная наука Q & A лучше для этого вопроса? http://scicomp.stackexchange.com –