Получаем ли мы такой же результат, если применим K-средства и последовательные методы K-методов к одному набору данных с теми же начальными настройками? Объясните свои причины.Тот же результат из K-средств и последовательных K-средних?
Лично я думаю, что ответ №. Результат, полученный последовательными К-средствами, зависит от порядка представления точек данных. И конечное условие не одно и то же.
Здесь крепится псевдокод двух алгоритмов кластеризации.
К-означает
Make initial guesses for the means m1, m2, ..., mk
Until there is no change in any mean
Assign each data point to the cluster whose mean is the nearest.
Calculate the mean of each cluster.
For i from 1 to k
Replace mi with the mean of all examples for cluster i.
end_for
end_until
Последовательный К-означает
Make initial guesses for the means m1, m2, ..., mk
Set the counts n1, n2, ..., nk to zero
Until interrupted
Acquire the next example, x
If mi is closest to x
Increment ni
Replace mi by mi + (1/ni)*(x - mi)
end_if
end_until
Доказательство по контрпримеру, поэтому закрытое закрыто +1 –
Поймите, спасибо. –