2015-11-28 1 views
2

Я использую кластер Weka SimpleKMeans для набора данных.Что такое «семя» в кластере Uska SimpleKMeans?

Но я не уверен, что такое начальное значение, что оно делает или как оно влияет на данные.

Т.е. как более высокое или более низкое начальное значение влияет на результат, поскольку оно соответствует значению по умолчанию 10?

+0

https://en.wikipedia.org/wiki/Random_seed – cel

ответ

2

Семена - это просто семена случайных чисел. Как только семя фиксируется, даже рандомизированный алгоритм ведет себя детерминистически. KMeans не является детерминированным, поэтому, если вам нужны повторяемые результаты - вы фиксируете семя. Однако нет точной связи между точной величиной семени и результатами кластеризации KMeans.

+0

Я все еще не уверен, что это значит? Я читал, что это как-то связано с инициализацией кластеров, но смущает его реальную цель. – Wolff

+0

@Wolff Это в основном означает, что, поскольку KMeans использует случайные числа, если вы всегда используете одно и то же семя, вы всегда будете получать одинаковые случайные числа. Короче говоря, если вы дважды запускаете KMeans по тем же данным, если вы оба раза имели одинаковое семя, вы получите точно такой же результат. Если вы не используете одно и то же семя, результаты будут меняться каждый раз, когда вы запустите KMeans. –

+0

@Wolff - ** только ** Цель посева состоит в том, чтобы убедиться, что вы получите тот же результат при многократном запуске этого кода по тем же самым данным. KMeans рандомизирован и поэтому может привести к разным результатам, если вы просто запускаете его много раз - таким образом вы можете «заставить его» быть повторяемым. – lejlot

 Смежные вопросы

  • Нет связанных вопросов^_^