Представьте, что у вас есть два распределения вероятности Гаусса в двух измерениях. Сначала центрируется на (0,1), а второе - на (0, -1). (Для простоты предположим, что они имеют одинаковую дисперсию.) Можно ли считать, что кластеры точек данных, отобранных из этих двух гауссианов, линейно отделимы?Являются ли гауссовы кластеры линейно разделяемыми?
Интуитивно ясно, что граница, разделяющая два распределения, линейна, а именно абсцисса в нашем случае. Однако формальное требование линейной сепарабельности состоит в том, что выпуклые оболочки кластеров не перекрываются. Это не может иметь место с кластерами, генерируемыми Гауссовым, поскольку их базовые распределения вероятностей пронизывают все R^2 (хотя и с незначительными вероятностями вдали от среднего).
Итак, являются ли гауссово сгенерированные кластеры линейно разделяемыми? Как можно примирить требование выпуклых оболочек с тем, что прямая линия является единственной мыслимой «границей»? Или, может быть, граница фактически перестает быть линейной, когда на фотографиях появляются неравные отклонения?
Имеет смысл, спасибо! В качестве последующего вопроса предположим, что конкретные результаты имеют неперекрывающиеся выпуклые оболочки. Будет ли граница между кластерами зависеть только от контуров корпусов или же распределение распределения и плотность точек внутри корпусов также играют роль? – Tfovid
Нет, все, что вам нужно, это выпуклый корпус, а не внутренности внутри него. –