Насколько я знаю, проблема с несколькими метками может быть решена с помощью схемы с одним vs-all, для которой Scikit-learn реализует OneVsRestClassifier
в качестве обертки для классификатора, такого как svm.SVC
, Мне интересно, как бы это было иначе, если бы я буквально тренировался, скажем, у нас есть проблема с несколькими метками с n классами, n отдельных бинарных классификаторов для каждой метки и, следовательно, оценивать их отдельно.Sklearn: Разница между использованием OneVsRestClassifier и построением каждого классификатора индивидуально
Я знаю, что это похоже на «ручной» способ реализации one-vs-all, а не с использованием обертки, но на самом деле это разные способы? Если да, то как они отличаются, например, во время выполнения или производительности классификатора (ов)?
Спасибо за ваш ответ. Если оба способа идентичны, означает ли это, что окончательное решение мультимаркировки SVM не зависит от максимального расстояния до гиперплоскости, как это делает многопроцессорный SVM? То есть при тестировании, поскольку экземпляр может принадлежать нескольким классам, поиск максимального расстояния до гиперплоскости не требуется, как в случае с несколькими классами. Поэтому в сценарии с несколькими метками, как это, проверенный экземпляр можно предсказать как отрицательный для всех классов, в то время как один должен быть предсказан как один из классов в многоклассовом сценарии. – Francis
Ток для стратегии множественного класса («встроенный») [svm] (http://scikit-learn.org/dev/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC) является одно-противным. Таким образом, у вас будет разница между ovr и ovo. В multi-label ovo называется ранжированием по парному сравнению. В обоих случаях решение будет зависеть от расстояния до гиперплоскости. Если это вам поможет, вы можете просмотреть классификацию с несколькими метками как несколько связанных с бинарной классификацией задач. –
Извините, я, возможно, не поняла. Я сосредоточился на случае с одним VS-отдыхом (OVR) и задавался вопросом о различии между сценарием мультикласса (MC) и мульти-меткой (ML) при принятии окончательного решения. В обоих случаях OVR разбивается на n бинарных классификаторов, а из n гиперплоскостей MC выбирает тот, который имеет самое дальнее расстояние от тестируемого экземпляра в качестве выхода, в то время как ML просто назначает экземпляр на основе pos. или нег. знаков в каждом бинарном классификаторе и не беспокоит расстояние. Если это так, процесс принятия решений только что описанного ОД такой же, как и в ОП. – Francis