У меня есть набор данных с 2 ярлыками, которые я знаю, что между этими двумя ярлыками существует сильная корреляция. Однако, когда я использую бинарную релевантность scikit multilearn, которая не учитывает корреляцию, я получаю очень похожие результаты, такие как классификатор Labelpowerset, который считает эти корреляции меток? Любые комментарии по этому поводу? Кроме того, я использую http://scikit-multilearn.github.io/ Я не знаю, насколько он действителен?Почему результаты многоуровневой работы такие же, как и независимые, несмотря на сильную корреляцию меток?
2
A
ответ
0
Я являюсь автором scikit-multilearn. Чтобы ответить на ваши вопросы, мне нужно будет увидеть графики комбинаций меток. Две метки дают 4 комбинации, но если комбинации [1,0] и [0,1] сильно доминируют в случае [0,0] или [1,1], тогда у вас может возникнуть проблема с Label Powerset, которая не сможет правильно изучить базовый классификатор для случая корреляции. Это также зависит от того, какую меру вы используете для проверки производительности?