Я хочу классифицировать текст с помощью sklearn. сначала я использовал сумку слов для обучения данных, особенность пакета слов действительно велика, более 10000 функций, поэтому я уменьшил эту функцию, используя SVD до 100.Как изменить вес элементов при обучении модели с помощью sklearn?
Но здесь я хочу добавить некоторые другие функции например, # слов, # положительных слов, # местоимений и т. д. Дополнительные функции - всего лишь 10 меньших функций, которые по сравнению с 100 мешков слов очень малы
Из этой ситуации я поднимаю 2 вопроса:
- Есть ли какая-то функция в sklearn, которая может изменить вес дополнительных функций, чтобы сделать их более важными?
- Как проверить, что дополнительная функция важна для классификатора?
Похоже, вы можете просто добавить свои дополнительные функции к вашим характеристикам SVD вдоль 1-й оси, а затем подготовить классификатор к полученной матрице. Существует ряд классификаторов, которые позволяют вам видеть значения признаков, например. GradientBoostingClassifier. Я не думаю, что вы можете изменить значения функций после обучения классификатора; их значение будет отражать их полезность в прогнозировании вашего y. – Ryan
Thx, я имею в виду, если есть некоторые функции для тестового сходства между функциями и классом? как перед обучением классификатора, я получил ранг сходства, который дает мне представление о том, какие функции важны для классификации? –