Я использую векторы слов для решения классификации текста. Я использую текстовые векторы в основном для рассмотрения случая синонимов, которых нет в учебном наборе, но будет присутствовать в фактических случаях использования. Просто используя слова векторы, я не получаю достаточно хорошую точность в предсказании. Может ли кто-нибудь предложить некоторые улучшения, которые я могу сделать для векторов слов, чтобы повысить точность?Усовершенствования для классификации текста с использованием векторов слов
ответ
Отлаживайте свои плохие предсказания. Помогает ли хорошее качество встраивания синонимов (из тех, что в учебном наборе данных)?
Используйте другое вложение, прошедшую подготовку с большим словарем, с подобным содержанием, как приложения и т.д.
Получить больше данных обучения (маркировано набор данных). Это должно многое помочь. Текстовая классификация обычно имеет очень большое пространство функций.
Разрешить «тренировать» ваш слой внедрения при обучении текстового классификатора. Не путайте с обучением word2vec, которое должно получить предварительно изученное вложение для вашего слоя внедрения, и оно может использовать большое количество немеченых данных. Здесь вы используете относительно небольшой набор данных, содержащий только помеченные данные. Разрешить «обучаемый» слой внедрения означает, что градиент может быть обратно передан с выходного уровня на уровень внедрения, чтобы тонко настроить векторы внедрения.
Добро пожаловать в StackOverflow. Прочтите и следуйте инструкциям по отправке в справочной документации. [по теме] (http://stackoverflow.com/help/on-topic) и [как спросить] (http://stackoverflow.com/help/how-to-ask) применяются здесь. Мы можем иметь дело с конкретным запросом, но не с туманным описанием. Покажите свой дизайн и использование; показать точность, которую вы получаете, что вы ожидаете, и, возможно, почему вы считаете, что с вашим подходом возможна точность. – Prune