2

Мне пришлось создать анализатор понятий для информатики, и я использовал для этой машины обучение, оранжевую библиотеку для Python. У меня есть примеры понятий, где функции - это лемма и часть речи, как алгоритм | NN | concept. Проблема в том, что любое другое слово, которое на самом деле не является понятием, классифицируется как понятие из-за отсутствия отрицательных примеров. Невозможно поместить все другие слова в учебный файл, классифицированные как простые слова, а не понятия (это будет работать, но это не совсем решение). Есть идеи?Проблема машинного обучения для отрицательных экземпляров

Спасибо.

+0

вам нужно уточнить ваш вопрос лучше. в чем проблема, которую вы пытаетесь решить/обнаружить/классифицировать? Какова природа ваших данных обучения? Каким образом мечение части речи может помочь вам в вашей задаче? Что именно вы подразумеваете под отрицательными примерами? –

ответ

2

Вопрос очень неясен, но, предполагая, что вы имеете в виду, что ваш алгоритм машинного обучения не работает без отрицательных примеров, и вы не можете дать ему все возможные отрицательные примеры, тогда это совершенно нормально, чтобы дать ему отрицательный Примеры.

Целью интеллектуального анализа данных (a.k.a. машинное обучение) является попытка разработать общие правила на основе относительно небольших выборок данных и затем применить их к более крупным данным. В реальных проблемах вы будете никогда имеют все данные. Если у вас были все возможные входы, вы могли бы легко создать простую последовательность правил if-then, которые всегда были бы правильными. Если бы это было так просто, роботы все время думали о нас.