То, что я пытаюсь сделать, это создать генерацию запроса множественного выбора (MCQ), чтобы заполнить генератор вопросов стиля пробела. Мне нужно генерировать отвлекающих (неправильных ответов) от Ключа (правильный ответ). MCQ генерируется из учебных текстов, которые вводят пользователи. Мы пытаемся решить эту проблему, комбинируя контекстуальное сходство, сходство предложений, в которых встречаются ключи и дистракторы, и разница в терминах частот. Любая помощь? Я думал об использовании больших наборов данных данных для создания связанных с ними дистракторов, таких как те, которые были предоставлены с помощью видения google, я не знаю, как добиться этого в python.Как я могу найти хорошего отвлекающего фактора для ключа с помощью python
1
A
ответ
1
Этот вопрос слишком широк для ответа, хотя я сделаю все возможное, чтобы дать вам несколько указателей.
Если у вас есть замкнутый набор потенциальных дистракторов, Я бы использовал слово/фразу, чтобы найти ближайшего отвратителя к правильному ответу.
Gensim's word2vec является хорошей отправной точкой в питоне
Если вы хотите, чтобы ваши дистрактор следовать шаблону,, например, заменить определенное слово из правильного ответа с его противоположностью, я хотел бы использовать nltk's wordnet реализации, чтобы найти antonyns/синонимы.