2012-05-18 5 views
2

Как мы можем представить предложение, используя уникальное числовое значение, так что аналогичные предложения должны иметь ближайшее значение.Как представить предложение с численным значением?

Пример. предложение1 == Смит посещает Лос-Анджелес. предложение2 == Джон посещение Калифорнии.

для этих двух предложений 1 & 2 их численное значение должно быть ближе к представлению этих двух предложений, содержащих аналогичное сообщение.

+1

Нужна дополнительная информация - например, какой язык программирования вы используете? Вы пытаетесь принять предложение пользователя и сравнить его с ближайшими совпадениями, которые вы где-то сохранили? IE, если кто-то войдет в «alan visit california», который будет ближе к «john visit california» и таким образом вернуть предложение2 ..? – nealio82

+1

Число - слишком простая структура данных, чтобы улавливать сложность предложений человеческого языка. Не может быть сделано. – Amadan

+0

@Nealio ... Я использую java. у нас есть потоковые предложения, никаких предопределенных предложений. мы должны решить, что оба предложения похожи по их числовым значениям, не рассматривая друг друга предложения. –

ответ

0

Речь идет о понимании семантики предложения, Natural Language Processing и не является сложной задачей. Если ваши данные о предложении не соответствуют оченьrigid structure и similar patterns; Я думаю, что то, о чем вы просите, возможно, находится за пределами современного уровня техники и, конечно же, на уровне исследований уровня PhD.

Единственный подход, который я могу думать, - использовать естественный язык compression, используя известный словарь, который был отображен на directed graph, который был семантически осведомлен.

Затем вы можете оценить, насколько далеко каждое предложение (путь на графике) было от другого и назначить кумулятивный вес.

+1

его проект бакалавра, на самом деле мы работаем над сообщениями журнала, поэтому применение НЛП В этом случае мало сложно, потому что обычно сообщение журнала содержит больше структур отвлечения. –