Иногда данные, которые вы получаете, не чисты и имеют вариации используемых слов, орфографических ошибок или манипуляций. Можем ли мы найти такие примеры близкого сходства слов в предложении?Как программно найти варианты определенного слова в предложении?
Например, если я ищу за слово «Высокого», который был использован в качестве изменения в предложении, как
"We had an awwweesssommmeeee dinner at sea resort"
"We had an awesomeeee dinner at sea resort"
"We had an awwesooomee dinner at sea resort"
etc..
Вы должны думать о случайном выборе слов, которые не должны совпадать, как '' awful ". Нет простого ответа. Начните с 'agrep (« awesome », x, max.distance = 0.5, ignore.case = TRUE)', чтобы увидеть, как работает расстояние Левенштейна. –
Возможно, вы ищете http://datascience.stackexchange.com/ – Frank