2015-10-15 15 views
1

У меня есть данные, какSelective расстояние редактирования

Mega Mall 
Mega Malls 
L & T Gate 6 
L & T Gate 5 
L & T Gate 2 
Megas Mall 
Mega Mwll 

Теперь дело в том, я хочу, чтобы очистить его. Я взял подход редактирования расстояния, используя расстояние редактирования 1 и дело Mega Mall обрабатывается. Короче говоря, он удаляет L & T Gate 5,2 также [я сохраняю первую запись]. Есть ли способ, которым я могу справиться с этим, не удаляя эти случаи и не обрабатывая опечатки и т. Д.

ответ

1

Да, вы можете использовать форму редактирования расстояния , не изменяя при этом алгоритма или его сложности времени и пространства. Вместо того, чтобы считать любую замену, вставку или удаление как 1, считать ее более высоким числом, когда символ (или любой из символов для замещения) является цифрой.

Возможно даже рассчитать вес позиций в строке по-разному. Например. вы можете решить, что каждая буква, следующая за 1 или более цифрами, должна считаться более важной (поскольку, например, адрес 123B сильно отличается от 123).

 Смежные вопросы

  • Нет связанных вопросов^_^