Soundex, похоже, реализован в некоторых СУБД, но были ли какие-либо алгоритмические улучшения, которые окончательно лучше, чем текущая реализация Soundex?Улучшена ли Soundex?
ответ
Да. Как указывает Wikipedia, есть Метафон и Двойной Метафон, NYSIIS и многое другое.
Имейте в виду, что они работают только на английском языке, у которого есть свои особые проблемы с его орфографией. Это вряд ли нужно для испанского языка, и это не имеет смысла для китайского/мандарина.
Я не знаю о «окончательно лучше», но вы можете посмотреть на Метафон (и его варианты) и Caverphone. См., Например, http://www.atomodo.com/code/double-metaphone, где есть реализация «Двойной метафон» для использования с MYSQL.
Metaphone 3 - это третье поколение алгоритма Metaphone. Это повышает точность фонетического кодирования от 89% двойного Metaphone до 98%, протестировано с базой данных наиболее распространенных английских слов, а также имена и не-английские слова, знакомые в Северной Америке . Это дает чрезвычайно надежное фонетическое кодирование для American произношения.
Метафон 3 был разработан и разработан Лоуренсом Филипсом, который разработал и разработал оригинальные алгоритмы метафонов и двухточечных метафонов .