2011-04-12 5 views
8

Soundex, похоже, реализован в некоторых СУБД, но были ли какие-либо алгоритмические улучшения, которые окончательно лучше, чем текущая реализация Soundex?Улучшена ли Soundex?

ответ

11

Да. Как указывает Wikipedia, есть Метафон и Двойной Метафон, NYSIIS и многое другое.

Имейте в виду, что они работают только на английском языке, у которого есть свои особые проблемы с его орфографией. Это вряд ли нужно для испанского языка, и это не имеет смысла для китайского/мандарина.

3

Я не знаю о «окончательно лучше», но вы можете посмотреть на Метафон (и его варианты) и Caverphone. См., Например, http://www.atomodo.com/code/double-metaphone, где есть реализация «Двойной метафон» для использования с MYSQL.

2

Metaphone 3 - это третье поколение алгоритма Metaphone. Это повышает точность фонетического кодирования от 89% двойного Metaphone до 98%, протестировано с базой данных наиболее распространенных английских слов, а также имена и не-английские слова, знакомые в Северной Америке . Это дает чрезвычайно надежное фонетическое кодирование для American произношения.

Метафон 3 был разработан и разработан Лоуренсом Филипсом, который разработал и разработал оригинальные алгоритмы метафонов и двухточечных метафонов .