Я хочу увидеть, как фонетически подобные две неанглийских струны, AFAIK soundex и metaphone реализации работают только правильно строк Английский на основе, например coração
and corassão
звук точно такой же на португальском языке, но metaphone()
возвращение KR
and KRS
. То же самое происходит с другими фонемами, chita
and xita
возвращает XT
and ST
, но они звучат одинаково.Локализованная (Двухместный) Metaphone для португальского (pt_PT)
Я также пробовал это Double Metaphone implementation (demo), но результаты в точности совпадают.
Итак, Есть ли альтернативный алгоритм, который работает с португальскими словами? У меня есть read about Lucene in this other question, но я никогда не использовал его раньше, и я не уверен, как это работает или как его использовать.
Если нет, то кто-нибудь знает, какие данные мне нужно собрать, чтобы разработать метафоноподобный алгоритм?