2012-05-25 12 views
2

Я хочу увидеть, как фонетически подобные две неанглийских струны, AFAIK soundex и metaphone реализации работают только правильно строк Английский на основе, например coração and corassão звук точно такой же на португальском языке, но metaphone() возвращение KR and KRS. То же самое происходит с другими фонемами, chita and xita возвращает XT and ST, но они звучат одинаково.Локализованная (Двухместный) Metaphone для португальского (pt_PT)

Я также пробовал это Double Metaphone implementation (demo), но результаты в точности совпадают.

Итак, Есть ли альтернативный алгоритм, который работает с португальскими словами? У меня есть read about Lucene in this other question, но я никогда не использовал его раньше, и я не уверен, как это работает или как его использовать.

Если нет, то кто-нибудь знает, какие данные мне нужно собрать, чтобы разработать метафоноподобный алгоритм?

ответ

1

В случае, если кто-то интересно, я нашел перспективную работу в незавершенном here и someothercoolprojects.