В настоящее время я работаю над проектом, для которого я думаю, что придумать фонетические представления слов на разных языках было бы очень полезно. Я знаю, что Aspell делает это довольно хорошо, но я не думаю, что есть очень простой способ получить их фонетические представления, поэтому я спрашиваю: есть ли еще какой-то хороший пакет для получения фонетического представления слова с учетом слова и языка/диалект/акцент/независимо от того, из чего он идет?Что такое хороший пакет для фонетического представления для разных человеческих языков?
Это не должно быть на каком-либо конкретном языке, но если бы это был Perl, это было бы лучше.
Я уже пробовал Soundex, Metaphone, DoubleMetaphone и все остальное в Text::Phonetic, и ни один из этих материалов не был очень хорош - определенно нигде не было так хорошо, как материал в Aspell.
Производит ли фонетическое произношение конечной цели или средства к другому концу? – Schwern
Средства на другом конце. В конечном счете, цель состоит в том, чтобы использовать это в реализации алгоритма нечеткого автозаполнения. – Eli
О, дорогая, это сложно. Не в последнюю очередь из-за того, что частичные слова могут звучать совсем по-другому. «t», «th», «thro», «throu», «throug», «through». Я подозреваю, что потребуется много обучения ИИ для вероятностей, а не для использования фонетики. Возможно, вам захочется найти сервис, который предоставляет это. – Schwern