Я пытаюсь использовать фонетические алгоритмы, такие как Soundex и/или Metaphone, для генерации слов, которые похожи на данные словаря. Должен ли я иметь корпус всех слов словаря для этого? Есть ли другой способ генерировать слова, которые похожи на данное слово, не используя корпус? Я пытаюсь сделать это на Python.Есть ли способ генерировать слова, которые похожи на словарные слова, не используя корпус?
0
A
ответ
2
Если вы не используете корпус, вам, вероятно, придется вручную определить набор правил для разбиения слова в фонетических частях, а затем найти список близких фонем. Это может генерировать похожие звуковые слова, но большинство из них не будет существовать. Если вы хотите генерировать близкие звуковые слова, которые существуют, вам обязательно нужен корпус.
Вы не уточнили цель своей задачи, но вас могут заинтересовать работы Will Leben "Sounder I" (и II и III) и Jabberwocky sentences.
В основном я буду использовать корпус Корпуса Оксфордского университета. Я подал им запрос. Статьи, которые вы упомянули, очень интересны. Спасибо за ваше время! – user2832492