Есть ли пакет, который содержит функцию подсчета расстояния Левенштейна, которая реализована как код C или Fortran? У меня много строк для сравнения, и stringMatch
от MiscPsycho
слишком медленно для этого.Быстрое расстояние Левенштейна в R?
21
A
ответ
16
levenshteinDist (из пакета RecordLinkage
) вызывает скомпилированный код C. Попробуйте.
5
Вы можете попробовать stringDist
из Biostrings
а
12
И stringdist
в stringdist
пакете делает это слишком, даже быстрее, чем levenshteinDist
при определенных условиях (1)
stringdist был значительно ускорен с этого блога вы ссылаетесь на : теперь он использует несколько ядер. –