2010-07-05 1 views
21

Есть ли пакет, который содержит функцию подсчета расстояния Левенштейна, которая реализована как код C или Fortran? У меня много строк для сравнения, и stringMatch от MiscPsycho слишком медленно для этого.Быстрое расстояние Левенштейна в R?

ответ

16

levenshteinDist (из пакета RecordLinkage) вызывает скомпилированный код C. Попробуйте.

5

Вы можете попробовать stringDist из Biostrings а

12

И stringdist в stringdist пакете делает это слишком, даже быстрее, чем levenshteinDist при определенных условиях (1)

+0

stringdist был значительно ускорен с этого блога вы ссылаетесь на : теперь он использует несколько ядер. –

 Смежные вопросы

  • Нет связанных вопросов^_^