У меня есть большой список описаний продуктов что-то вродеСтрока подобия Поиск в R
Water bottles 1L
Water Can 1L
Aerated Drinks 1L
Chips Potato
Doritos Chips
Bread
Yogurt 300ML
Milk
Ofcourse список в миллионах.
Я пытаюсь создать сходство поиска. Я хочу функцию поиска, которая будет отображать описания подобия. Если я буду искать в Milk Products, он должен принести молоко, масло, йогурт, что-то в этом роде.
Для этого я использовал levenshteinSim
и запустил все описания в Loop и сравнил с моей строкой поиска. К тому времени, когда он побежал за всеми миллионами записей, это занимает много времени. Есть ли какой-либо алгоритм, который будет принимать фрейм данных и строку в качестве входного параметра и минимальный балл, чтобы получить значения?
Если вы хотите использовать специально 'levenshteinSim' просто заменить' 'adist' с levenshteinSim' во втором редактировать из моего поста ниже. Если вы считаете, что предлагаемое решение не отвечает на этот вопрос, добавьте комментарий, касающийся того, что конкретно вы хотите, а не повторного редактирования вашего вопроса. – Barker