Я хочу классифицировать две строки как похожие или не похожие. НапримерКак рассчитать совпадение между двумя строками в java?
s1 = "Token is invalid. DeviceId = deviceId: "345" "
s2 = "Token is invalid. DeviceId = deviceId: "123" "
s3 = "Could not send Message."
Я ищу библиотеку Java, которая может дать соответствующий счет между 2 строки и с этого балла я могу определить, если они похожи на нет. Моя программа должна работать только с небольшим набором данных (~ 2000 строк). Вы знаете, есть ли что-то уже доступное там?
http://commons.apache.org/proper/commons-lang/ есть куча удобных методов, включая расстояние Левенштейна. –