Кто-нибудь знает библиотеку или часть программного обеспечения там, где будут обнаружены нарушения в тексте? Например, предположим, что у меня есть ...Текстовые нарушения
1. Name 1, Comment 2. Name 2, Comment 3. Name 3 , Comment 5. Name 10, Comment
Это программное обеспечение или библиотека будет первой разрезали части текста, что было бы найти подобные (похожи друг на друга часть программного обеспечения сжатия будет кодировать повторяющиеся аналогичные части текста для сжатия это вниз), но используя переменную для допуска ошибок, она может найти похожие части текста, теперь почти аналогичные приложениям сравнения текста или инструменту diff/merge, которые могут фактически выделить то, что он видит как другое. Я думаю о возможности создания этого инструмента, но я не хочу изобретать велосипед. Если есть что-то там, где бы вы ни находились, это было бы очень полезно, я бы очень хотел знать, возможно, помочь в этом проекте или, по крайней мере, не знаю, как это сделать. Не говоря уже о том, что этот ответ мог бы помочь другим людям, охотящимся на одно и то же, я бы подумал, что спрос будет достаточно высок для поставки, поэтому это пугает мой разум, что я вообще ничего не могу найти.