Я использовал библиотеку Python difflib, чтобы найти, где 2 документа отличаются. Метод Differ(). Compare() делает это, но это очень slow - atleast 100x медленнее для больших HTML-документов по сравнению с командой diff.Определить, где документы отличаются от Python
Как я могу эффективно определить, где 2 документа отличаются в Python? (В идеале я занимаю позиции, а не фактический текст, что и выводит результат.)
2 разных документа могут различаться во многих местах ... – hoju
хорошая точка, исправлена. – Kimvais
Это хорошая идея для сравнения строк, а не персонажей, что я и делал. Когда я изменил Differ на использование строк вместо символов, эффективность стала сопоставимой с командой diff! – hoju