Я использую jericho для дезинфекции html, и он отлично работает. За исключением одной ситуации, я не могу понять. Я хочу полностью удалить любой скрипт и содержимое скрипта. Прямо сейчас я удаляю тег скрипта, но содержимое реального скрипта сохраняется.Как разобрать JavaScript из произвольного HTML
Так что в настоящее время я создаю объект Source и выполняю fullSequentialParse. Затем я создаю OutputDocument и просматриваю каждый тег.
Когда я добираюсь до тега «script», я просто хочу заменить все на «».
Любые идеи?
ТИА