У меня есть куча данных HTML, которые я пишу в файл PDF с помощью PHP. В PDF я хочу, чтобы весь HTML был удален и очищен. Так, например:Очистка HTML с PHP для создания чистой строки
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
должны стать:
First list item
Second list item which is quite a bit longer
List item with apostrophe 's 's
Однако, если я просто использовать strip_tags()
, я получаю что-то вроде этого:
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
отметить также отступа выход.
Любые советы о том, как правильно очищать HTML до хороших чистых строк без беспорядочных пробелов и нечетных символов?
Спасибо :)
Я сомневаюсь, что 'strip_tags()' будет только кодировать ваши объекты. Вы уверены, что где-то не звонили «htmlentities»? – Yoshi
Отступы - это именно то, что я ожидаю, PHP отделяет теги, но не дополнительный текст вокруг них. – scragar
Вы имеете в виду I * should * или * should not * использовать htmlentities() где-нибудь? В данный момент я не. Данные HTML поступают прямо из базы данных. – Rein