Мне нужно создать генератор PDF с использованием TCPDF и PHP. Я мог бы просто написать все в PDF, но это выглядело бы ужасно. Поэтому мне нужно получить каждый продукт в HTML на другой странице.Получить HTML-контент между двумя элементами
С новыми страницами это довольно просто. Просто используйте документ dom, чтобы найти <div>
вокруг продуктов, поместите его в массив и напишите это в формате PDF.
К сожалению, не все страницы одинаковые, поэтому не каждая страница имеет <div>
. Эта страница, например.
'<h3>sample#1</h3>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>
<img>
<table>
</table>
<h3>sample#2</h3>
<p>Aenean commodo ligula eget dolor. Aenean massa.</p>
<img>
<table>
</table>
<h3>sample#3</h3>
<p>Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus.</p>
<img>
<table>
</table>
<h3>sample#4</h3>
<p>Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem.</p>
<img>
<table>
</table>'
Так что я пытаюсь получить, что-то вроде этого:
array (size=4)
0 => string "
<h3>sample#1</h3>
<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>
<img>
<table>
</table>"
1=> string "
<h3>sample#2</h3>
<p>Aenean commodo ligula eget dolor. Aenean massa.</p>
<img>
<table>
</table>"
т.д.
У меня нет никаких проблем с включением что-то в файлах сервера, если это необходимо, но предпочтительно не.
Если вы знаете, все возможности, как страница может выглядеть, вы можете использовать регулярное выражение для извлечения именно вам данные во всех случаях ... –