Вопрос, аналогичный другим, заданный здесь раньше, но поскольку я не могу понять, как применять эти предложения, мне нужна помощь.XPath до следующего тега
Я хотел бы найти узлы в HTML-документ, который имеет структуру, как это (экстракты, могут различаться):
<h2>My title 1</h2>
<h3>Sub-heading</h3>
<p>...<span><a href='#'>...</a></span></p>
<div>...</div>
<h2>My title 2</h2>
<p>No sub-heading here :O</p>
<h3>But here</h3>
<p>No link</p>
<h2>And so on...</h2>
<p>...</p>
То, что я хотел бы выполнить, чтобы найти все узлы из один h2 до последнего элемента до следующего h2, включая сам h2. Как и в моем примере я хотел бы извлечь "блоки", подобные этим:
Блок 1:
<h2>My title 1</h2>
<h3>Sub-heading</h3>
<p>...<span><a href='#'>...</a></span></p>
<div>...</div>
Блок 2:
<h2>My title 2</h2>
<p>No sub-heading here :O</p>
<h3>But here</h3>
<p>No link</p>
Блок 3:
<h2>And so on...</h2>
<p>...</p>
Я не могу больше стремиться (без id, никакого текстового контента, о котором я мог бы знать, без уверенного контента и т. Д.), Кроме h2.
Удивительных - настолько очевидно, думает, я усложненный его слишком много. Большое спасибо! – chrney