У меня есть эта следующая структура HTML файла:найти шаблон регулярного выражения не предваряется то
<table>
<tr class="heading">
<td colspan="2">
<h2 class="groupheader">Public Types</h2>
<!-- I don't want that! We're in a table.-->
</td>
</tr>
<tr>...</tr>
</table>
<h2 class="groupheader">Detailed Description</h2>
<!-- I want all that until the next h2-->
<div class="textblock"><p>Provides the functions to control the generation of a single data log file. </p>
<h4>Example</h4>
<div class="fragment"><div class="line">Test <a href="aaa">stuff</a>();</div>
<div class="line">...</div>
<div class="line">...</div>
</div>
</div> <!-- end of first result -->
<h2 class="groupheader">Member</h2>
<!-- I want all that until the next h2 or hr-->
<a class="anchor"></a>
<div class="memitem">
<div class="memproto">
<table class="memname">
<tr>
<td class="memname">enum <a class="el" href="...">test</a></td>
</tr>
</table>
</div><div class="memdoc">
<hr><!-- End of 2nd result -->
И с Regexp, мне нужно, чтобы получить все содержимое между каждыми названиями до следующего заголовка или часа тега, ожидайте, если он находится в таблице.
До сих пор у меня было все мое h2-> h2 | hr. Это выглядит так:
(?s)(<h2 class="groupheader">.*?)(<h2|<hr)
Как я могу пропустить содержимое под H2, которое содержится в таблице? Я пробовал noodling с негативным взглядом позади, но я никуда не денусь.
Благодарим за помощь.
Кажется, у вас есть опечатки, которые мешают мне понять вопрос, не могли бы вы исправить их? Может быть, предоставить некоторые образцы данных и выборки? –
что вам нужно, чтобы точно, не поняли, добавьте пример, пожалуйста и как это не получается –
Я попытался прояснить свою проблему. Надеюсь, это лучше! – Flag