Доброе утроRegex для извлечения только TR с TDs
Я пытаюсь получить строки таблицы (TR), который должен иметь один или несколько ячеек таблицы (TD):
Имея эту строку
<TABLE>
<TR valign="top">
<TH>First</TH>
<TH>2nd</TH>
<TH>3rd</TH>
<TH>4th</TH>
</TR>
<TR valign="top">
<TD width="15%">Michael Jackson</TD>
<TD width="5%">Cramberries</TD>
<TD width="25%">Pixies</TD>
<TD width="45%">The Ramones</TD>
</TR>
</TABLE>
Я хотел бы получить:
<TR valign="top">
<TD width="15%">Michael Jackson</TD>
<TD width="5%">Cramberries</TD>
<TD width="25%">Pixies</TD>
<TD width="45%">The Ramones</TD>
</TR>
что будет лучший образец для извлечения одного или нескольких ТР с вложенными TDs ?
'Ты не использовать регулярное выражение для разбора HTML'. Используйте некоторую библиотеку манипуляций DOM на своем языке. –
@Jan Используется в C# для разбора строки HTML –
См. Этот ответ http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454 # 1732454 –