Прямоугольные регулярные выражения могут быть недостаточно, если ваш div содержит вложенные div. Это связано с тем, что элемент закрывающего div не содержит идентификатор, поэтому регулярное выражение трудно сопоставить с закрывающим тегом.
Если DIV является:
<div id="findme">
<!-- No other divs here! -->
</div>
Тогда вы могли бы использовать регулярное выражение (просто быть осторожным алчности), более элегантную версию этого:
<div id="findme">(.*?)</div>
Примечание: Im довольно что regexp не будет запускаться, прошло какое-то время!
Я хотел бы изучить библиотеку анализатора HTML, чтобы проанализировать структуру и получить смещения символов для внутренней части div, а затем взять этот диапазон из буфера. Использование библиотеки HTML позволит вам разобрать и найти, где заканчивается div.
Возможно, что-то вроде this tutorial. Эти синтаксические анализаторы, вероятно, позволят вам точно отображать данные, заключенные в тег, например ваш div.
Вы также можете использовать C# HTML parser, все они делают подобную работу, просто ознакомиться с документацией, чтобы убедиться, что они не только построили деревья, и позволяют получить характер смещения для вложенных данных Div (так что вы может извлечь его) или разрешить доступ к этим данным.
Нет необходимости в негативном взгляде (что на самом деле?! Не!?). m {< div id = "findme" > (. *?) </div >} будет работать до тех пор, пока нет вложенных div. – friedo
Приветствия! .... ... –