Я пытаюсь написать RegEx, который соответствует открытому тегу HTML с атрибутом class
. Так же, как следующее:RegEx для сопоставления с тегами HTML с определенными атрибутами
<!-- these should match -->
<div class="
<div class=">
<img src="image.jpg" class="
<img src="image.jpg" class=">
<!-- these should not match -->
<div> class="
</div class=">
До сих пор у меня есть:
<[^/^>]+>
Это соответствует любому открывающий HTML-тег. Я ищу, чтобы адаптировать его, чтобы найти атрибут class
внутри, как в приведенных выше примерах.
Ах, вы поднимаете хороший момент, когда мои примеры матчей очень просты. Я отредактировал свой вопрос с немного другим набором совпадений. Как я могу настроить RegEx так же, как и для них? – gosseti
Возможно, вам понадобится связать их. Сначала найдите все теги, затем сопоставьте их для класса. <[[a-z] {1,} + ([a-z] {1,} = ["']. * ["'])? * [\ /]?> Это может найти ваши html-теги, но тогда вам нужно будет сделать еще одну операцию для поиска класса, что-то вроде class = ['"]. * ['"]. Это регулярное выражение javascript, какой язык вы используете для фактического обработки html? – rob
О, спасибо. Я использую JavaScript для чтения HTML как неэкранированной/unsanitized строки. – gosseti