RegExp: хочу найти все ссылки, которые не заканчиваются на «.html»

Я относительный новичок в регулярных выражениях (хотя я использовал их много раз успешно). Я хочу, чтобы найти все ссылки в документе, которые не заканчиваются на «.html» регулярное выражение, которое я придумал это:RegExp: хочу найти все ссылки, которые не заканчиваются на «.html»

href=\"([^"]*)(?<!html)\"

В Notepad ++, мой редактор, href=\"([^"]*)\" находит все ссылки (как те, это конец в «html», а те, которые этого не делают). Почему не работает отрицательный lookbehind?

Я также попытался опережение:

href=\"[^"]*(?!html\")

, но это не сработало.

Может ли кто-нибудь помочь?

Приветствия, пресмыкаться

источник

2010-03-25 grovel

Я думаю, что «Блокнот ++» просто не поддерживает взгляды на внешний вид. – Gumbo

Это так уродливо, чтобы попытаться заставить регулярное выражение работать с Notepad ++. Я сдаюсь, есть так много раздражающих ограничений. – pars

Это регулярное выражение будет работать нормально, если бы вы использовали PERL или PCRE (например preg_match в PHP). Однако утверждения lookahead и lookbehind не поддерживаются большинством, особенно более простыми, механизмами регулярных выражений, такими как те, которые используются Notepad ++. Только большинство основных синтаксисов, таких как кванторы, подшаблоны и классы символов, поддерживаются почти всеми механизмами регулярных выражений.

Вы можете найти документацию для Notepad ++ регулярных выражений по адресу: http://sourceforge.net/apps/mediawiki/notepad-plus/index.php?title=Regular_Expressions

источник

2010-03-25 11:19:44 Rithiur

Документация является сбивающей с толку, потому что в ней есть раздел об обратном просмотре, который, по-видимому, указывает, что они поддерживаются. – mellamokb

Edit: Notepad ++ с помощью SciTE регулярных выражений и он не поддерживает осмотреться выражений.

Для получения дополнительной информации смотрите здесь http://www.scintilla.org/SciTERegEx.html

Оригинал ответа

~~^.*(?<!\.html)$~~

источник

2010-03-25 11:12:06 YOU

Вы можете сделать регулярное выражение, что делает это, но это, вероятно, будет слишком сложным:

href=\"((([^"]*)([^h"][^"][^"][^"]|[^t"][^"][^"]|[^m"][^"]|[^l]))|([^"]|)([^"]|)([^"]|))\"

источник

2010-03-25 12:08:25 jpalecek

Спасибо всем много.

В конце концов, регулярное выражение действительно не срабатывало.

Я просто использовал обходное решение и заменил все ссылки на себя + «.html», а затем заменил все вхождения «.html.html» на «.html».

Так я заменил href=\"([^"]*)\" с href="\1.html" и затем .html.html с .html

Спасибо в любом случае, пресмыкаться

источник

2010-03-25 13:12:40 grovel

Обратите внимание, что Notepad ++ (теперь?) Поддерживает assertions как это. (У меня есть Notepad ++ 6.3 от 3 февраля 2012 года.)

Я считаю, что Regular Expressions documentation подразумевает, что оба заменяющие-варианты используют тот же PCRE говор:

стандарт: Search | Replace (по умолчанию ярлык Ctrl H)
плагин: TextFX | TextFX Quick | Find/Replace (по умолчанию ярлык Ctrl R)

источник

2013-03-28 16:04:05

RegExp: хочу найти все ссылки, которые не заканчиваются на «.html»

ответ

Смежные вопросы