Надеюсь, кто-то может помочь, это сводит меня с ума!Regex удалить www с URL
Я пытаюсь изменить фильтры Logstash Grok для анализа имени домена. В настоящее время в регулярном выражении: \b(?:[0-9A-Za-z][0-9A-Za-z-]{0,62})(?:\.(?:[0-9A-Za-z][0-9A-Za-z-]{0,62}))*(\.?|\b)
и правильно разделяет домен, необходимо добавить дополнительную проверку, чтобы удалить www.
.
Это то, что я придумал до сих пор:
\b(?:[0-9A-Za-z][0-9A-Za-z-]{0,62})(^(?<!www$).*$?:\.(?:[0-9A-Za-z][0-9A-Za-z-]{0,62}))*(\.?|\b)
я могу только показаться, чтобы сохранить www.
часть домена, а не сам домен. Пример того, что мне нужно для достижения: www.stackoverflow.com
должно быть stackoverflow.com
.
Мне нужно удалить конкретно www.
, а не весь поддомен.
Спасибо заранее!
ОБНОВЛЕНИЕ
Пример входы ожидаемых результатов (с использованием этот пост в качестве примера): в его текущее состояние: https://stackoverflow.com/questions/37070358/
возвращается www.stackoverflow.com
Что мне нужно для того, чтобы вернуть stackoverflow.com
Почему бы не захватить доменное имя без части www? – CinCout
Если я правильно истолковываю ваш вопрос, мне нужно включить субдомены, например: blog.stackoverflow.com, но специально хотите удалить www. Поэтому я попробовал обратное. Не знаете, как просто захватить доменное имя? – josh
, так что вы хотите также поддомен, только если это www, вы хотите его отбросить? Можете ли вы показать нам возможные исходные данные? – CinCout