2010-08-24 5 views
0

Я хочу получить название веб-страницы с помощью C#. Поэтому я запрашиваю эту страницу и получаю страницу ответа и использую регулярное выражение для извлечения заголовка.Непригласимое регулярное выражение для получения заголовка со страницы

string regex = @ "(? < =) ([\ s \ S] *) (? =) /";

Но я видел сайт, имеющий два названия, такие как

<title>Page Title</title> 
<link href="...."/> 
<title>Page Title</title> 

Так что, когда я использую выше Regex я получить титул

Page Title</title><link href="...."/><title>Page Title 

Я знаю, что регулярные выражения являются жадными. Как изменить Regex как ungreedy, чтобы он дал мне «Название страницы»?

ответ

5

Чтобы ungreed ваш * вы можете использовать *?

+0

Спасибо. Работал отлично. Динт знает, что все так просто. – NLV

2
(?<=(<\s*title\s*>))((\s|\S)*?)(?=<\s*\/\s*title\s*>)