Я спросил об этом раньше, но я хотел перефразировать вопрос. Я пытаюсь сделать скребок для моего проекта. Я хотел бы, чтобы он отображал определенную часть ссылки. Единственная часть ссылки, которая изменяется, - это номер. Этот номер - это то, что я хотел бы соскрести. Ссылка выглядит так:awesomium web scraping некоторые части
<a href="/link/player.jsp?user=966354" target="_parent" "="">
Как уже упоминалось, я пытаюсь отрезать только часть 966354 ссылки. Я попробовал несколько способов сделать это, но не могу понять это. Когда я добавляю
<a href="/link/player.jsp?user="
к коду ниже он нарушает
List<string> player = new List<string>();
string html = webControl2.ExecuteJavascriptWithResult("document.getElementsByTagName('a')[0].innerHTML");
MatchCollection m1 = Regex.Matches(html, "<a href=\\s*(.+?)\\s*</a>", RegexOptions.Singleline);
foreach (Match m in m1)
{
string players = m.Groups[1].Value;
player.Add(players);
}
listBox.DataSource = player;
Так что я удалил его, он не показывает никаких ошибок пока я иду, чтобы запустить программу, то я получаю эту ошибку:
" Необработанное исключение типа «System.InvalidOperationException» произошло в Awesomium.Windows.Forms.dll «
Итак, я пробовал это, и он кое-что работает:
string html = webControl2.ExecuteJavascriptWithResult("document.getElementsByTagName('html')[0].innerHTML");
Этот код обрывается, но не так, как хотелось бы. Может кто-нибудь протянет руку помощи, пожалуйста.
Спасибо, что очень помогли. – David
Редактировать, он просто разбился с помощью error: NullReferenceException был необработанным, указывая на foreach – David
playerNodes будет null, если нет подходящих элементов. Поэтому вы можете проверить его, если вы иногда выполняете его на страницах без этих элементов. – AlexP11223