Привет, все, что я новичок в Скрап-сцены, и хотел бы помочь получить информацию о том, как получить все изображения с определенным именем класса с веб-страницы.Сброс веб-сайта для изображений, которые интенсивно обрабатываются AJAX
Проблема заключается в том, что все это построено с помощью AJAX и оно загружает больше изображений при прокрутке вниз. Естественно, загрузка веб-сайта с помощью элемента управления Webbrowser загружает только количество изображений по умолчанию, прежде чем вы начнете прокрутку вниз.
К счастью, я могу получить общее количество изображений, которые будут на этой странице для какой-либо конкретной категории.
Как я могу получить ВСЕ изображения, прежде чем запускать команду htmlagilitypack, чтобы вырвать все изображения с определенным именем класса?
Он загружает около 30 изображений в начале, в зависимости от того, какую категорию вы выберете, он может состоять в общей сложности из 800 изображений более или менее. Когда вы прокручиваете ближе к основанию, он загружает еще 30 изображений.
Итак, есть ли какие-либо трюки для автоматизации этого процесса и зная, когда он достигнет нижней части всех загруженных изображений?
Мой код до сих пор получаю по умолчанию 30 изображений на странице это:
Private Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click
Dim doc As New HtmlAgilityPack.HtmlDocument()
htmlCode = WebBrowser1.Document.Body.OuterHtml
doc.LoadHtml(htmlCode)
Dim totalNumOfPosters() As String = doc.DocumentNode.SelectSingleNode("//span[@class='main-title-divider']").InnerText.Split(" ")
Debug.WriteLine(totalNumOfPosters(0)) 'Shows total num of images
For Each img As HtmlNode In doc.DocumentNode.SelectNodes("//img[contains(@class,'img-poster')]")
posterArray.Add(img.Attributes("src").Value.ToString)
Next
End Sub
Я просто нужен кто-то, что сделал что-то подобное раньше, дайте мне знать, лучший способ приблизиться к получать остальное изображения!
Спасибо!
Невозможно найти + для POST. См. OP для изображения. – StealthRT
Попробуйте использовать Firebug. – uonlyYOLOonce