2016-04-02 8 views
1
источником

HTML (Обратите внимание, что он использует ленивые нагрузки JQuery плагина): enter image description hereНевозможно получить URL изображения (определяется с данными-оригиналом) внутри specic класса (JSOUP)

1). Когда я запускаю код ниже, он извлекает все изображения с сайта:

Elements images=document.select("img[src~=(?i)\\.(png|jpe?g|gif)]"); 

2). Но когда я указываю класс он терпит неудачу, как показано ниже:

Elements images=document.select("div.newscat img[src~=(?i)\\.(png|jpe?g|gif)]"); 

А потом я использую (во втором случае он бросает OutOfBoundsException):

for (int i=0;i<images.size();i++){ 
    imageUrl[i]=images.get(i).attr("src"); 
} 

Могли бы, во всяком случае, ленивый load быть проблемой, если да, то как решить?

ответ

0

Наконец, благодаря android: how can i scrap images (in url) using jsoup?(Image tag contain attribute "data-original" which is url of image)

Я нашел работу вокруг изменения

Elements images=document.select("div.newscat img[src~=(?i)\\.(png|jpe?g|gif)]"); 
for (int i=0;i<images.size();i++){ 
    imageUrl[i]=images.get(i).attr("src"); 
} 

в

Elements images=document.select("div.newscat").select("img"); 
for (int i=0;i<images.size();i++){ 
    imageUrl[i]=images.get(i).attr("data-original"); 
}