2017-01-11 6 views
0

Я должен извлечь исходный код с веб-страницы моего сайта WP. Я должен экстраполировать каждый тег. Страница - это информация о продукте, и я должен изменить код плагина woocommerceprintproduct. я добавил в код плагина следующий код:Извлечь тег img с веб-страницы с функциями DOMdocument и getElementByTagName

$dom = new DOMDocument(); 
libxml_use_internal_errors(true); 
$dom->loadHTMLFile("http://www.pecso.it/prodotto/741drinkflex-piatto-nondiv/"); 
var_dump($dom); 
$imgTags = $dom->getElementsByTagName("img"); 
var_dump($imgTags); 

Печать $imgTags ПОЛУЧИТЬ следующее значение: object(DOMNodeList)#20572 (1) { ["length"]=> int(34) }

Теперь я могу извлечь каждый <img> тег?

+0

imgTag является объект, что вы пытаетесь получить ??? –

+0

Я пытаюсь получить img-тег с веб-страницы .. –

+0

У вас есть это .. вы хотите src ??? –

ответ

0
$images_links = [];$i=0; 
    $img_tags = $dom->getElementsByTagName('img'); 
    if (!is_null($img_tags)) { 
     foreach ($img_tags as $img_tag) { 
      if ($img_tag->hasAttribute('src')) { 
       $src_value = $img_tag->getAttribute('src'); 
       $images_links[$i] = $src_value; 
       $i++; 
      } 
     } 
    } 

Таким образом, вы можете получить атрибут и так далее

+0

thank's, но $ images_links остается пустым .. Я думаю, что проблема заключается в значении, возвращаемом из $ dom-> loadHTMLFile («...»), потому что для его распечатки я не нахожу src, что обнаруживаю, что просматриваю страницу. –