2017-02-06 18 views
0

Привет Я хочу, чтобы извлечь данные с этого сайта: taobao.com Единственное, что мне нужно, чтобы извлечь значение атрибута данных идентификатор в каждом элементе в магазине. Я приведу пример источник данных относится к файлу с этим:извлекая Data Only Return Quote «» (Imacros)

https://shop122418146.world.taobao.com 
https://shop68989753.world.taobao.com 

Вот что я пробовал.

const L = "\n"; 
const numLines = 3; 


/* --------------------- main --------------------- */ 
for (x = 1; x <= numLines; x++) { 
     iimPlayCode (
       'SET !DATASOURCE E:\\XXX\\Taobao\\TaobaoShop.csv' + L + 
       'SET !DATASOURCE_LINE ' + x + L + 
       //'SET !REPLAYSPEED MEDIUM' + L 
       'URL GOTO={{!COL1}}' + L + 
       'WAIT SECONDS=1' + L + 
       'EVENTS TYPE=KEYPRESS SELECTOR="HTML" KEYS="[40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40,40]"' + L + 
       'WAIT SECONDS=1' + L 
      ); 
    for (y = 1; ;y++) { 
     iimPlayCode (
       'TAG POS=' + y + ' TYPE=DL ATTR=CLASS:item* EXTRACT=data-id' + L 
      ); 
     if(iimGetLastExtract()=="#EANF#"){ 
      break; 
     } else{ 
      iimPlayCode (
       'SAVEAS TYPE=EXTRACT FOLDER={{!FOLDER_DATASOURCE}}\\Taobao\ FILE=Taobao.csv' + L + 
       'SET !EXTRACT NULL' + L 
      ); 
     } 
    } 
} 

Я думал, что это может быть легко заставить его работать, но только вернуться, как эти

"" 
"" 
"" 
"" 
... 

Любое предложение решить эту проблему?

ответ

0

Aha! Я пытаюсь использовать другой подход, используя метод match(), и он работает без проблем.

SET !EXTRACT EVAL("'{{!EXTRACT}}'.match(/-*[0-9]+/)") 
+0

Но оставьте мне вопрос, ли imacros приплюсовать для Firefox не может быть использована для извлечения значения из атрибута *** непосредственно ***? Хотя нам нужно вместо этого извлечь HTML-код, извлеките необходимые данные. – muflichkamil