Я пытаюсь разобрать этот HTML.Scrapy не обрабатывает TBODY в селекторе Xpath и CSS
<table id="ctl00_LeftColumnMiddle_Table1" border="0">
<tbody>
<tr>
<td>
<table border="0">
<tbody>
<tr>
<td >Contractor Name</td><td>UNITED RENTALS HIGHWAY TECHNOLOGIES INC</td>
</tr>
</tbody>
</table>
</td>
</tr>
<tr>
<td><table border="0">
<tbody>
<tr>
<td >Contractor Name</td><td>UNITED RENTALS NORTHWEST INC</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
Он имеет несколько ТЕ в #ctl00_LeftColumnMiddle_Table1
и имеет table
внутри каждого tr
Я хочу, чтобы обрабатывать каждую запись (ТР на самом деле), а затем обработать детали каждой записи.
Я пробовал эти селекторы/Xpaths.
Selector(response).xpath('//*[@id="ctl00_LeftColumnMiddle_Table1"]/tbody/tr')
и
Selector(response).css('#ctl00_LeftColumnMiddle_Table1 > tbody >tr')
Но это не возвращает никаких результатов.
Но если я
Selector(response).css('#ctl00_LeftColumnMiddle_Table1 tr')
Но это выражение также выбирает внутренние tr
с с Contractor Name
тоже.
Это ошибка в Scrapy?
Если это так, есть ли другой способ обработки записей так, как я хочу?
'tbody' - это тег, который генерируется автоматически, поэтому вам лучше не использовать его в селекторах. – Andersson