Хорошо, поэтому я зациклился на том, как обойти эту проблему здесь. это просто частный счетчик онлайн-пользователей для игры.lxml скрипт python, как я могу удалить счет дубликата id
После некоторых исследований мне удалось перейти к этому коду, который я немного добавил в поиске, чтобы получить счет всех изображений с помощью on.png ... и он действительно работает!
from lxml import etree
import requests
def get_img_cnt(url):
response = requests.get(url)
parser = etree.HTMLParser()
root = etree.fromstring(response.content, parser=parser)
return int(root.xpath('count(//img[@src="pics/on.png"])'))
Теперь мое разочарование, что это «on.png» повторяется 2 раза в случае Guild Master вне. Может ли кто-нибудь подумать о том, как обойти это? это часть HTML
<tr><td class='tabellatitolo a_dx' style=' padding:10px;' >Master
<td class='tabelladati' style=' padding:10px;' ><img align=absmiddle src='pics/on.png'>
<a href='?f=pg&id=55110'>Modernist</a>
<tr><td class='tabellatitolo a_dx' style=' padding:10px;' >Membri<p>(5)
<td class='tabelladati' style=' padding:10px;' >**<img align=absmiddle src='pics/on.png'>
<a href='?f=pg&id=55110'>**Modernist**</a>** - <br><img align=absmiddle src='pics/off.png'>
<a href='?f=pg&id=232720'>Human Slayer</a> - <i>Ti stimo!</i><br>
<img align=absmiddle src='pics/off.png'> <a href='?f=pg&id=68194'>Juggernaut</a><br>
<img align=absmiddle src='pics/off.png'> <a href='?f=pg&id=67121'>XeDiOr ThE KoOl</a><br>
<img align=absmiddle src='pics/on.png'> <a href='?f=pg&id=142638'>Lisbet Irmgard</a><br>
я, возможно, думал использовать позицию контекста или, возможно, использовать на что «* О себе» (членов)?
Благодаря любой намек будет appriciated :)
Да, я бы посмотрел на использование этой «Мембра» в качестве отправной точки, а затем оттуда. Похоже, что html, который вы предоставили, является неполным, поэтому трудно сказать, как это сделать именно с вашей структурой. –