2017-02-11 11 views
0

У меня есть несколько групп facebook, которые я хотел бы получить для подсчета членов. Примером может быть эта группа: https://www.facebook.com/groups/347805588637627/ Я посмотрел на осмотр элементов на странице, и она хранится так:Получить значение тега span с помощью BeautifulSoup

<span id="count_text">9,413 members</span> 

Я пытаюсь получить «9,413 членов» из страницы. Я пробовал использовать BeautifulSoup, но не могу это решить.

Благодаря

Edit:

from bs4 import BeautifulSoup 
import requests 

url = "https://www.facebook.com/groups/347805588637627/" 
r = requests.get(url) 
data = r.text 
soup = BeautifulSoup(data, "html.parser") 
span = soup.find("span", id="count_text") 
print(span.text) 
+0

pr int 'data', и вы заметите, что нет такого тега. –

ответ

0

Вы можете использовать атрибут text разобранного пролете:

>>> from bs4 import BeautifulSoup 
>>> soup = BeautifulSoup('<span id="count_text">9,413 members</span>', 'html.parser') 
>>> soup.span 
<span id="count_text">9,413 members</span> 
>>> soup.span.text 
'9,413 members' 
+0

Это работает отлично, как есть, но при попытке его на реальной странице я все еще не могу заставить его работать. Я новичок в BeautifulSoup, я обновил свой вопрос с помощью кода, который я использую. Спасибо – newaccount1111

1

В случае, если есть более чем один пролет тегов на странице:

from bs4 import BeautifulSoup 
soup = BeautifulSoup(your_html_input, 'html.parser') 
span = soup.find("span", id="count_text") 
span.text 
+0

Спасибо, я попытался использовать это, но получил атрибут AttributeError: объект «NoneType» не имеет атрибута «текст». Я обновил свой вопрос с помощью кода, который я использую. – newaccount1111

+0

'soup.find()' не находит никаких результатов, поэтому вы вызываете '.text' на' None'. Попробуйте взглянуть на ту же страницу в режиме инкогнито в своем браузере; элемент, который вы ищете, не отображается, когда он не вошел в систему. – Henrik

+0

Спасибо, что имеет смысл, похоже, мне нужно найти другой способ получить счет членов группы facebook по URL-адресу. Можно ли войти в систему, а затем использовать красивый суп каким-то образом? – newaccount1111