Я пытаюсь сделать программу (для практики), в которой подсчитывается количество глав и стихов в каждой книге Библии ... Итак, скажите, хочу ли я знать полных глав или стихов в книге 1, тогда это даст мне общее число. Если я хочу узнать только число стихов в главе 4 книги 2, то это дает мне только количество стихов в этой главе. Также, для глав.Как подсчитать, сколько страниц на веб-странице с помощью python
Итак, моя логика была подыскивает font class: tk4l
(который является уникальным размер шрифта для тела контекста) с этого сайта:
http://www.holybible.or.kr/B_NIV/cgi/bibleftxt.php?VR=NIV&VL=1&CN=1&CV=99
и если он находит класс шрифта затем добавить 1 к мой подсчет глав и если не удается найти класс шрифта перейти к следующей книге (book += 1
) и сделать то же самое ..
Я собирался использовать:
import requests
from bs4 import BeautifulSoup
import operator
def read_chapters(max_books, max_chapters):
book=1
chapter=1
while chapter <= max_chapters:
url = 'http://www.holybible.or.kr/B_NIV/cgi/bibleftxt.php?VR=NIV&VL={}&CN={}&CV=99'.format(book, chapter)
source_code = requests.get(url).text
soup = BeautifulSoup(source_code, "html.parser")
for bible_text in soup.findAll('font', {'class': 'tk4l'}):
и так далее ...
Мой вопрос ...
1) как я могу напечатать, что количество главы ?? 2) Я понятия не имею, как мне подсчитать количество стихов.
Я только начал изучать Python. Пожалуйста, помогите мне в этом .. T.T
Пожалуйста, вы можете объяснить мне о переменных страницах? как вы раскалываете и что это значит [0] ad [1] –
@YunTaeHwang На странице разбиты две стрелки на этой странице. Взятие page.content как строки означает, что мы имеем весь контент веб-страницы как одну гигантскую строку. Поскольку элементы разбиения на страницы заканчиваются на, мы могли бы просто перебирать всю строку, фактически удаление всего, начиная с .split, даст тот же результат. Но иногда вы можете уменьшить данные, которые вы анализируете. Разбираясь на gifs с разбивкой на страницы, мы получаем список. С индексированием я извлек именно ту часть строки страницы, которая содержит номера глав. – Tristan
Прошу прощения, но не могли бы вы немного объяснить о цикле for, который вы написали тоже. Например, стихи [i] == "> '?? hmmmmm, если вы не возражаете..пожалуйста, –