Существует API endpoint for the daily top 1000 most-viewed pages, который обновляется через несколько часов после полуночи (UTC).
Например: https://wikimedia.org/api/rest_v1/metrics/pageviews/top/en.wikipedia/all-access/2016/02/29
{
"items": [
{
"project": "en.wikipedia",
"access": "all-access",
"year": "2016",
"month": "02",
"day": "29",
"articles": [
{
"article": "Main_Page",
"views": 21384819,
"rank": 1
},
{
"article": "Special:Search",
"views": 2211296,
"rank": 2
},
{
"article": "Steve_Blake",
"views": 2084367,
"rank": 3
},
...
- Она включает в себя популярные страницы Википедии, которые не являются «статьи» сами по себе, как главная страница, страницы поиска, и несколько других. Вы можете отфильтровать их, проверив заголовки в английской Википедии, которые начинаются со специального :, Шаблон :, Пользователь :, Обсуждение :, и т. Д.
- Вы можете заметить несколько страниц с большим количеством просмотров страниц из-за пауков или ботов. Это, надеюсь, будет filtered out, eventually.
В настоящее время API для наименее просматриваемой страницы отсутствует. Вы также можете получить aggregate stats для всей Википедии или pageviews for a particular article.
Спасибо @slaporte за ссылки и советы! Очень полезно. – user142694