Я изучаю веб-соскабливание самостоятельно, и я пытаюсь обменивать оценки рецензента на Yelp как практику. Как правило, я могу использовать CSS-селектор или методы XPath для выбора содержимого, которое меня интересует. Однако эти методы не работают для выбора рейтингов рецензентов. Например, на следующей странице: https://www.yelp.com/user_details_reviews_self?userid=0S6EI51ej5J7dgYz3-O0lA. Селектор CSS для первого рейтинга - «.stars_2». Однако, если я использую этот селектор в своем коде RSelenium следующим образом:Как извлечь информацию о рейтингах с помощью CSS-селектора или любых других методов
ratings=remDr$findElements('css selector','.stars_2')
ratings=unlist(lapply(ratings, function(x){x$getElementText()}))
Я получаю NULL. Я думаю, причина в том, что рейтинг на самом деле является образом. Я вставить небольшую часть исходного кода страницы здесь:
<div class="review-content">
<div class="review-content">
<div class="biz-rating biz-rating-very-large clearfix">
<div>
<div class="rating-very-large">
<i class="star-img stars_2" title="2.0 star rating">
<img alt="2.0 star rating" class="offscreen" height="303" src="//s3-media4.fl.yelpcdn.com/assets/srv0/yelp_styleguide/c2252a4cd43e/assets/img/stars/stars_map.png" width="84">
</i>
</div>
</div>
В принципе, если я могу извлечь текст из класса = «стат IMG stars_2» или название = «2,0 звезды рейтинг», то я хорошо. Может ли кто-нибудь помочь мне в этом?
, пожалуйста, добавьте свой код – HubertL
Спасибо, я добавил код. – Allen
Это запрещено [Yelp's TOS] (https://www.yelp.com/static?p=tos) (термин 6 B iii). – Gregor