Python 如何使用CSS选择器或任何其他方法提取评级信息

Python 如何使用CSS选择器或任何其他方法提取评级信息,python,r,web-scraping,yelp,rselenium,Python,R,Web Scraping,Yelp,Rselenium,我正在学习自己的网络刮削,我正在尝试将Yelp作为一种实践来刮削评论员的评分。通常,我可以使用CSS选择器或XPath方法来选择我感兴趣的内容。但是,这些方法不适用于选择评论员的评分。例如,在以下页面:。第一个等级的CSS选择器是“.stars_2”。但是,如果我在RSelenium代码中使用此选择器,如下所示: ratings=remDr$findElements('css selector','.stars_2') ratings=unlist(lapply(ratin

我正在学习自己的网络刮削,我正在尝试将Yelp作为一种实践来刮削评论员的评分。通常,我可以使用CSS选择器或XPath方法来选择我感兴趣的内容。但是,这些方法不适用于选择评论员的评分。例如,在以下页面:。第一个等级的CSS选择器是“.stars_2”。但是,如果我在RSelenium代码中使用此选择器,如下所示:

     ratings=remDr$findElements('css selector','.stars_2')

     ratings=unlist(lapply(ratings, function(x){x$getElementText()}))
我得到空值。我认为原因是评级实际上是一种形象。我将页面源的一小部分粘贴到此处:

            <div class="review-content">
            <div class="review-content">
            <div class="biz-rating biz-rating-very-large clearfix">
            <div>        
            <div class="rating-very-large">
            <i class="star-img stars_2" title="2.0 star rating">
          <img alt="2.0 star rating" class="offscreen" height="303" src="//s3-media4.fl.yelpcdn.com/assets/srv0/yelp_styleguide/c2252a4cd43e/assets/img/stars/stars_map.png" width="84">
    </i>
</div>


    </div>


基本上,如果我可以从class=“stat img stars_2”或title=“2.0 star rating”中提取文本,那么我就很好了。有人能帮我吗?

你可能想试试这种方法:

虽然有些人觉得这已经过时了,但我在Yelp github页面上找到了一些有用的代码:

祝你好运!
:)

请添加您的代码谢谢,我添加了代码。这是(第6b条iii)所禁止的。实际上我只是把它作为一种练习。我不会把它用于任何其他目的。我只是想知道如何处理这种情况。谢谢!但是API只能在业务级别上工作。若我想提取个人评级,我不认为API可以帮助。如果我错了,请纠正我。