如何在Python中使用BeautifulSoup解析多个主体标记中的文本?
我想解析此网站: 我想获取html源代码中的信息 与此信息一样,2830:如何在Python中使用BeautifulSoup解析多个主体标记中的文本?,python,html,beautifulsoup,Python,Html,Beautifulsoup,我想解析此网站: 我想获取html源代码中的信息 与此信息一样,2830: <span class="sharenumber" id="fb_share_span">2830</span> python的输出是: <span class="sharenumber" id="fb_share_span"></span> None 没有一个 如何提取场景中的信息? 此外,该网站有多个主体标签。 所以我怀疑这就是我失败的原因,但我不知道如何处理
<span class="sharenumber" id="fb_share_span">2830</span>
python的输出是:
<span class="sharenumber" id="fb_share_span"></span>
None
没有一个
如何提取场景中的信息?
此外,该网站有多个主体标签。
所以我怀疑这就是我失败的原因,但我不知道如何处理这种问题
谢谢您的帮助,很抱歉我的英语很差。您想要的数据/值不是由提供的。它是在这个XHR(AJAX)调用中接收的: 其输出如下:
[{
"url": "https:\/\/www.flyingv.cc\/project\/3724",
"normalized_url": "https:\/\/www.flyingv.cc\/project\/3724",
"share_count": 466,
"like_count": 1995,
"comment_count": 369,
"total_count": 2830,
"click_count": 0,
"comments_fbid": "673240602745001",
"commentsbox_count": 0
}]
因此,如果您想获得每个项目的总计数
值(这是共享计数+的总和,就像+注释计数),只需更改上述链接中的URL
变量内容即可
此代码可能有助于:
#coding:utf-8
import json
import requests
url_prefix = "https://api.facebook.com/restserver.php?format=json&method=links.getStats&urls="
project_url = "https://www.flyingv.cc/project/3724"
response = requests.get("{}{}".format(url_prefix, project_url))
data = json.loads(response.content)[0]
print data.get('total_count', None)
输出:
2830
太完美了!!!谢谢你的帮助!!!很抱歉,我还有一个问题。。。。我还想提取信息,1201按讚次數, 这就是Facebook粉丝页面的数量。但我也不知道如何处理这个问题。我很抱歉。。。。非常感谢你的帮助!!!哎@陳冠穎 我很高兴我的回答有帮助。如果我的回答能帮你解决问题,请别忘了接受。关于Facebook粉丝页面的喜好,我明天可以帮你。非常感谢你的帮助!!!我与这些问题斗争了很长时间……但仍然失败了。。。。
2830