Python 我如何从网络上获得一定的价值
所以,immagine我们有一个网站,比如pewdiepies YT主页。我想写一个剧本,让我知道他的底数。我要用漂亮的汤吗 我知道,它保存在 yt格式字符串id=“订户计数”class=“style scope ytd-c4-tabbed-header-renderer”>84831541订户/yt格式字符串> 我与web开发无关,所以这对我来说是一堆胡言乱语。但我必须有办法得到这个值,没有漂亮的汤,难道没有办法吗Python 我如何从网络上获得一定的价值,python,html,python-3.x,web,Python,Html,Python 3.x,Web,所以,immagine我们有一个网站,比如pewdiepies YT主页。我想写一个剧本,让我知道他的底数。我要用漂亮的汤吗 我知道,它保存在 yt格式字符串id=“订户计数”class=“style scope ytd-c4-tabbed-header-renderer”>84831541订户/yt格式字符串> 我与web开发无关,所以这对我来说是一堆胡言乱语。但我必须有办法得到这个值,没有漂亮的汤,难道没有办法吗 import urllib.request import json impor
import urllib.request
import json
import webbrowser
data = urllib.request.urlopen('https://www.youtube.com/channel/UC-lHJZR3Gqxm24_Vd_AJ5Yw')
print(data)
这就是我到目前为止所拥有的一切。您正在做的是网页抓取。谷歌的快速搜索澄清了如何实现这一点。您正在查找的代码
导入请求
从lxml导入html
#检索网页
data=requests.get('https://www.youtube.com/channel/UC-lHJZR3Gqxm24_Vd_AJ5Yw')
#解析HTML
tree=html.fromstring(data.content)
#在HTML树中查找订户计数
subscriber_count=tree.xpath('//*[包含(@class,“yt订阅按钮”“订户计数”)]/text()'[0]
#转换为整数
订户计数=int(订户计数。替换(“,”,“”)
打印(用户计数)
写作时的结果:“84851474”
如果你想了解更多,你可以深入研究和。你正在做的是网页抓取。谷歌的快速搜索澄清了如何实现这一点。您正在查找的代码
导入请求
从lxml导入html
#检索网页
data=requests.get('https://www.youtube.com/channel/UC-lHJZR3Gqxm24_Vd_AJ5Yw')
#解析HTML
tree=html.fromstring(data.content)
#在HTML树中查找订户计数
subscriber_count=tree.xpath('//*[包含(@class,“yt订阅按钮”“订户计数”)]/text()'[0]
#转换为整数
订户计数=int(订户计数。替换(“,”,“”)
打印(用户计数)
写作时的结果:“84851474”
如果您想了解更多信息,您可以更深入地了解和。从您试图做的事情来看,就是获取指定频道的子计数。为此,我将使用谷歌Youtube API,因为它比网络抓取更快、更可靠。下面是示例代码 1) 获取API密钥并启用此库
https://console.developers.google.com/apis/library/youtube.googleapis.com
2) 获取Youtube频道的频道id,例如PewDiePie isUC-lHJZR3Gqxm24\u Vd_AJ5Yw
https://www.youtube.com/channel/<channel_id>
3b)将返回需要解析的JSON响应
{
"kind": "youtube#channelListResponse",
"etag": "\"XpPGQXPnxQJhLgs6enD_n8JR4Qk/MlIT59Jru-h7AvGc09RB7HQI6qA\"",
"pageInfo": {
"totalResults": 1,
"resultsPerPage": 1
},
"items": [
{
"kind": "youtube#channel",
"etag": "\"XpPGQXPnxQJhLgs6enD_n8JR4Qk/a5p-d8soZS1kVL3A3QlzHsJFa44\"",
"id": "UC-lHJZR3Gqxm24_Vd_AJ5Yw",
"statistics": {
"viewCount": "20374094982",
"commentCount": "0",
"subscriberCount": "84859110",
"hiddenSubscriberCount": false,
"videoCount": "3744"
}
}
]
}
获取pewdiepies通道子计数的示例代码
导入请求
url='1〕https://www.googleapis.com/youtube/v3/channels?part=statistics&id=&key='
resp=requests.get(url=url)
data=resp.json()
sub_count=数据['items'][0]['statistics']['subscriberCount']
打印(子单元计数)
看起来,您试图做的是获取指定频道的子计数。为此,我将使用谷歌Youtube API,因为它比网络抓取更快、更可靠。下面是示例代码
1) 获取API密钥并启用此库
https://console.developers.google.com/apis/library/youtube.googleapis.com
2) 获取Youtube频道的频道id,例如PewDiePie isUC-lHJZR3Gqxm24\u Vd_AJ5Yw
https://www.youtube.com/channel/<channel_id>
3b)将返回需要解析的JSON响应
{
"kind": "youtube#channelListResponse",
"etag": "\"XpPGQXPnxQJhLgs6enD_n8JR4Qk/MlIT59Jru-h7AvGc09RB7HQI6qA\"",
"pageInfo": {
"totalResults": 1,
"resultsPerPage": 1
},
"items": [
{
"kind": "youtube#channel",
"etag": "\"XpPGQXPnxQJhLgs6enD_n8JR4Qk/a5p-d8soZS1kVL3A3QlzHsJFa44\"",
"id": "UC-lHJZR3Gqxm24_Vd_AJ5Yw",
"statistics": {
"viewCount": "20374094982",
"commentCount": "0",
"subscriberCount": "84859110",
"hiddenSubscriberCount": false,
"videoCount": "3744"
}
}
]
}
获取pewdiepies通道子计数的示例代码
导入请求
url='1〕https://www.googleapis.com/youtube/v3/channels?part=statistics&id=&key='
resp=requests.get(url=url)
data=resp.json()
sub_count=数据['items'][0]['statistics']['subscriberCount']
打印(子单元计数)
您可能希望查看一篇文章,例如了解web刮取如何处理请求和Beauty soup之类的内容。您可能希望查看一篇文章,例如了解web刮取如何处理请求和Beauty soup之类的内容。