Python:从url中提取精确的单词
我刚从2天开始学习python,我试图制作一个脚本,从url中提取一些数据并保存,但问题是我只想从一个长行中提取一个特定的数据 例: {“2019-11-19”:{“期间”:“2019-11-19T00:00:00+00:00”,“uniqs”:“344627”,“点击”:“0”,“点击”:“4922”,“支付”:126.52971186,“货币”:“RON”,“subs”:0},“2019-11-20T00:00:00+00:00”,“uniqs”:“156983”,“点击”:“0”,“点击”:“15621”,“支付”:358.43100342,“货币”:“RON”,“subs”:0},“2019-11-21:00”,“uniqs:00”:“1699844”,“点击次数:”“0”,“点击次数:”“1779319”,“点击次数:”“17865”,“支付次数:”“384.67092962”,“货币:”“RON”,“subs:”“0}”,2019-11-22:“{”期间:”“2019-11-22T00:00:00+00:00”,“uniqs:”“1825346”,“点击次数:”“17865”,“支付次数:”“384.67092962”,“货币:”“RON”,“subs:”“0}”,2019-11-23:“{”期间:”“2019-11-23T00:00+00:00”,“uniqs:”“点击次数:”“1775346”,“点击次数:”“1778340”,“支付次数:”“35395”货币“:“RON”,“subs”:0}”,2019-11-24:{“期间”:“2019-11-24T00:00:00+00:00”,“Uniq”:“1732639”,“点击次数”:“0”,“点击次数”:“16870”,“支付”:308.4201041,“货币”:“RON”,“subs”:0}”,2019-11-25:{“期间”:“2019-11-25T00:00+00:00”,“uniqs”:“1826060”,“点击次数”:“0”,“点击次数”:“17991”,“支付”:346.29137133,“货币”:“RON”,“subs”:2019-11-26:{“期间”:2019-11-26T00:00:00+00:00,“uniqs”:“1873961”,“点击次数”:“0”,“点击次数”:“18645”,“支付”:379.17652358,“货币”:“RON”,“subs”:0},“2019-11-27”:{“期间”:“2019-11-27T00:00+00:00”,“uniqs”:“1734207”,“点击次数”:“0”,“点击次数”:“16187”,“支付”:251.91152953,“货币”:“RON”,“subs”:0},“2019-11-28”:“期间”:“2019-11-11-28:00+00:00”,“uniqs”:“点击次数”:“1610”:“uniqs”:点击“:”12056“,”支付“:”158.96447829,“货币“:”RON“,”subs“:”0}”,2019-11-29“:”期间“:”2019-11-29T00:00+00:00”,“uniqs“:”712011“,”点击“:”0“,”点击“:”6242“,”支付“:”85.70053418,“货币“:”RON“,”subs“,”0}”,2019-11-30“,”期间“:”2019-11-30T00:00+00”,“uniqs“:”47957“,”点击“:”0“,”点击“:”427“,”支付“,”548.327735,“货币“,”Subsron“,”点击“,”2019-12-01:{“期间”:“2019-12-01T00:00:00+00:00”,“uniqs”:“1268892”,“点击”:“0”,“点击”:“11779”,“支付”:217.42321168,“货币”:“RON”,“subs”:0},“2019-12-02-02”:“期间”:“2019-12-02T00:00+00:00”,“uniqs”:“1130724”,“点击”:“0”,“点击”:“10694”,“支付”:195.44476902”,“货币”:“RON”,“subs”:0},“2019-12-03-12-00”,“uniqs:00”:“uniqs”::00”1058965,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,货币:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,货币:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,货币:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数:,点击次数货币“:“RON”,“subs”:0}”,2019-12-06:{“期间”:“2019-12-06T00:00:00+00:00”,“uniqs:“951828”,“点击次数”:“0”,“点击次数”:“9379”,“支付”:153.35155293,“货币”:“RON”,“subs”:0},2019-12-07:{“期间”:“2019-12-07T00:00+00:00”,“uniqs:“1172156”,“点击次数”:“0”,“点击次数”:“11776”,“支付”:181.65819439,“货币”:“RON”,“subs:”2019-12-08:{“期间”:2019-12-08T00:00:00+00:00,“Uniq”:“912109”,“点击”:“0”,“点击”:“9240”,“支付”:147.6364827,“货币”:“RON”,“subs”:0} 我尝试提取“pay”之后的代码:并将其保存到一个文件中,然后我编写代码来计算金额并给出结果:D为此我工作了1天:D 我使用此代码从链接中提取和保存数据:Python:从url中提取精确的单词,python,Python,我刚从2天开始学习python,我试图制作一个脚本,从url中提取一些数据并保存,但问题是我只想从一个长行中提取一个特定的数据 例: {“2019-11-19”:{“期间”:“2019-11-19T00:00:00+00:00”,“uniqs”:“344627”,“点击”:“0”,“点击”:“4922”,“支付”:126.52971186,“货币”:“RON”,“subs”:0},“2019-11-20T00:00:00+00:00”,“uniqs”:“156983”,“点击”:“0”,“点击”
从urllib.request导入urlopen作为uReq
url1=http://link.com'
page=uReq(url1.read().decode())
f=打开(“dataNEW.txt”,“w”)
f、 书写(第页)
f、 关闭()
但问题是,它将所有细节都写在那里,我只想保存支付后的内容。该字符串是JSON格式的,可以使用
JSON
包轻松转换为Python数据结构。她就是一个例子:
import json
from urllib.request import urlopen as uReq
url1 = 'http://link.com'
page = uReq(url1).read().decode()
data = json.loads(page)
with open("dataNEW.txt", "w") as f:
for sub_dict in data.values():
f.write("{}\n".format(sub_dict["pay"]))
然后,您的dataNEW.txt
应该如下所示:
358.43100342
363.15667371
384.67092962
356.72833095
126.52971186
346.29137133
379.17652358
251.91152953
158.96447829
85.70053418
8.32775435
147.6364827
153.35155293
181.65819439
308.4201041
196.21644271
230.84154581
151.05243751
195.44476902
217.42321168
这看起来像一个JSON文档。如果您只使用
JSON
解析它(或者使用自动为您解析的requests
库),会容易得多还有,你想要哪个pay
呢?每个子字典都有一个单独的pay
键。我尝试从该url中提取所有的pay,以后会更多。你能给出一个预期输出的例子吗?你想只在dataNEW.txt
中看到一列数字吗?126.52971186 358.43100342 363.156677371 384.67092962356.72833095 308.4201041逐行精彩!!!!!!!!!!!!!!!!!谢谢!!!!!我的剧本的其他部分完美无瑕:D我希望几年后我也能回答其他提出问题的ppl