Python 我如何从提供Json字典结果的网站正确保存Json?

Python 我如何从提供Json字典结果的网站正确保存Json?,python,json,Python,Json,我不熟悉Json和Python。 我从网站上得到的结果是 {"urlkey": "se,009)/", "url": "https://009.se/"} {"urlkey": "se,013159560)/", "url": "http://013159560.se/"} {"urlkey": "se,01

我不熟悉Json和Python。 我从网站上得到的结果是

{"urlkey": "se,009)/", "url": "https://009.se/"}
{"urlkey": "se,013159560)/", "url": "http://013159560.se/"}
{"urlkey": "se,013159560,blogg)/", "url": "http://blogg.013159560.se/"}
{"urlkey": "se,018maleri)/", "url": "https://018maleri.se/"}
我的代码:

from bs4 import BeautifulSoup
import requests
import json

html_text = requests.get("https://index.commoncrawl.org/CC-MAIN-2021-21-index?url=*.se&output=json&filter=languages:swe&fl=urlkey,url&filter=~urlkey:se,(.*)\)\/$&pageSize=10").text
soup = BeautifulSoup(html_text, 'lxml')
results = soup.find('p').text
j = json.dumps(results, ensure_ascii=False).encode('utf8')
with open('Results.json', 'wb') as f:
    f.write(j)
    f.close()
但是每一行都会被保存为“\n”,并且在每一行“之前都有一个反斜杠,如:\”(中间没有空格)。 我保存的对吗? 如何从该文件中提取每个“url”

编辑: 保存所有内容的Json文件如下所示:

"{\"urlkey\": \"se,009)/\", \"url\": \"https://009.se/\"}\n{\"urlkey\": \"se,013159560)/\", \"url\": \"http://013159560.se/\"}\n{\"urlkey\": \"se,013159560,blogg)/\", \"url\": \"http://blogg.013159560.se/\"}\n{\"urlkey\": \"se,018maleri)/\", \"url\": \"https://018maleri.se/\"}\n{\"urlkey\": \"se,018radio)/\", \"url\": \"https://018radio.se/\"}\n{\"urlkey\": \"se,021grappling)/\", \"url\": \"http://021grappling.se/\"}\n{\"urlkey\": \"se,021media)/\", \"url\": \"https://www.021media.se/\"}\n{\"urlkey\": \"se,031flytt)/\", \"url\": \"https://www.031flytt.se/\"}\n{\"urlkey\": \"se,035gruppen)/\", \"url\": \"https://www.035gruppen.se/\"}\n{\"urlkey\": \"se,035hemtjanst)/\", \"url\": \"http://035hemtjanst.se/\"}\n{\"urlkey\": \"se,036100200)/\", \"url\": \"http://www.036100200

(所有内容都很狭窄,很难阅读。我甚至不知道是否能够从中提取任何内容?

您的大部分代码都不需要,可以简化为:

import requests
response = requests.get("https://index.commoncrawl.org/CC-MAIN-2021-21-index?url=*.se&output=json&filter=languages:swe&fl=urlkey,url&filter=~urlkey:se,(.*)\)\/$&pageSize=10")
response.raise_for_status() # Make sure there are no http errors
with open("results.json", "w", encoding='utf-8') as f:
    f.write(response.text)

您的大部分代码都不需要,可以简化为:

import requests
response = requests.get("https://index.commoncrawl.org/CC-MAIN-2021-21-index?url=*.se&output=json&filter=languages:swe&fl=urlkey,url&filter=~urlkey:se,(.*)\)\/$&pageSize=10")
response.raise_for_status() # Make sure there are no http errors
with open("results.json", "w", encoding='utf-8') as f:
    f.write(response.text)
尝试:

导入请求
html_text=请求。获取(“https://index.commoncrawl.org/CC-MAIN-2021-21-index?url=*.se&output=json&filter=languages:swe&fl=urlkey,url&filter=~urlkey:se,(.*)\/$&pageSize=10”).text
将open('Results.json','w')作为f:
f、 写入(html_文本)
Results.json:

{"urlkey": "se,009)/", "url": "https://009.se/"}
{"urlkey": "se,013159560)/", "url": "http://013159560.se/"}
{"urlkey": "se,013159560,blogg)/", "url": "http://blogg.013159560.se/"}
{"urlkey": "se,018maleri)/", "url": "https://018maleri.se/"}
.
.
.
如果这不是您想要的,请提供所需文件结构的示例。

尝试:

导入请求
html_text=请求。获取(“https://index.commoncrawl.org/CC-MAIN-2021-21-index?url=*.se&output=json&filter=languages:swe&fl=urlkey,url&filter=~urlkey:se,(.*)\/$&pageSize=10”).text
将open('Results.json','w')作为f:
f、 写入(html_文本)
Results.json:

{"urlkey": "se,009)/", "url": "https://009.se/"}
{"urlkey": "se,013159560)/", "url": "http://013159560.se/"}
{"urlkey": "se,013159560,blogg)/", "url": "http://blogg.013159560.se/"}
{"urlkey": "se,018maleri)/", "url": "https://018maleri.se/"}
.
.
.

如果这不是您想要的,请提供所需文件结构的示例。

看起来像
结果
已经是
JSON
,无需将其转换为JSONagain@mousetail你的意思是j=json.dumps(结果,确保ascii=False)。encode('utf8')?是,如果你看
结果
你会发现它已经是JSON编码的了,我可以删除那一行吗?(如果这是一个愚蠢的问题,很抱歉)是的,您也可以删除整个BeautifulSoup部分,因为它不是HTMLook,例如
结果
已经是
JSON
,无需将其转换为JSONagain@mousetail你的意思是j=json.dumps(结果,确保ascii=False)。encode('utf8')?是,如果你看
结果
你会发现它已经是JSON编码的了,我可以删除那一行吗?(抱歉,如果这是一个愚蠢的问题)是的,你也可以删除整个BeautifulSoup部分,因为它不是HTMLa快速问题,如果我想从该文件中导入just链接,那么最好的方法是什么?你可以解析JSON,修改它,然后将结果转换回JSON。如果你需要更多的帮助,考虑一个新的问题。一个快速的问题,如果我想从那个文件中导入链接,那么最好的方法是什么?你可以解析JSON,修改它,然后把结果转换回JSON。如果你需要更多的帮助,请考虑提出一个新问题。