使用Python从具有不同级别嵌套列表和dicitonaries的json中提取数据_Python_Json_Extract

使用Python从具有不同级别嵌套列表和dicitonaries的json中提取数据

python json

使用Python从具有不同级别嵌套列表和dicitonaries的json中提取数据,python,json,extract,Python,Json,Extract,我有以下API可从中提取数据：我已经使用json（见下文）提取了API结果，但API的结构似乎非常复杂，我不知道如何提取与我相关的信息并将其存储到数据帧中。我感兴趣的信息是以下键的值 “译名” “回溯日期” “翻译摘要” “已翻译的url” 更一般地说，如果我能被指出如何从字典中的列表、字典中的列表等中提取数据的逻辑，那就太好了我的预期输出是一个新闻级别的数据集，其中每一行我都报告翻译的标题、翻译的摘要和回溯日期。请参见以下结构： df = pd.DataFrame([{"tra

我有以下API可从中提取数据：

我已经使用json（见下文）提取了API结果，但API的结构似乎非常复杂，我不知道如何提取与我相关的信息并将其存储到数据帧中。我感兴趣的信息是以下键的值

“译名” “回溯日期” “翻译摘要” “已翻译的url”

更一般地说，如果我能被指出如何从字典中的列表、字典中的列表等中提取数据的逻辑，那就太好了

我的预期输出是一个新闻级别的数据集，其中每一行我都报告翻译的标题、翻译的摘要和回溯日期。请参见以下结构：

df = pd.DataFrame([{"translated_title" : "Chine : La pression augmente contre Nike, Apple et d’autres à mesure que le boycott lié aux allégations de travail forcé s’intensifie", "translated_abstract":'..', "backdate": "2020-07-24"}, 
{"translated_title" : "..",  "translated_abstract":'..', "backdate": ".."}])

谢谢

试试这个

keys = ["translated_title", "backdate", "translated_abstract", "translated_url"]

res = [{k: x[k] for k in keys if k in x} for x in users_locs]
df = pd.DataFrame(res)

你的预期输出是什么？嗨，苏珊特，我添加了预期结果，谢谢你的请求clarification@FilippoSebastio对于您的信息

翻译的\u abstract

对于所有记录都有空字符串。这可能只是针对此api请求，感谢您提供的解决方案：）

keys = ["translated_title", "backdate", "translated_abstract", "translated_url"]

res = [{k: x[k] for k in keys if k in x} for x in users_locs]
df = pd.DataFrame(res)