使用Python从具有不同级别嵌套列表和dicitonaries的json中提取数据
我有以下API可从中提取数据: 我已经使用json(见下文)提取了API结果,但API的结构似乎非常复杂,我不知道如何提取与我相关的信息并将其存储到数据帧中。我感兴趣的信息是以下键的值 “译名” “回溯日期” “翻译摘要” “已翻译的url” 更一般地说,如果我能被指出如何从字典中的列表、字典中的列表等中提取数据的逻辑,那就太好了 我的预期输出是一个新闻级别的数据集,其中每一行我都报告翻译的标题、翻译的摘要和回溯日期。请参见以下结构:使用Python从具有不同级别嵌套列表和dicitonaries的json中提取数据,python,json,extract,Python,Json,Extract,我有以下API可从中提取数据: 我已经使用json(见下文)提取了API结果,但API的结构似乎非常复杂,我不知道如何提取与我相关的信息并将其存储到数据帧中。我感兴趣的信息是以下键的值 “译名” “回溯日期” “翻译摘要” “已翻译的url” 更一般地说,如果我能被指出如何从字典中的列表、字典中的列表等中提取数据的逻辑,那就太好了 我的预期输出是一个新闻级别的数据集,其中每一行我都报告翻译的标题、翻译的摘要和回溯日期。请参见以下结构: df = pd.DataFrame([{"tra
df = pd.DataFrame([{"translated_title" : "Chine : La pression augmente contre Nike, Apple et d’autres à mesure que le boycott lié aux allégations de travail forcé s’intensifie", "translated_abstract":'..', "backdate": "2020-07-24"},
{"translated_title" : "..", "translated_abstract":'..', "backdate": ".."}])
谢谢 试试这个
keys = ["translated_title", "backdate", "translated_abstract", "translated_url"]
res = [{k: x[k] for k in keys if k in x} for x in users_locs]
df = pd.DataFrame(res)
你的预期输出是什么?嗨,苏珊特,我添加了预期结果,谢谢你的请求clarification@FilippoSebastio对于您的信息
翻译的\u abstract
对于所有记录都有空字符串。这可能只是针对此api请求,感谢您提供的解决方案:)
keys = ["translated_title", "backdate", "translated_abstract", "translated_url"]
res = [{k: x[k] for k in keys if k in x} for x in users_locs]
df = pd.DataFrame(res)