从一组json文件中提取特定数据
免责声明:我知道以前也有人问过类似的问题,但作为一个外行,我无法理解一些术语,以及我需要做什么,或者我应该使用哪个程序/软件。如果有人能以一种易于理解的方式解释,并尽可能采取明确的步骤,我将不胜感激。我正在努力学习如何用我的电脑分析和提取数据,但我几周前才刚刚开始,在这方面还是很新的。谢谢大家! 我有一个庞大的json文件集合(数千个),每个文件都包含关于单个在线帖子的元数据,比如帖子ID、用户名(以及全名,如果用户公开的话)、时间戳等等。我想从每个文件中提取这些信息,而不必手动这样做,但我自己还不太熟悉我的命令行、Python或R(或其他可能工作的东西),不知道如何做到这一点。我想将这些数据导出为一个Excel或csv文件,其中每行包含一篇文章的所有提取数据,每列包含一种提取数据 我遇到的另一个问题是,当有人在帖子上发表评论时,一些文件将包含多组同名的不同数据。但是,我只需要关于主帖子的这些信息(因此第一次在文件中出现这些信息) (部分)文件中的信息如下所示(所有个人信息已交换为中立的替补信息): 我在想要提取的信息周围加了三个星号 有人知道我如何提取和导出这些信息吗? 提前非常感谢从一组json文件中提取特定数据,json,excel,csv,export,extract,Json,Excel,Csv,Export,Extract,免责声明:我知道以前也有人问过类似的问题,但作为一个外行,我无法理解一些术语,以及我需要做什么,或者我应该使用哪个程序/软件。如果有人能以一种易于理解的方式解释,并尽可能采取明确的步骤,我将不胜感激。我正在努力学习如何用我的电脑分析和提取数据,但我几周前才刚刚开始,在这方面还是很新的。谢谢大家! 我有一个庞大的json文件集合(数千个),每个文件都包含关于单个在线帖子的元数据,比如帖子ID、用户名(以及全名,如果用户公开的话)、时间戳等等。我想从每个文件中提取这些信息,而不必手动这样做,但我自己
亲切问候您可以安装mongodb。。。导入json并导出csv。。。mongodb将基本上从任何json数据创建一个表。对于嵌套字典,它创建嵌套链接表。因此,双击要进一步展开的结构,并仅将该内部表导出为csv
"fact_check_information": null,
"fact_check_overall_rating": null,
"gating_info": null,
"has_ranked_comments": false,
"id": "***0000000000000000000***",
"is_ad": false,
"is_video": false,
"location": null,
"media_preview": "xxxxxxx/xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
"owner": {
"blocked_by_viewer": false,
"followed_by_viewer": false,
"full_name": "***Jane Doe***",
"has_blocked_viewer": false,
"id": "000000000",
"is_private": false,
"is_unpublished": false,
"is_verified": false,
"profile_pic_url": "https://xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.xxxxxxxxxxxxxxxxxxxxxxxxxxxx",
"requested_by_viewer": false,
"username": "***janedoe***"
},
"shortcode": "XXXXXXXXXXX",
"taken_at_timestamp": ***0000000000***,
"thumbnail_resources": [