从一组json文件中提取特定数据

从一组json文件中提取特定数据,json,excel,csv,export,extract,Json,Excel,Csv,Export,Extract,免责声明:我知道以前也有人问过类似的问题,但作为一个外行,我无法理解一些术语,以及我需要做什么,或者我应该使用哪个程序/软件。如果有人能以一种易于理解的方式解释,并尽可能采取明确的步骤,我将不胜感激。我正在努力学习如何用我的电脑分析和提取数据,但我几周前才刚刚开始,在这方面还是很新的。谢谢大家! 我有一个庞大的json文件集合(数千个),每个文件都包含关于单个在线帖子的元数据,比如帖子ID、用户名(以及全名,如果用户公开的话)、时间戳等等。我想从每个文件中提取这些信息,而不必手动这样做,但我自己

免责声明:我知道以前也有人问过类似的问题,但作为一个外行,我无法理解一些术语,以及我需要做什么,或者我应该使用哪个程序/软件。如果有人能以一种易于理解的方式解释,并尽可能采取明确的步骤,我将不胜感激。我正在努力学习如何用我的电脑分析和提取数据,但我几周前才刚刚开始,在这方面还是很新的。谢谢大家!

我有一个庞大的json文件集合(数千个),每个文件都包含关于单个在线帖子的元数据,比如帖子ID、用户名(以及全名,如果用户公开的话)、时间戳等等。我想从每个文件中提取这些信息,而不必手动这样做,但我自己还不太熟悉我的命令行、Python或R(或其他可能工作的东西),不知道如何做到这一点。我想将这些数据导出为一个Excel或csv文件,其中每行包含一篇文章的所有提取数据,每列包含一种提取数据

我遇到的另一个问题是,当有人在帖子上发表评论时,一些文件将包含多组同名的不同数据。但是,我只需要关于主帖子的这些信息(因此第一次在文件中出现这些信息)

(部分)文件中的信息如下所示(所有个人信息已交换为中立的替补信息):

我在想要提取的信息周围加了三个星号

有人知道我如何提取和导出这些信息吗? 提前非常感谢


亲切问候

您可以安装mongodb。。。导入json并导出csv。。。mongodb将基本上从任何json数据创建一个表。对于嵌套字典,它创建嵌套链接表。因此,双击要进一步展开的结构,并仅将该内部表导出为csv

"fact_check_information": null,
        "fact_check_overall_rating": null,
        "gating_info": null,
        "has_ranked_comments": false,
        "id": "***0000000000000000000***",
        "is_ad": false,
        "is_video": false,
        "location": null,
        "media_preview": "xxxxxxx/xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
        "owner": {
            "blocked_by_viewer": false,
            "followed_by_viewer": false,
            "full_name": "***Jane Doe***",
            "has_blocked_viewer": false,
            "id": "000000000",
            "is_private": false,
            "is_unpublished": false,
            "is_verified": false,
            "profile_pic_url": "https://xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx.xxxxxxxxxxxxxxxxxxxxxxxxxxxx",
            "requested_by_viewer": false,
            "username": "***janedoe***"
        },
        "shortcode": "XXXXXXXXXXX",
        "taken_at_timestamp": ***0000000000***,
        "thumbnail_resources": [