Python 熊猫中的嵌套数据

Python 熊猫中的嵌套数据,python,pandas,data-structures,Python,Pandas,Data Structures,首先:我知道这是一个危险的问题。关于在pandas中存储和访问嵌套数据,有许多类似的问题,但我认为我的问题不同(更一般),所以请稍候。:) 我有一个运动员的中型训练数据集。每次训练都有一个日期和时间、大约200个属性(例如平均速度和心率)和一些原始数据(3-10个列表,例如每秒速度和心率值)。我有大约300次训练,每次训练平均约4000秒 到目前为止,我尝试了3种解决方案将这些数据存储在pandas中,以便能够对其进行分析: 我可以使用多索引并将所有数据存储在一个数据帧中,但这个 数据帧将变得相

首先:我知道这是一个危险的问题。关于在pandas中存储和访问嵌套数据,有许多类似的问题,但我认为我的问题不同(更一般),所以请稍候。:)

我有一个运动员的中型训练数据集。每次训练都有一个日期和时间、大约200个属性(例如平均速度和心率)和一些原始数据(3-10个列表,例如每秒速度和心率值)。我有大约300次训练,每次训练平均约4000秒

到目前为止,我尝试了3种解决方案将这些数据存储在pandas中,以便能够对其进行分析:

  • 我可以使用
    多索引
    并将所有数据存储在一个数据帧中,但这个 数据帧将变得相当大(这不一定是个问题) 但目视检查将很困难)并且切片数据很麻烦
  • 另一种方法是存储日期和属性 在数据帧中
    df_1
    并将原始数据存储在单独的 数据帧
    df_2
    我将存储在一个单独的列
    raw_data
    df_1
  • …或者(类似于(2))我可以将原始数据存储在单独的
    DataFrame
    s中 我存储在一个
    dict
    中,其键与
    DataFrame
    df_1
  • 这两种解决方案中的任何一种都可以工作,对于这个用例,它们都没有主要的性能优势。对我来说,(1)感觉最“潘多拉”(真的像那个词:),但是分割数据是困难的,对
    数据帧的目视检查(打印)是没有用的。(2) 感觉有点“黑客”,就地修改可能不可靠,但这个解决方案非常好用。和(3)是丑陋的,有点难以合作,但在我看来,也是最蟒蛇

    问题:每种方法的好处是什么?您认为最适合的解决方案是什么?


    顺便说一句:我当然愿意接受其他解决方案。

    我也有同样的问题。你找到解决办法了吗?@user48956其实没有。我使用了方法2一段时间,只要你不切割数据帧(然后创建一个新的df),它就可以正常工作,然后这个方法变得不可靠,因为指向第二个数据帧的指针有时会丢失。我真的不明白为什么会发生这种事。。。