Python 熊猫中的嵌套数据
首先:我知道这是一个危险的问题。关于在pandas中存储和访问嵌套数据,有许多类似的问题,但我认为我的问题不同(更一般),所以请稍候。:) 我有一个运动员的中型训练数据集。每次训练都有一个日期和时间、大约200个属性(例如平均速度和心率)和一些原始数据(3-10个列表,例如每秒速度和心率值)。我有大约300次训练,每次训练平均约4000秒 到目前为止,我尝试了3种解决方案将这些数据存储在pandas中,以便能够对其进行分析:Python 熊猫中的嵌套数据,python,pandas,data-structures,Python,Pandas,Data Structures,首先:我知道这是一个危险的问题。关于在pandas中存储和访问嵌套数据,有许多类似的问题,但我认为我的问题不同(更一般),所以请稍候。:) 我有一个运动员的中型训练数据集。每次训练都有一个日期和时间、大约200个属性(例如平均速度和心率)和一些原始数据(3-10个列表,例如每秒速度和心率值)。我有大约300次训练,每次训练平均约4000秒 到目前为止,我尝试了3种解决方案将这些数据存储在pandas中,以便能够对其进行分析: 我可以使用多索引并将所有数据存储在一个数据帧中,但这个 数据帧将变得相
多索引
并将所有数据存储在一个数据帧中,但这个
数据帧将变得相当大(这不一定是个问题)
但目视检查将很困难)并且切片数据很麻烦df_1
并将原始数据存储在单独的
数据帧df_2
我将存储在一个单独的列raw_data
在df_1
中DataFrame
s中
我存储在一个dict
中,其键与
DataFrame
df_1
数据帧的目视检查(打印)是没有用的。(2) 感觉有点“黑客”,就地修改可能不可靠,但这个解决方案非常好用。和(3)是丑陋的,有点难以合作,但在我看来,也是最蟒蛇
问题:每种方法的好处是什么?您认为最适合的解决方案是什么?
顺便说一句:我当然愿意接受其他解决方案。我也有同样的问题。你找到解决办法了吗?@user48956其实没有。我使用了方法2一段时间,只要你不切割数据帧(然后创建一个新的df),它就可以正常工作,然后这个方法变得不可靠,因为指向第二个数据帧的指针有时会丢失。我真的不明白为什么会发生这种事。。。