Python 熊猫中的嵌套数据_Python_Pandas_Data Structures

Python 熊猫中的嵌套数据

python pandas data-structures

Python 熊猫中的嵌套数据,python,pandas,data-structures,Python,Pandas,Data Structures,首先：我知道这是一个危险的问题。关于在pandas中存储和访问嵌套数据，有许多类似的问题，但我认为我的问题不同（更一般），所以请稍候。：）我有一个运动员的中型训练数据集。每次训练都有一个日期和时间、大约200个属性（例如平均速度和心率）和一些原始数据（3-10个列表，例如每秒速度和心率值）。我有大约300次训练，每次训练平均约4000秒到目前为止，我尝试了3种解决方案将这些数据存储在pandas中，以便能够对其进行分析：我可以使用多索引并将所有数据存储在一个数据帧中，但这个数据帧将变得相

首先：我知道这是一个危险的问题。关于在pandas中存储和访问嵌套数据，有许多类似的问题，但我认为我的问题不同（更一般），所以请稍候。：）

我有一个运动员的中型训练数据集。每次训练都有一个日期和时间、大约200个属性（例如平均速度和心率）和一些原始数据（3-10个列表，例如每秒速度和心率值）。我有大约300次训练，每次训练平均约4000秒

到目前为止，我尝试了3种解决方案将这些数据存储在pandas中，以便能够对其进行分析：

我可以使用

多索引

并将所有数据存储在一个数据帧中，但这个数据帧将变得相当大（这不一定是个问题）但目视检查将很困难）并且切片数据很麻烦

另一种方法是存储日期和属性在数据帧中

df_1

并将原始数据存储在单独的数据帧

df_2

我将存储在一个单独的列

raw_data

在

df_1

中

…或者（类似于（2））我可以将原始数据存储在单独的

DataFrame

s中我存储在一个

dict

中，其键与

DataFrame

df_1

这两种解决方案中的任何一种都可以工作，对于这个用例，它们都没有主要的性能优势。对我来说，（1）感觉最“潘多拉”（真的像那个词：），但是分割数据是困难的，对

数据帧的目视检查（打印）是没有用的。（2） 感觉有点“黑客”，就地修改可能不可靠，但这个解决方案非常好用。和（3）是丑陋的，有点难以合作，但在我看来，也是最蟒蛇
问题：每种方法的好处是什么？您认为最适合的解决方案是什么？
顺便说一句：我当然愿意接受其他解决方案。
我也有同样的问题。你找到解决办法了吗？@user48956其实没有。我使用了方法2一段时间，只要你不切割数据帧（然后创建一个新的df），它就可以正常工作，然后这个方法变得不可靠，因为指向第二个数据帧的指针有时会丢失。我真的不明白为什么会发生这种事。。。