Python 组织熊猫数据帧信息的最有效方法

Python 组织熊猫数据帧信息的最有效方法,python,pandas,Python,Pandas,我想存储在pandas dataframe上的数据结构可以表示为: F1 F2 F3 . . . . a b c t1 t2 . . t18000 x1 x2 . . x18000 y z 当我想可视化行只是为了了解数据帧包含的信息时,我不想看到18000个t或x变量。相反,我想做这样的事情:[a,b,c,t,x,y,z] 我对Pandas模块不是很熟悉,所以我的问题是,将来我应该如何存储信息以达到我上面提到的行名称?更具体地说: 我应该将t和x值作为数组存储

我想存储在pandas dataframe上的数据结构可以表示为:

        F1    F2     F3 . . . .

a
b
c
t1
t2
.
.
t18000
x1
x2
.
.
x18000
y
z
当我想可视化行只是为了了解数据帧包含的信息时,我不想看到18000个t或x变量。相反,我想做这样的事情:[a,b,c,t,x,y,z]

我对Pandas模块不是很熟悉,所以我的问题是,将来我应该如何存储信息以达到我上面提到的行名称?更具体地说:

  • 我应该将t和x值作为数组存储在一个单元格中吗

                 F1                F2        ...
    a
    b
    c
    t [t1 t2 .. t18000]
    x [x1 x2 .. x18000]
    y
    z                                                    
    
  • 或者,是否有一种固有的方式来可视化多个索引,这些索引与pandas中的一个索引具有相同的行名称


    • 有几种方法可以做到这一点。您可以使用,它允许您创建层次索引。例如:

      df = pd.DataFrame({'F1': range(4)}, index=[['x', 'x', 'y', 'y'], ['x1', 'x2', 'y1', 'y2']])
      
      将为您提供如下数据帧:

              F1
      x   x1  0
          x2  1
      y   y1  2
          y2  3
      
      您可以简单地
      groupby
      level,例如to sum,
      df.groupby(level=0.sum()

      或者,如果您不想要索引,您可以使用
      groupby
      中的函数。例如,按索引中的第一个字符分组:

      df = pd.DataFrame({'F1': range(4)}, index=['x1', 'x2', 'y1', 'y2'])
      df.groupby(lambda index: index[0]).sum()