Pandas 熊猫分级索引&x27;s使用n-d numpy数组作为索引的数据帧

Pandas 熊猫分级索引&x27;s使用n-d numpy数组作为索引的数据帧,pandas,numpy,dataframe,multi-index,hierarchical,Pandas,Numpy,Dataframe,Multi Index,Hierarchical,我需要将csv文件中的参数化数据读取到数据框中进行统计分析。我想使用层次索引。我有10组参数,共有70个变量。excel表示形式的样例剪切: 我尝试使用n-d nparray构建df,以避免手动定义元组,但在使用数组、从_乘积、每个参数合并多个数据帧等之间迷失了方向: params = np.array([[['Baseline'], ['orig']] , [['Threshold'], ['Thresh-2', 'Thresh+2', 'Thr

我需要将csv文件中的参数化数据读取到数据框中进行统计分析。我想使用层次索引。我有10组参数,共有70个变量。excel表示形式的样例剪切:

我尝试使用n-d nparray构建df,以避免手动定义元组,但在使用数组、从_乘积、每个参数合并多个数据帧等之间迷失了方向:

params = np.array([[['Baseline'], ['orig']]
                       , [['Threshold'], ['Thresh-2', 'Thresh+2', 'Thresh_marg', 'Thresh_cort']]
                       , [['Marker'], ['MHx-2', 'MHx+2', 'MHz-2', 'MHz+2', 'MTx-2', 'MTx+2', 'MTz-2', 'MTz+2', 'MSx-2', 'MSx+2', 'MSz-2', 'MSz+2']]])

rows = []
df = []
paramLen = 0
paramdf = pd.DataFrame()
for i in range(len(params)):
    paramLen += len(params[i][1])
    rows.append(pd.MultiIndex.from_product(params[i]))
    df.append(pd.DataFrame(np.zeros(len(params[i][1])), index = rows[i]))
    paramdf = pd.concat([paramdf, df[i]])

有没有办法直接使用n-d数组进行索引?

目标序列不是多索引结构,所以据我所知,没有办法直接扩展它。我使用您的方法将索引存储在两个列表中,并在最后创建了一个多索引。我没有用令人信服的方式回答这个问题,但我已经用另一种方式回答了,供你参考

import itertools
idx1 = []
idx2 = []
for i in params:
    d = pd.MultiIndex.from_product(i)
    idx1.append(d.get_level_values(0).tolist())
    idx2.append(d.get_level_values(1).tolist())
idx1 = list(itertools.chain.from_iterable(idx1))
idx2 = list(itertools.chain.from_iterable(idx2))

df = pd.MultiIndex.from_arrays([idx1, idx2], names=('Parameter','Value'))
df
MultiIndex([( 'Baseline',        'orig'),
            ('Threshold',    'Thresh-2'),
            ('Threshold',    'Thresh+2'),
            ('Threshold', 'Thresh_marg'),
            ('Threshold', 'Thresh_cort'),
            (   'Marker',       'MHx-2'),
            (   'Marker',       'MHx+2'),
            (   'Marker',       'MHz-2'),
            (   'Marker',       'MHz+2'),
            (   'Marker',       'MTx-2'),
            (   'Marker',       'MTx+2'),
            (   'Marker',       'MTz-2'),
            (   'Marker',       'MTz+2'),
            (   'Marker',       'MSx-2'),
            (   'Marker',       'MSx+2'),
            (   'Marker',       'MSz-2'),
            (   'Marker',       'MSz+2')],
           names=['Parameter', 'Value'])

谢谢你的选择。