Python 如何对具有重复列名的行进行切片并按顺序堆叠这些行
我有一个如图所示的数据帧,我想在不改变顺序的情况下将其转换为多行Python 如何对具有重复列名的行进行切片并按顺序堆叠这些行,python,pandas,pandas-groupby,data-science,google-colaboratory,Python,Pandas,Pandas Groupby,Data Science,Google Colaboratory,我有一个如图所示的数据帧,我想在不改变顺序的情况下将其转换为多行 RESP HR SPO2 PULSE 1 46 122 0 0 2 46 122 0 0 3 4 一种可能的解决方案是使用,列长度的唯一必要模数是0(因此可以将所有数据转换为4列DataFrame): 通用数据解决方案: a = '46 122 0 0 46 122 0 0 45 122 0 0 45 122 0'.split() df = pd.DataFrame([a]).astype
RESP HR SPO2 PULSE
1 46 122 0 0
2 46 122 0 0
3
4
一种可能的解决方案是使用,列长度的唯一必要模数是
0
(因此可以将所有数据转换为4列DataFrame
):
通用数据解决方案:
a = '46 122 0 0 46 122 0 0 45 122 0 0 45 122 0'.split()
df = pd.DataFrame([a]).astype(int)
print (df)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 46 122 0 0 46 122 0 0 45 122 0 0 45 122 0
#flatten values
a = df.values.ravel()
#number of new columns
N = 4
#array filled by NaNs for possible add NaNs to end of last row
arr = np.full(((len(a) - 1)//N + 1)*N, np.nan)
#fill array by flatten values
arr[:len(a)] = a
#reshape to new DataFrame (last value is NaN)
df1 = pd.DataFrame(arr.reshape((-1, N)), columns=['RESP','HR','SPO2','PULSE'])
#new column with shifting first col
df1['RESP1'] = df1['RESP'].shift(-1)
print(df1)
RESP HR SPO2 PULSE RESP1
0 46.0 122.0 0.0 0.0 46.0
1 46.0 122.0 0.0 0.0 45.0
2 45.0 122.0 0.0 0.0 45.0
3 45.0 122.0 0.0 NaN NaN
下面是使用
groupby
的另一种方法:
df = pd.DataFrame(np.random.arange(12), columns=list('abcd'*3))
new_df = pd.concat((x.stack().reset_index(drop=True)
.rename(k) for k,x in df.groupby(df.columns, axis=1)),
axis=1)
new_df = (new_df.assign(a1=lambda x: x['a'].shift(-1))
.rename(columns={'a1':'a'})
)
输出:
a b c d a
0 0 1 2 3 4.0
1 4 5 6 7 8.0
2 8 9 10 11 NaN
Iam收到此错误:ValueError:无法将大小为2348的数组重塑为形状(5)@NajamShah-如果检查模
2348%5=3
,则意味着必须删除最后3个值才能工作。或者需要添加缺少的值以结束,就像最后一行应该通过data,data,data,NaN,NaN
?@jezrael如果不是上述错误,这会给出正确的结果吗?例如,这不会重复使用第1行的RESP列作为第2行的第一列,然后所有内容都会使一列的顺序发生变化…@JonClements-你是对的,似乎更复杂。对不起,我的错误,我不想重复RESP againa,你添加了示例数据的导出输出,也是第3行?您是否需要重复新数据帧中上一列的RESP
值?yop,可能应该解释doublea
列,而不是,因为选择问题
a b c d a
0 0 1 2 3 4.0
1 4 5 6 7 8.0
2 8 9 10 11 NaN