Sorting 按列中的名称对数据帧中的数据进行排序
嗨,我在熊猫数据框中排序一些数据时遇到问题。数据的格式与我习惯的不同,我不知道如何使它工作。我要排序的数据采用以下格式:Sorting 按列中的名称对数据帧中的数据进行排序,sorting,python-3.x,pandas,dataframe,Sorting,Python 3.x,Pandas,Dataframe,嗨,我在熊猫数据框中排序一些数据时遇到问题。数据的格式与我习惯的不同,我不知道如何使它工作。我要排序的数据采用以下格式: [['2016-05-23', 'name1', 'data1'], ['2016-05-23', 'name2', 'data2'], ['2016-05-24', 'name1', 'data1'], ['2016-05-24', 'name2', 'data2'], ['2016-05-25', 'name1', 'data1'], ['2016-05-25', 'na
[['2016-05-23', 'name1', 'data1'],
['2016-05-23', 'name2', 'data2'],
['2016-05-24', 'name1', 'data1'],
['2016-05-24', 'name2', 'data2'],
['2016-05-25', 'name1', 'data1'],
['2016-05-25', 'name2', 'data2'],
['2016-05-26', 'name1', 'data1'],
['2016-05-26', 'name2', 'data2'],
['2016-05-27', 'name1', 'data1'],
['2016-05-27', 'name2', 'data2']]
我想做的是把它按日期分类,并把它的名字命名为ColumNames
[['2016-05-23, 'data1', 'data2'],
['2016-05-24', 'data1', 'data2'],
['2016-05-25', 'data1', 'data2'] and so on...]
如果可以使用一些特定的pandas命令来实现这一点,我还希望解决方案能够处理更多的内容,而不仅仅是两个name列。我不知道该怎么做,希望得到任何帮助。我认为您需要:
然后,如果需要,例如按列name1
:
import pandas as pd
df = pd.DataFrame([['2016-05-23', 'name1', 9],
['2016-05-23', 'name2', 4],
['2016-05-24', 'name1', 5],
['2016-05-24', 'name2', 1],
['2016-05-25', 'name1', 5],
['2016-05-25', 'name2', 7],
['2016-05-26', 'name1', 10],
['2016-05-26', 'name2', 7],
['2016-05-27', 'name1', 0],
['2016-05-27', 'name2', 1]], columns = ['a','b','c'])
print (df)
a b c
0 2016-05-23 name1 9
1 2016-05-23 name2 4
2 2016-05-24 name1 5
3 2016-05-24 name2 1
4 2016-05-25 name1 5
5 2016-05-25 name2 7
6 2016-05-26 name1 10
7 2016-05-26 name2 7
8 2016-05-27 name1 0
9 2016-05-27 name2 1
print (df.pivot(index='a', columns='b', values='c').sort_values('name1'))
b name1 name2
a
2016-05-27 0 1
2016-05-24 5 1
2016-05-25 5 7
2016-05-23 9 4
2016-05-26 10 7
有时pivot
不起作用,然后使用:
但是pivot\u表
使用aggfunc
,默认值为aggfunc=np。如果重复,则平均值为
。更好的解释与样品是和在
最后您可以和(在
pandas
0.18.0
中新增):
谢谢,这似乎很有效,有没有办法将其合并到新的数据帧中?我厌倦了在一个新的数据框中打印(df.pivot(index='a',columns='b',values='c')。sort_values('a'))以使其在日期上排序,但这不起作用,但是
a
是索引,它被排序了。。。如果没有,您可以使用df1=df.pivot(index='a',columns='b',values='c')。reset_index()。sort_values('a')
我还添加了将字符串列a转换为datetime的代码,请参见编辑。很抱歉,是我写错了。它似乎工作得很好。谢谢你的接受。很高兴能帮助你!祝你好运
#convert column a to datetime
df['a'] = pd.to_datetime(df.a)
print (df.pivot(index='a', columns='b', values='c'))
b name1 name2
a
2016-05-23 data1 data2
2016-05-24 data1 data2
2016-05-25 data1 data2
2016-05-26 data1 data2
2016-05-27 data1 data2
import pandas as pd
df = pd.DataFrame([['2016-05-23', 'name1', 9],
['2016-05-23', 'name2', 4],
['2016-05-24', 'name1', 5],
['2016-05-24', 'name2', 1],
['2016-05-25', 'name1', 5],
['2016-05-25', 'name2', 7],
['2016-05-26', 'name1', 10],
['2016-05-26', 'name2', 7],
['2016-05-27', 'name1', 0],
['2016-05-27', 'name2', 1]], columns = ['a','b','c'])
print (df)
a b c
0 2016-05-23 name1 9
1 2016-05-23 name2 4
2 2016-05-24 name1 5
3 2016-05-24 name2 1
4 2016-05-25 name1 5
5 2016-05-25 name2 7
6 2016-05-26 name1 10
7 2016-05-26 name2 7
8 2016-05-27 name1 0
9 2016-05-27 name2 1
print (df.pivot(index='a', columns='b', values='c').sort_values('name1'))
b name1 name2
a
2016-05-27 0 1
2016-05-24 5 1
2016-05-25 5 7
2016-05-23 9 4
2016-05-26 10 7
print (df.pivot_table(index='a', columns='b', values='c'))
print (df.pivot(index='a', columns='b', values='c')
.reset_index()
.rename_axis(None, axis=1))
a name1 name2
0 2016-05-23 9 4
1 2016-05-24 5 1
2 2016-05-25 5 7
3 2016-05-26 10 7
4 2016-05-27 0 1
#pandas bellow 0.18.0
df1 = df.pivot(index='a', columns='b', values='c').reset_index()
df1.columns.name = None
print (df1)
a name1 name2
0 2016-05-23 9 4
1 2016-05-24 5 1
2 2016-05-25 5 7
3 2016-05-26 10 7
4 2016-05-27 0 1