Python 如何在熊猫数据帧中找到最大值并为其指定新值?

Python 如何在熊猫数据帧中找到最大值并为其指定新值?,python,pandas,dataframe,Python,Pandas,Dataframe,这是我的熊猫数据框熊猫数据框 ID Position Time(in Hours) Date 01 18 2 01/01/2016 01 21 4 01/10/2016 01 19 2 01/10/2016 05 19 5 01/10/2

这是我的熊猫数据框熊猫数据框

ID          Position   Time(in Hours) Date
01          18          2             01/01/2016
01          21          4             01/10/2016
01          19          2             01/10/2016
05          19          5             01/10/2016
05          21          1             01/10/2016
05          19          8             01/10/2016
02          19          18            02/10/2016
02          35          11            02/10/2016
我需要为每个Id和日期分配“1”作为最长时间,否则分配“0”。 我的代码是

def find_max(db7):
max_row = db7['Time'].max()
labels = np.where((db7['Time_in_Second'] == max_row),'1','0')
return max_row

db7['Max'] = db7['Time'].map(find_max)
但我的错误率越来越低。请问我该怎么做

TypeError:“float”对象不可下标

我的预期产出应该是:

ID          Position   Time(in Hours) Date        Max
01          18          2             01/01/2016  0
01          21          4             01/10/2016  1
01          19          2             01/10/2016  0
05          19          5             01/10/2016  0
05          21          1             01/10/2016  0
05          19          8             01/10/2016  1
02          19          18            02/10/2016  1
02          35          11            02/10/2016  0
max
一起使用,并用于分配新值:

max1 = db7.groupby(['ID','Date'])['Time(in Hours)'].transform('max')
db7['Max'] = np.where(db7['Time(in Hours)'].eq(max1), '1', '0')
print (db7)
   ID  Position  Time(in Hours)        Date Max
0   1        18               2  01/01/2016   1
1   1        21               4  01/10/2016   1
2   1        19               2  01/10/2016   0
3   5        19               5  01/10/2016   0
4   5        21               1  01/10/2016   0
5   5        19               8  01/10/2016   1
6   2        19              18  02/10/2016   1
7   2        35              11  02/10/2016   0
或者将
True
s和
False
s转换为
'1'
'0'
,方法是双击
astype

max1 = db7.groupby(['ID','Date'])['Time(in Hours)'].transform('max')
db7['Max'] = db7['Time(in Hours)'].eq(max1).astype(int).astype(str)
print (db7)
   ID  Position  Time(in Hours)        Date  Max
0   1        18               2  01/01/2016    1
1   1        21               4  01/10/2016    1
2   1        19               2  01/10/2016    0
3   5        19               5  01/10/2016    0
4   5        21               1  01/10/2016    0
5   5        19               8  01/10/2016    1
6   2        19              18  02/10/2016    1
7   2        35              11  02/10/2016    0
详情:

print (max1)
0     2
1     4
2     4
3     8
4     8
5     8
6    18
7    18
Name: Time(in Hours), dtype: int64

#eq is same as ==
print (db7['Time(in Hours)'].eq(max1))
0     True
1     True
2    False
3    False
4    False
5     True
6     True
7    False
Name: Time(in Hours), dtype: bool
编辑:

如果需要仅按列分组
ID

max1 = db7.groupby('ID')['Time(in Hours)'].transform('max')
db7['Max'] = np.where(db7['Time(in Hours)'].eq(max1), '1', '0')
print (db7)
   ID  Position  Time(in Hours)        Date Max
0   1        18               2  01/01/2016   0
1   1        21               4  01/10/2016   1
2   1        19               2  01/10/2016   0
3   5        19               5  01/10/2016   0
4   5        21               1  01/10/2016   0
5   5        19               8  01/10/2016   1
6   2        19              18  02/10/2016   1
7   2        35              11  02/10/2016   0

print (max1)
0     4
1     4
2     4
3     8
4     8
5     8
6    18
7    18
Name: Time(in Hours), dtype: int64
max
一起使用,并用于分配新值:

max1 = db7.groupby(['ID','Date'])['Time(in Hours)'].transform('max')
db7['Max'] = np.where(db7['Time(in Hours)'].eq(max1), '1', '0')
print (db7)
   ID  Position  Time(in Hours)        Date Max
0   1        18               2  01/01/2016   1
1   1        21               4  01/10/2016   1
2   1        19               2  01/10/2016   0
3   5        19               5  01/10/2016   0
4   5        21               1  01/10/2016   0
5   5        19               8  01/10/2016   1
6   2        19              18  02/10/2016   1
7   2        35              11  02/10/2016   0
或者将
True
s和
False
s转换为
'1'
'0'
,方法是双击
astype

max1 = db7.groupby(['ID','Date'])['Time(in Hours)'].transform('max')
db7['Max'] = db7['Time(in Hours)'].eq(max1).astype(int).astype(str)
print (db7)
   ID  Position  Time(in Hours)        Date  Max
0   1        18               2  01/01/2016    1
1   1        21               4  01/10/2016    1
2   1        19               2  01/10/2016    0
3   5        19               5  01/10/2016    0
4   5        21               1  01/10/2016    0
5   5        19               8  01/10/2016    1
6   2        19              18  02/10/2016    1
7   2        35              11  02/10/2016    0
详情:

print (max1)
0     2
1     4
2     4
3     8
4     8
5     8
6    18
7    18
Name: Time(in Hours), dtype: int64

#eq is same as ==
print (db7['Time(in Hours)'].eq(max1))
0     True
1     True
2    False
3    False
4    False
5     True
6     True
7    False
Name: Time(in Hours), dtype: bool
编辑:

如果需要仅按列分组
ID

max1 = db7.groupby('ID')['Time(in Hours)'].transform('max')
db7['Max'] = np.where(db7['Time(in Hours)'].eq(max1), '1', '0')
print (db7)
   ID  Position  Time(in Hours)        Date Max
0   1        18               2  01/01/2016   0
1   1        21               4  01/10/2016   1
2   1        19               2  01/10/2016   0
3   5        19               5  01/10/2016   0
4   5        21               1  01/10/2016   0
5   5        19               8  01/10/2016   1
6   2        19              18  02/10/2016   1
7   2        35              11  02/10/2016   0

print (max1)
0     4
1     4
2     4
3     8
4     8
5     8
6    18
7    18
Name: Time(in Hours), dtype: int64

请把我的期望值加进去。在您的结果中,第一行不会得到“1”吗?因为当我们比较前三行时,最大值将是4(以小时为单位)。然后使用
max1=db7.groupby('ID'['Time(以小时为单位))。transform('Max')
-仅按列分组
ID
。是的,这很好。谢谢如果我的答案有用,请不要忘记它-单击复选标记(
)旁边的答案将其从灰色变为填充。谢谢。我添加了我的预期输出。在您的结果中,第一行不会得到“1”?因为当我们比较前三行时,最大值将是4(时间单位为小时)。然后使用
max1=db7.groupby('ID'['Time(in Hours))。转换('Max')
-仅按列分组
ID
。是的,很好。谢谢如果我的答案有用,请不要忘记-单击复选标记(
),将其从灰色切换为已填写。谢谢。