Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/maven/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Pandas 检测具有不同ID的行';s但是重复的值_Pandas - Fatal编程技术网

Pandas 检测具有不同ID的行';s但是重复的值

Pandas 检测具有不同ID的行';s但是重复的值,pandas,Pandas,我有一个数据框,它从设备上收集读数。有时,同一个样本有多个读数,这些读数作为单独的ID存储在我的数据框中。有没有办法通过使用具有相同值的列来检测重复的ID 示例数据帧: test_df = {'ID': [1,2,3,4,5,6], 'Age': [18,18,19,19,20,21], 'Sex':['Male','Male','Female','Female','Male','Female'], 'Values':[1200,200, 300, 400, 500,600]} 我希望结果返回

我有一个数据框,它从设备上收集读数。有时,同一个样本有多个读数,这些读数作为单独的ID存储在我的数据框中。有没有办法通过使用具有相同值的列来检测重复的ID

示例数据帧:

test_df = {'ID': [1,2,3,4,5,6], 'Age': [18,18,19,19,20,21], 'Sex':['Male','Male','Female','Female','Male','Female'], 'Values':[1200,200, 300, 400, 500,600]}
我希望结果返回ID的
1,2,3,4
,因为当我们比较
Age
Sex
列值时,它们是重复的

预期产出:

ID    Age     Sex     Values
1     18      Male     1200
2     18      Male     200
3     19      Female   300
4     19      Female   400

提供您希望输出数据帧看起来像什么的示例,使用
subset
keep=False
参数:
test_-df[test_-df.duplicated(subset=['Age','Sex'],keep=False)]
我知道这是离题的,我可以获得数据帧中实际ID的计数吗?在这种情况下,我在test_df中的实际样本计数为4,其中
ID:1,3,5,6
,因为它们不同。您可以尝试len(test_df['ID'])来获得计数