Python 用于突出显示组内的独特观察结果的函数
我想帮助创建一个函数,该函数按组(非指定颜色)动态迭代数据帧,查看ID,看看哪个ID与每个按颜色分组的ID中的大多数ID是否不一致(因此,无论每种颜色有多少个观察值,都等于每种颜色填充id的一半以上,在这种情况下都是正确的)。真实的数据集很可能每种颜色有10-50行,并且可能有多个实例存在不合适的id。如果我们可以包含字符串注释“用于以后研究的标志”,或者如果更简单,则可以使用简单的0/1输出,并且我可以编写相应的文本功能,那将是非常棒的。我很难确定在何处使用这些标记使用groupby nunique函数或循环或将两者结合起来的东西Python 用于突出显示组内的独特观察结果的函数,python,pandas,unique,Python,Pandas,Unique,我想帮助创建一个函数,该函数按组(非指定颜色)动态迭代数据帧,查看ID,看看哪个ID与每个按颜色分组的ID中的大多数ID是否不一致(因此,无论每种颜色有多少个观察值,都等于每种颜色填充id的一半以上,在这种情况下都是正确的)。真实的数据集很可能每种颜色有10-50行,并且可能有多个实例存在不合适的id。如果我们可以包含字符串注释“用于以后研究的标志”,或者如果更简单,则可以使用简单的0/1输出,并且我可以编写相应的文本功能,那将是非常棒的。我很难确定在何处使用这些标记使用groupby nuni
- 正如您在下面看到的,在“note”列中,我留下的注释(稍后研究的标志)对应的id与其相应颜色分组中的其他id不同
color id commitment Note *(where i need help)
blue 1 10
blue 1 5
blue 1 15
blue 2 10 Flag for later research
blue 1 9
green 3 10
green 3 11
green 2 12 Flag for later research
green 3 15
IIUC:
提供您的:
color id commitment Note
0 blue 1 10 False
1 blue 1 5 False
2 blue 1 15 False
3 blue 2 10 True
4 blue 1 9 False
5 green 3 10 False
6 green 3 11 False
7 green 2 12 True
8 green 3 15 False
color id commitment Note
0 blue 1 10 False
1 blue 1 5 False
2 blue 1 15 False
3 blue 2 10 True
4 blue 1 9 False
5 green 3 10 False
6 green 3 11 False
7 green 2 12 True
8 green 3 15 False