Python 与熊猫和一张CSV表建立并创建多对多关系
我有一个csv,我导入了两个ID,ID1和ID2。两个ID之间存在多对多关系。最后,我想创建两个东西,一个摘要和两个列表,列出与单个组相关的所有可能的ID1和ID2 以下是我的一个示例:Python 与熊猫和一张CSV表建立并创建多对多关系,python,pandas,many-to-many,Python,Pandas,Many To Many,我有一个csv,我导入了两个ID,ID1和ID2。两个ID之间存在多对多关系。最后,我想创建两个东西,一个摘要和两个列表,列出与单个组相关的所有可能的ID1和ID2 以下是我的一个示例: ID1 ID2 0 46667523 9122532 1 55189732 9122532 2 71453880 9122532 3 77817617 9122532 4 77817617 79834910 5 79871820
ID1 ID2
0 46667523 9122532
1 55189732 9122532
2 71453880 9122532
3 77817617 9122532
4 77817617 79834910
5 79871820 9122532
6 79871820 79834910
7 98158277 9122532
8 98158277 458182615
9 134303192 9122532
10 187502299 458182615
这个小样本中的所有这些ID都表示一个分组。我想添加一个新的列ID_new,在这个例子中,它们都是相等的
ID1 ID2 ID_New
0 46667523 9122532 1
1 55189732 9122532 1
2 71453880 9122532 1
3 77817617 9122532 1
4 77817617 79834910 1
5 79871820 9122532 1
6 79871820 79834910 1
7 98158277 9122532 1
8 98158277 458182615 1
9 134303192 9122532 1
10 187502299 458182615 1
最终的数据集不是很大,可能有100000行,我如何创建和设置与熊猫的多对多关系?如果您需要其他数据/信息,请告诉我,我可以向您发送我正在使用的csv。您如何决定分组?
test=df[['ID2',ID1']
test1=test。删除重复项(子集=['ID1',ID2'])
您能提供更多关于您要做什么的信息吗?删除重复项是如何进行分组的?