Pandas 添加到系列中而不重复的有效方法_Pandas

Pandas 添加到系列中而不重复的有效方法

pandas

Pandas 添加到系列中而不重复的有效方法,pandas,Pandas,我需要经常向数据帧（或者更高效的序列）添加一个，同时确保添加不会产生重复。随着dataframe的增长，这似乎会变得效率低下，只需将其合并，然后调用drop_duplicates，因为每次添加都需要检查整个数据集的重复项数据只有两列，所以我猜将其中一列转换为索引可能会加快速度。（或将两列合并为层次索引）。熊猫有办法禁止重复索引吗下面是一个示例问题： print accumulating_result c1 c2 0 A x1 1 B x2 2 B x3 3 C x4

我需要经常向数据帧（或者更高效的序列）添加一个，同时确保添加不会产生重复。随着dataframe的增长，这似乎会变得效率低下，只需将其合并，然后调用drop_duplicates，因为每次添加都需要检查整个数据集的重复项

数据只有两列，所以我猜将其中一列转换为索引可能会加快速度。（或将两列合并为层次索引）。熊猫有办法禁止重复索引吗

下面是一个示例问题：

print accumulating_result
  c1  c2
0  A  x1
1  B  x2
2  B  x3
3  C  x4

print new
  c1  c2
0  B  x3
1  C  x4
2  C  x5

执行向结果中添加新内容并获得：

print accumulating_result
  c1  c2
0  A  x1
1  B  x2
2  B  x3
3  C  x4
4  C  x5

无论如何，c2列中的每个条目都是唯一的

有什么想法吗？

您可以使用

先组合（）
输出：
   c1
c2   
x1  A
x2  B
x3  B
x4  C
x5  Z

但is每次都会复制所有数据。也许使用HDF5或数据库更好。谢谢。如果没有适当的方法进行操作，那么这个答案就足够了。我会试试看我是否有足够的内存或时间。
   c1
c2   
x1  A
x2  B
x3  B
x4  C
x5  Z