Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/performance/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Excel 将列(A)与其他列(B)进行比较,并返回列(A)中存在的唯一值_Excel_Performance_Python 3.x_Pandas_Ipython - Fatal编程技术网

Excel 将列(A)与其他列(B)进行比较,并返回列(A)中存在的唯一值

Excel 将列(A)与其他列(B)进行比较,并返回列(A)中存在的唯一值,excel,performance,python-3.x,pandas,ipython,Excel,Performance,Python 3.x,Pandas,Ipython,我在比较这两列数据时遇到了一个问题,数据中包含大约5到6个单元格。我使用了countif公式来检查A列和B列中是否存在值。但是,计算需要花费大量时间,因此我停止了使用excel进行该任务。我在大熊猫身上找到了另一种方法 是否可以通过比较B列找到A列中的唯一值列表。请建议 A栏:585256 B栏:556245 嘿,使用默认的python数据结构是非常简单的 下面是返回集合差异的简单代码段 def get_difference(file_1, file_2): data_1 = set(o

我在比较这两列数据时遇到了一个问题,数据中包含大约5到6个单元格。我使用了countif公式来检查A列和B列中是否存在值。但是,计算需要花费大量时间,因此我停止了使用excel进行该任务。我在大熊猫身上找到了另一种方法

是否可以通过比较B列找到A列中的唯一值列表。请建议

A栏:585256

B栏:556245


嘿,使用默认的python数据结构是非常简单的

下面是返回集合差异的简单代码段

def get_difference(file_1, file_2):
    data_1 = set(open(file_1, encoding='utf-8').read().splitlines())
    data_2 = set(open(file_2, encoding='utf-8').read().splitlines())
    return data_1 - data_2

我已经用大约500000行的数据检查了性能。脚本在2秒内生成结果

抱歉,您可以发布一个具有代表性的示例数据和代码来显示您的df和所需结果吗?这里有
unique()
,它将为您提供所有唯一的值,您可以使用
isin()
来测试成员资格