Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/355.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 逐行比较两个未排序的文件,只比较文件1和文件2中的输出行,而不比较文件1中的输出行_Php_Python_Grep - Fatal编程技术网

Php 逐行比较两个未排序的文件,只比较文件1和文件2中的输出行,而不比较文件1中的输出行

Php 逐行比较两个未排序的文件,只比较文件1和文件2中的输出行,而不比较文件1中的输出行,php,python,grep,Php,Python,Grep,我需要逐行比较两个未排序的文件,并且只比较文件1和文件2中的输出行,而不是文件1中的输出行。基本上,从两个文件中的每个文件中为我提供新的+相同的字符串,并排除旧的/不存在的字符串 我需要在一些非常大的文件上这样做。(10+GB)(约1000000行) 我尝试了以下几种选择,但没有任何东西能满足我的需求: join -v1 -v2 <(sort File1.txt) <(sort File2.txt) > File3.txt 这是可行的,但正如您所知,在处理大型文件时速度非常慢

我需要逐行比较两个未排序的文件,并且只比较文件1和文件2中的输出行,而不是文件1中的输出行。基本上,从两个文件中的每个文件中为我提供新的+相同的字符串,并排除旧的/不存在的字符串

我需要在一些非常大的文件上这样做。(10+GB)(约1000000行)

我尝试了以下几种选择,但没有任何东西能满足我的需求:

join -v1 -v2 <(sort File1.txt) <(sort File2.txt) > File3.txt
这是可行的,但正如您所知,在处理大型文件时速度非常慢,并且不是一个真正的选项

区分大小写会很好,但根本不需要。我之所以提到这一点,是因为在我的研究中,我发现如果比较不区分大小写,它将大大加快搜索速度


请提前再次感谢。

不清楚您想做什么,但请尝试以下操作:

comm <(sort File1.txt) <(sort File2.txt)

comm显示示例输入和该示例输入所需的输出。例如,每个文件都包含一个随机绝对URL列表。我不理解第一句话。一行怎么可能在文件1和文件2中,但不在文件1中?要查看文件1和文件2中,但不在文件1中的
行,只需执行
cat/dev/null
。要查看两个文件中的
New+相同字符串,并排除旧的/不存在的字符串
,只需执行
cat file2
。考虑一下,然后编辑您的问题,告诉我们您真正想要什么,并提供示例输入和预期输出。
comm <(sort File1.txt) <(sort File2.txt)