Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/file/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 快速阅读大量列表_Python_File_Merge_Large Data - Fatal编程技术网

Python 快速阅读大量列表

Python 快速阅读大量列表,python,file,merge,large-data,Python,File,Merge,Large Data,我想合并2>GB大小的文件。每个文件包含交替的行标识符和值。合并意味着:如果标识符仅在任一文件中找到,或者在两个文件中都找到并且值相同,则保留该值。如果在两个文件中都找到了标识符,但其值不同,则拒绝该标识符。标识符和值都是字符串 我知道这听起来很简单,但我对python的知识的缺乏只会导致解决方案的运行时间非常长。任何关于更快的方法的提示都很好。您能提供一个文件的简要示例并描述您目前的解决方案吗?这似乎是一项数据库任务。看起来您可以将文件加载到数据库中,并进行连接以高效地查找不冲突的值。免责声明

我想合并2>GB大小的文件。每个文件包含交替的行标识符和值。合并意味着:如果标识符仅在任一文件中找到,或者在两个文件中都找到并且值相同,则保留该值。如果在两个文件中都找到了标识符,但其值不同,则拒绝该标识符。标识符和值都是字符串


我知道这听起来很简单,但我对python的知识的缺乏只会导致解决方案的运行时间非常长。任何关于更快的方法的提示都很好。

您能提供一个文件的简要示例并描述您目前的解决方案吗?这似乎是一项数据库任务。看起来您可以将文件加载到数据库中,并进行连接以高效地查找不冲突的值。免责声明:我从未使用过数据库。这可能是个坏主意。这些文件分类了吗?它们是什么类型的文件?ascii码?还是一些奇特的二进制格式?文件的内部结构是什么,关于它的更多细节也可能有用,比如几行左右的例子。