Python 如何对不符合';我记不起来了?
我有一些大的(20GB+)CSV文件,它们是双引号“文本限定的,我需要排序并输出到新文件 有些文件只是按一列数字排序,而其他文件则按两列排序,第一列按数字排序,第二列按字符串排序 到目前为止,我已经尝试了Pythons csv排序,但最终由于内存不足而失败。还有CoreUtils for Windows,尽管排序似乎无法处理文本限定符,并且给出了错误的结果Python 如何对不符合';我记不起来了?,python,sorting,csv,windows-server-2008,Python,Sorting,Csv,Windows Server 2008,我有一些大的(20GB+)CSV文件,它们是双引号“文本限定的,我需要排序并输出到新文件 有些文件只是按一列数字排序,而其他文件则按两列排序,第一列按数字排序,第二列按字符串排序 到目前为止,我已经尝试了Pythons csv排序,但最终由于内存不足而失败。还有CoreUtils for Windows,尽管排序似乎无法处理文本限定符,并且给出了错误的结果 是否有任何推荐的/现有的解决方案可以处理这种排序?平台是Windows Server 2008 R2。这里您需要一些外部排序技巧。其想法是创
是否有任何推荐的/现有的解决方案可以处理这种排序?平台是Windows Server 2008 R2。这里您需要一些外部排序技巧。其想法是创建较小的排序文件,然后逐个排序并保存在新文件中。下面是一个快速摘要
因此,我能够在一台8GB的机器上,在2-3小时内对40GB的文件进行排序,该机器还运行着其他几个进程。这里您需要一些外部排序技巧。其想法是创建较小的排序文件,然后逐个排序并保存在新文件中。下面是一个快速摘要
因此,我能够在一台8GB的机器上,在2-3小时内对一个40GB的文件进行排序,这台机器还运行着其他几个进程。您可以将其加载到数据库中,排序,然后导出您可以将其加载到数据库中,排序,然后导出