Python 有没有办法知道panda`to_csv`在很长的数据库中的状态?

Python 有没有办法知道panda`to_csv`在很长的数据库中的状态?,python,pandas,Python,Pandas,在Pandas中,我有一个非常大的数据帧,我正试图将其写入CSV文件。这需要很长时间(几个小时,还没有完成),我想知道是否有任何方法可以检查这个命令中的完成百分比 我在中查找了所有参数,但似乎没有任何帮助 pd.to\u csv('thefile.csv',chunksize=1000) 我想要状态、区块编号等的任何时间。如果编写数据帧需要几个小时,那么正如@AntonvBR所建议的,您应该寻找更好的替代方案 如果您仍然想坚持使用csv,您可以拆分数据帧并编写它。通过这种方式,您还将了解其进展

在Pandas中,我有一个非常大的数据帧,我正试图将其写入CSV文件。这需要很长时间(几个小时,还没有完成),我想知道是否有任何方法可以检查这个命令中的完成百分比

我在
中查找了所有参数,但似乎没有任何帮助

pd.to\u csv('thefile.csv',chunksize=1000)


我想要状态、区块编号等的任何时间。

如果编写数据帧需要几个小时,那么正如@AntonvBR所建议的,您应该寻找更好的替代方案

如果您仍然想坚持使用csv,您可以拆分数据帧并编写它。通过这种方式,您还将了解其进展情况。这是代码

import pandas as pd
import numpy as np

df_split = np.array_split(df, 10) # Choose a bigger number

for i in range(0,10): # Use the number of splits
    print(i)
    df_split[i].to_csv("the_file.csv", mode='a', header=False)

几个小时听起来很累。我可以问一下,为什么要在csv文件中存储这么多的数据?你考虑过用数据库来代替吗?或者如果你想在Python中重用它,pickle?我需要记住磁盘空间,所以我选择了CSV。我听说压缩后的CSV占用了最小的磁盘空间,如果这是不正确的,我希望听到更多的信息。您的DF中有什么样的数据类型?我建议使用拼花或HDF5二进制格式-它们更快,所有熊猫数据类型都是本机支持的,它们支持快速压缩,等等。我只使用CSV,没有其他选择。我有文本文件,将查看拼花地板,谢谢!!谢谢,我不知道你可以附加。在mode下的docs中,它有“mode:str Python write mode,默认值为“w”,我不知道这是什么意思。