Python 有没有办法知道panda`to_csv`在很长的数据库中的状态？_Python_Pandas

Python 有没有办法知道panda`to_csv`在很长的数据库中的状态？

python pandas

Python 有没有办法知道panda`to_csv`在很长的数据库中的状态？,python,pandas,Python,Pandas,在Pandas中，我有一个非常大的数据帧，我正试图将其写入CSV文件。这需要很长时间（几个小时，还没有完成），我想知道是否有任何方法可以检查这个命令中的完成百分比我在中查找了所有参数，但似乎没有任何帮助 pd.to\u csv（'thefile.csv'，chunksize=1000）我想要状态、区块编号等的任何时间。如果编写数据帧需要几个小时，那么正如@AntonvBR所建议的，您应该寻找更好的替代方案如果您仍然想坚持使用csv，您可以拆分数据帧并编写它。通过这种方式，您还将了解其进展

在Pandas中，我有一个非常大的数据帧，我正试图将其写入CSV文件。这需要很长时间（几个小时，还没有完成），我想知道是否有任何方法可以检查这个命令中的完成百分比

我在

中查找了所有参数，但似乎没有任何帮助

pd.to\u csv（'thefile.csv'，chunksize=1000）

我想要状态、区块编号等的任何时间。
如果编写数据帧需要几个小时，那么正如@AntonvBR所建议的，您应该寻找更好的替代方案
如果您仍然想坚持使用csv，您可以拆分数据帧并编写它。通过这种方式，您还将了解其进展情况。这是代码
import pandas as pd
import numpy as np

df_split = np.array_split(df, 10) # Choose a bigger number

for i in range(0,10): # Use the number of splits
    print(i)
    df_split[i].to_csv("the_file.csv", mode='a', header=False)

几个小时听起来很累。我可以问一下，为什么要在csv文件中存储这么多的数据？你考虑过用数据库来代替吗？或者如果你想在Python中重用它，pickle？我需要记住磁盘空间，所以我选择了CSV。我听说压缩后的CSV占用了最小的磁盘空间，如果这是不正确的，我希望听到更多的信息。您的DF中有什么样的数据类型？我建议使用拼花或HDF5二进制格式-它们更快，所有熊猫数据类型都是本机支持的，它们支持快速压缩，等等。我只使用CSV，没有其他选择。我有文本文件，将查看拼花地板，谢谢！！谢谢，我不知道你可以附加。在mode下的docs中，它有“mode:str Python write mode，默认值为“w”，我不知道这是什么意思。