Pandas 用于自动停止打印的重复数据消除设置

Pandas 用于自动停止打印的重复数据消除设置,pandas,Pandas,是否有用于自动停止打印的重复数据消除设置。它总是打印出来 Importing data ... Reading from link_dataframes_learned_settings Clustering... # duplicate sets x 我希望它不打印任何内容。我是熊猫重复数据消除的维护者之一 谢谢你对图书馆感兴趣。 目前没有停止自动打印的设置 如果这是您工作的一个基本特性,请随时在上打开一个问题。此外,如果您愿意,我们很高兴收到PR。实际上,即使不修改库,也可以停止这些打印

是否有用于自动停止打印的重复数据消除设置。它总是打印出来

Importing data ...
Reading from link_dataframes_learned_settings
Clustering...
# duplicate sets x


我希望它不打印任何内容。

我是熊猫重复数据消除的维护者之一

谢谢你对图书馆感兴趣。 目前没有停止自动打印的设置


如果这是您工作的一个基本特性,请随时在上打开一个问题。此外,如果您愿意,我们很高兴收到PR。

实际上,即使不修改库,也可以停止这些打印邮件。使用一个上下文管理器,它会吞噬打印的输出,这样它就不会进入你的屏幕

导入上下文库
使用contextlib.redirect\u stdout(无):
#这里的任何代码(比如调用库函数)都不会打印任何内容。
df_final=pandas_duplicate.duplicate_数据帧(df,['first_name','last_name','middle_initial'])
打印(“我仍然希望打印这行。”)

重定向\u stdout
通常用于将打印输出发送到其他文件或标准错误流。如果您改为提供
None
作为参数,则输出将无效。

对不起,您可以解释一下吗?谢谢Arya。我同意这是个好把戏。可能在将来帮助他人的快速评论:我要提醒用户,只有在重复数据消除(或链接dataframe)且数据已使用主动学习进行标记(即已创建了.*u设置和.*u json文件)时,此功能才起作用。否则,该库将无法工作。此外,用户不会知道使用了哪个*\u设置文件,也不会知道库当前正在执行哪些步骤。对于某些用户来说,这可能并不理想。如果用户不希望打印任何内容(“我希望它不打印任何内容”),我假设他们知道不知道正在执行哪个步骤的风险。这对于任何程序都是正确的,不仅仅是那些使用你的软件包的程序;您的评论可能会错误地让读者相信,这个简单的上下文管理器在您何时可以使用它,或者在您的库被使用时是否可以工作方面都是有限的。我想澄清一下。pandas-Duplicate在主动学习期间使用
input()
功能。如果使用
contextlib
运行
input()
,可能会出现错误。这是我目前从设置中得到的。我的警告很简单。正如我在之前的评论中所说,你的回答很好。我同意这一点。我不知道你为什么这么生气。这是我对这篇文章的最后一点评论。和平。