Python 如何过滤Coulmns,即使列中的单个值不是NaN
我有一个包含500行和502列的熊猫数据框架,下面是列名的简要展望:Python 如何过滤Coulmns,即使列中的单个值不是NaN,python,pandas,dataframe,filter,pycharm,Python,Pandas,Dataframe,Filter,Pycharm,我有一个包含500行和502列的熊猫数据框架,下面是列名的简要展望: ['cluster', 'question1', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, ....,500] 群集-群集编号 问题1-表示文本数据 列(0-500)-包含500个问题中每个问题的余弦相似度值 对于每个问题,我只想过滤那些余弦值大于0.5(比如x)且小于1的行以及任何其他问题 我已经尝试了下面一组用于过滤数据的代码 filter_boolean = final_df[(final_d
['cluster', 'question1', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, ....,500]
群集-群集编号
问题1-表示文本数据
列(0-500)-包含500个问题中每个问题的余弦相似度值
对于每个问题,我只想过滤那些余弦值大于0.5(比如x)且小于1的行以及任何其他问题
我已经尝试了下面一组用于过滤数据的代码
filter_boolean = final_df[(final_df.iloc[:,2:] > 0.5) &(final_df.iloc[:,2:] < 1)]
filter\u boolean=final\u df[(final\u df.iloc[:,2:]>0.5)和(final\u df.iloc[:,2:<1)]
预期和实际结果如下图所示
函数使用轴
和如何
参数来解决此用例
要在列上使用dropna
,请使用axis=1
(而不是在行上操作的默认值axis=0
)
要删除'any'
是NaN
的位置,请使用how
关键字和特殊的'any'
这应该能解决你的问题
您也可以使用布尔过滤器来实现这一点,但是dropna
可能会更清晰地为其他人和您自己阅读