在Python中消除句子中的数字
我正在解析一个xml文件,并试图为xml中的每个上下文构建一个字典。我已经成功地完成了解析,现在我需要从我得到的字符串中去掉停止词、标点符号和数字 然而,由于某些原因,我无法摆脱这些数字,我已经调试了一整晚,希望有人能帮我在Python中消除句子中的数字,python,Python,我正在解析一个xml文件,并试图为xml中的每个上下文构建一个字典。我已经成功地完成了解析,现在我需要从我得到的字符串中去掉停止词、标点符号和数字 然而,由于某些原因,我无法摆脱这些数字,我已经调试了一整晚,希望有人能帮我 def is_number(s): try: float(s) return True except ValueError: return False 我一直在检查“is_number”方法是否有效,但我不知道
def is_number(s):
try:
float(s)
return True
except ValueError:
return False
我一直在检查“is_number”方法是否有效,但我不知道为什么它仍然可以通过if语句:
if (words[headIndex + index] not in cachedStopWords) and ~isNumber:
提前谢谢 问题是:
~isNumber
~
是最新版本。您想要的是而不是:
按位运算符将导致~isNumber
始终是一个真实值(-1
或-2
),因此输入if
语句。为什么不使用@Julius,因为我正在检查的字符串可能没有被单独编码
>>> ~True
-2
>>> ~False
-1
>>> not True
False
>>> not False
True