Python 从文本文件中搜索行中的单词时,某些单词不';他没有出现

Python 从文本文件中搜索行中的单词时,某些单词不';他没有出现,python,string,python-2.7,word,Python,String,Python 2.7,Word,下面的代码逐行搜索文本文件,以过滤坏行并将好行添加到新文件中。出于某种原因,该文件只返回带“-”的行,而不响应任何其他单词 此代码是否存在可能导致这种情况发生的问题?还是更可能是文本文件有问题 import re new=open('FilteredData.txt', 'w') f=open('ClusteredData.txt', 'r') line = f.readline() while line: reResult = re.search(r'-',line, re.I)

下面的代码逐行搜索文本文件,以过滤坏行并将好行添加到新文件中。出于某种原因,该文件只返回带“-”的行,而不响应任何其他单词

此代码是否存在可能导致这种情况发生的问题?还是更可能是文本文件有问题

import re
new=open('FilteredData.txt', 'w')
f=open('ClusteredData.txt', 'r')
line = f.readline()

while line:
    reResult = re.search(r'-',line, re.I)
    reResult1 = re.search(r'by', line, re.I)
    reResult2=re.search(r'ft', line, re.I)
    reResult3=re.search(r'feat', line, re.I)
    reResult4=re.search(r'f\.', line, re.I)

    if reResult or reResult1 or reResult2 or reResult3 or reResult4:
        new.write(line)

    line = f.readline()

由于文本编码问题,我以前也遇到过类似的问题。代码在我看来很好,我已经在一个文本文件上运行了它,没有任何非ascii字符,使用UTF-8编码,它可以工作。你的新文本文件有什么乱七八糟的地方吗?如果有,可能是文本文件本身有问题。尝试检查您的文本是否使用正确的编码


也许可以尝试在文本文件的一小部分上运行代码,看看它是否有效。

显示你的新文件它不会让我显示它,因为它包含很多链接,这些是从twitter API中提取的tweet。你为什么要进行5次不同的
重新搜索?您可以创建一个与所有规则匹配的regexp
r'-|by | ft | feat | f\.
进行错误检查,我只是从未更改过它。我知道我没有得到足够的结果,所以我将其拆分以进行检查。请尝试打印每个
reResultX
值以查看它们是什么。谢谢您,这起到了作用,我使用UTF-16将其更改为UTF-8。