Python 从文本文件中搜索行中的单词时，某些单词不'；他没有出现_Python_String_Python 2.7_Word

Python 从文本文件中搜索行中的单词时，某些单词不'；他没有出现

python string python-2.7

Python 从文本文件中搜索行中的单词时，某些单词不'；他没有出现,python,string,python-2.7,word,Python,String,Python 2.7,Word,下面的代码逐行搜索文本文件，以过滤坏行并将好行添加到新文件中。出于某种原因，该文件只返回带“-”的行，而不响应任何其他单词此代码是否存在可能导致这种情况发生的问题？还是更可能是文本文件有问题 import re new=open('FilteredData.txt', 'w') f=open('ClusteredData.txt', 'r') line = f.readline() while line: reResult = re.search(r'-',line, re.I)

下面的代码逐行搜索文本文件，以过滤坏行并将好行添加到新文件中。出于某种原因，该文件只返回带“-”的行，而不响应任何其他单词

此代码是否存在可能导致这种情况发生的问题？还是更可能是文本文件有问题

import re
new=open('FilteredData.txt', 'w')
f=open('ClusteredData.txt', 'r')
line = f.readline()

while line:
    reResult = re.search(r'-',line, re.I)
    reResult1 = re.search(r'by', line, re.I)
    reResult2=re.search(r'ft', line, re.I)
    reResult3=re.search(r'feat', line, re.I)
    reResult4=re.search(r'f\.', line, re.I)

    if reResult or reResult1 or reResult2 or reResult3 or reResult4:
        new.write(line)

    line = f.readline()

由于文本编码问题，我以前也遇到过类似的问题。代码在我看来很好，我已经在一个文本文件上运行了它，没有任何非ascii字符，使用UTF-8编码，它可以工作。你的新文本文件有什么乱七八糟的地方吗？如果有，可能是文本文件本身有问题。尝试检查您的文本是否使用正确的编码

也许可以尝试在文本文件的一小部分上运行代码，看看它是否有效。

显示你的新文件它不会让我显示它，因为它包含很多链接，这些是从twitter API中提取的tweet。你为什么要进行5次不同的

重新搜索？您可以创建一个与所有规则匹配的regexpr'-|by | ft | feat | f\.
进行错误检查，我只是从未更改过它。我知道我没有得到足够的结果，所以我将其拆分以进行检查。请尝试打印每个reResultX
值以查看它们是什么。谢谢您，这起到了作用，我使用UTF-16将其更改为UTF-8。