如何在python中搜索文件中的字符?
我有一个将近1500行的文件,其中包含像&&^%&^a%&@^%*&^这样的符号,以及整个文件中的两三个字母如何在python中搜索文件中的字符?,python,file-io,alphabet,Python,File Io,Alphabet,我有一个将近1500行的文件,其中包含像&&^%&^a%&@^%*&^这样的符号,以及整个文件中的两三个字母 如何在这样的文件中搜索这些字母,并在o/p屏幕上显示找到的字母。最快的方法可能是 import re with open("giantfile.txt") as infile: print(re.findall("[A-Za-z]+", infile.read())) 也许最快的方法就是 import re with open("giantfile.txt") as infil
如何在这样的文件中搜索这些字母,并在o/p屏幕上显示找到的字母。最快的方法可能是
import re
with open("giantfile.txt") as infile:
print(re.findall("[A-Za-z]+", infile.read()))
也许最快的方法就是
import re
with open("giantfile.txt") as infile:
print(re.findall("[A-Za-z]+", infile.read()))
基于Tim的答案,您可以使用此代码来节省一些内存
import re
alphas = []
with open("giantfile.txt") as infile:
for row in infile:
alphas.extend(re.findall("[A-Za-z]+", row))
print alphas
给定此输入文件:
aaa
bbb
c12d
输出将是
['aaa', 'bbb', 'c', 'd']
基于Tim的答案,您可以使用此代码来节省一些内存
import re
alphas = []
with open("giantfile.txt") as infile:
for row in infile:
alphas.extend(re.findall("[A-Za-z]+", row))
print alphas
给定此输入文件:
aaa
bbb
c12d
输出将是
['aaa', 'bbb', 'c', 'd']
如果字母A,B和C散布在这个巨大的文件中,你想输出ABC吗?是的,或者像A,B,C…我的意思是说任何像A,B,C这样的字符。。。。z可以出现在这个文件中,o/p应该显示其中的字符,如d,e应该是o/p,如果文件内容是&&^&%$^%$d ^&^%&*e*那么如果字母A、B和C散布在这个巨大的文件中,你想输出ABC吗?是的,或者类似于A、B、C……我的意思是说任何字符,如A、B、C。。。。z可以出现在这个文件中,o/p应该像d一样显示文件中的字符,e应该是o/p,如果文件内容是&&^&%$^%$d ^&^%&*e*@tobias_k:也许更愿意以大的块读取文件。但是,是的,这取决于文件的结构。@tobias_k:也许更喜欢大块地读取文件。但这取决于文件的结构。