Python-如何在文本文件中使用正则表达式搜索词

Python-如何在文本文件中使用正则表达式搜索词,python,regex,function,Python,Regex,Function,我对编码非常陌生,所以如果有任何帮助,我将不胜感激 所以我这里有一个正则表达式函数来查找.txt文件中的某些术语 函数返回正则表达式 所有.txt文件都有不同的数字(如4410、4408、4405等),下一个字符串始终是一个字母,后跟7个数字(即C90253453、D0004323、N1235423) 查找四个编号序列的功能是: #this function finds 44xx, it's meant to stop at Mxxxxxxx found_stuff = fin

我对编码非常陌生,所以如果有任何帮助,我将不胜感激

所以我这里有一个正则表达式函数来查找.txt文件中的某些术语

函数返回正则表达式 所有.txt文件都有不同的数字(如4410、4408、4405等),下一个字符串始终是一个字母,后跟7个数字(即C90253453、D0004323、N1235423)

查找四个编号序列的功能是:

    #this function finds 44xx, it's meant to stop at Mxxxxxxx 
    found_stuff = find_regex('44\d{2}', ('\s\d{7}'), page_words_raw)

当我运行它时,它返回4407,但不在C0243543处停止。有什么方法可以解决这个问题吗?

如果您能够容忍将整个文件读入Python,那么您的需求就很容易使用
re.findall

text = """4410 C90253453 4408 D0004323 4405 N1235423"""
nums = re.findall(r'\b(\d{4})\s+[A-Z]\d+\b', text)
print(nums)
这张照片是:

['4410', '4408', '4405']

您在这里期望的确切输出是什么?
['4410', '4408', '4405']