Python 用于从臃肿的描述中删除城市和州的正则表达式

Python 用于从臃肿的描述中删除城市和州的正则表达式,python,regex,Python,Regex,你可以在这里看到描述 MDH人力资源部 格兰特街东525号 伊利诺伊州马库姆,邮编61455 电话:309-836-1577 F:309-836-1677 页面有这个地址,我想使用regex提取城市和州。在这种情况下,是Macomb和IL 有一段时间,我使用了下面的正则表达式,但当描述包含多个类似模式时,它就不起作用了 (\w+),\s+(\w{2})\s+\d+ 如何编写regex,它告诉我们首先提取这些地址行,然后提取具有此模式的行 ^([A-Z][A-Za-z\s]*),\s+([A-Z

你可以在这里看到描述

MDH人力资源部

格兰特街东525号

伊利诺伊州马库姆,邮编61455

电话:309-836-1577

F:309-836-1677

页面有这个地址,我想使用regex提取城市和州。在这种情况下,是Macomb和IL

有一段时间,我使用了下面的正则表达式,但当描述包含多个类似模式时,它就不起作用了

(\w+),\s+(\w{2})\s+\d+
如何编写regex,它告诉我们首先提取这些地址行,然后提取具有此模式的行

^([A-Z][A-Za-z\s]*),\s+([A-Z]{2})\s+\d{5}$
我认为这足以让噪音远离。缺点是它可能会避免你想要的东西。在这种情况下,您可能希望使用不太强的正则表达式(如您的正则表达式)遍历页面。无论如何,使用正则表达式是无法达到完美的


它可以和你一起工作。调整语法以满足Python的需要。

哪种编程语言?