Python 如何从分类广告中提取街道地址?

Python 如何从分类广告中提取街道地址?,python,nlp,nltk,information-retrieval,opennlp,Python,Nlp,Nltk,Information Retrieval,Opennlp,在非HTML格式的纸张、文本、文字等中出现了大量分类广告,这些广告倾向于出售房屋、汽车、租金、租赁、公寓等。例如,分类广告说,公寓租赁广告具有一些特征,如:大小、面积、地区、价格、联系信息。等 我的问题是如何提取文章中提到的街道地址/广告所在的地区或前一篇文章中提到的街道地址 使用NLTK和python有没有解决这个问题的方法?? 假设文章的来源是普通文本文件.txt 如果源代码是.txt格式的,正则表达式可能是最好的解决方案。 我认为为所有任意类型的广告编写正则表达式并不容易,甚至不可能,但示

在非HTML格式的纸张、文本、文字等中出现了大量分类广告,这些广告倾向于出售房屋、汽车、租金、租赁、公寓等。例如,分类广告说,公寓租赁广告具有一些特征,如:大小、面积、地区、价格、联系信息。等

我的问题是如何提取文章中提到的街道地址/广告所在的地区或前一篇文章中提到的街道地址

使用NLTK和python有没有解决这个问题的方法??
假设文章的来源是普通文本文件.txt

如果源代码是.txt格式的,正则表达式可能是最好的解决方案。
我认为为所有任意类型的广告编写正则表达式并不容易,甚至不可能,但示例越多,搜索效果越好。

谢谢你的建议。但是除了正则表达式之外,没有其他解决方案吗???我认为NLTK没有适合你需要的东西。即使是这样,它也会使用底层的正则表达式。谢谢。但除了NLtk和正则表达式之外,你还有其他建议吗?没有。现在脑子里想不出对这个案例有什么真正帮助的东西:你能提供一段示例数据吗?