Parsing 从非结构化文本解析名称和地址

Parsing 从非结构化文本解析名称和地址,parsing,street-address,Parsing,Street Address,我正在开发一个需要解析非结构化数据的应用程序 文本。我需要解析姓名,地址-地区,城市,国家和邮政编码 从它。地址将是印度的 样本输入: “我是XYZ公司的ABC员工。 我擅长网页设计,有三年的工作经验。 我住在马哈拉施特拉邦浦那411038的科特鲁德。” 输出: 姓名:ABC 地区:科特鲁德 城市:浦那 州:马哈拉施特拉邦 邮政编码:411038 我计划使用ApacheConceptMapper解析城市和州 为此我必须自己编一本字典,但我想 这是可以做到的。对于邮政编码,我可以使用regex。我

我正在开发一个需要解析非结构化数据的应用程序 文本。我需要解析姓名,地址-地区,城市,国家和邮政编码 从它。地址将是印度的

样本输入: “我是XYZ公司的ABC员工。 我擅长网页设计,有三年的工作经验。 我住在马哈拉施特拉邦浦那411038的科特鲁德。”

输出: 姓名:ABC 地区:科特鲁德 城市:浦那 州:马哈拉施特拉邦 邮政编码:411038

我计划使用ApacheConceptMapper解析城市和州 为此我必须自己编一本字典,但我想 这是可以做到的。对于邮政编码,我可以使用regex。我被困在如何学习英语上 解析名称和区域。Regex可以用来获取名称和区域 小黑客和大量的模式,但我想知道是否有任何 提供更好的解决方案

是否有我可以查询的数据库,可以返回地址?我 没有搜索过谷歌地图/地点,但你能找到地址吗 你能轻松地与他们交谈吗

如有任何意见,将不胜感激


谢谢。

您可以帮忙。如果没有找到匹配项,它将返回给定地址的地图坐标或相应的状态代码。

您需要处理什么上下文?也就是说,这些地址是美国地址还是印度地址?如果能够限制到这一点,那将是非常有帮助的。