Database 开源地址清理器?

Database 开源地址清理器?,database,street-address,Database,Street Address,我已经在excel电子表格中输入了一组名称和地址,但问题是,许多输入地址的人以许多不同的非标准格式输入了它们。在将所有地址传输到我的数据库之前,我想清除这些地址。环顾四周,我真正发现的地址洗涤器(解析器或格式化程序)就是由。就我而言,我并不真的需要所有这些,我也不想为软件支付许可费。有没有免费和/或开源的东西可以帮我清理 我使用过的大多数软件都非常昂贵(或者换一种说法,市场营销部门很幼稚,预算巨大) 这类工作是地理编码的先驱。这包括一系列地理编码软件,其中一些是免费的。如果幸运的话,一些免费的可

我已经在excel电子表格中输入了一组名称和地址,但问题是,许多输入地址的人以许多不同的非标准格式输入了它们。在将所有地址传输到我的数据库之前,我想清除这些地址。环顾四周,我真正发现的地址洗涤器(解析器或格式化程序)就是由。就我而言,我并不真的需要所有这些,我也不想为软件支付许可费。有没有免费和/或开源的东西可以帮我清理

我使用过的大多数软件都非常昂贵(或者换一种说法,市场营销部门很幼稚,预算巨大)

这类工作是地理编码的先驱。这包括一系列地理编码软件,其中一些是免费的。如果幸运的话,一些免费的可能包括地址标准化例程


如果你找到一个好的,让我知道

因为我在邮递公司工作

可邮寄地址不是地理编码。一个允许USPS向您发送邮件,另一个告诉您该点在地球上的何处。USPS不会对其可邮寄地址进行地理编码。它对于标记目标人群的区域很有用

你买的不是软件的许可证,而是数据。邮局有很多规定,尤其是当你在做商业活动,试图获得比头等舱更高的费率时。有关规则的完整列表,请参见。USPS始终在拉链之间移动拉链和家庭。该公司(我为其工作)为其更新的邮件列表向USPS付款,以便我们能够更新我们的DBs。每周

回到你的问题上来。您是想将数据更改为通用格式(street->st),还是想寻找重复的数据并只存储真实的可邮寄地址

通用格式;您可以将地址分成几部分,清理空白,并应用术语/翻译词典。然后应用一些sql来查找重复项。请记住,家庭(主街1号)与个人(约翰·多伊,主街1号)是不同的

对于可邮寄地址,你们中的一些人(读者)不喜欢这个答案,但你们需要信息,而这不是免费的。有人花费时间或金钱来获取和维护这些列表。所以,找一个商业模式来为这份名单筹集资金,或者去找愿意为你做这件事的人

实际上,这是相当便宜的,只是请记住,地址数据库必须每季度更新一次,每季度19美元是相当便宜的


另一个地址是洗涤产品。但我不知道这些数据需要多少成本。

我们使用Accuzip。它比大多数解决方案(每年约700美元)便宜得多,并且每两个月更新一次。它使用USPS地址标准化API,为此我编写了一个.NET包装器。这使我能够实时运行它(默认情况下,Accuzip仅带有批处理模式)。

USPS API的.NET包装器


我实际上在地址验证行业工作。。。吉姆的回答是明智的。不幸的是,对于我们这些预算较低的人来说,美国邮政的官方数据价格昂贵,系统复杂。(根据经验,我知道,因为我工作的公司提供的地址验证比大多数公司都低。)


我在这里所能做的最好的帮助就是推荐一个低成本/免费的替代方案(取决于您的数量),如LiveAddress,其中地址列表没有最低购买量,相比之下,API超级便宜且超级简单。

可能提供一些示例数据。更新:地址验证API服务(在SmartyStreets)如果您仍然需要一个好的解决方案,现在可以免费使用。