Algorithm 客户名称验证算法

Algorithm 客户名称验证算法,algorithm,names,Algorithm,Names,是否有任何算法或标准来验证不同格式的客户名称 我是说 史密斯 约翰·史密斯 约翰·L·史密斯 路易斯·史密斯 约翰·路易斯S 可能是同一个人,并且应该通过验证 谢谢的公认答案肯定会帮到你,因为我自己也在研究一种非常类似的方法来规范名字 请注意,一个单独的指标是不够的。集成方法必须考虑字符N克匹配、编辑距离等因素,最终返回匹配单词的强度。设计一个计算匹配关键字强度的公式,一旦你的名字列表用尽,只需对强度低于你设定的特定阈值的名字/单词重新运行算法。这会使名称与其他名称集群产生共鸣,其中匹配/强

是否有任何算法或标准来验证不同格式的客户名称

我是说

  • 史密斯
  • 约翰·史密斯
  • 约翰·L·史密斯
  • 路易斯·史密斯
  • 约翰·路易斯S
可能是同一个人,并且应该通过验证

谢谢

的公认答案肯定会帮到你,因为我自己也在研究一种非常类似的方法来规范名字

请注意,一个单独的指标是不够的。集成方法必须考虑字符N克匹配、编辑距离等因素,最终返回匹配单词的强度。设计一个计算匹配关键字强度的公式,一旦你的名字列表用尽,只需对强度低于你设定的特定阈值的名字/单词重新运行算法。这会使名称与其他名称集群产生共鸣,其中匹配/强度值更大


此外,您还必须注意精度/召回权衡。通过上述方法,我发现精度太高,但召回率并不是很高。

这似乎不是一项特别复杂的任务,您是否尝试自己解决它?“除非您为名称的含义指定一个特别严格的标准,否则这可能是一个非常困难的问题”,该名前称为“42”的人士向议员表示。牧师。Jonathan Louis“Louie”Smith博士,博士,医学部。