Algorithm 文本中拼写错误名称的识别算法
我需要开发一个应用程序,将索引几个文本,我需要在这些文本中搜索人们的名字。问题是,虽然一个人的正确名字是“Gregory Jackson Junior”,但在文本中,这个名字可能会写为: -小格雷格·杰克逊 -小盖戈里·杰克逊 -格雷戈里·杰克逊 -小格雷戈里 我计划每晚对文本进行索引,并建立数据库索引以加快搜索速度。我想推荐关于这个主题的好书和/或好文章。Algorithm 文本中拼写错误名称的识别算法,algorithm,string,search,nlp,Algorithm,String,Search,Nlp,我需要开发一个应用程序,将索引几个文本,我需要在这些文本中搜索人们的名字。问题是,虽然一个人的正确名字是“Gregory Jackson Junior”,但在文本中,这个名字可能会写为: -小格雷格·杰克逊 -小盖戈里·杰克逊 -格雷戈里·杰克逊 -小格雷戈里 我计划每晚对文本进行索引,并建立数据库索引以加快搜索速度。我想推荐关于这个主题的好书和/或好文章。 谢谢检查这些相关问题 你的问题措辞不正确。这些例子并不表示拼写错误,而是表示写全名的形式发生了变化 以及 您的搜索是否希望与示例中的son
谢谢检查这些相关问题
你的问题措辞不正确。这些例子并不表示拼写错误,而是表示写全名的形式发生了变化 以及 您的搜索是否希望与示例中的son等词匹配? 它会期待吗? 你在找像和这样的东西吗?
好的,阅读您的评论表明您不想冒险进入这一领域。请记录在案。使用贝叶斯过滤器。您可以使用机械卡车初始化算法 你的问题措辞不正确。这些例子并不表示拼写错误,而是表示写全名的形式发生了变化。而且,我很好奇,你的搜索结果会不会与这个例子中的“儿子”这样的词相匹配?事实上,其中一个名字可能也拼写错了。我不需要像junior和son这样的同义词匹配。谢谢你有没有找到什么可以做到这一点的?谢谢你的推荐。在发布问题之前,我确实检查了他们。第一个重点是文章和实时搜索。在第二篇文章中,最好的答案是指一个特定的数据库引擎,但是没有什么算法内容。不需要同义词或昵称。