Machine learning 文本预测的双图模型

Machine learning 文本预测的双图模型,machine-learning,nlp,n-gram,Machine Learning,Nlp,N Gram,我计划实现双图模型来预测搜索文本。如果用户经常搜索“测试搜索词”,然后如果用户键入“测试”,我希望自动建议“测试搜索词” 我有搜索文本的数据列表。我正在尝试使用bi-gram,因为即使用户输入“Tast”,它仍然应该提供“测试搜索词”。我正在用Java实现它。我正在寻找一个库来提供我拥有的数据,当我通过用户输入文本时,它应该提供预测 经过研究,我发现以下链接 但他们对我的情况没有帮助。有适合我的用途的Java库吗?我正在考虑两种解决方案: 首先 在(使用递归实现存储的匹配算法)TRIE

我计划实现双图模型来预测搜索文本。如果用户经常搜索“测试搜索词”,然后如果用户键入“测试”,我希望自动建议“测试搜索词”

我有搜索文本的数据列表。我正在尝试使用bi-gram,因为即使用户输入“Tast”,它仍然应该提供“测试搜索词”。我正在用Java实现它。我正在寻找一个库来提供我拥有的数据,当我通过用户输入文本时,它应该提供预测

经过研究,我发现以下链接


但他们对我的情况没有帮助。有适合我的用途的Java库吗?

我正在考虑两种解决方案:

首先

  • 在(使用递归实现存储的匹配算法)TRIE数据结构(针对关键字搜索和自动完成优化的数据结构)中为每个用户字符串查询编制索引
  • 准备Levenshtein距离测量方法,以容忍打字错误
现在,对于每个新的用户查询
q
,在MARISA TRIE中将查询
q
作为前缀的所有字符串编入索引(在键入容差之后)

使用elasticsearch建议器

文件

请注意,部分建议功能仍在开发中

希望有帮助