Machine learning NLP:从文本中查找语法相似的子序列

Machine learning NLP:从文本中查找语法相似的子序列,machine-learning,nlp,Machine Learning,Nlp,有人能为这样一个场景提出一个合适的算法或相关的论文吗?在这个场景中,我们得到一个文本文件,并且我们必须将文本文件中语法相似的子序列分组 比如:我请求你递给我一杯咖啡&你能递给我一杯咖啡吗 必须在同一标签下分组,因为两者都表达相似的含义。如果要将相似的含义分组,则是语义相似,而不是句法相似。请尝试gensim:

有人能为这样一个场景提出一个合适的算法或相关的论文吗?在这个场景中,我们得到一个文本文件,并且我们必须将文本文件中语法相似的子序列分组

比如:我请求你递给我一杯咖啡&你能递给我一杯咖啡吗


必须在同一标签下分组,因为两者都表达相似的含义。

如果要将相似的含义分组,则是语义相似,而不是句法相似。请尝试gensim: