Machine learning NLP&;最大似然短语提取

Machine learning NLP&;最大似然短语提取,machine-learning,nlp,nltk,stanford-nlp,text-mining,Machine Learning,Nlp,Nltk,Stanford Nlp,Text Mining,我可以使用什么ML算法来训练给定句子中的动作短语 Sentence1:I want to play cricket Label1: play cricket Sentence2: Need to wash my clothes Label2: wash clothes 我有大约2k个句子和相应的动作短语(标签)的数据,需要根据它们预测另一组句子。有人可以指导我如何使用NLP/ML来实现这一点吗?哪种算法同样适用?(最好是python)看看NLTK, 它是多类的,您可以直接向它提供句子/标签

我可以使用什么ML算法来训练给定句子中的动作短语

Sentence1:I want to play cricket 
Label1: play cricket

Sentence2: Need to wash my clothes
Label2: wash clothes
我有大约2k个句子和相应的动作短语(标签)的数据,需要根据它们预测另一组句子。有人可以指导我如何使用NLP/ML来实现这一点吗?哪种算法同样适用?(最好是python)

看看NLTK, 它是多类的,您可以直接向它提供句子/标签对

NaiveBayesClassifier.train()
将需要培训功能,我将开始 其特点就是每个句子中的单词。可以使用更复杂的方法修改特征选择,直到获得所需的结果


您可以使用来评估结果。记住将句子分成训练和测试数据。

以下是句子分类过程:

1) 规范化文本-将所有文本改为小写

2) 删除所有停止字-确保只保留相关功能

3) 将句子标记为单字标记

4) 应用词干分析技术-尝试使用不同的词干分析模型/lemmatizer将单词带到其基本单词中。看看哪一个最适合你的情况。例如:play,play,plays将转换为基本单词“play”。此步骤减少了功能的数量

5) 为所有句子创建术语文档矩阵。TDM的每一行对应一个句子,TDM的每一列对应一个句子的标记。(还有另一种以矩阵形式表示文本的方法,称为Tf Idf)

6) 现在,这个术语文档矩阵包含作为列的标记。您已经准备好了标签。现在可以开始训练ML模型了。我想你知道怎么做这个部分