Machine learning 支持向量机的文本特征表示

Machine learning 支持向量机的文本特征表示,machine-learning,nlp,text-mining,feature-selection,semantic-analysis,Machine Learning,Nlp,Text Mining,Feature Selection,Semantic Analysis,我正在学习语义角色标记(SRL)任务。我读了很多书,现在我遇到了一个问题:如何将文本特征表示为向量 例如,对于句子: 我们非常喜欢StackOverflow 给定谓词动词:类似于,有以下几个特性: the left 1st word: I the right 1st word: StackOverflow the POS tag of the left 1st word: Pronoun The POS tag of the right 1st word: Adverbial 将这些特征表示为

我正在学习语义角色标记(SRL)任务。我读了很多书,现在我遇到了一个问题:如何将文本特征表示为向量

例如,对于句子:

我们非常喜欢StackOverflow

给定谓词动词:
类似于
,有以下几个特性:

the left 1st word: I
the right 1st word: StackOverflow
the POS tag of the left 1st word: Pronoun
The POS tag of the right 1st word: Adverbial
将这些特征表示为向量的正确方法是什么?

如果可能的话,你能给我一些关于如何规范这些特性的指导吗


我基本上希望使用
SVM
模型来训练具有这些类型特征的数据

无论您使用何种分类器(SVM或非SVM),文本的特征生成都是相同的。 我建议你看看这个:

此外,该图书馆将使您的生活更加轻松: 这里有一个教程: