Nlp 斯坦福分类器中的系统非对称处理

Nlp 斯坦福分类器中的系统非对称处理,nlp,stanford-nlp,Nlp,Stanford Nlp,在斯坦福分类器中,同义词或其他特定的两个或多个单词是否可以作为一个单词袋模型中的单个特征来处理 例如: 我希望并且可以被视为一个单一的功能。我不完全理解你的问题。请更具体地说明您试图分类的内容 但一般来说,在将输入提供给任何分类器之前,都可以对其进行转换。即,将“嘿,我能帮你吗”替换为“X,Y,我能帮你吗”,其中X是组{hi,hey,hello,…}的占位符 这些组有时称为“synset”,例如在WordNet()中。下面是WordNet中“hello”的语法集:[1]如果这有帮助,可以使用AP

在斯坦福分类器中,同义词或其他特定的两个或多个单词是否可以作为一个单词袋模型中的单个特征来处理

例如:
我希望并且可以被视为一个单一的功能。

我不完全理解你的问题。请更具体地说明您试图分类的内容

但一般来说,在将输入提供给任何分类器之前,都可以对其进行转换。即,将“嘿,我能帮你吗”替换为“X,Y,我能帮你吗”,其中X是组{hi,hey,hello,…}的占位符

这些组有时称为“synset”,例如在WordNet()中。下面是WordNet中“hello”的语法集:[1]如果这有帮助,可以使用API访问WordNet

当然,您也可以手动创建这些词组。请记住,虽然有很多模棱两可的词,但分配其中一组是相当困难的


[1]

@tthomasss是哈佛磁通补偿器还是电容器?找不到对“harvard flux compensator”的谷歌搜索引用。@Coffee,我正在构建一个分类器,该分类器从一组特定的单词/短语中生成单个功能。例如,“hi”,“hey”,“hello”应被视为单个功能。@user2256866-请忽略上面的“harvard”行。是的jest@user2256866该死的,先生!