Machine learning 使用LingPipe进行分层情绪分析

Machine learning 使用LingPipe进行分层情绪分析,machine-learning,nlp,sentiment-analysis,Machine Learning,Nlp,Sentiment Analysis,这是在使用LingPipe机器学习工具进行情绪分析的背景下进行的。我必须对一个大段落中的句子是否有积极/消极情绪进行分类。我知道在LingPipe中有以下方法 根据段落的极性对完整段落进行分类-负或正 在这里,我还不知道句子层面的极性。我们仍处于段落级别。我如何确定段落句子层面的极性,确定段落中的句子是否为正/负句子?我知道如果一个句子是主观/客观的,LingPipe能够进行分类。所以用这个方法 我应该吗 首先对LingPipe进行一系列主客观句子的训练 使用经过训练的模型从测试段落中提取所有主

这是在使用LingPipe机器学习工具进行情绪分析的背景下进行的。我必须对一个大段落中的句子是否有积极/消极情绪进行分类。我知道在LingPipe中有以下方法

  • 根据段落的极性对完整段落进行分类-负或正

    在这里,我还不知道句子层面的极性。我们仍处于段落级别。我如何确定段落句子层面的极性,确定段落中的句子是否为正/负句子?我知道如果一个句子是主观/客观的,LingPipe能够进行分类。所以用这个方法

    我应该吗

  • 首先对LingPipe进行一系列主客观句子的训练

  • 使用经过训练的模型从测试段落中提取所有主观句子
  • 通过手动将提取的主观性句子标记为正/负来训练基于极性的LingPipe分类器
  • 现在使用经过训练的极性模型,并输入一个测试主观句子(即通过经过训练的主观/客观句子传递一个句子)模型,然后确定陈述是否为正/负

    上述方法有效吗?在上面提出的方法中,我们知道LingPipe能够接受大量文本内容(段落)进行极性分类。如果我们只通过一个主观的句子来进行极性分类,它会做得好吗?我糊涂了


  • 包括lingpipe在内的大多数机器库都是基于行的(具有平面特征的对象)。所以,如果你想用它做一些层次分类,你应该去规范化你的数据。例如,您可以在同一个特征集中具有段落和句子的特征。如果您只使用单词分类,您可以创建这样的功能PARGRAPH\u WORDX=true,句子\u WORDX=true。
    其他一些工具包允许您在不进行非规范化的情况下表达您的模型,这就是所谓的图形模型,例如CRF、ACRF、马尔可夫模型等,它们是您可以在mallet和Factorie中找到的模型的实现

    您可能想看看文献中的多层次分析方法,例如

    Li,S.等人(2010年)。“利用组合多层次模型进行文档情感分析”,2010年模式识别国际会议

    Yessenalina,A.等人(2010年)。“文档级情感分类的多层次结构化模型”,2010年自然语言处理经验方法会议论文集,第1046-1056页,麻省理工学院,美国马萨诸塞州,2010年10月9-11日

    多级分析方法在信息检索中非常常见,如用于向量空间相似性搜索的内容索引


    像Ling Pipe这样的环境是一个很好的入门方式,但最终您需要使用更低级别、更细粒度的工具,如yura建议的工具。

    谢谢yura。简而言之,你的意思是说,如果我在段落级使用一个功能集,那么同样的功能集也可以在句子级使用?是的,你可以将段落和句子的功能组合在一个分类下的句子功能集中。有时它也能起作用。这就像你想在树中对某个节点进行分类,并因此添加其所有父节点的特性。