Machine learning 使用LingPipe进行分层情绪分析_Machine Learning_Nlp_Sentiment Analysis

Machine learning 使用LingPipe进行分层情绪分析

machine-learning nlp

Machine learning 使用LingPipe进行分层情绪分析,machine-learning,nlp,sentiment-analysis,Machine Learning,Nlp,Sentiment Analysis,这是在使用LingPipe机器学习工具进行情绪分析的背景下进行的。我必须对一个大段落中的句子是否有积极/消极情绪进行分类。我知道在LingPipe中有以下方法根据段落的极性对完整段落进行分类-负或正在这里，我还不知道句子层面的极性。我们仍处于段落级别。我如何确定段落句子层面的极性，确定段落中的句子是否为正/负句子？我知道如果一个句子是主观/客观的，LingPipe能够进行分类。所以用这个方法我应该吗首先对LingPipe进行一系列主客观句子的训练使用经过训练的模型从测试段落中提取所有主

这是在使用LingPipe机器学习工具进行情绪分析的背景下进行的。我必须对一个大段落中的句子是否有积极/消极情绪进行分类。我知道在LingPipe中有以下方法

根据段落的极性对完整段落进行分类-负或正

在这里，我还不知道句子层面的极性。我们仍处于段落级别。我如何确定段落句子层面的极性，确定段落中的句子是否为正/负句子？我知道如果一个句子是主观/客观的，LingPipe能够进行分类。所以用这个方法

我应该吗

首先对LingPipe进行一系列主客观句子的训练

使用经过训练的模型从测试段落中提取所有主观句子

通过手动将提取的主观性句子标记为正/负来训练基于极性的LingPipe分类器

现在使用经过训练的极性模型，并输入一个测试主观句子（即通过经过训练的主观/客观句子传递一个句子）模型，然后确定陈述是否为正/负

上述方法有效吗？在上面提出的方法中，我们知道LingPipe能够接受大量文本内容（段落）进行极性分类。如果我们只通过一个主观的句子来进行极性分类，它会做得好吗？我糊涂了

包括lingpipe在内的大多数机器库都是基于行的（具有平面特征的对象）。所以，如果你想用它做一些层次分类，你应该去规范化你的数据。例如，您可以在同一个特征集中具有段落和句子的特征。如果您只使用单词分类，您可以创建这样的功能PARGRAPH\u WORDX=true，句子\u WORDX=true。

其他一些工具包允许您在不进行非规范化的情况下表达您的模型，这就是所谓的图形模型，例如CRF、ACRF、马尔可夫模型等，它们是您可以在mallet和Factorie中找到的模型的实现

您可能想看看文献中的多层次分析方法，例如

Li，S.等人（2010年）。“利用组合多层次模型进行文档情感分析”，2010年模式识别国际会议

Yessenalina，A.等人（2010年）。“文档级情感分类的多层次结构化模型”，2010年自然语言处理经验方法会议论文集，第1046-1056页，麻省理工学院，美国马萨诸塞州，2010年10月9-11日

多级分析方法在信息检索中非常常见，如用于向量空间相似性搜索的内容索引

像Ling Pipe这样的环境是一个很好的入门方式，但最终您需要使用更低级别、更细粒度的工具，如yura建议的工具。

谢谢yura。简而言之，你的意思是说，如果我在段落级使用一个功能集，那么同样的功能集也可以在句子级使用？是的，你可以将段落和句子的功能组合在一个分类下的句子功能集中。有时它也能起作用。这就像你想在树中对某个节点进行分类，并因此添加其所有父节点的特性。