Python 2.7 如何将这些句子分为肯定句和否定句?

Python 2.7 如何将这些句子分为肯定句和否定句?,python-2.7,text-mining,sentiment-analysis,text-classification,spacy,Python 2.7,Text Mining,Sentiment Analysis,Text Classification,Spacy,我有一份高管的评论清单。它们从来都不一样(不太可能)。它们表明了公司业绩的总体情绪。我的目标是使用过去的评论来训练分类器,并将未来的评论分为正面或负面。这可能吗?什么技术可以帮助我实现这个结果?非常感谢你的帮助。我在下面列出了一些示例评论: “业务[正在]改善,交付周期延长了两周或两周以上。” “本季度前景非常乐观。由于需求,生产目标已多次调整,每次都有所增加。” “产品需求持续稳定。” “本季初预订量很大。预计上半年会很强劲。” “需求仍然超过产能。竞争对手已宣布进行巨额资本投资以提高产能。”

我有一份高管的评论清单。它们从来都不一样(不太可能)。它们表明了公司业绩的总体情绪。我的目标是使用过去的评论来训练分类器,并将未来的评论分为正面或负面。这可能吗?什么技术可以帮助我实现这个结果?非常感谢你的帮助。我在下面列出了一些示例评论:

“业务[正在]改善,交付周期延长了两周或两周以上。”

“本季度前景非常乐观。由于需求,生产目标已多次调整,每次都有所增加。”

“产品需求持续稳定。”

“本季初预订量很大。预计上半年会很强劲。”

“需求仍然超过产能。竞争对手已宣布进行巨额资本投资以提高产能。”

“销售和业务继续强劲增长。”

“第一季度业务保持稳定。”

“医疗器械制造业依然强劲。”

“尽管石油和天然气价格正在上涨,但2017年我们仍将面临严峻挑战,并将继续节约成本。”


“主要关注商品和进一步通胀的可能性。”

这就像是一篇完整的论文。。。一种开始的方法是标记你的句子,列出积极和消极的单词。使用一些基本计数,看看有多少积极和消极的词显示了我应该手动将这些词标记为积极和消极,还是有一本字典可以使用?@prashanthmanohar你有大量这样的评论吗?他们已经贴标签了吗(正面还是负面)?根据我的经验,给文档贴标签(正面、负面)比给单词贴标签要容易一些。然后使用文本分类器(例如NaiveBayes),在您的训练数据上,它将自动学习哪些单词+上下文使文档为正还是为负。不过,要得到准确的估计,几个100可能有点低。在您的案例中删除stopwords会有所帮助。我建议您特别阅读第1.3节(如果尚未完成),好的起点是: