Nlp 我可以使用NLTK来确定评论是正面的还是负面的吗?

Nlp 我可以使用NLTK来确定评论是正面的还是负面的吗?,nlp,nltk,Nlp,Nltk,你能给我举个简单的例子,用它来判断一个字符串是关于快乐还是沮丧的情绪吗 这是一项远远超出NLTK或任何已知或现实想象的语法分析器能力的任务。看一看,看看它能完成什么样的任务,这些任务与你所说的目标相去甚远 例如: 我真的很喜欢用你的报纸来训练我的狗 用NLTK解析它,你可以得到 [('I', 'PRP'), ('really', 'RB'), ('enjoyed', 'VBD'), ('using', 'VBG'), ('your', 'PRP$'), ('paper', 'NN'),

你能给我举个简单的例子,用它来判断一个字符串是关于快乐还是沮丧的情绪吗

这是一项远远超出NLTK或任何已知或现实想象的语法分析器能力的任务。看一看,看看它能完成什么样的任务,这些任务与你所说的目标相去甚远

例如:

我真的很喜欢用你的报纸来训练我的狗

用NLTK解析它,你可以得到

[('I', 'PRP'), ('really', 'RB'), ('enjoyed', 'VBD'), 
 ('using', 'VBG'), ('your', 'PRP$'), ('paper', 'NN'), 
 ('to', 'TO'), ('train', 'VB'), ('my', 'PRP$'), ('dog', 'NN')]
解析树告诉我“享受”是简单句的中心动词(过去时)。享受某样东西是好的。训练是一件好事。动名词、名词、比较词等都是相对中性的。所以给它一个很好的分数0.90

除了我的意思是我要么用你的纸打我的狗,要么让它在纸上排泄,你可能认为它不是一件好事。 雇用一个人来完成此识别任务

为那些认为即使是经过训练的分类器也很有用的人添加:

使用您喜欢的任何分类器对真实客户评论语料库中的真实条目进行分类,并在您喜欢的任何数据集上进行培训:

这架照相机在镜头中保持自动对焦 带有嗡嗡声的自动模式 无法阻止。那真是太好了 如果他们给了一个选择,那就好了 停止自动对焦。如果你愿意 把日期和时间写在地图上 形象,这只是通过他们的 读取图像日期的软件 以及来自图像元数据的时间。 所以如果你使用你的读卡器和 复制图像-你必须再次 通过他们的软件打开它们 写上日期和时间。在这方面,, 没有直接添加日期的方法 时间呢 -你必须说“打印图像”到另一个目录,其中有 指定日期和时间的选项 . 哪怕是最轻微的震动 完全扭曲了你的形象。室内的 图像不是很清晰。你必须 让flash“开启”以获取它,即使 你的房间光线很好。镜头盖是透明的 真是讨厌。电影剪辑 拍摄过程中总会有一些“噪音” 这是你无法避免的


我得到的最糟糕的情绪分类是“完全模棱两可”,然而人类可以很容易地确定这不是赞美。这不是一个随机选取的数据,而是一个没有“仇恨”或“suxz”或类似内容的负偏差数据

NLTK不能开箱即用,但如果您正在寻找该领域的相关研究,请看一下这篇文章。同样的方法也可以用来检测那些不是冒犯性的/非冒犯性的,而是快乐/不快乐的评论。该项目中用于文本分类的主要软件包被调用,并使用多个分类器(根据前面的示例进行训练)来确定语言是否具有攻击性(在该方法中使用可调阈值).

您正在寻找一种使用机器学习分类器来确定文本是正文本还是负文本的技术。许多研究团队对此进行了各种不同的尝试(例如,和),我们可以在确定产品审查是积极的还是消极的方面获得大约80%到90%的准确性

由于您的问题简短,我不清楚确定产品评论是正面的还是负面的是您试图完成的同一项任务,还是仅仅是一项相关任务,但我建议从简单的单词袋分类开始,使用贝叶斯分类器(NLTK应该能够处理),然后根据准确度的结果改进你的技术

不幸的是,我从来没有使用过NLTK(也没有使用过Python),所以我不能给你一个如何使用NLTK的代码示例。

也值得一试:你可以在项目主页上看到两个观点挖掘实验


可能。你应该研究分类器的功能;给定一个训练集,你可能可以把情绪分为积极的或消极的。看,我也不会说这超出了NLTK。我的第一个想法是情绪分析,你联系到了。如果有一个相当大的训练语料库,你可以训练一个分类器来给你一个像样的“情绪”近似值;它要求提供一个没有的简单例子。甚至分类器也依赖于真实的文本输入,就像维基百科链接的各种语料库一样。对于一个简单的陈述性仍然很麻烦的领域来说,处理细微差别、讽刺、含蓄和用微弱的赞扬来谴责是非常困难的。你可能把问题复杂化了。他没有询问如何辨别细微差别、讽刺等。他只对“高兴”或“不高兴”这两个模糊的布尔标签感兴趣,他可以通过手动标记句子样本轻松定义这些标签。我同意,这可能不是“小事”,但我也不认为这是不可能的。你似乎在理论上说话,理论和实践在理论上的差异小于实践中的差异。如果您有疑问,请获取真实的语料库并亲自尝试;如果你确实通过新颖的输入获得了比随机机会更好的结果,那就写下来并获得博士学位。@msw:我碰巧在这方面获得了博士学位。这是可行的,尽管我们只能得到大约80%到90%的准确率。在尝试过这项任务的人中(或者这仅仅是一项相关的任务——从问题的简洁性很难判断),NLTK的《自然语言处理》一书中包括了一个对文本进行分类的例子,以确定文本是否是积极的。OP的问题和应用对于讨论和演示的算法来说可能过于微妙,但这将是一个开始。