Machine learning 通过训练分类器对数据集进行注释?

Machine learning 通过训练分类器对数据集进行注释?,machine-learning,classification,Machine Learning,Classification,我有5331个正面评论和5331个负面评论。我想标记每次复习的强度。强度可以是“0”或“1”。 他们的任何技术,我可以手动标记1000条评论和培训分类器。如果分类器的性能非常好(比如说90%的s倍验证),那么我可以使用分类器的输出填充剩余的评论?手动填充十分之一的数据并预测剩余数据是否合理 我是机器学习新手 你要找的短语是情绪分析,这是机器学习社会中一个众所周知的问题。这是NLP分类中最简单的任务之一,因此很有可能达到90%以上的准确率。一般来说,假设数据集足够大,10-CV的SCOR是真实分类

我有5331个正面评论和5331个负面评论。我想标记每次复习的强度。强度可以是“0”或“1”。 他们的任何技术,我可以手动标记1000条评论和培训分类器。如果分类器的性能非常好(比如说90%的s倍验证),那么我可以使用分类器的输出填充剩余的评论?手动填充十分之一的数据并预测剩余数据是否合理


我是机器学习新手

你要找的短语是情绪分析,这是机器学习社会中一个众所周知的问题。这是NLP分类中最简单的任务之一,因此很有可能达到90%以上的准确率。一般来说,假设数据集足够大,10-CV的SCOR是真实分类器行为的一个相当合理的近似值。还有其他(通常被认为更好的)技术,比如基于bootstrap的技术,例如google for Err^0.632。

感谢您的回复。我知道情绪分析和观点挖掘。我这里的问题更多的是用适当的标签标记训练值。我想使用上面的数据集进行训练,并在其他数据集上使用学习的模型。培训集有10k的回顾,手动标记它们是一项有点乏味的任务。我将签出“Err^0.632”