Machine learning 通过训练分类器对数据集进行注释？_Machine Learning_Classification

Machine learning 通过训练分类器对数据集进行注释？

machine-learning

Machine learning 通过训练分类器对数据集进行注释？,machine-learning,classification,Machine Learning,Classification,我有5331个正面评论和5331个负面评论。我想标记每次复习的强度。强度可以是“0”或“1”。他们的任何技术，我可以手动标记1000条评论和培训分类器。如果分类器的性能非常好（比如说90%的s倍验证），那么我可以使用分类器的输出填充剩余的评论？手动填充十分之一的数据并预测剩余数据是否合理我是机器学习新手你要找的短语是情绪分析，这是机器学习社会中一个众所周知的问题。这是NLP分类中最简单的任务之一，因此很有可能达到90%以上的准确率。一般来说，假设数据集足够大，10-CV的SCOR是真实分类

我有5331个正面评论和5331个负面评论。我想标记每次复习的强度。强度可以是“0”或“1”。他们的任何技术，我可以手动标记1000条评论和培训分类器。如果分类器的性能非常好（比如说90%的s倍验证），那么我可以使用分类器的输出填充剩余的评论？手动填充十分之一的数据并预测剩余数据是否合理

我是机器学习新手

你要找的短语是情绪分析，这是机器学习社会中一个众所周知的问题。这是NLP分类中最简单的任务之一，因此很有可能达到90%以上的准确率。一般来说，假设数据集足够大，10-CV的SCOR是真实分类器行为的一个相当合理的近似值。还有其他（通常被认为更好的）技术，比如基于bootstrap的技术，例如google for Err^0.632。

感谢您的回复。我知道情绪分析和观点挖掘。我这里的问题更多的是用适当的标签标记训练值。我想使用上面的数据集进行训练，并在其他数据集上使用学习的模型。培训集有10k的回顾，手动标记它们是一项有点乏味的任务。我将签出“Err^0.632”