NLP分类训练模型

NLP分类训练模型,nlp,stanford-nlp,opennlp,Nlp,Stanford Nlp,Opennlp,我正在尝试训练一个模型,使用opennlp对推特进行分类。我的问题是,我应该对我用于培训模型的tweet执行标记化、停止单词删除等操作,还是直接使用tweet而不执行清理 这实际上取决于你的培训内容: 如果您的算法设计为接收简单文本,并且在使用机器学习技术之前,它自己执行所有简化,那么您应该提供类型对 否则,如果你只是试运行一个黑盒,我会说,如果你的模型要处理某种类型的特征,在你的例子中,标记化和词干化的单词应该在这种类型的数据上进行训练,所以提供 这实际上取决于您的培训内容: 如果您的算法

我正在尝试训练一个模型,使用opennlp对推特进行分类。我的问题是,我应该对我用于培训模型的tweet执行标记化、停止单词删除等操作,还是直接使用tweet而不执行清理

这实际上取决于你的培训内容:

  • 如果您的算法设计为接收简单文本,并且在使用机器学习技术之前,它自己执行所有简化,那么您应该提供类型对
  • 否则,如果你只是试运行一个黑盒,我会说,如果你的模型要处理某种类型的特征,在你的例子中,标记化和词干化的单词应该在这种类型的数据上进行训练,所以提供

这实际上取决于您的培训内容:

  • 如果您的算法设计为接收简单文本,并且在使用机器学习技术之前,它自己执行所有简化,那么您应该提供类型对
  • 否则,如果你只是试运行一个黑盒,我会说,如果你的模型要处理某种类型的特征,在你的例子中,标记化和词干化的单词应该在这种类型的数据上进行训练,所以提供

您的模型想要实现什么?您的模型想要实现什么?