Neural network 寻找文本分类的神经网络输入参数

Neural network 寻找文本分类的神经网络输入参数,neural-network,input-parameters,Neural Network,Input Parameters,我需要训练一个神经网络,将一些文本文档分类为布尔类(NN有一个带有“是”或“否”值的输出)。 是否有任何算法可以找到最佳输入参数(例如单词、术语、句子和/或单词的频率/重复次数&…)? 如果没有,你能给我一个找到这些参数的起点吗(我应该如何选择它们) 谢谢我所知道的标准方法是使用单词/术语向量,并使用学习或统计算法为它们分配一个负或正的分数。即使感知器学习应该足够了,你只需要一组好的正面和负面的例子 据我所知,所有垃圾邮件过滤器都是这样工作的。而且它们工作得很好。理想情况下,上述所有功能都可以!

我需要训练一个神经网络,将一些文本文档分类为布尔类(NN有一个带有“是”或“否”值的输出)。
是否有任何算法可以找到最佳输入参数(例如单词、术语、句子和/或单词的频率/重复次数&…)?
如果没有,你能给我一个找到这些参数的起点吗(我应该如何选择它们)


谢谢

我所知道的标准方法是使用单词/术语向量,并使用学习或统计算法为它们分配一个负或正的分数。即使感知器学习应该足够了,你只需要一组好的正面和负面的例子


据我所知,所有垃圾邮件过滤器都是这样工作的。而且它们工作得很好。

理想情况下,上述所有功能都可以!如果你能给神经网络单词,术语,单词n-gram,字符n-gram,等等,那么你给它更多的输入,从中做出决定。给出NN语句或任何大于一个术语的东西可能没有意义。但是,输入越多,算法运行的速度就越慢,因此必须对其进行调整,直到得到满意的结果。这方面没有什么灵丹妙药,虽然你可以构建另一个AI算法来为NN提供不同的输入,但你可能最终也会遇到同样的问题。@Lirik:我不是说给NN一句话。我的意思是给出布尔输入,显示一个术语的存在或不存在,。。。和/或一个单词的重复次数,。。。我不会考虑超过10-15个输入我的答案不会有太大变化。。。没有算法可以为您优化它(除非您构建另一个AI算法来实现),因此您应该尝试使用所有可能提高精度的东西来调整NN。这是一个乏味的过程,我不知道如何解决。