Neural network 在这种情况下我可以使用神经网络吗?

Neural network 在这种情况下我可以使用神经网络吗?,neural-network,Neural Network,如果我的输出数据是27680,所有数据都是零,只有一个是一,我可以使用神经网络或svm等吗? 我是说这样做对吗 当我使用SVM时,我有以下错误: 使用seqminopt>seqminoptImpl时出错(第198行) 在最大迭代次数内没有收敛。支持向量机通常是二进制分类器。基本上,这意味着它们将数据点分为两组,这表示数据点是否属于某个类。使用支持向量机解决多类问题的常用策略是一对一和一对一。在one vs rest的情况下,您将为每个类训练一个分类器,这对您来说是27680。在一对一的情况下,你

如果我的输出数据是27680,所有数据都是零,只有一个是一,我可以使用神经网络或svm等吗? 我是说这样做对吗

当我使用SVM时,我有以下错误: 使用seqminopt>seqminoptImpl时出错(第198行)
在最大迭代次数内没有收敛。

支持向量机通常是二进制分类器。基本上,这意味着它们将数据点分为两组,这表示数据点是否属于某个类。使用支持向量机解决多类问题的常用策略是一对一和一对一。在one vs rest的情况下,您将为每个类训练一个分类器,这对您来说是27680。在一对一的情况下,你将训练(K除以2)=(K(K-1))/2个分类器,所以在你的情况下大约3800万。如您所见,这两个数字都相当高,因此我对您使用支持向量机成功解决问题的可能性持悲观态度。
不过,您可以尝试增加最大迭代次数,如中所述。也许它仍然有效

你可以使用神经网络完成你的任务,1/K的输出也没什么不寻常的。然而,即使只有一个包含500个神经元的隐藏层(并且使用您的评论中提到的输入和输出向量大小),您的网络中也会有(27680*2*500)+(500*27680)=41520000个权重。因此,我预计培训时间相当长(尽管谷歌员工可能会嘲笑这些数字)。除非您的输入非常简单,否则您很可能还需要大量的培训示例


作为替代方案,您可以查看决策树/随机林、朴素贝叶斯或kNN。

您的意思是您的输入向量是27680,它有27679个零,只有一个值等于1?hi。是的,我的意思是,如果我想训练这个网络,我的网络输入(特征或观测变量)是X,是27680*2,我的网络输出是Y(目标),是27680*1…当我想使用Y的数据时,它有27679个零,只有一个值等于1…我可以使用神经网络或支持向量机等吗?这对我来说听起来你可以改进你的特征向量。带有二进制标志的27680类对于梯度下降来说并不理想。如果您正在执行文本分类,请使用朴素贝叶斯(Naive Bayes)。X是序列输入,Y是序列输出……当我们想要得到Y值时,测试数据只需要2个X值。。我在这个链接中上传了一张图片,上面显示了你可以看到的东西,看到只有一个数据是绿色的…X有2个维度,y有1个维度…谢谢你,你的意思是你有大约27000个例子(而不是27000个维度),你用1/0的值投射到一个维度上是/否?然后SVM应该能够找到一个很好的解决方案。如果迭代次数不足,则尝试使用非线性决策边界(例如RBF)并增加可能被错误分类的数据点的数量(通常通过增加C值)。是的,我有两个类a和B要分开(a显示为零,B显示为一),当我们在所有情况下看到数据集时,类a有27679个零,类B有1个(在这些情况下,只有1的位置在变化,我们一直有27679个0和1个1)…一直以来,对于所有数据示例,我们有27679个零,只有1个…我想知道,对于像这样的项目,SVM或神经网络能得到正确的解决方案吗?像这样的图像axgig.com/viewer.php?file=94461789190863693715.jpg所有数据都在claasA中,只有一个在classBSo中显然,你有一堆训练示例和ev每个示例是一组约27000个数据点,其中只有一个点属于a类。如果a类的所有点都有点类似,那么您可以在所有这些示例中使用SVM(a中的多个点+B中的多个点作为训练集)。你可能必须在B中扔掉很多点,否则你的训练集将严重地向B倾斜。如果A依赖于每个示例中的所有其他点,那么你可以尝试使用回归预测A的坐标,并选择最接近A的点作为A。非常感谢,我可以省略classA中的一些点。但我认为A中的点的数量是还很大,所以我会用回归法。我真的很感谢你的帮助。