Machine learning 使用深度学习技术的监督学习(文档分类)

Machine learning 使用深度学习技术的监督学习(文档分类),machine-learning,neural-network,deep-learning,supervised-learning,Machine Learning,Neural Network,Deep Learning,Supervised Learning,我在读关于深度学习的论文。其中大多数是指无监督学习 他们还说,神经元是使用无监督的RBM网络预先训练的。之后,使用反向传播算法(监督)对它们进行微调 那么我们能用深度学习解决监督学习问题吗 我试图找出深度学习是否可以应用于文档分类问题。 我知道有相当好的分类器可用。但我的目标是找出我们是否可以使用深度学习来达到这个目的。深度学习是关于学习未知概念的,因此通常用于在数据集中查找模式。这是无监督的,因为这些模式不一定是先验的。然而,在监督学习中,你所需要的模式类型很容易被先验地理解为适合你试图学习的

我在读关于深度学习的论文。其中大多数是指无监督学习

他们还说,神经元是使用无监督的RBM网络预先训练的。之后,使用反向传播算法(监督)对它们进行微调

那么我们能用深度学习解决监督学习问题吗

我试图找出深度学习是否可以应用于文档分类问题。
我知道有相当好的分类器可用。但我的目标是找出我们是否可以使用深度学习来达到这个目的。

深度学习是关于学习未知概念的,因此通常用于在数据集中查找模式。这是无监督的,因为这些模式不一定是先验的。然而,在监督学习中,你所需要的模式类型很容易被先验地理解为适合你试图学习的数据的训练模式。这些模式成为将模型(例如,使用反向传播训练的神经网络)拟合到数据的基础。没有真正发现新的概念和组件。因此,从这个角度来看,我想说,不,深度学习不能用于解决监督学习问题

话虽如此,您也许可以使用它在数据中找到有趣的模式。然后,您可以使用这些有趣的模式作为使用标准监督方法进行培训的基础。也许这就是他们在上面所做的,你提到的

“他们还说,神经元是使用无监督RBM网络进行预训练的。之后,他们使用反向传播算法(监督)对神经元进行微调。”


在没有阅读您阅读的内容的情况下,他们可能从一个无监督的算法开始寻找最有趣的数据,并在这样做的过程中执行了一种形式的降维,从而得到比原始数据更容易训练的数据,使用监督算法。

简言之-是的,可以,通常以监督的方式使用。正如Ben J所描述的那样——体系结构的“深度”是以无监督的方式使用的,以便创建数据的非常抽象的表示,这些数据可以稍后用作预处理层(无微调)或神经网络的初始化(具有微调,类似Hinton)。特别是,你可以在文本中使用这种方法

Hinton最近发表了一篇关于使用DBMs建模文本文档的有趣论文:

网上有很多可用的资源,特别是Pyrearn图书馆实现了这些方法,包括“经典”DBN(深度信念网络)


此外,也可以仅使用堆叠的RBM进行实际分类,这种模型称为“分类RBM”。更多细节可以在这里获得:

除了上面提供的良好参考之外,Yann Le Cunn的小组还有一篇论文,它只通过编码字符而不使用任何外部特征提取库进行文本分类。它只需在字符级别编码即可工作。他们声称准确率为98%


是的,绝对是。实际上,在工业中,深度学习主要用于解决监督问题。成果管理制等无监督的东西在学术界之外没有得到广泛应用。要了解更多关于监督学习的深度学习,您可以在2012年后阅读论文,从任何与ImageNet挑战相关的内容开始

这些是深层神经网络的主要里程碑:


绝对是的,您可以使用深度学习进行监督和非监督学习。例如,著名的CNN网络用于无监督学习。也许您需要从根本上了解一些关于文本挖掘的知识,以理解对文档进行分类的深度学习模型。 我发现这个链接很有趣,我希望它也能帮助你:

由于深度学习的基础是神经元,因此我们在神经元中有监督算法,如逻辑回归,这意味着,是的。

感谢lejlot和Ben。这些见解非常有用。请随意接受其中一个提供的答案(以更适合您的需要为准)