Machine learning 基于像素分类的神经网络模型结构_Machine Learning_Neural Network_Theano_Convolution_Keras

Machine learning 基于像素分类的神经网络模型结构

machine-learning neural-network keras

Machine learning 基于像素分类的神经网络模型结构,machine-learning,neural-network,theano,convolution,keras,Machine Learning,Neural Network,Theano,Convolution,Keras,我熟悉（C）NNs通常如何处理分类问题（2d图像->1类），但我不知道如何构造一个网络，以获取2d图像并输出2d分类值矩阵实际上，我有一组NxN图像（1个通道），我想在“每像素”的基础上进行分类。我希望输出是一组NxN类，这样对于位置（a，b）处的像素，结果将是输入图像中像素（a，b）的分类结果模型架构有什么帮助吗另外，我听说过基于补丁的方法，但我想将整个NxN映像无需“补丁”即可送入网络谢谢！乔总的来说，这项任务没有什么特别之处。DNN可以同时执行多个分类或回归任务。由于权重是共享的

我熟悉（C）NNs通常如何处理分类问题（2d图像->1类），但我不知道如何构造一个网络，以获取2d图像并输出2d分类值矩阵

实际上，我有一组NxN图像（1个通道），我想在“每像素”的基础上进行分类。我希望输出是一组NxN类，这样对于位置（a，b）处的像素，结果将是输入图像中像素（a，b）的分类结果

模型架构有什么帮助吗

另外，我听说过基于补丁的方法，但我想将整个NxN映像无需“补丁”即可送入网络

谢谢！

乔总的来说，这项任务没有什么特别之处。DNN可以同时执行多个分类或回归任务。由于权重是共享的，您可以确保在对每个像素进行分类的过程中，一个像素和所有其他像素之间存在某种链接

长话短说，解决此问题的可能算法：

1）确保您有一个训练集，其中输入有NxN图像，输出有目标类标签的NxN矩阵（每个像素的类标签）

2）使用通常用于图像分类的体系结构构建一些DNN。像两个最大池的卷积层，然后是2-3个完全连接的ReLU层

3）确保输出层的大小为NxN，而不是softmax层（再次使用ReLU）

4）训练它

这应该绝对有效。我还可以向您保证，从DNN获得几个半独立的输出并不罕见。例如，同一网络用于同时定位所有面部关键点（眼睛、嘴巴、鼻子等）。

像素是否依赖于其他像素？您有什么问题？我的意思是你可以很明显地尝试使用NxN输入层和NxN输出层。只需确保不要在整个输出层上应用softmax函数（就像我们在分类问题中通常所做的那样）。试试看是否有效。或者你已经试过了？这些图像是医学CT扫描的切片@malioboro：一个像素并不明确地依赖于其他像素，但就像一个图像一样，它们是内在联系的。@马克西姆：这不是一个有效的自动编码器吗？为分类目的创建这样一个网络有什么建议吗？