Machine learning 基于像素分类的神经网络模型结构

Machine learning 基于像素分类的神经网络模型结构,machine-learning,neural-network,theano,convolution,keras,Machine Learning,Neural Network,Theano,Convolution,Keras,我熟悉(C)NNs通常如何处理分类问题(2d图像->1类),但我不知道如何构造一个网络,以获取2d图像并输出2d分类值矩阵 实际上,我有一组NxN图像(1个通道),我想在“每像素”的基础上进行分类。我希望输出是一组NxN类,这样对于位置(a,b)处的像素,结果将是输入图像中像素(a,b)的分类结果 模型架构有什么帮助吗 另外,我听说过基于补丁的方法,但我想将整个NxN映像无需“补丁”即可送入网络 谢谢! 乔总的来说,这项任务没有什么特别之处。DNN可以同时执行多个分类或回归任务。由于权重是共享的

我熟悉(C)NNs通常如何处理分类问题(2d图像->1类),但我不知道如何构造一个网络,以获取2d图像并输出2d分类值矩阵

实际上,我有一组NxN图像(1个通道),我想在“每像素”的基础上进行分类。我希望输出是一组NxN类,这样对于位置(a,b)处的像素,结果将是输入图像中像素(a,b)的分类结果

模型架构有什么帮助吗

另外,我听说过基于补丁的方法,但我想将整个NxN映像无需“补丁”即可送入网络

谢谢!
乔总的来说,这项任务没有什么特别之处。DNN可以同时执行多个分类或回归任务。由于权重是共享的,您可以确保在对每个像素进行分类的过程中,一个像素和所有其他像素之间存在某种链接

长话短说,解决此问题的可能算法:

1) 确保您有一个训练集,其中输入有NxN图像,输出有目标类标签的NxN矩阵(每个像素的类标签)

2) 使用通常用于图像分类的体系结构构建一些DNN。像两个最大池的卷积层,然后是2-3个完全连接的ReLU层

3) 确保输出层的大小为NxN,而不是softmax层(再次使用ReLU)

4) 训练它


这应该绝对有效。我还可以向您保证,从DNN获得几个半独立的输出并不罕见。例如,同一网络用于同时定位所有面部关键点(眼睛、嘴巴、鼻子等)。

像素是否依赖于其他像素?您有什么问题?我的意思是你可以很明显地尝试使用NxN输入层和NxN输出层。只需确保不要在整个输出层上应用softmax函数(就像我们在分类问题中通常所做的那样)。试试看是否有效。或者你已经试过了?这些图像是医学CT扫描的切片@malioboro:一个像素并不明确地依赖于其他像素,但就像一个图像一样,它们是内在联系的。@马克西姆:这不是一个有效的自动编码器吗?为分类目的创建这样一个网络有什么建议吗?