Python 表示一个实例的多幅图像的卷积神经网络_Python_Image Processing_Machine Learning_Keras_Conv Neural Network

Python 表示一个实例的多幅图像的卷积神经网络

python image-processing machine-learning keras

Python 表示一个实例的多幅图像的卷积神经网络,python,image-processing,machine-learning,keras,conv-neural-network,Python,Image Processing,Machine Learning,Keras,Conv Neural Network,我有一个分类任务，在这个任务中，我试图根据文档图像识别（比如）一个“应用程序”是否通过/失败。一个应用程序可以有一个或多个文档，而不是对单个图像进行分类。数据如下所示： Application_1 (PASS) - document1.jpg - document2.png Application_2 (PASS) - document1.jpg Application_3 (FAIL) - do

我有一个分类任务，在这个任务中，我试图根据文档图像识别（比如）一个“应用程序”是否通过/失败。一个应用程序可以有一个或多个文档，而不是对单个图像进行分类。数据如下所示：

 Application_1          (PASS)
     - document1.jpg
     - document2.png
 Application_2          (PASS)
     - document1.jpg
 Application_3          (FAIL)
     - document1.jpg
     - document2.jpg
     - document3.jpg
     - document4.jpg

每个应用程序都有一个基于文档内容的合格/不合格标签，例如，护照本身可以通过，许可证+推荐信可以通过，但许可证本身不能通过

我有基于文档文本的分类器，但图像内容很重要。有没有可能训练一个CNN，输入的是任意数量的图像，而不是单个图像？

当然可以。一种可能是简单地将图像文件连接成一个文件。另一个是调整输入层以接受所有四个文件。您必须配置CNN拓扑，以处理输入层提供的各种形状的数据

从概念上讲，这与编写CNN的摄取层来处理单个图像几乎没有什么不同，但大小不同。

为什么不一次处理一个图像（一批），记录它们的分数，然后对它们进行平均（或任何其他适合您的算法）以获得文档的最终分数

这将需要更少的/无模型重新设计，几乎不需要新的培训。

因为它们不是独立的，所以一次输入一个图像，但将输出从“通过/失败”更改为“文档类型映射”和“通过/失败问题”如何？同时，也要确保不同文件的分数对最终分数的影响不同。