Python 表示一个实例的多幅图像的卷积神经网络
我有一个分类任务,在这个任务中,我试图根据文档图像识别(比如)一个“应用程序”是否通过/失败。一个应用程序可以有一个或多个文档,而不是对单个图像进行分类。数据如下所示:Python 表示一个实例的多幅图像的卷积神经网络,python,image-processing,machine-learning,keras,conv-neural-network,Python,Image Processing,Machine Learning,Keras,Conv Neural Network,我有一个分类任务,在这个任务中,我试图根据文档图像识别(比如)一个“应用程序”是否通过/失败。一个应用程序可以有一个或多个文档,而不是对单个图像进行分类。数据如下所示: Application_1 (PASS) - document1.jpg - document2.png Application_2 (PASS) - document1.jpg Application_3 (FAIL) - do
Application_1 (PASS)
- document1.jpg
- document2.png
Application_2 (PASS)
- document1.jpg
Application_3 (FAIL)
- document1.jpg
- document2.jpg
- document3.jpg
- document4.jpg
每个应用程序都有一个基于文档内容的合格/不合格标签,例如,护照本身可以通过,许可证+推荐信可以通过,但许可证本身不能通过
我有基于文档文本的分类器,但图像内容很重要。有没有可能训练一个CNN,输入的是任意数量的图像,而不是单个图像?当然可以。一种可能是简单地将图像文件连接成一个文件。另一个是调整输入层以接受所有四个文件。您必须配置CNN拓扑,以处理输入层提供的各种形状的数据
从概念上讲,这与编写CNN的摄取层来处理单个图像几乎没有什么不同,但大小不同。为什么不一次处理一个图像(一批),记录它们的分数,然后对它们进行平均(或任何其他适合您的算法)以获得文档的最终分数
这将需要更少的/无模型重新设计,几乎不需要新的培训。因为它们不是独立的,所以一次输入一个图像,但将输出从“通过/失败”更改为“文档类型映射”和“通过/失败问题”如何?同时,也要确保不同文件的分数对最终分数的影响不同。