Image 如何使用机器学习/视觉功能在胶片扫描中查找帧?

Image 如何使用机器学习/视觉功能在胶片扫描中查找帧?,image,machine-learning,computer-vision,ml.net,Image,Machine Learning,Computer Vision,Ml.net,我最近开始从事电影摄影。工作流程的一部分是使用平板扫描仪扫描图像。不幸的是,这个过程非常缓慢。使用一些软件(Silverfast)进行预扫描,放大并进行更详细的预扫描,单击并拖动一个突出显示帧的矩形,进行12帧的预扫描,然后将软件设置为进行全分辨率扫描 我想自动化这个过程。我希望扫描整个胶片带,然后使用ML.Net查找每个帧(左上角的X,Y坐标),然后将其传递给ImageMagick以提取实际图像,而不是在每个帧的位置进行布局 我想使用ML.Net,因为我是一名.Net开发人员,以后可能有机会使

我最近开始从事电影摄影。工作流程的一部分是使用平板扫描仪扫描图像。不幸的是,这个过程非常缓慢。使用一些软件(Silverfast)进行预扫描,放大并进行更详细的预扫描,单击并拖动一个突出显示帧的矩形,进行12帧的预扫描,然后将软件设置为进行全分辨率扫描

我想自动化这个过程。我希望扫描整个胶片带,然后使用ML.Net查找每个帧(左上角的X,Y坐标),然后将其传递给ImageMagick以提取实际图像,而不是在每个帧的位置进行布局

我想使用ML.Net,因为我是一名.Net开发人员,以后可能有机会使用此体验。所以,尽管使用OpenCV的示例是受欢迎的,但最好使用ML.Net

说到ML的东西,我有点不知所措。我的第一个想法是尝试训练一个神经网络,输入扫描图像并输出X和Y值。然而,这看起来很幼稚(因为图像的大小是100s MB)。我想有更好的工具,然后只是一个原始的神经网络

我在“ML对象识别”上的搜索似乎没有什么帮助,因为我找到的例子是在一张不是“框架”的图像中找到狗或人;可能是狗也可能是人

即使是一个指向正确方向的指针,一个正确的名称,对于这个问题也会有很大的帮助


那么,我应该使用什么类型的工具/函数来尝试使用ML.net解决这类问题呢?

这与其说是一个机器学习问题,不如说是一个图像处理问题。我认为ML.Net是相当过分的

您可能需要的是一个图像处理库,并利用某种形式的边缘检测或“感兴趣区域”检测

例如,看看这个问题:

也许我误解了你想做什么,你实际上会从机器学习中受益;然后,在将图像馈送到模型之前,您可能应该使用图像处理库对图像进行预处理

希望能有帮助