Python 神经网络能识别屏幕并复制有限的一组动作吗?

Python 神经网络能识别屏幕并复制有限的一组动作吗?,python,neural-network,image-recognition,online-algorithm,Python,Neural Network,Image Recognition,Online Algorithm,我明白了,神经网络可以复制任何功能 通常,神经网络向其输入神经元提供一组描述符,然后在其输出神经元上给出一定的分数。我想让我的神经网络从屏幕上识别某些行为。屏幕上的对象已经过预处理并且清晰可见,因此识别不应该是一个问题 是否有可能使用神经网络识别屏幕上的像素化图片,并在此基础上做出决策?当然,训练数据的数量将是巨大的。有没有办法通过在线监督学习来教授人工神经网络 编辑: 因为有评论说编程问题太普遍了: 我想先用python实现它,看看它是否有效。如果有人能给我提供一个资源,让我用python进行

我明白了,神经网络可以复制任何功能

通常,神经网络向其输入神经元提供一组描述符,然后在其输出神经元上给出一定的分数。我想让我的神经网络从屏幕上识别某些行为。屏幕上的对象已经过预处理并且清晰可见,因此识别不应该是一个问题

是否有可能使用神经网络识别屏幕上的像素化图片,并在此基础上做出决策?当然,训练数据的数量将是巨大的。有没有办法通过在线监督学习来教授人工神经网络

编辑: 因为有评论说编程问题太普遍了:
我想先用python实现它,看看它是否有效。如果有人能给我提供一个资源,让我用python进行在线学习,我将不胜感激。

这并不完全正确

三层前馈MLP理论上可以复制任何连续函数

如果存在不连续性,则需要第四层

因为你正在处理像素化的屏幕,这样,你可能需要考虑第四层。 最后,如果您正在研究圆形等,那么径向基函数(RBF)网络可能更合适。

我建议

openCV基本上是一个图像处理库,但也有一些惊人的助手类,可以用于几乎任何任务。它的机器学习模块非常容易使用,您可以通过源代码查看关于每个功能的解释和背景理论

您还可以使用纯python机器学习库,如:

但是,在将屏幕上的数据(我假设是像素数?)输入到ANN或SVM或您选择的任何ML算法之前,您需要对数据执行“特征提取”。(屏幕上的对象有哪些)

特征提取可以被认为类似于在屏幕上表示相同的数据,但数字较少,因此我可以给我的ANN的数字较少。在找到适合您特定场景的组合之前,您需要对不同的功能进行试验。示例一可以如下所示:

[x1,y1,x2,y2…,col]

这基本上是表示对象所在区域的边点列表。一种ROI(感兴趣区域),执行egde检测、颜色检测,并提取任何其他相关特征。重要的是,现在所有的对象,它们的形状/颜色信息都由许多这样的列表表示,每个检测到的对象对应一个列表

这是可以作为神经网络输入的数据。当然,在训练/测试系统之前,您必须根据具体的问题陈述定义一些有意义的完整输出参数


希望这有帮助。

是的,您可以训练一个适当大的ANN,在给定适当数量的样本的情况下复制任何函数。然而,更有可能的是,另一种工具更适合您的问题。我想这是一个错误的问题。具体的编程问题也是如此,而不是寻找一般问题的解决方案。然而:理论告诉我们,人工神经网络几乎可以做任何事情(著名的引文“有一个人工神经网络可以做到这一点。”[需要引文];-))。在实践中,无论是计算性能还是检测性能都不是很好。好吧,我对ANN不是很精通,所以我想通过使用像素来避免特征提取:)。但似乎我无法绕过它,必须为我的数据编写一些描述符。有什么现成的东西我可以用吗?hm可能想就此提出另一个问题,或者可能会有所帮助?