Python 神经网络能识别屏幕并复制有限的一组动作吗？_Python_Neural Network_Image Recognition_Online Algorithm

Python 神经网络能识别屏幕并复制有限的一组动作吗？

python neural-network

Python 神经网络能识别屏幕并复制有限的一组动作吗？,python,neural-network,image-recognition,online-algorithm,Python,Neural Network,Image Recognition,Online Algorithm,我明白了，神经网络可以复制任何功能通常，神经网络向其输入神经元提供一组描述符，然后在其输出神经元上给出一定的分数。我想让我的神经网络从屏幕上识别某些行为。屏幕上的对象已经过预处理并且清晰可见，因此识别不应该是一个问题是否有可能使用神经网络识别屏幕上的像素化图片，并在此基础上做出决策？当然，训练数据的数量将是巨大的。有没有办法通过在线监督学习来教授人工神经网络编辑：因为有评论说编程问题太普遍了：我想先用python实现它，看看它是否有效。如果有人能给我提供一个资源，让我用python进行

我明白了，神经网络可以复制任何功能

通常，神经网络向其输入神经元提供一组描述符，然后在其输出神经元上给出一定的分数。我想让我的神经网络从屏幕上识别某些行为。屏幕上的对象已经过预处理并且清晰可见，因此识别不应该是一个问题

是否有可能使用神经网络识别屏幕上的像素化图片，并在此基础上做出决策？当然，训练数据的数量将是巨大的。有没有办法通过在线监督学习来教授人工神经网络

编辑：因为有评论说编程问题太普遍了：

我想先用python实现它，看看它是否有效。如果有人能给我提供一个资源，让我用python进行在线学习，我将不胜感激。

这并不完全正确

三层前馈MLP理论上可以复制任何连续函数

如果存在不连续性，则需要第四层

因为你正在处理像素化的屏幕，这样，你可能需要考虑第四层。最后，如果您正在研究圆形等，那么径向基函数（RBF）网络可能更合适。

我建议

openCV基本上是一个图像处理库，但也有一些惊人的助手类，可以用于几乎任何任务。它的机器学习模块非常容易使用，您可以通过源代码查看关于每个功能的解释和背景理论

您还可以使用纯python机器学习库，如：

但是，在将屏幕上的数据（我假设是像素数？）输入到ANN或SVM或您选择的任何ML算法之前，您需要对数据执行“特征提取”。（屏幕上的对象有哪些）

特征提取可以被认为类似于在屏幕上表示相同的数据，但数字较少，因此我可以给我的ANN的数字较少。在找到适合您特定场景的组合之前，您需要对不同的功能进行试验。示例一可以如下所示：

[x1，y1，x2，y2…，col]

这基本上是表示对象所在区域的边点列表。一种ROI（感兴趣区域），执行egde检测、颜色检测，并提取任何其他相关特征。重要的是，现在所有的对象，它们的形状/颜色信息都由许多这样的列表表示，每个检测到的对象对应一个列表

这是可以作为神经网络输入的数据。当然，在训练/测试系统之前，您必须根据具体的问题陈述定义一些有意义的完整输出参数

希望这有帮助。

是的，您可以训练一个适当大的ANN，在给定适当数量的样本的情况下复制任何函数。然而，更有可能的是，另一种工具更适合您的问题。我想这是一个错误的问题。具体的编程问题也是如此，而不是寻找一般问题的解决方案。然而：理论告诉我们，人工神经网络几乎可以做任何事情（著名的引文“有一个人工神经网络可以做到这一点。”[需要引文]；-））。在实践中，无论是计算性能还是检测性能都不是很好。好吧，我对ANN不是很精通，所以我想通过使用像素来避免特征提取：）。但似乎我无法绕过它，必须为我的数据编写一些描述符。有什么现成的东西我可以用吗？hm可能想就此提出另一个问题，或者可能会有所帮助？