Neural network 时间相关特征的卷积神经网络

Neural network 时间相关特征的卷积神经网络,neural-network,convolution,feature-extraction,feature-selection,conv-neural-network,Neural Network,Convolution,Feature Extraction,Feature Selection,Conv Neural Network,我需要从一系列图像中进行降维。更具体地说,每个图像都是一个球运动的快照,最佳特征是它的位置和速度。据我所知,CNN在减少图像分类功能方面是最先进的,但在这种情况下,只提供了一帧。如果在不同的时间步长上有许多图像,是否也可以提取与时间相关的特征?否则,这样做的最先进技术是什么 这是我第一次使用CNN,我也非常感谢任何参考资料或任何其他建议。如果你想让网络以某种方式识别一个与时间相关的进程,你可能应该研究递归神经网络(RNN)。由于您将在视频上操作,因此您应该研究递归卷积神经网络(RCNN),如:

我需要从一系列图像中进行降维。更具体地说,每个图像都是一个球运动的快照,最佳特征是它的位置和速度。据我所知,CNN在减少图像分类功能方面是最先进的,但在这种情况下,只提供了一帧。如果在不同的时间步长上有许多图像,是否也可以提取与时间相关的特征?否则,这样做的最先进技术是什么


这是我第一次使用CNN,我也非常感谢任何参考资料或任何其他建议。

如果你想让网络以某种方式识别一个与时间相关的进程,你可能应该研究递归神经网络(RNN)。由于您将在视频上操作,因此您应该研究递归卷积神经网络(RCNN),如:

重复添加一些输入数据先前状态的内存。请参见Karpathy的这一很好的解释:

在您的情况下,您需要在多个图像中重复,而不是仅在一个图像中重复。看起来您需要解决的第一个问题是图像分割问题(能够从图像的其余部分中挑出球),上面链接的第一篇文章是关于分割的。(再说一遍,也许你是想利用移动来识别移动的物体?)


这里还有另一个想法:也许您只能查看连续帧之间的差异,并将其用作您的convnet的输入数据?然后,输入的“图像”将显示运动对象在前一帧中的位置以及在当前帧中的位置。差异越大,移动量越大。这可能会产生与使用循环网络类似的效果。

谢谢!RCNN似乎是我需要的,这篇论文非常有趣。我想我应该尝试这样的方法:我给RCNN提供X个连续的图片,它应该能很好地近似表示场景的特征,同时考虑到球运动的差异。