Python Resnet50对PyTorch视频中的人类行为进行分类_Python_Computer Vision_Pytorch

Python Resnet50对PyTorch视频中的人类行为进行分类

python computer-vision pytorch

Python Resnet50对PyTorch视频中的人类行为进行分类,python,computer-vision,pytorch,Python,Computer Vision,Pytorch,我正在尝试使用Resnet50对回购后的人类行为进行分类。我已经实现了自己的数据加载器来从数据集生成批。与回购协议不同，我使用的不是3D CNN，而是一个简单的Pytork Resnet50。因此，我需要一个4D张量输入来输入网络，而我需要一个5D（批量大小、通道大小、堆叠图像、高度、宽度），其中堆叠图像是视频中不同时间步长的帧。我是否应该停止堆叠这些图像，只是在4D张量列表上迭代

我正在尝试使用Resnet50对回购后的人类行为进行分类。我已经实现了自己的数据加载器来从数据集生成批。与回购协议不同，我使用的不是3D CNN，而是一个简单的Pytork Resnet50。因此，我需要一个4D张量输入来输入网络，而我需要一个5D（批量大小、通道大小、堆叠图像、高度、宽度），其中堆叠图像是视频中不同时间步长的帧。我是否应该停止堆叠这些图像，只是在4D张量列表上迭代