Python Resnet50对PyTorch视频中的人类行为进行分类

Python Resnet50对PyTorch视频中的人类行为进行分类,python,computer-vision,pytorch,Python,Computer Vision,Pytorch,我正在尝试使用Resnet50对回购后的人类行为进行分类。我已经实现了自己的数据加载器来从数据集生成批。与回购协议不同,我使用的不是3D CNN,而是一个简单的Pytork Resnet50。因此,我需要一个4D张量输入来输入网络,而我需要一个5D(批量大小、通道大小、堆叠图像、高度、宽度),其中堆叠图像是视频中不同时间步长的帧。我是否应该停止堆叠这些图像,只是在4D张量列表上迭代

我正在尝试使用Resnet50对回购后的人类行为进行分类。我已经实现了自己的数据加载器来从数据集生成批。与回购协议不同,我使用的不是3D CNN,而是一个简单的Pytork Resnet50。因此,我需要一个4D张量输入来输入网络,而我需要一个5D(批量大小、通道大小、堆叠图像、高度、宽度),其中堆叠图像是视频中不同时间步长的帧。我是否应该停止堆叠这些图像,只是在4D张量列表上迭代