如何在python中加载图像数据集

如何在python中加载图像数据集,python,image-processing,deep-learning,computer-vision,pytorch,Python,Image Processing,Deep Learning,Computer Vision,Pytorch,我有一个文件夹(在我的windows桌面上),其中包含我想用来构建深度学习分类器的图像。我还有一个.csv文件,它有图像编号(例如img_1035)和相应的类标签如何将带有标签的数据集加载到python/jupyter笔记本中? 这是kaggle()上数据集的链接 我更愿意使用PyTorch来实现这一点,但任何其他方式也将受到高度赞赏 幸运的是,PyTorch有一个方便的工具,您可以扩展它来创建自己的数据集 以下是使用ImageFolder的数据集示例: class MyDataset(torc

我有一个文件夹(在我的windows桌面上),其中包含我想用来构建深度学习分类器的图像。我还有一个.csv文件,它有图像编号(例如img_1035)和相应的类标签如何将带有标签的数据集加载到python/jupyter笔记本中? 这是kaggle()上数据集的链接


我更愿意使用PyTorch来实现这一点,但任何其他方式也将受到高度赞赏

幸运的是,PyTorch有一个方便的工具,您可以扩展它来创建自己的数据集

以下是使用ImageFolder的数据集示例:

class MyDataset(torchvision.datasets.ImageFolder):

def __init__(self, train_folder_path='.', transform=None, target_transform=None):
    super().__init__(train_folder_path, transform, target_transform)

# [ Some functions omitted ]
然后,使用PyTorch的“数据加载器”加载设备。 以下是一个培训集示例:

training_set = MyDataset(root_path, transform)
train_loader = torch.utils.data.DataLoader(training_set, batch_size=batch_size, shuffle=True)
使用火车装载机,您可以从数据集中获取批次。然后,您可以使用这些批次进行培训/验证,以此类推:

batch = next(iter(train_loader))
images, labels = batch

训练是一个相当复杂的过程,所以我不完全确定你想在这里潜多深。我希望这是一个正确的方向。

您应该了解如何在pytorch中构建自定义数据集。应该相当容易。