在Python中将数据加载到训练集中

在Python中将数据加载到训练集中,python,load,Python,Load,我需要在我的2个目录中的所有文件上创建一个培训和测试集。但我只能选择一个文件。如何浏览所有的.npz文件 图像存储在图像文件夹中,格式如下:[患者id].npz。每个.npz文件都包含扫描和掩码三维阵列,可通过以下方式访问: import numpy as np archive = np.load('Train set/Images/patient_002.npz') train_scan = archive['scan'] train_mask = archive['mask'] test

我需要在我的2个目录中的所有文件上创建一个培训和测试集。但我只能选择一个文件。如何浏览所有的.npz文件

图像存储在图像文件夹中,格式如下:[患者id].npz。每个.npz文件都包含扫描和掩码三维阵列,可通过以下方式访问:

import numpy as np

archive = np.load('Train set/Images/patient_002.npz')
train_scan = archive['scan']
train_mask = archive['mask']

test_set = np.load('Test set/Images/patient_000.npz')
test_scan = test_set['scan']
test_mask = test_set['mask']
将test_scan.shape和train_mask.shape作为3d矩阵:

输出:

92,92,92

您可以使用


然后您可以读取for循环中的所有_文件。希望这有帮助。

到底是什么问题?你在挣扎哪一部分?
import os
all_files = []
for _, _, file_name in os.walk('Train set/Images/'):
    all_files.extend(file_name)

all_files = [file_name for file_name in all_files if file_name.endswith('.npz')]