Amazon web services AWS g4dn.4XL大型实例中的驱动程序空间不足
前提:一般来说,我对使用AmazonAWS或Linux分区有点陌生 因此,我需要在一个g4dn.4XL的大实例(一个带有单Nvidia T4 GPU的实例)上训练一个Tensorflow 2.0深度学习模型。 安装进展顺利,机器已正确初始化。 正如我在机器配置中看到的,我有:Amazon web services AWS g4dn.4XL大型实例中的驱动程序空间不足,amazon-web-services,tensorflow,ubuntu,nvidia,partition,Amazon Web Services,Tensorflow,Ubuntu,Nvidia,Partition,前提:一般来说,我对使用AmazonAWS或Linux分区有点陌生 因此,我需要在一个g4dn.4XL的大实例(一个带有单Nvidia T4 GPU的实例)上训练一个Tensorflow 2.0深度学习模型。 安装进展顺利,机器已正确初始化。 正如我在机器配置中看到的,我有: 8GB根文件夹 200GB的存储空间(我可以使用本指南在启动时装载) 下面是lsblk的结果: NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT loop0
- 8GB根文件夹李>
- 200GB的存储空间(我可以使用本指南在启动时装载)
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
loop0 7:0 0 33.3M 1 loop /snap/amazon-ssm-agent/3552
loop1 7:1 0 32.3M 1 loop /snap/snapd/11588
loop2 7:2 0 70.4M 1 loop /snap/lxd/19647
loop3 7:3 0 55.5M 1 loop /snap/core18/1997
loop4 7:4 0 55.4M 1 loop /snap/core18/2066
nvme1n1 259:0 0 209.6G 0 disk /newvolume
nvme0n1 259:1 0 8G 0 disk
└─nvme0n1p1 259:2 0 8G 0 part /
问题:我按照本指南安装了必要的驱动程序,以便能够将GPU与tensorflow一起使用,但我遇到了“设备上没有剩余空间”的问题,因为所需的所有软件包都超过了可用空间(8 GB)
我尝试的内容:我尝试在已装入的磁盘(/newvolume)上安装驱动程序,但它们还是会转到根目录(可能这是愚蠢的做法)。我尝试过用一些粗略的指南合并这两个磁盘,但没有成功或进展
问题:有没有办法将两个分区合并为具有200GB+的根目录,这样我就可以安装必要的驱动程序而不会出现空间问题?或者还有其他解决办法吗
我的目标不是通过配置另一个具有更多空间的实例来扩展根文件夹,而是利用200GB磁盘(nvme1n1)
非常感谢
df-h显示了什么?为什么不将8GB分区扩展到更大的分区?是的,在启动实例时扩展分区解决了问题。这是一个很小的问题,但我在AWS方面没有足够的经验。