Amazon web services AWS g4dn.4XL大型实例中的驱动程序空间不足_Amazon Web Services_Tensorflow_Ubuntu_Nvidia_Partition

Amazon web services AWS g4dn.4XL大型实例中的驱动程序空间不足

amazon-web-services tensorflow ubuntu

Amazon web services AWS g4dn.4XL大型实例中的驱动程序空间不足,amazon-web-services,tensorflow,ubuntu,nvidia,partition,Amazon Web Services,Tensorflow,Ubuntu,Nvidia,Partition,前提：一般来说，我对使用AmazonAWS或Linux分区有点陌生因此，我需要在一个g4dn.4XL的大实例（一个带有单Nvidia T4 GPU的实例）上训练一个Tensorflow 2.0深度学习模型。安装进展顺利，机器已正确初始化。正如我在机器配置中看到的，我有： 8GB根文件夹 200GB的存储空间（我可以使用本指南在启动时装载）下面是lsblk的结果： NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT loop0

前提：一般来说，我对使用AmazonAWS或Linux分区有点陌生

因此，我需要在一个g4dn.4XL的大实例（一个带有单Nvidia T4 GPU的实例）上训练一个Tensorflow 2.0深度学习模型。安装进展顺利，机器已正确初始化。正如我在机器配置中看到的，我有：

8GB根文件夹
200GB的存储空间（我可以使用本指南在启动时装载）

下面是lsblk的结果：

NAME        MAJ:MIN RM   SIZE RO TYPE MOUNTPOINT
loop0         7:0    0  33.3M  1 loop /snap/amazon-ssm-agent/3552
loop1         7:1    0  32.3M  1 loop /snap/snapd/11588
loop2         7:2    0  70.4M  1 loop /snap/lxd/19647
loop3         7:3    0  55.5M  1 loop /snap/core18/1997
loop4         7:4    0  55.4M  1 loop /snap/core18/2066
nvme1n1     259:0    0 209.6G  0 disk /newvolume
nvme0n1     259:1    0     8G  0 disk
└─nvme0n1p1 259:2    0     8G  0 part /

问题：我按照本指南安装了必要的驱动程序，以便能够将GPU与tensorflow一起使用，但我遇到了“设备上没有剩余空间”的问题，因为所需的所有软件包都超过了可用空间（8 GB）

我尝试的内容：我尝试在已装入的磁盘（/newvolume）上安装驱动程序，但它们还是会转到根目录（可能这是愚蠢的做法）。我尝试过用一些粗略的指南合并这两个磁盘，但没有成功或进展

问题：有没有办法将两个分区合并为具有200GB+的根目录，这样我就可以安装必要的驱动程序而不会出现空间问题？或者还有其他解决办法吗

我的目标不是通过配置另一个具有更多空间的实例来扩展根文件夹，而是利用200GB磁盘（nvme1n1）

非常感谢

从AWS EBS控制台将现有EC2根EBS卷大小从8 GB扩展到200 GB。然后，您可以分离和删除/newvolume上安装的EBS卷

或

终止此实例并启动新的EC2。启动实例时，将根卷的大小从8 GB增加到200 GB

df-h显示了什么？为什么不将8GB分区扩展到更大的分区？是的，在启动实例时扩展分区解决了问题。这是一个很小的问题，但我在AWS方面没有足够的经验。