Neural network TX2上的Nvidia数字错误代码1
我不熟悉数字和TX2。我正在尝试使用以下教程创建对象检测模型: 我成功地创建了数据集。问题在于模型 在创建模型时,我遇到以下错误Neural network TX2上的Nvidia数字错误代码1,neural-network,object-detection,tegra,nvidia-digits,nvidia-jetson,Neural Network,Object Detection,Tegra,Nvidia Digits,Nvidia Jetson,我不熟悉数字和TX2。我正在尝试使用以下教程创建对象检测模型: 我成功地创建了数据集。问题在于模型 在创建模型时,我遇到以下错误 Memory required for data: 3268934784 creating layer bbox_loss Creating Layer bbox_loss bbox_loss <- bboxes-obj-masked-norm bbox_loss <- bbox-obj-label-
Memory required for data: 3268934784
creating layer bbox_loss
Creating Layer bbox_loss
bbox_loss <- bboxes-obj-masked-norm
bbox_loss <- bbox-obj-label-norm
bbox_loss -> loss_bbox
Setting up bbox_loss
Top shape: (1)
with loss weight 2
Memory required for data: 3268934788
Creating layer coverage_loss
Creating Layer coverage_loss
coverage_loss <- coverage_coverage/sig_0_split_0
coverage_loss <- coverage-label_slice-label_4_split_0
coverage_loss -> loss_coverage
Setting up coverage_loss
Top shape: (1)
with loss weight 1
Memory required for data: 3268934792
Creating layer cluster
服务器上的错误为
2018-08-16 16:10:53 [20180816-161051-e67a] [INFO ] Task subprocess args: "/home/nvidia/Caffe/caffe/build/tools/caffe train --solver=/home/nvidia/DIGITS/digits/jobs/20180816-161051-e67a/solver.prototxt --gpu=0 --weights=/home/nvidia/bvlc_googlenet.caffemodel.4"
2018-08-16 16:11:00 [20180816-161051-e67a] [ERROR] Train Caffe Model task failed with error code 1
我不知道如何释放内存,因为作业目录中有超过2GB的可用内存。
请帮帮我。提前谢谢。过去几天也有同样的问题,也许将来会有帮助。首先,确保您拥有正确版本的protobuf。您可以通过以下方式进行检查:
protoc --version
如果是2.*则必须更新为3.*,例如,按照此处列出的方式构建,然后重新构建Caffe。另外,确保您拥有protobuf的pip包的兼容版本。对于我来说,以下版本目前对本教程中的Digits和Caffe很有效:
protoc --version
pip install --user --upgrade protobuf==3.1.0.post1