Google cloud platform Cloud ML无法在Google云存储上找到该文件

Google cloud platform Cloud ML无法在Google云存储上找到该文件,google-cloud-platform,google-cloud-storage,google-cloud-ml,Google Cloud Platform,Google Cloud Storage,Google Cloud Ml,我正在使用以下命令读取数据文件: data_dir = arguments['data_dir'] data = pd.read_csv(data_dir + "/train.csv") 我正在使用此数据在Google Cloud ML上训练我的模型,我成功地安排了作业,但在获取文件时出现以下IO错误: IOError:文件gs://cloud bucket/data/train.csv不存在 文件的地址是正确的,因为我已经使用上面提到的bucket中的控制台上传了它。此外,Cloud ML与

我正在使用以下命令读取数据文件:

data_dir = arguments['data_dir']
data = pd.read_csv(data_dir + "/train.csv")
我正在使用此数据在Google Cloud ML上训练我的模型,我成功地安排了作业,但在获取文件时出现以下IO错误:

IOError:文件gs://cloud bucket/data/train.csv不存在


文件的地址是正确的,因为我已经使用上面提到的bucket中的控制台上传了它。此外,Cloud ML与my bucket在同一地区工作,并配置了同一个项目,因为GCS不是POSIX文件系统,因此您通常无法使用“常规”文件库来操作GCS上的文件(例如,请参阅和),当然包括方便的功能,如
pd.read\u csv

在熊猫的情况下,您可以传递一个文件句柄,因此,基于上述情况,我建议使用TensorFlow的文件包装器,它可以从GCS或标准POSIX文件系统读取,使您能够在本地和云上运行相同的代码:

from tensorflow.python.lib.io import file_io

data_dir = arguments['data_dir']
with file_io.FileIO(data_dir + "/train.csv", mode ='r') as f:
  data = pd.read_csv(f)
通过在本地运行代码并在提交云作业之前传入GCS文件名来测试代码也可能会有所帮助