Dask 尝试使用OpenDAP打开一系列netCDF文件

Dask 尝试使用OpenDAP打开一系列netCDF文件,dask,netcdf,python-xarray,noaa,Dask,Netcdf,Python Xarray,Noaa,我想使用xarray和open_mfdataset打开1950-2005年的所有数据。 这就是我到目前为止所做的: 来源= 然而,我似乎无法将我的列表解读为源代码中的可变年份 有什么想法吗 先谢谢你 编辑: 路径https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface' files=['{0}/air.sig995.{1:04d}.nc'.formatpath,年份范围19502005,1] 打

我想使用xarray和open_mfdataset打开1950-2005年的所有数据。

这就是我到目前为止所做的:

来源=

然而,我似乎无法将我的列表解读为源代码中的可变年份

有什么想法吗

先谢谢你

编辑: 路径https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface' files=['{0}/air.sig995.{1:04d}.nc'.formatpath,年份范围19502005,1] 打印文件 nc=netCDF4.MFDatasetfiles

这是我正在使用的代码。当我试图打开这些文件时,出现了一个错误:

OSError: [Errno -90] NetCDF: file not found: b'https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/air.sig995.1948.nc'
我没有正确输入路径吗?

所有文件都命名为air.sig995.YYYY.nc,因此您需要类似以下内容:

files = ['air.sig995.{0:04d}.nc'.format(years) for years in range(1950,2005,1)]
产生:

In [2]: files
Out[2]: 
['air.sig995.1950.nc',
 'air.sig995.1951.nc',
 'air.sig995.1952.nc',
 'air.sig995.1953.nc',
 .....
如果需要,您还可以在此处轻松包含远程路径:

path = '/some/file/path'
files = ['{0}/air.sig995.{1:04d}.nc'.format(path, years) for years in range(1950,2005,1)]

有关Python中字符串格式的更多信息,请参阅。

这就是我一直在寻找的内容。我不确定如何在远程路径中将日期作为变量引用。将这些数据组合成一个连续时间序列的最佳方法是什么?也许是xarray?正是xarray。您可以使用xr.auto_combine。
path = '/some/file/path'
files = ['{0}/air.sig995.{1:04d}.nc'.format(path, years) for years in range(1950,2005,1)]