从R包生成中排除数据集

从R包生成中排除数据集,r,build,dataset,package,rstudio,R,Build,Dataset,Package,Rstudio,我正在实现一个R包,在“data”文件夹中有几个大的.rda数据文件 当我构建包(使用R CMD build创建.tar.gz压缩文件)时,数据文件也包含在包中,因为它们非常大,这使得构建(以及检查)过程非常缓慢,最终的包大小也非常大 这些数据是通过包的函数从某个数据库下载的,因此目的不是要将数据包含在包中,而是让用户从自己的数据库填充数据文件夹。我使用的数据是用于测试的,将它们包含到包中是没有意义的 总结我的问题是:是否可以将数据保存在“数据”文件夹中,但将其从构建包中排除? 编辑 好的,我通

我正在实现一个R包,在“data”文件夹中有几个大的.rda数据文件

当我构建包(使用R CMD build创建.tar.gz压缩文件)时,数据文件也包含在包中,因为它们非常大,这使得构建(以及检查)过程非常缓慢,最终的包大小也非常大

这些数据是通过包的函数从某个数据库下载的,因此目的不是要将数据包含在包中,而是让用户从自己的数据库填充数据文件夹。我使用的数据是用于测试的,将它们包含到包中是没有意义的

总结我的问题是:是否可以将数据保存在“数据”文件夹中,但将其从构建包中排除?

编辑

好的,我通过创建一个名为
.Rbuildignore
的文件找到了第一个解决方案,该文件包含一行:

^data/.+$
无论如何,R CMD安装和R CMD检查过程仍然存在问题,这些过程不考虑
.Rbuildignore
文件


是否建议将文件夹也从安装/检查过程中排除?

如果使用
.Rbuildignore
则应首先生成,然后检查软件包(这不是检查忽略)。以下是Debian环境和随机软件包中的一些测试:

l@np350v5c:~/src/yapomif/pkg$ ls
data  DESCRIPTION  man  NAMESPACE  R

l@np350v5c:~/src/yapomif/pkg$ R
> save(Formaldehyde, file = "data/formal.rda")

l@np350v5c:~/src/yapomif/pkg$ ls -l
totale 20
drwxr-xr-x 2 l l 4096 mag  1 01:31 data
-rw-r--r-- 1 l l  349 apr 25 00:35 DESCRIPTION
drwxr-xr-x 2 l l 4096 apr 25 01:10 man
-rw-r--r-- 1 l l 1189 apr 25 00:33 NAMESPACE
drwxr-xr-x 2 l l 4096 apr 25 01:02 R

l@np350v5c:~/src/yapomif/pkg$ ls -l data/
totale 4
-rw-r--r-- 1 l l 229 mag  1 01:31 formal.rda
现在我完全创建了您的
.Rbuildignore

l@np350v5c:~/src/yapomif/pkg$ em .Rbuildignore
l@np350v5c:~/src/yapomif/pkg$ cat .Rbuildignore
^data/.+$
好的,让我们建造

l@np350v5c:~/src/yapomif/pkg$ cd ..
l@np350v5c:~/src/yapomif$ R CMD build pkg
> tools:::.build_packages()
* checking for file ‘pkg/DESCRIPTION’ ... OK
* preparing ‘yapomif’:
* checking DESCRIPTION meta-information ... OK
* checking for LF line-endings in source and make files
* checking for empty or unneeded directories
Removed empty directory ‘yapomif/data’
* building ‘yapomif_0.8.tar.gz’
很好(您可以看到关于yapomif/data的消息)。现在检查一下包裹

l@np350v5c:~/src/yapomif$ R CMD check yapomif_0.8.tar.gz
> tools:::.check_packages()
* using log directory ‘/home/l/.src/yapomif/yapomif.Rcheck’
* using R version 3.1.0 (2014-04-10)
* using platform: x86_64-pc-linux-gnu (64-bit)
...
。。。一切照旧

现在让我们检查文件(移动到主目录以保留我的 发展主任(清洁)

所以没有数据目录

但如果

l@np350v5c:~/src/yapomif$ R CMD check pkg

...

Undocumented data sets:
  ‘Formaldehyde’
如前所述,首先构建,然后检查


嗯,卢卡

@Nicola我希望我的测试有用,因为现在是下一阶段。。。但是,您不能使用该函数在web上的某个位置检索较小的数据集,以便使小场景完全可复制吗?
l@np350v5c:~/src/yapomif$ R CMD check pkg

...

Undocumented data sets:
  ‘Formaldehyde’