有没有办法将R包中的数据帧保存为hdf5以加载到python中?
我试图从CASdatasets包()循环中导出每个数据集,并将它们保存到有没有办法将R包中的数据帧保存为hdf5以加载到python中?,python,r,hdf5,Python,R,Hdf5,我试图从CASdatasets包()循环中导出每个数据集,并将它们保存到hdf5文件中,以便将每个数据集作为数据帧加载到python中。然而,我对R的熟悉程度不如python。是否有方法循环遍历包中的每个数据集,并将每个数据集作为hdf5文件保存到磁盘 到目前为止,我已经 install.packages("CASdatasets", repos = "http://dutangc.free.fr/pub/RRepos/", type="source") library(CASdatasets)
hdf5
文件中,以便将每个数据集作为数据帧加载到python中。然而,我对R的熟悉程度不如python。是否有方法循环遍历包中的每个数据集,并将每个数据集作为hdf5
文件保存到磁盘
到目前为止,我已经
install.packages("CASdatasets", repos = "http://dutangc.free.fr/pub/RRepos/", type="source")
library(CASdatasets)
有不同的方法可以做到这一点。这里的这个将rda文件直接从库加载到一个新的环境中。从那里,您可以导出为任何文件格式
library(feather)
all_data <- list.files(
file.path(.libPaths()[1], "CASdatasets", "data"),
pattern = "\\.rda",
full.names = TRUE
)
# Load all files into a fresh environment
data_env <- new.env()
lapply(all_data, load, envir = data_env)
# Export into your favourite format
for (f in names(data_env)[1:3]) {
if (is.data.frame(f))
write_feather(data_env[[f]], paste(f, ".feather"))
else
warning(f)
}
库(feather)
所有的数据都有不同的方法。这里的这个将rda文件直接从库加载到一个新的环境中。从那里,您可以导出为任何文件格式
library(feather)
all_data <- list.files(
file.path(.libPaths()[1], "CASdatasets", "data"),
pattern = "\\.rda",
full.names = TRUE
)
# Load all files into a fresh environment
data_env <- new.env()
lapply(all_data, load, envir = data_env)
# Export into your favourite format
for (f in names(data_env)[1:3]) {
if (is.data.frame(f))
write_feather(data_env[[f]], paste(f, ".feather"))
else
warning(f)
}
库(feather)
你可能会发现这是一个有趣的替代方案。你有没有看过《感谢大家》。是否有一些有效的r循环将每个数据集从CASdatasets包中拉出来,然后使用feather或rpy2进行保存或转换?您可能会发现这是一个有趣的替代方法。您是否也看到了“参考所有”。是否有一些高效的r循环将每个数据集从CASdatasets包中拉出来,然后使用feather或rpy2进行保存或转换?