R 读取二进制向量

R 读取二进制向量,r,R,想象一下,我从一个API得到一个二进制响应,它是一个用saveRDS()(R-version>3.5)创建的.rds对象。基本上,内置的iris数据集的前五行,如下面的cont对象: cont = as.raw(c(0x1f, 0x8b, 0x08, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 0x03, 0x85, 0x50, 0xb1, 0x4e, 0xc3, 0x30, 0x10, 0x75, 0x93, 0xba,

想象一下,我从一个API得到一个二进制响应,它是一个用
saveRDS()
(R-version>3.5)创建的.rds对象。基本上,内置的
iris
数据集的前五行,如下面的
cont
对象:

cont = as.raw(c(0x1f, 0x8b, 0x08, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00, 
            0x03, 0x85, 0x50, 0xb1, 0x4e, 0xc3, 0x30, 0x10, 0x75, 0x93, 0xba, 
            0x6d, 0x42, 0x40, 0xa8, 0xed, 0x6f, 0x90, 0x99, 0xad, 0x9e, 0x98, 
            0x18, 0x90, 0x0a, 0x82, 0xd5, 0x72, 0x9d, 0x62, 0xc9, 0x24, 0x95, 
            0x6d, 0x85, 0x95, 0xdf, 0x80, 0x3f, 0x42, 0x82, 0xbf, 0x41, 0x88, 
            0x09, 0xb0, 0x73, 0xe7, 0x08, 0xd2, 0xa1, 0x27, 0x59, 0xef, 0xee, 
            0xf9, 0xbd, 0x3b, 0xdd, 0xdd, 0xe5, 0x84, 0x90, 0x94, 0xa4, 0x93, 
            0x11, 0x49, 0xa9, 0x4f, 0x09, 0xbd, 0xb9, 0xbe, 0x38, 0x3b, 0xf7, 
            0xdc, 0x22, 0x14, 0xfe, 0x9d, 0x04, 0x64, 0xcb, 0xaa, 0x0b, 0xb6, 
            0x78, 0x0e, 0xf1, 0xc2, 0xe6, 0x6f, 0x21, 0xde, 0xd9, 0x1c, 0xf9, 
            0x25, 0x89, 0x01, 0xfa, 0x02, 0x0a, 0x36, 0x43, 0xcc, 0xd0, 0x37, 
            0x43, 0x5f, 0x01, 0x18, 0xf5, 0xab, 0x4f, 0xe8, 0xd3, 0xe3, 0x07, 
            0xfc, 0xaf, 0xbe, 0xc0, 0x1f, 0xf9, 0x5e, 0xff, 0x0a, 0xfd, 0x0e, 
            0xa1, 0xdf, 0xe3, 0x18, 0xf7, 0x18, 0xed, 0xbf, 0x71, 0xd2, 0xe1, 
            0x98, 0x64, 0x1e, 0x27, 0x5a, 0xb6, 0x52, 0x5b, 0x9f, 0x9d, 0x76, 
            0x27, 0x41, 0xd6, 0x4a, 0xd7, 0x58, 0x8e, 0x55, 0xde, 0x4a, 0x63, 
            0x95, 0x68, 0x74, 0x63, 0x90, 0xc9, 0x5a, 0x65, 0xb6, 0xaa, 0x56, 
            0x82, 0x0f, 0xda, 0x51, 0xa1, 0xb9, 0x8d, 0xdd, 0xfa, 0x19, 0x15, 
            0x17, 0xce, 0x7b, 0x09, 0xf9, 0x1e, 0xca, 0x6b, 0xfe, 0x20, 0xa3, 
            0x9c, 0x22, 0x59, 0xac, 0xe5, 0x8e, 0xeb, 0xf2, 0x52, 0xd6, 0x5b, 
            0x77, 0x8f, 0xdc, 0x11, 0x70, 0xb7, 0x6a, 0xd3, 0x53, 0xc5, 0x95, 
            0x74, 0x7b, 0x32, 0xe0, 0xfe, 0xca, 0xa6, 0xeb, 0x9d, 0x14, 0x2a, 
            0x0c, 0xf9, 0x37, 0x39, 0x33, 0xcd, 0x63, 0x19, 0xa7, 0x87, 0x63, 
            0x25, 0x4f, 0x70, 0x73, 0x0a, 0xc2, 0xe4, 0x67, 0xb0, 0x44, 0xbe, 
            0xe1, 0x8e, 0x97, 0x95, 0xf1, 0x96, 0xb0, 0xc8, 0x2f, 0xd6, 0xf2, 
            0xca, 0x74, 0x42, 0x02, 0x00, 0x00))
我可以将其保存在本地,然后使用
readRDS()
读取,如下所示:

tmp = tempfile()
writeBin(cont, tmp)
iris5 = readRDS(tmp)

然而,在R中难道没有一种方法可以直接将二进制向量读回data.frame吗?类似于
readBin(cont)
——尽管这不起作用。

您可以使用
rawConnection()
将原始向量转换为可读连接。一个复杂的问题是,字节被压缩,当从连接读取时,
readRDS()
不会自动解压缩它们。所以你会得到这个:

readRDS(rawConnection(cont))
# Error in readRDS(rawConnection(cont)) : unknown input format
但是,您可以显式解压缩该文件,然后它就可以工作了:

readRDS(gzcon(rawConnection(cont)))
#  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1          5.1         3.5          1.4         0.2  setosa
#2          4.9         3.0          1.4         0.2  setosa
#3          4.7         3.2          1.3         0.2  setosa
#4          4.6         3.1          1.5         0.2  setosa
#5          5.0         3.6          1.4         0.2  setosa
编辑添加:另一个复杂的问题是,上面的代码打开了连接,但从未关闭它,因此最终会收到关于未使用的连接保持打开的警告。这解决了这个问题:

con <- gzcon(rawConnection(cont))
result <- readRDS(con)
close(con)

我不太清楚你在问什么。您的
cont
向量是否已经定义为二进制向量?您想用
readBin(cont)
实现什么?我希望将二进制向量读入看起来像iris5对象的data.frame,而不需要将其作为中间步骤保存在本地。更改了问题。有趣的问题。在我看来,这更像是一个能够直接(无需连接)使用
readRDS(cont)
的问题。您说过这些对象来自API。您能否在此API的输出上调用
readRDS()
readRDS()
需要的连接对象可以是url。请注意:
readBin(cont)
失败,因为您没有告诉它要读取什么。您可以使用
readBin(cont,integer(),n=2,size=1,signed=FALSE)
将前2个字节作为整数读取。这对于
readBin
是特殊的,大多数函数不能直接从原始向量读取。另一种方法是
readChar
。不,
readBin()
根本不会将值解释为数据帧。这个调用只是将原始字节转换为相应的整数。谢谢!我花了好几个小时试着让它工作!!