在r中导入json文件的选定列

在r中导入json文件的选定列,json,r,Json,R,找不到如何加载巨大JSON的任何解决方案。我尝试使用著名的Yelp数据集。它是3.2GB,我想分析10列中的9列。我需要跳过import$text列,这将使我可以轻松地加载文件。大概是-70%。我不想操纵这个文件 我尝试了很多图书馆,但都卡住了。我找到了data.frame的解决方案,可以应用pipe函数: df试试这个: library(jsonlite) df <- as.data.frame(fromJSON('yelp_academic_dataset_review.json',

找不到如何加载巨大JSON的任何解决方案。我尝试使用著名的Yelp数据集。它是3.2GB,我想分析10列中的9列。我需要跳过import
$text
列,这将使我可以轻松地加载文件。大概是-70%。我不想操纵这个文件

我尝试了很多图书馆,但都卡住了。我找到了
data.frame
的解决方案,可以应用
pipe
函数:

df试试这个:

library(jsonlite)

df <- as.data.frame(fromJSON('yelp_academic_dataset_review.json', flatten=TRUE))
library(jsonlite)

df谢谢,但是扁平版也一样,因为结构是扁平的。替代品是好的,但它是一种替代品。也许是唯一的解决办法,也许还有另一个。加载文件需要这么长时间吗?你可以只做一次,然后删除列,然后用
toJSON
编写一个新的json供将来使用。这是无限的负载。没有办法看到结果。更糟糕的是,它不是我想要加载的最大文件,所以我现在正在考虑编写json包,以便在这个过程中以某种有效的方式读取和操作数据。当然我放弃了,我会重新格式化文件。我不想下载答案,但如果一个json包含1000个字段,其中只有2个字段是有趣的,那么你的解决方案最多也就是效率低下。json看起来怎么样?是每个键/值对都有缩进和换行符,还是全部都有一条长线?
library(jsonlite)

df <- as.data.frame(fromJSON('yelp_academic_dataset_review.json', flatten=TRUE))