Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/64.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何从Google Analytics获取R中的大型数据集?_R_Google Analytics - Fatal编程技术网

如何从Google Analytics获取R中的大型数据集?

如何从Google Analytics获取R中的大型数据集?,r,google-analytics,R,Google Analytics,当我在R中使用google analytics的GoogleAnalytics获取一个小数据集(比如2000个观测值)时,一切都很好 df <- google_analytics(id=ga_id, start="2017-12-01", end="2017-12-31", metrics="ga:users",

当我在R中使用google analytics的GoogleAnalytics获取一个小数据集(比如2000个观测值)时,一切都很好

    df <- google_analytics(id=ga_id,
                           start="2017-12-01",
                           end="2017-12-31",
                           metrics="ga:users",
                           dimensions="ga:dimension1, ga:longitude, ga:latitude",
                           max=10000)  

df有一项规定可以成批运行代码。我使用“rga”库,分批下载大量数据,出来的数据框通常包含所有观察结果。这里有一个小小的修改。如果不行,请告诉我

df <- ga$getData(id, batch =TRUE,
                           start="2017-01-01",
                           end="2017-12-31",
                           metrics="ga:users",
                           dimensions="ga:dimension1, ga:longitude,ga:latitude",
                           max=10000)  

df您需要将max设置为-1,然后它将获取所有结果。您不需要设置批次或页面大小等,它可以为您设置

以下是来自以下方面的一些示例:

#仅1000行

非常感谢,Sree。但当我在googleAnalyticsR库中添加“batch=TRUE”语句时,出现了错误“unused argument(batch=TRUE)”。当我在rga库“df”中使用“batch=TRUE”语句时,我编辑了我的答案HW Scientist。请看。很抱歉我忘记了。我终于能够获得一个包含20000个观察值的数据集。我做了两个调整:1)在定义数据帧之前添加了语句:rga.open(instance=“ga”)。2)将日期格式调整为:start.date=“2017-01-01“,end.date=“2017-12-31”,这与googleAnalyticsR软件包略有不同。
# 1000 rows only
thousand <- google_analytics(ga_id, 
                             date_range = c("2017-01-01", "2017-03-01"), 
                             metrics = "sessions", 
                             dimensions = "date")

# 2000 rows
twothousand <- google_analytics(ga_id, 
                             date_range = c("2017-01-01", "2017-03-01"), 
                             metrics = "sessions", 
                             dimensions = "date",
                             max = 2000)  

# All rows
alldata <- google_analytics(ga_id, 
                             date_range = c("2017-01-01", "2017-03-01"), 
                             metrics = "sessions", 
                             dimensions = "date",
                             max = -1)