如何从Google Analytics获取R中的大型数据集?
当我在R中使用google analytics的GoogleAnalytics获取一个小数据集(比如2000个观测值)时,一切都很好如何从Google Analytics获取R中的大型数据集?,r,google-analytics,R,Google Analytics,当我在R中使用google analytics的GoogleAnalytics获取一个小数据集(比如2000个观测值)时,一切都很好 df <- google_analytics(id=ga_id, start="2017-12-01", end="2017-12-31", metrics="ga:users",
df <- google_analytics(id=ga_id,
start="2017-12-01",
end="2017-12-31",
metrics="ga:users",
dimensions="ga:dimension1, ga:longitude, ga:latitude",
max=10000)
df有一项规定可以成批运行代码。我使用“rga”库,分批下载大量数据,出来的数据框通常包含所有观察结果。这里有一个小小的修改。如果不行,请告诉我
df <- ga$getData(id, batch =TRUE,
start="2017-01-01",
end="2017-12-31",
metrics="ga:users",
dimensions="ga:dimension1, ga:longitude,ga:latitude",
max=10000)
df您需要将max设置为-1,然后它将获取所有结果。您不需要设置批次或页面大小等,它可以为您设置
以下是来自以下方面的一些示例:
#仅1000行
非常感谢,Sree。但当我在googleAnalyticsR库中添加“batch=TRUE”语句时,出现了错误“unused argument(batch=TRUE)”。当我在rga库“df”中使用“batch=TRUE”语句时,我编辑了我的答案HW Scientist。请看。很抱歉我忘记了。我终于能够获得一个包含20000个观察值的数据集。我做了两个调整:1)在定义数据帧之前添加了语句:rga.open(instance=“ga”)。2)将日期格式调整为:start.date=“2017-01-01“,end.date=“2017-12-31”,这与googleAnalyticsR软件包略有不同。
# 1000 rows only
thousand <- google_analytics(ga_id,
date_range = c("2017-01-01", "2017-03-01"),
metrics = "sessions",
dimensions = "date")
# 2000 rows
twothousand <- google_analytics(ga_id,
date_range = c("2017-01-01", "2017-03-01"),
metrics = "sessions",
dimensions = "date",
max = 2000)
# All rows
alldata <- google_analytics(ga_id,
date_range = c("2017-01-01", "2017-03-01"),
metrics = "sessions",
dimensions = "date",
max = -1)