如何使用R分析来自互联网的数据以发现差异?

如何使用R分析来自互联网的数据以发现差异?,r,R,我不熟悉“R”;我有这个html表格 我需要找出“时间(DT)”列中是否有超过一分钟的间隔。我需要分析数据并创建一个只包含两列的新表,第一列显示时间,第二列显示间隔数 像这样: 到目前为止,我能够下载数据 require(XML) u='http://cronos.est.pr/test.html' tables = readHTMLTable(u) datatest=tables[[1]] View(datatest) 下一步是什么?使用lubridate包 library(lubridat

我不熟悉“R”;我有这个html表格

我需要找出“时间(DT)”列中是否有超过一分钟的间隔。我需要分析数据并创建一个只包含两列的新表,第一列显示时间,第二列显示间隔数

像这样:

到目前为止,我能够下载数据

require(XML)
u='http://cronos.est.pr/test.html'
tables = readHTMLTable(u)
datatest=tables[[1]]
View(datatest)

下一步是什么?

使用
lubridate

library(lubridate)
minutes = minute(datatest[,"Time (DT)"])
gaps = c(0, diff(minutes))
output = data.frame("date_time" = datatest[,"Time (DT)"], gaps = gaps)
输出与您要求的一样,只是记录了每个间隙,而不仅仅是大于1分钟的间隙。要获得较大的间隙,请执行以下操作:

output[output$gaps > 1,]

使用
lubridate
包装

library(lubridate)
minutes = minute(datatest[,"Time (DT)"])
gaps = c(0, diff(minutes))
output = data.frame("date_time" = datatest[,"Time (DT)"], gaps = gaps)
输出与您要求的一样,只是记录了每个间隙,而不仅仅是大于1分钟的间隙。要获得较大的间隙,请执行以下操作:

output[output$gaps > 1,]

将第一列转换为
“POSIXct”
类,获取差异并用NA替换一分钟或更短的差异。没有使用任何软件包

with(datatest, { 
  Time <- as.POSIXct(`Time (DT)`)
  Diff <- c(0 , c(diff(Time, units = "minutes")))
  data.frame(Time, Diff = ifelse(Diff <= 1, NA, Diff))
})

将第一列转换为
“POSIXct”
类,获取差异并用NA替换一分钟或更短的差异。没有使用任何软件包

with(datatest, { 
  Time <- as.POSIXct(`Time (DT)`)
  Diff <- c(0 , c(diff(Time, units = "minutes")))
  data.frame(Time, Diff = ifelse(Diff <= 1, NA, Diff))
})

我有一个错误:[到达getOption(“max.print”)--省略了89672行]我可以将输出保存在一个.csv文件中吗???这不是一个错误。它只是告诉你,它并没有打印出全部内容,因为考虑到尺寸,你不太可能想这样做。建议您将结果分配给一个变量:
outDF我有此错误:[到达getOption(“max.print”)--省略89672行]我可以将输出保存在.csv文件中吗???这不是错误。它只是告诉你,它并没有打印出全部内容,因为考虑到尺寸,你不太可能想这样做。建议将结果分配给变量:
outDF