R文本数据刮刀通过日期循环

R文本数据刮刀通过日期循环,r,loops,web-scraping,lapply,R,Loops,Web Scraping,Lapply,我正在做一个小项目,目标是从网站检索文本格式的数据。() 该网站很好,可以在线提供,但他们在不同的链接中整理了几天的数据 我考虑使用以下代码循环日期并存储数据: #Download the needed data my_data <- c() for (i in 01:13){ my_data <- read.delim(sprintf("http://regsho.finra.org/CNMSshvol202005%i.txt", i), header=TRUE, sep=

我正在做一个小项目,目标是从网站检索文本格式的数据。()

该网站很好,可以在线提供,但他们在不同的链接中整理了几天的数据

我考虑使用以下代码循环日期并存储数据:

#Download the needed data

my_data <- c()

for (i in 01:13){

my_data <- read.delim(sprintf("http://regsho.finra.org/CNMSshvol202005%i.txt", i), header=TRUE, sep="|")

}

head(my_data)

我使用了sprintf()方法,因此可以在字符串中包含一个变量

这行空变量my_data似乎总是被最后下载的数据覆盖

my_data <- read.delim(sprintf("http://regsho.finra.org/CNMSshvol202005%i.txt", i), header=TRUE, sep="|")  
# the empty variable my_data always seems to be overwritten by the last data downloaded. 

my_data这应该给您一个前导0,而不使用额外的包:

sprintf("%02d", i)
i、 e


01:13
不考虑“0”,但它与
1:13
相同,因为它是数字。您需要有一个字符串,因此请尝试以下try
stringr::str_pad(1:13,2,“left”,“0”)
对于第二个问题,请尝试
my_data。看起来并不是每个日期都有数据,例如缺少2、3和10。其他几个月也没有几天了。你最好只是删除链接。
sprintf("%02d", i)
sprintf("http://regsho.finra.org/CNMSshvol202005%02d.txt", i)