如何将此csv语法读入R
我正在尝试将这个csv文件直接从web导入R;但是,我得到的所有值都是列名 csv文件如下所示: 月/年,“指数”如何将此csv语法读入R,r,csv,import,R,Csv,Import,我正在尝试将这个csv文件直接从web导入R;但是,我得到的所有值都是列名 csv文件如下所示: 月/年,“指数” “2019年2月”、“125” “2019年3月”、“127日” “2019年4月”、“130年” 到目前为止,我已经尝试: read.csv("path", header = TRUE) #Not working read.delim("path", header = TRUE, sep = ",") 如果您需要源URL,可以在此处找到: 编辑: 在检查了源文件和一些注释之后
“2019年2月”、“125”
“2019年3月”、“127日”
“2019年4月”、“130年” 到目前为止,我已经尝试:
read.csv("path", header = TRUE) #Not working
read.delim("path", header = TRUE, sep = ",")
如果您需要源URL,可以在此处找到:
编辑:
在检查了源文件和一些注释之后,我意识到它是以HTML而不是CSV的形式发送信息的;因此,这是另一种问题。现在我将结束这个问题,因为我将操作数据以自动读取它。这里使用
数据没有问题。表的fread()
这里使用数据没有问题。表的fread()
源文件不是普通的CSV文件,而是用HTML格式化的
Mes/Año,"Índice de precios Lima Metropolitana (índice 2009 = 100) - IPC Sin Alimentos"<br>"Feb.2018","123.094735792622"
<br>"Mar.2018","124.074279098189"<br>"Abr.2018","124.106210561863"
<br>"May.2018","124.110950696298"<br>"Jun.2018","124.457010420352"
<br>"Jul.2018","124.821481844788"<br>"Ago.2018","124.952886180169"
Mes/Añ;o、 “Í;ndice de precios Lima Metropolitana(Í;ndice 2009=100)-食品工业协会”
“2018年2月”、“123.094735792622”
“2018年3月”、“124.074279098189”
“2018年3月”、“124.106210561863”
“2018年5月”、“124.110950696298”
“2018年6月”、“124.457010420352”
“2018年7月”、“124.821481844788”
“2018年前”、“124.952886180169”
等等。您需要使用另一个包将其解析为HTML,或者可能将其作为字符串读取,然后自己将其拆分-每一行以
标记结束,然后在该行中,字段用逗号拆分。源文件不是普通的CSV文件,而是用HTML格式化的
Mes/Año,"Índice de precios Lima Metropolitana (índice 2009 = 100) - IPC Sin Alimentos"<br>"Feb.2018","123.094735792622"
<br>"Mar.2018","124.074279098189"<br>"Abr.2018","124.106210561863"
<br>"May.2018","124.110950696298"<br>"Jun.2018","124.457010420352"
<br>"Jul.2018","124.821481844788"<br>"Ago.2018","124.952886180169"
Mes/Añ;o、 “Í;ndice de precios Lima Metropolitana(Í;ndice 2009=100)-食品工业协会”
“2018年2月”、“123.094735792622”
“2018年3月”、“124.074279098189”
“2018年3月”、“124.106210561863”
“2018年5月”、“124.110950696298”
“2018年6月”、“124.457010420352”
“2018年7月”、“124.821481844788”
“2018年前”、“124.952886180169”
等等。您需要使用另一个包将其解析为HTML,或者可能将其作为字符串读取,然后自己将其拆分-每一行以
标记结束,然后在该行中,字段以逗号拆分。可能是因为您提供的url在表行之间包含
,你可以打开chrome开发工具来检查它
尝试从R下载数据并加载到R中。可能是因为您提供的url在表行之间包含
,您可以打开chrome开发工具查看它
尝试从R下载数据并加载到R中。我也处理来自此网站的数据。我不知道你是如何找到这个链接的,但我可以告诉你,直接刮表非常容易。此外,您还可以使用链接的命名法随时间更改日期。(2020-1. 2020-2, ... 2020-12). 我在我的抓取代码中执行以下操作:
library(httr)
httr::set_config(config(ssl_verifypeer = FALSE)) # bad ssl on the site
r = GET("https://estadisticas.bcrp.gob.pe/estadisticas/series/mensuales/resultados/PN01288PM/html/2018-2/2020-1/")
r = content(r, "text")
r = read_html(r)
r = html_table(fill = TRUE)
r[[2]]
我还处理这个网站上的数据。我不知道你是如何找到这个链接的,但我可以告诉你,直接刮表非常容易。此外,您还可以使用链接的命名法随时间更改日期。(2020-1. 2020-2, ... 2020-12). 我在我的抓取代码中执行以下操作:
library(httr)
httr::set_config(config(ssl_verifypeer = FALSE)) # bad ssl on the site
r = GET("https://estadisticas.bcrp.gob.pe/estadisticas/series/mensuales/resultados/PN01288PM/html/2018-2/2020-1/")
r = content(r, "text")
r = read_html(r)
r = html_table(fill = TRUE)
r[[2]]
read.csv
可以处理问题中显示的数据,但链接中的数据与问题中的数据格式不同。请修正你的问题,修正问题。我直接从文档中发布了链接,没有意识到它给了我另一种格式。感谢您注意到read.csv
确实适用于问题中显示的数据,但链接中的数据与问题中的数据格式不同。请修正你的问题,修正问题。我直接从文档中发布了链接,没有意识到它给了我另一种格式。谢谢你注意到这个答案适用于问题本身所显示的数据,所以我已经推翻了有人对这个答案的反对票。问题在于问题,而不是答案。这确实是一个应该被否决的问题,而不是答案。请看我在问题下的评论。这个答案适用于问题本身所显示的数据,因此我已经推翻了有人对这个答案投的反对票。问题在于问题,而不是答案。这确实是一个应该被否决的问题,而不是答案。请看我在问题下的评论。这应该是一个评论。它没有提供问题的答案。这应该是一个评论。它没有回答这个问题。