Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/qt/7.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R-从网页读取表_R - Fatal编程技术网

R-从网页读取表

R-从网页读取表,r,R,我想从下面提到的网页访问包含证券列表的表格 我对R比较陌生,在这个论坛上我尝试了一些解决方案 readLines()方法,尝试使用XML库,即readHTMLTable()方法,但无法从网页访问该表。此外,我还尝试使用GET()将Chrome用作用户代理(因为我收到了禁止的错误消息)。 如果有人能调查这件事,那就太好了 提前感谢:)这应该可以让你开始了 library(httr) site <- GET("https://www.nseindia.com/products/content

我想从下面提到的网页访问包含证券列表的表格

我对R比较陌生,在这个论坛上我尝试了一些解决方案 readLines()方法,尝试使用XML库,即readHTMLTable()方法,但无法从网页访问该表。此外,我还尝试使用GET()将Chrome用作用户代理(因为我收到了禁止的错误消息)。 如果有人能调查这件事,那就太好了


提前感谢:)

这应该可以让你开始了

library(httr)
site <- GET("https://www.nseindia.com/products/content/derivatives/equities/fo_underlying_home.htm",
         user_agent("Mozilla/5.0"))
content <- content(site, as="text")
parsedHTML = htmlParse(content, asText = TRUE)

我怀疑UTF-8存在编码问题,但我并不擅长xpath

这应该让你开始了

library(httr)
site <- GET("https://www.nseindia.com/products/content/derivatives/equities/fo_underlying_home.htm",
         user_agent("Mozilla/5.0"))
content <- content(site, as="text")
parsedHTML = htmlParse(content, asText = TRUE)

我怀疑UTF-8存在编码问题,但我并不擅长xpath

您的Web链接没有指向正确的位置。如果您使用的是
mozilla firefox
,请转到
Developer
部分,在
Network-HTML
下,您将看到所有下载的HTML页面。如果没有,请重新加载页面。其中一个是正确的。我已将其包含在以下代码中

library("httr")
URL <- "https://www.nseindia.com/products/content/derivatives/equities/fo_underlyinglist.htm"
temp <- tempfile(fileext = ".html")
GET(url = URL, user_agent("Mozilla/5.0"), write_disk(temp))

library("XML")
df <- readHTMLTable(temp)
df <- df[[1]]

> head(df)
  S. No.\n    Underlying\n     Symbol
1        1       INDIA VIX   INDIAVIX
2        2        Nifty 50      NIFTY
3        3        Nifty IT    NIFTYIT
4        4      Nifty Bank  BANKNIFTY
5        5 Nifty Midcap 50 NIFTYMID50
6        6       Nifty PSE   NIFTYPSE
库(“httr”)

URL您的Web链接未指向正确的位置。如果您使用的是
mozilla firefox
,请转到
Developer
部分,在
Network-HTML
下,您将看到所有下载的HTML页面。如果没有,请重新加载页面。其中一个是正确的。我已将其包含在以下代码中

library("httr")
URL <- "https://www.nseindia.com/products/content/derivatives/equities/fo_underlyinglist.htm"
temp <- tempfile(fileext = ".html")
GET(url = URL, user_agent("Mozilla/5.0"), write_disk(temp))

library("XML")
df <- readHTMLTable(temp)
df <- df[[1]]

> head(df)
  S. No.\n    Underlying\n     Symbol
1        1       INDIA VIX   INDIAVIX
2        2        Nifty 50      NIFTY
3        3        Nifty IT    NIFTYIT
4        4      Nifty Bank  BANKNIFTY
5        5 Nifty Midcap 50 NIFTYMID50
6        6       Nifty PSE   NIFTYPSE
库(“httr”)
URL
readHTMLTable()
听起来是个不错的选择?你为什么不识字?您可以分享一些代码吗?对于readHTMLTable(),我得到一个错误-内容似乎不是XML,因此值为空。检查。
readHTMLTable()
听起来是个不错的选择?你为什么不识字?您可以分享一些代码吗?对于readHTMLTable(),我得到了一个错误-内容似乎不是XML,因此值为Null检查。