R 基于xml的Web抓取价格

R 基于xml的Web抓取价格,r,xml,web-scraping,rvest,xml2,R,Xml,Web Scraping,Rvest,Xml2,我正试图刮取以下内容:13.486 Kč自: 出于某种原因,下面的代码似乎找不到号码。我是一个新手,所以可能是因为xml\u find\u all中的字符串是错误的。谁能看看为什么 library(xml) library(xml2) page <- "https://www.aofis.cz/informace-pro-klienty/elba-opf/" read_page <- read_html(page) Price <- read_pag

我正试图刮取以下内容:13.486 Kč自:

出于某种原因,下面的代码似乎找不到号码。我是一个新手,所以可能是因为xml\u find\u all中的字符串是错误的。谁能看看为什么

library(xml)
library(xml2)

page <- "https://www.aofis.cz/informace-pro-klienty/elba-opf/"  
read_page <- read_html(page)

Price <- read_page %>% 
  rvest::html_nodes('page-content') %>%
  xml2::xml_find_all("//strong[contains(@class 'sg_selected')]") %>% 
  rvest::html_text()

Price
库(xml)
库(xml2)
页数%
rvest::html_text()
价格
谢谢!!
Michael

您在浏览器开发人员面板(或选择器小工具)中看到的html代码与交付到R会话的内容不同。它实际上是一个javascript文件,然后构建web页面。这就是为什么您的
rvest
调用找不到正确的html节点:您正在处理的字符串中没有html节点

有几种不同的方法可以获取您想要的信息,但最好的方法可能是使用正则表达式从javascript代码中获取货币值:


page非常感谢@Allan Cameron!的确非常有用!!!