html_节点返回不同数量的行(R)
我是个新手,我正试图创建一个网站。该网站包含许多产品及其价格。当我勉强做到这一点时,不知何故,价格的数量超过了产品的数量html_节点返回不同数量的行(R),html,r,web-scraping,rvest,Html,R,Web Scraping,Rvest,我是个新手,我正试图创建一个网站。该网站包含许多产品及其价格。当我勉强做到这一点时,不知何故,价格的数量超过了产品的数量 library(rvest) url <- 'https://website' webpage <- read_html(url) SKU_data <- html_nodes(webpage,'.title') %>% html_text() Price_data <- html_nodes(webpage,'.pric
library(rvest)
url <- 'https://website'
webpage <- read_html(url)
SKU_data <- html_nodes(webpage,'.title') %>% html_text()
Price_data <- html_nodes(webpage,'.price') %>% html_text()
res <- data.frame(SKU_data,Price_data)
库(rvest)
url长度不同的原因是网站对某些产品给出了多种价格。你会想要最低的,对吗?最低价格包含在具有3 486,-ΓПц.
的元素中。使用,可以提取以下内容:
SKU_data <- html_nodes(webpage,'.title') %>% html_text()
price_xpath <- "//span[contains(@style, 'position:relative')]"
Price_data <- html_nodes(webpage, xpath = price_xpath) %>%
html_text()
res <- data.frame(SKU_data, Price_data)
head(res)
# SKU_data Price_data
# 1 Кресло Чинция Пластик Неаполь N-20 1 699,-грн.
# 2 Стул Луиза хром Неаполь N-20 479,-грн.
# 3 OM-100 Стол письменный (1350х600х750мм) бук/бук 659,-грн.
SKU数据%html\u文本()
price_xpath要解决这个问题,我需要从代码1881,-1 699,-ΓПц中接收数值。正如您所看到的,这里有两个值,其中第一个有时不存在。但我需要每一秒。如何从那里得到它?然后我将拥有与SKU名称相同的511值。这是我所需要的,非常感谢!将进一步了解XPath,因为它为您提供了更强大的解析能力:)