使用R进行HTML刮取-刮取特定节点时出错
我正试图从网页上截取工作描述- 我还不熟悉使用HTML和CSS选择器进行抓取,所以如果我做了一些愚蠢的事情,我向您道歉 我有以下代码使用R进行HTML刮取-刮取特定节点时出错,r,web-scraping,data-science,R,Web Scraping,Data Science,我正试图从网页上截取工作描述- 我还不熟悉使用HTML和CSS选择器进行抓取,所以如果我做了一些愚蠢的事情,我向您道歉 我有以下代码 test_url <- read_html("https://www.indeed.com/cmp/HP/jobs") job_description <- test_url %>% html_nodes(".cmp-JobDetailDescription") %>% html_text() test\u url%
test_url <- read_html("https://www.indeed.com/cmp/HP/jobs")
job_description <- test_url %>%
html_nodes(".cmp-JobDetailDescription") %>%
html_text()
test\u url%
html_text()
我使用CSS选择器来查找节点,但由于某些原因,我无法获得工作描述
要提取该url中的所有职务描述,我必须在代码中更改什么
提前感谢请看一看API文档:该页面对独立描述发出xhr请求,例如,我怀疑url的一部分是原始页面上的id。刮取是针对T&C的,因此我建议查看APIOhh,我明白了,谢谢:)