使用rvest删除文本
我正在尝试从以下网站中删除一个文本项:使用rvest删除文本,r,web,web-scraping,rvest,R,Web,Web Scraping,Rvest,我正在尝试从以下网站中删除一个文本项: 我想从网页顶部“Position:”后面的“3B”中刮取一个项目。我下面的尝试只创建了一个空数据集aka: 字符(0) 感谢您的帮助。谢谢 library(rvest) url="http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B" ret <- url %>% read_html() %>% html_nodes(xpat
我想从网页顶部“Position:”后面的“3B”中刮取一个项目。我下面的尝试只创建了一个空数据集aka:
字符(0)
感谢您的帮助。谢谢
library(rvest)
url="http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B"
ret <- url %>%
read_html() %>%
html_nodes(xpath='//*[@id="content"]/table[1]/tbody/tr/td[1]/table/tbody/tr[1]/td/div[2]/text()[4]') %>%
html_text()
ret
库(rvest)
url=”http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B"
ret%
读取html()%>%
html_节点(xpath='/*[@id=“content”]/table[1]/tbody/tr/td[1]/table/tbody/tr[1]/td/div[2]/text()[4]')%>%
html_text()
ret
使用这个xpath
:/*[@id=“content”]/table[1]/tr/td[1]/table/tr[1]/td/div[2]/text()[5]
它与您的基本相同,只是它排除了tbody
标记-不确定原因,找不到它的文档-并将最后一个索引更改为5
playerid=639的结果
:“3B”
(在末尾添加
%%>%trimws()
以获得“3B”
)@g甘巴谢谢!但愿我知道将来复制xpath的问题所在。