使用rvest删除文本_R_Web_Web Scraping_Rvest

使用rvest删除文本

r web web-scraping

使用rvest删除文本,r,web,web-scraping,rvest,R,Web,Web Scraping,Rvest,我正在尝试从以下网站中删除一个文本项：我想从网页顶部“Position:”后面的“3B”中刮取一个项目。我下面的尝试只创建了一个空数据集aka: 字符（0）感谢您的帮助。谢谢 library(rvest) url="http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B" ret <- url %>% read_html() %>% html_nodes(xpat

我正在尝试从以下网站中删除一个文本项：
我想从网页顶部“Position:”后面的“3B”中刮取一个项目。我下面的尝试只创建了一个空数据集aka:

字符（0）

感谢您的帮助。谢谢

library(rvest)
url="http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B"       
ret <- url %>%
    read_html() %>%
    html_nodes(xpath='//*[@id="content"]/table[1]/tbody/tr/td[1]/table/tbody/tr[1]/td/div[2]/text()[4]') %>%
    html_text()

ret

库（rvest）
url=”http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B"       
ret%
读取html（）%>%
html_节点（xpath='/*[@id=“content”]/table[1]/tbody/tr/td[1]/table/tbody/tr[1]/td/div[2]/text（）[4]'）%>%
html_text（）
ret

使用这个

xpath

：

/*[@id=“content”]/table[1]/tr/td[1]/table/tr[1]/td/div[2]/text（）[5]

它与您的基本相同，只是它排除了

tbody

标记-不确定原因，找不到它的文档-并将最后一个索引更改为5

playerid=639的结果

：

“3B”

（在末尾添加

%%>%trimws（）

以获得

“3B”

）

@g甘巴谢谢！但愿我知道将来复制xpath的问题所在。