rvest是否可以保留内嵌html标记,如<;br>;使用html_表?
我正试图在R中创建一个以html形式给出的表。Rvest在从表中获取所有文本方面非常有用,但我希望保留HTML表单中出现的内联样式 例如,表中的文本可能是rvest是否可以保留内嵌html标记,如<;br>;使用html_表?,html,r,rvest,Html,R,Rvest,我正试图在R中创建一个以html形式给出的表。Rvest在从表中获取所有文本方面非常有用,但我希望保留HTML表单中出现的内联样式 例如,表中的文本可能是 "This is a sentence <BR> this is another sentence" “这是一句话这是另一句话” 我想保留BR 我试着在整张桌子上读: my_table <- my_table_html %>% html_nodes("table") %>% html_table(fill
"This is a sentence <BR> this is another sentence"
“这是一句话
这是另一句话”
我想保留BR
我试着在整张桌子上读:
my_table <- my_table_html %>%
html_nodes("table") %>%
html_table(fill=TRUE)
我的表格%
html_节点(“表”)%%>%
html_表(fill=TRUE)
我还尝试选择表中的特定列:
my_column <- my_table_html %>%
html_nodes(".Tabletitle:nth-child(2)") %>%
html_text()
myu列%
html_节点(“.Tabletitle:第n个子节点(2)”)%>%
html_text()
任何想法都将不胜感激库(rvest)
library(rvest)
pg <- read_html("This is a sentence <BR> this is another sentence")
xml_find_all(pg, ".//br") %>% xml_add_sibling("p", "\n")
xml_find_all(pg, ".//br") %>% xml_remove()
html_text(pg)
## [1] "This is a sentence \n this is another sentence"
pg%xml\u添加\u同级(“p”,“n”)
xml\u find\u all(pg,“../br”)%%>%xml\u remove()
html_文本(pg)
##[1]“这是一个句子\n这是另一个句子”
你找到答案了吗?我希望用html_text()做同样的事情。Python中有一个解决方案:--也许它可以适应rvest/xml2。