rvest是否可以保留内嵌html标记,如<;br>;使用html_表?

rvest是否可以保留内嵌html标记,如<;br>;使用html_表?,html,r,rvest,Html,R,Rvest,我正试图在R中创建一个以html形式给出的表。Rvest在从表中获取所有文本方面非常有用,但我希望保留HTML表单中出现的内联样式 例如,表中的文本可能是 "This is a sentence <BR> this is another sentence" “这是一句话这是另一句话” 我想保留BR 我试着在整张桌子上读: my_table <- my_table_html %>% html_nodes("table") %>% html_table(fill

我正试图在R中创建一个以html形式给出的表。Rvest在从表中获取所有文本方面非常有用,但我希望保留HTML表单中出现的内联样式

例如,表中的文本可能是

"This is a sentence <BR> this is another sentence"
“这是一句话
这是另一句话”
我想保留BR

我试着在整张桌子上读:

my_table <- my_table_html %>% 
html_nodes("table") %>% 
html_table(fill=TRUE) 
我的表格%
html_节点(“表”)%%>%
html_表(fill=TRUE)
我还尝试选择表中的特定列:

my_column <- my_table_html %>% 
html_nodes(".Tabletitle:nth-child(2)") %>%
html_text()
myu列%
html_节点(“.Tabletitle:第n个子节点(2)”)%>%
html_text()
任何想法都将不胜感激

库(rvest)
library(rvest)

pg <- read_html("This is a sentence <BR> this is another sentence")

xml_find_all(pg, ".//br") %>% xml_add_sibling("p", "\n")

xml_find_all(pg, ".//br") %>% xml_remove()

html_text(pg)
## [1] "This is a sentence \n this is another sentence"
pg%xml\u添加\u同级(“p”,“n”) xml\u find\u all(pg,“../br”)%%>%xml\u remove() html_文本(pg) ##[1]“这是一个句子\n这是另一个句子”
你找到答案了吗?我希望用html_text()做同样的事情。Python中有一个解决方案:--也许它可以适应rvest/xml2。