使用R从论坛抓取网页,如何从以前的用户删除引用并导航到下一页?

使用R从论坛抓取网页,如何从以前的用户删除引用并导航到下一页?,r,web-scraping,rvest,R,Web Scraping,Rvest,我的任务是搜集论坛评论。如果没有以前用户的引用评论,我怎么能删除它们?另外,要自动刮取下一页,如何为其编写循环?非常感谢你的帮助 使用R函数rvest和CSS选择器。刮取的结果包含以前用户的引用。有没有一种方法可以在不引用引文的情况下刮取评论?或者我可以用什么方法删除引用的内容 对于循环,我找不到一种方法来实现它,因为大多数在线教程中的代码不适用于这种情况。论坛不是按url/pageN,而是按每页的评论数,url/+n。对此有什么建议吗 library(XML) library(RCurl) l

我的任务是搜集论坛评论。如果没有以前用户的引用评论,我怎么能删除它们?另外,要自动刮取下一页,如何为其编写循环?非常感谢你的帮助

使用R函数rvest和CSS选择器。刮取的结果包含以前用户的引用。有没有一种方法可以在不引用引文的情况下刮取评论?或者我可以用什么方法删除引用的内容

对于循环,我找不到一种方法来实现它,因为大多数在线教程中的代码不适用于这种情况。论坛不是按url/pageN,而是按每页的评论数,url/+n。对此有什么建议吗

library(XML)
library(RCurl)
library(rvest)
url='https://forum.lowyat.net/topic/4161836'
webpage=read_html(url)
description_data_html <- html_nodes(webpage,'.post_text')
description_data <- html_text(description_data_html)
预期产出应为:

I have a pen.
I have a pen too.

似乎有些条件对我来说不清楚,尤其是要删除、保留哪个句子。Akrun,很抱歉造成混淆。我想从第二个擦掉的句子中删除“QUOTE(USERNAME@DATE TIME)I have a pen.”。所以只剩下“我也有笔”了。希望这能澄清问题。:)这是一个简单的例子。如果您选中字符串2,则它是一个很长的字符串。然后是
“引用(ycgoh123@Dec 30 2016,09:49 AM)听起来很难。
。你删除了之前的整条字符串吗?我需要删除那一行的那一部分。那一行我需要的是“你的朋友承诺得到CIMB CC的金额有多少…”。。。???“如果你看一下网页,你可以得到更清晰的图片,第3条评论。我需要省略报价部分。
I have a pen.
I have a pen too.