Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/69.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ember.js/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中的read_html()未使用rvest包读取整个页面_R_Rvest - Fatal编程技术网

R中的read_html()未使用rvest包读取整个页面

R中的read_html()未使用rvest包读取整个页面,r,rvest,R,Rvest,我正试图阅读成员类型和评论下面的链接使用rvest包。但是,我的代码总是只返回前10条注释。我觉得read_html(url)并不是在阅读整个页面。请帮我做这个 下面是我正在使用的代码: url = "http://mmb.moneycontrol.com/stock-message-forum/axisbank/comments/3142?utm_source=PC_SENTI" library(rvest) html_content= read_html(url) html_main_n

我正试图阅读成员类型和评论下面的链接使用rvest包。但是,我的代码总是只返回前10条注释。我觉得read_html(url)并不是在阅读整个页面。请帮我做这个

下面是我正在使用的代码:

url = "http://mmb.moneycontrol.com/stock-message-forum/axisbank/comments/3142?utm_source=PC_SENTI"


library(rvest)
html_content= read_html(url)
html_main_node = html_nodes(html_content,".info a")
html_text(html_main_node)

谢谢

rvest
正在阅读整个页面。只是页面不断动态加载更多的内容。在这种情况下,有没有办法增加会话的阅读时间?或者任何其他建议都会很有帮助。那没有帮助。向下滚动时,网站将加载内容。但是,即使它在一定时间后加载,
read\uhtml
也不会在站点上执行脚本,它只是在读取静态内容——这是应该的。我不知道有什么简单的方法可以删除这些内容。令人悲哀的是,这种“花哨”的脚本破坏了可用性(在本例中,还破坏了机器可读性)。这就是说,有问题的网站可能不想被刮掉,所以他们当然不想让它变得简单。我能够使用Rselenium软件包实现它,使用发布的参考信息,这样人们就不会疯狂了。以下是动态URL:(将100更改为您认为可以达到的最大值)。开发者工具->网络->XHR点击FTW
rvest
阅读完整页面。只是页面不断动态加载更多的内容。在这种情况下,有没有办法增加会话的阅读时间?或者任何其他建议都会很有帮助。那没有帮助。向下滚动时,网站将加载内容。但是,即使它在一定时间后加载,
read\uhtml
也不会在站点上执行脚本,它只是在读取静态内容——这是应该的。我不知道有什么简单的方法可以删除这些内容。令人悲哀的是,这种“花哨”的脚本破坏了可用性(在本例中,还破坏了机器可读性)。这就是说,有问题的网站可能不想被刮掉,所以他们当然不想让它变得简单。我能够使用Rselenium软件包实现它,使用发布的参考信息,这样人们就不会疯狂了。以下是动态URL:(将100更改为您认为可以达到的最大值)。开发者工具->网络->XHR点击FTW