R刮网-以下为“；阅读更多“；使用rvest链接并获取详细信息_R_Web Scraping_Rvest - Fatal编程技术网

R刮网-以下为“；阅读更多“；使用rvest链接并获取详细信息

r web-scraping

R刮网-以下为“；阅读更多“；使用rvest链接并获取详细信息,r,web-scraping,rvest,R,Web Scraping,Rvest,我正在使用rvest包从网页中获取信息。我想刮网站的前两页下面是我的代码。我面临的问题是删掉评论部分。在有“阅读更多”的地方，我想去那个链接，把所有的评论都删掉有人能告诉我怎么做吗？我试图跟随链接并跳转到，但没有成功 library(rvest) hospital <- html("http://www.ratemds.com/doctors/?specialty=family-gp") nxt_pg<- "&page=3" nxt_pg1<- "?page2

我正在使用rvest包从网页中获取信息。我想刮网站的前两页

下面是我的代码。我面临的问题是删掉评论部分。在有“阅读更多”的地方，我想去那个链接，把所有的评论都删掉

有人能告诉我怎么做吗？我试图跟随链接并跳转到，但没有成功

library(rvest)

hospital <- html("http://www.ratemds.com/doctors/?specialty=family-gp")

nxt_pg<- "&page=3"
nxt_pg1<- "?page2=&"
hospital_test1 <-paste0("http://www.ratemds.com/doctors/",nxt_pg1,"?specialty=family-gp",
                        nxt_pg,sep="") 
hospital_test1 <- html(hospital_test1)

web_crawler(x=hospital)

web_crawler <- function(x)

{
  Doctor_nm <- x %>%  
    html_nodes("h2 a") %>%
    html_text()
  Doctor_nm
  # return(Doctor_nm) 

  Comments <- x %>%
    html_nodes(".rating-comment") %>%
    html_text()
  Comments
  # return(Comments)
  return(list(Doctor_nm,Comments))
}

fd<-web_crawler(x=hospital)
df <- as.data.frame(fd)
colnames(df) <- c ("Doctors_nm","Comments")
fd1<-web_crawler(x=hospital_test1)
df1 <- as.data.frame(fd1)
colnames(df1) <- c ("Doctors_nm","Comments")

Final_data <- rbind(df,df1)

库（rvest）
医院帮助（html\U会话）
您需要处于会话上下文中才能有效地使用这些内容。@hrbrmstr我尝试过使用html\U会话，但不确定如何使用它。这就是我得到的>s另一种方法是获取与阅读更多
相关的所有网页的列表（请参见查看页面源代码或检查），然后使用html
解析这些网页。或者使用医生的姓名和ID，您可以创建唯一的url，然后相应地解析这些url。




[web scraping]相关文章推荐



                                                        
Web scraping SGMLLinkedExtractor（）不会提取所有URL
web-scrapingscrapy 
Web scraping 将csv数据放入阵列imacros js
web-scraping 
Web scraping 谁擅长抓取网站？我有一个棘手的问题
web-scrapingmapsgis 
Web scraping 如何从nutch中的特定标记中选择数据
web-scrapingweb-crawler 
Web scraping html5lib:TypeError:uu init_uuuuuuuuuuuuuuuuuuuuuuu（）获得了一个意外的关键字参数'；编码'；
web-scraping 
Web scraping Selenium Internet Explorer驱动程序所需功能错误
web-scraping 
Web scraping iMacros从搜索中提取POS
web-scraping 
Web scraping 如何用Pentaho解析HTML文件？
web-scrapingpentaho 
Web scraping 用茉莉花测试木偶演员？
web-scraping 
Web scraping 抓取、上传和通知
web-scraping 
Web scraping 此版本的ChromeDriver仅支持Chrome版本78
web-scraping 
Web scraping IMPORTFROMWEB（），splitResult=TRUE是否不适用于此表？
web-scrapinggoogle-sheets 
Web scraping IP轮换-是否可以在python脚本上添加vpn？
web-scrapingproxy 
Web scraping 可以在cheerio.js中获取按钮的x和y坐标吗
web-scraping 
Web scraping 如何在scrapy.selector.unified.SelectorList上迭代使用xpath？
web-scrapingxpathscrapy 
                                       





随机文章推荐



                                                        
Charts 有没有办法在x轴上以每小时的时间标度绘制一天的变化？
chartsgnuplot 
Charts 使用google app inventor打印图表
charts 
Charts 谷歌图表-更改单个条形图的颜色
chartsgoogle-visualization 
Charts d3.json将数据传递给d3.svg.arc（）
chartssvgd3.js 
Charts 使用可重用图表更新d3.js中的HTML表
chartsd3.js 
Charts 如何在同一图表中集成线图和面积图
charts 
Charts 更改图形图表中的轴线颜色
charts 
Charts 详细信息栏中的条形图显示每个记录的最终记录数据
chartsjasper-reports 
Charts 如何使用jFreeChart格式化极简主义图表？
charts 
Charts 图例位置在堆叠柱形图（谷歌图表）中不起作用
chartsgoogle-visualization 
Charts 心肺图的设定范围
charts 
Highcharts具有向下钻取功能的多列图表，向下钻取轴的格式正确
chartshighcharts 
Charts Google Analytics API自定义仪表板-活动用户页面
chartsgoogle-analyticsgoogle-api 
Charts 通过谷歌图表在柱状图中添加单位？
chartsgoogle-visualization 
Charts Highstocks图表多窗格宽度和y轴对齐问题
chartshighcharts 
Charts 仅创建特定行的图表
chartsgoogle-sheets 
Charts 向图表轴添加多个字段（例如散点图）
chartspowerbi 
Charts Primefaces 6条编码
chartsprimefaces 
Charts 如何"；“固定缩放功能”；图表中的错误？
charts 
Charts ChartJS-线图，位置工具提示
chartschart.js


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R：如何进行RAII（或类似的资源管理）
									R
							 
R 连接两个ggplot2直方图和密度图
									R
							 
获取环境在R中使用的RAM量
									R
							 
R 用固定数量的Y=1或成功模拟逻辑回归
									R
							 
R 如何从需要登录的网站上抓取数据
									R
							 
将间隔与R中的事件匹配
									R
							 
R 在一个数据帧中查找字符串，并在第二个数据帧中替换它
									R
							 
在R中创建承诺/延迟计算表达式
									R
							 
在R中连接字符单元格和十六进制数
									R
							 
R 创建一个弹出对话框
									R
							 									Shiny
							 
R：合并两个应用程序
									R
							 									Shiny
							 
R程序卡在网格引擎中：quser显示它正在运行，但并没有结果
									R
							 									Shell
							 									Cluster Computing
							 
R Highcharter-如何使用hc_rangeSelector（）
									R
							 									Highcharts
							 									Shiny
							 
如何将reactive（）应用于被动对象？
									R
							 									Shiny
							 
R：取消嵌套行索引
									R
							 
如何调整R中图例中各个标签之间的间距？
									R
							 
R 如何确定缺失值的百分比
									R
							 
在MXNet-R中使用RNN的形状不匹配
									R
							 									Deep Learning
							 
在R数据编程课程中计算数据帧的完整行
									R
							 									Dataframe
							 
R 方差分析输出的表格格式
									R
							 
如何从R中数据帧的前n行中删除条件下的行
									R
							 
用R中的外协变量融化矩阵
									R
							 
r语言文本的时间序列分析
									R
							 
“值”之间的差异&`R中光栅上的GetValue`
									R
							 
如何从ApacheSpark中的RFormula/RFormulaModel获取索引映射的因子？
									R
							 									Model
							 
R 使用平均值的聚类柱状图
									R
							 									Plot
							 
使用'；使用get#u Retweets提取Retweets；rtweet'；
									R
							 									Twitter
							 
R 如何将数据从长格式改为宽格式
									R
							 
R 等待PID完成
									R
							 
R 为什么自动绘图功能不'；t显示95%置信区间，但绘图函数是否显示？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Entity Framework
Arrays
Virtualbox
Hive
Design Patterns
Matplotlib
Drupal 7
Reactjs
D3.js
Tridion
Menu
Influxdb
Objective C
Ionic2
Ruby
Joomla
Codenameone
Processing
Vagrant
Asynchronous
Zend Framework2
Azure Ad B2c
Bots
Unix
Filter
Csv
Microsoft Graph Api
Lua
Gulp
Android Layout
Airflow
Centos
Netlogo
Vhdl
Erlang
Oracle
Imagemagick
Salesforce
Ibm Mobilefirst
Boost
Maps
Activerecord
Ignite
Map
Zend Framework
Amazon S3
Kendo Ui
Snowflake Cloud Data Platform
Active Directory
Opencv
Exchange Server
Ide
Powerbi
Talend
Sharepoint 2010
Sublimetext2
Nginx
Sphinx
Asterisk
Jsf
Woocommerce
Indexing
Migration
Google App Engine
Rxjs
Authentication
Node.js
Vbscript
Liferay
Editor
Dialogflow Es
Sass
Methods
Programming Languages
Ionic Framework
Fluent Nhibernate
Tags
Jsp
Kernel
Serialization
Stripe Payments
Windows Services
Jetty
Windows 7
Nosql
Webpack
Sqlite
Compilation
Ajax
Multithreading
Animation
Grafana
Asp.net Mvc 4
Ibm Cloud
Sugarcrm
Orientdb
Phpstorm
Sql Server 2008 R2
Jaxb
Iphone
Sparql
Dataframe
Internet Explorer
Domain Driven Design
Memory Leaks
Ipython
Modelica
Exception
Binding
Sublimetext3
Time
Import
Caching
Sql Server 2012
Azure Service Fabric
Project Management
Uwp
Requirejs
Blazor
Amazon Dynamodb
Tcp
Url
Architecture
Rust
Math
Twitter Bootstrap 3
If Statement
Azure
Apache Zookeeper
.htaccess
Ruby On Rails 3
Highcharts
Sas
Internationalization
Apache Flink
Windows
Network Programming
Pine Script
Windows 10
Hbase
Testng
Dask
Ios4
Pip
Git
Compiler Construction
Certificate
Osgi
Javafx
Swift3
Weblogic
Dojo
Dns
Gruntjs
Twitter Bootstrap
Gcc
Google Cloud Dataflow
C++ Cli
Plsql
Visual Studio 2010
.net 4.0
Cygwin
Hadoop
Plugins
Stm32
Spring Mvc
Model View Controller
Visual Studio 2013
Aframe
Jboss
C# 3.0
Jira
Dotnetnuke
Ssrs 2008
Facebook
Akka
Excel
Scroll
Here Api
Kdb
Biztalk
Charts
Wpf
Dom
Loopbackjs
Pycharm
Robotframework
Selenium Webdriver
Elm
Office365
Sorting
Open Source
Actionscript 3
Sonarqube
Playframework
Composer Php
Umbraco
Junit
Bootstrap 4
Blockchain
Mqtt


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网