在R中进行谷歌网页抓取时获取链接_R_Web Scraping_Rvest - Fatal编程技术网

在R中进行谷歌网页抓取时获取链接

r web-scraping

在R中进行谷歌网页抓取时获取链接,r,web-scraping,rvest,R,Web Scraping,Rvest,我试图在搜索时获得谷歌的链接，也就是说，所有这些链接：我做过这种刮削，但在这种情况下，我不明白为什么它不工作，所以我运行以下行： library(rvest) url<-"https://www.google.es/search?q=Ediciones+Peña+sl+telefono" content_request<-read_html(url) content_request %>% html_nodes(".r") %>% html_attr(

我试图在搜索时获得谷歌的链接，也就是说，所有这些链接：

我做过这种刮削，但在这种情况下，我不明白为什么它不工作，所以我运行以下行：

library(rvest)
url<-"https://www.google.es/search?q=Ediciones+Peña+sl+telefono"
content_request<-read_html(url)
content_request %>%
    html_nodes(".r") %>%
    html_attr("href")

最后，我尝试获取网页的所有链接，但有些链接我无法下载：

html_attr(html_nodes(content_request, "a"), "href")

拜托，你能帮我解决这个问题吗？谢谢。

这里有两个选项供您选择

#1) 

url <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
html <- paste(readLines(url), collapse="\n")
library(stringr)
matched <- str_match_all(html, "<a href=\"(.*?)\"")


#2) 

library(xml2)
library(rvest)
URL <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
pg <- read_html(URL)
head(html_attr(html_nodes(pg, "a"), "href"))

#1）
url这里有两个选项供您使用
#1) 

url <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
html <- paste(readLines(url), collapse="\n")
library(stringr)
matched <- str_match_all(html, "<a href=\"(.*?)\"")


#2) 

library(xml2)
library(rvest)
URL <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
pg <- read_html(URL)
head(html_attr(html_nodes(pg, "a"), "href"))

#1）
url在第一种情况下，您获得的链接比显示的多，在第二种情况下，您获得的链接比显示的少。在第一种情况下，您获得的链接比显示的多，在第二种情况下，您获得的链接比显示的少。




[web scraping]相关文章推荐



                                                        
Web scraping 针对给定查询从多个网站聚合数据
web-scraping 
Web scraping 假装Firefox而不是Phantom.js
web-scrapingphantomjs 
Web scraping 刮皮不'；下载图片
web-scrapingweb-crawlerscrapy 
Web scraping 无法继续进行刮取或爬行
web-scrapingscrapy 
Web scraping 如何从登录站点提取数据
web-scraping 
Web scraping 我们如何从java/android移动应用程序中提取数据，哪个爬虫可以用于从移动应用程序中提取数据？sn
web-scrapingweb-crawler 
Web scraping 是否设置为使用IP池？
web-scrapingscrapy 
Web scraping import.io疑难解答
web-scraping 
Web scraping 来自CNES的Web垃圾处理表
web-scraping 
Web scraping 在automation anywhere中从网页提取表
web-scraping 
Web scraping “刮维基百科”；prop=linkshere"；更有效率？
web-scraping 
Web scraping scrapy不处理imdb关键字页面
web-scrapingscrapy 
Web scraping 使用Scrapy发送post请求
web-scrapingscrapy 
Web scraping 有没有办法获取twitch视频数据？
web-scrapingvideo-streaming 
Web scraping 从Investment.com到google sheets获取历史股价
web-scrapinggoogle-sheets 
                                       





随机文章推荐



                                                        
Salesforce 在名称空间下组织Apex类
salesforce 
Salesforce 如何在自定义对象上显示自定义按钮？
salesforce 
Salesforce 如何根据其他字段中的值显示字段
salesforce 
salesforce中初学者的调试困惑
salesforce 
Salesforce 如何访问SOQL关系查询返回的列？
salesforce 
Salesforce.com:System.NullPointerException:尝试取消引用空对象
salesforce 
如何更改salesforce中的系统字段？
salesforce 
Salesforce-在特定位置插入字符的验证规则
salesforce 
Salesforce rest api事件WhoId
salesforce 
Salesforce 序列化apex中的记录集合时获取堆大小错误
salesforce 
连接到Tableau中的Salesforce
salesforcetableau-api 
salesforce合同对象上的自定义保存按钮
salesforce 
Salesforce 如何在SOQL中检索父对象字段值以在VF页面中显示
salesforce 
Salesforce docusignrestapi登录问题
salesforcedocusignapi 
Salesforce 将两个PDF合并为一个PDF并在apex中附加到电子邮件中
salesforce 
SAML SSO-如何配置动态ACS URL（SalesForce是IdP）
salesforcesingle-sign-on 
Salesforce 在AAD中为Saas应用程序配置自定义属性
salesforceazure-active-directory 
Salesforce Lightning Flow Builder查找错误
salesforce 
Salesforce lightning组件中createrecordevent或navigationlocation上的saveurl
salesforce 
Salesforce 如何从新的自定义对象中删除字段？
salesforce


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
geom_文本R中的两种颜色
									R
							 
“错误”；运行'；拉链'；“失败”；在编译R包中
									R
							 
使用API密钥设置rfigshare
									R
							 									Api
							 
R 将列标题转换为新列
									R
							 
试图从SEC网站和本地文件读取时发生R XBRL IO错误
									R
							 									Web Scraping
							 
R中的混合logit模型
									R
							 
如何在Knitr的pdf输出中设置动画打印
									R
							 
如何称呼；“公开无效”；方法通过rJava
									R
							 
R 查找对应于特定X的Y值
									R
							 
在pdf文档中，knitr:：kable标题未放在表的顶部
									R
							 
从命名列表中提取元素时防止R删除名称
									R
							 
R 在上使用时出错（空间点、空间多边形）
									R
							 
同时输出并在R中显示结果
									R
							 
剂量反应-使用R
									R
							 
R plot（）'；b'；绘图中的参数不显示连接点的线
									R
							 									Plot
							 									Shiny
							 
基于r中的行值的累积和
									R
							 									Function
							 									Datetime
							 
R-将数据帧的两列组合成形式为c（x，y，z…）的向量
									R
							 									Vector
							 
根据精确的范围和R中的采样，可视化ggplot
									R
							 
在R中的地图上绘制多条直线图。需要绘制单独的线段，而不是连续的路径
									R
							 									Plot
							 
R 用一对印刷品替换或删除多个反斜杠
									R
							 
geom_丝带不同颜色-R
									R
							 									Plot
							 									Colors
							 
R tmap：如何调整图例框线宽
									R
							 
带R的某些特殊点的超边界插值和外推
									R
							 
R 没有给出错误，但数据未加载
									R
							 									Web Scraping
							 
如何在R中进行自定义堆叠？
									R
							 
R 我在使用蘑菇数据集进行网格搜索时遇到问题
									R
							 									Machine Learning
							 
R 避免apply（）中的简化
									R
							 
R 读取.csv文件列表，然后将它们绑定在一起而不删除任何列
									R
							 									Csv
							 
R 在应用程序上上载.CSV文件时，如何将变量x设置为默认值？
									R
							 									Shiny
							 
R 需要帮助创建一个函数来删除一个数据波（如果是'；这是前一波的翻版，用于回顾性测量
									R
							 									Function
							 									Dataframe
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Printing
Drupal 7
Virtualbox
Websphere
Orm
Sugarcrm
Wxpython
Java 8
Matlab
Bootstrap 4
Ocaml
Path
Docker
Isabelle
Cypress
Windows Installer
.net 4.0
Openstack
Ravendb
Ethereum
Testing
Sql Server
Jasper Reports
Mongoose
Magento2
Swift
Azure Active Directory
Android Fragments
Marklogic
Certificate
Drop Down Menu
Alfresco
Loopbackjs
Cassandra
Webstorm
Vaadin
Swing
Dojo
Ip
Hive
Xmpp
Ansible
Cmd
Https
Pine Script
Testng
Mapping
Hash
Android
Vbscript
Uwp
Visual Studio
Variables
Mfc
Phpunit
Reflection
Server
Air
Smtp
Installation
Office Js
Gulp
Applescript
Azure
Blockchain
Filter
Webpack
Qt4
Visual Studio 2017
Random
Jakarta Ee
Model
Jquery Ui
Ms Office
Coq
Layout
Swiftui
Phpstorm
Properties
Sass
Computer Science
Arangodb
Plot
Silverlight 4.0
Django
Node.js
Ipad
Numpy
Google Chrome Extension
Markdown
Maven 2
Visual C++
Validation
Discord.js
Chef Infra
Oauth 2.0
Tcl
Select
Appium
Web
Windows Phone 8
Xaml
Keyboard
.net Core
Postgresql
Openlayers
Snmp
Import
Puppet
Collections
Log4j
Polymer
Computer Vision
Xml
Ubuntu
Selenium Webdriver
Cocos2d Iphone
Moodle
Mqtt
Ftp
Cloud Foundry
Electron
Parsing
Camera
Raspberry Pi
Programming Languages
Curl
Networking
Discord.py
Less
Autocomplete
Git
Sqlalchemy
Asp.net Web Api
Yaml
Iis 7
Scroll
Ionic2
Aframe
Google Cloud Firestore
Mediawiki
Tinymce
Install4j
Excel Formula
Woocommerce
Prestashop
Automated Tests
Vagrant
Telegram
Performance
Jersey
Elm
Ibm Mobilefirst
Biztalk
List
Composer Php
Asynchronous
Asp.net Mvc
Codenameone
Grails
Youtube Api
Jira
Web Scraping
Joomla
Windows 10
Post
Concurrency
Synchronization
Windows Runtime
Google Apps Script
Binding
Google App Maker
Ssas
Twitter Bootstrap
Security
Plsql
Map
Hbase
Jquery Plugins
Entity Framework 4
Hybris
Pointers
Ajax
Awk
Sorting
Mobile
Filesystems
Nsis
Discord
Actionscript 3
Office365
Protractor
Notifications
Solr
Ios8
Dialogflow Es
Dns
Twilio
Sharepoint
Reporting Services
Pytorch


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网