遍历到由R检索的每个超链接中_R_Xpath_Traversal - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ruby-on-rails/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
遍历到由R检索的每个超链接中_R_Xpath_Traversal - Fatal编程技术网

遍历到由R检索的每个超链接中

r xpath

遍历到由R检索的每个超链接中,r,xpath,traversal,R,Xpath,Traversal,这是我的代码： library(XML) library(RCurl) url.link <- 'http://www.jamesaltucher.com/sitemap.xml' blog <- getURL(url.link) blog <- htmlParse(blog, encoding = "UTF-8") titles <- xpathSApply (blog ,"//loc",xmlValue) ## titles

这是我的代码：

library(XML)
library(RCurl)
url.link <- 'http://www.jamesaltucher.com/sitemap.xml'
blog <- getURL(url.link)
blog          <- htmlParse(blog, encoding = "UTF-8")
titles  <- xpathSApply (blog ,"//loc",xmlValue)             ## titles

库（XML）
图书馆（RCurl）
url.link我想这就是你想要的
函数foo
接收元素x
，检索html对象，分配给tmp
。然后xpathApply（tmp，//div[@id=“mainContent”]”）
说获取tmp
对象，并获取具有idmainContent
的div
元素。就这样。lappy
行通过foo（）
函数传递对象列表，因此您应该获得所需html对象的长度标题列表
foo <- function(x){
  tmp <- htmlParse(x)
  xpathApply(tmp, '//div[@id="mainContent"]')
}
lapply(titles[2:3], foo)

foo你能附上一些解释来解构代码吗？我对Python或R不是很熟悉。谢谢。例如，标题[2:3]的含义是什么？请参见子集介绍。标题[2:3]是指标题对象中的第二个和第三个元素。第一个是根url（站点的登录页，所以我想你不会想要的）。当然，我会解释得更清楚一些。我可能还有一些后续问题。让我花点时间来消化一下。谢谢你，斯科特！好吧，我或多或少理解这段代码。我只有一个后续问题。运行lappy时如何“查看”提取的内容？请尝试out




[xpath]相关文章推荐



                                                        
Xpath fn的Xquery错误：之前的子字符串
xpathxquery 
xpath-如果存在另一个节点值，请选择一个节点值
xpath 
Xpath 如何使用硒滴入特定位置？
xpathseleniumfullcalendar 
Xpath 使用java读取具有命名空间的XML文件
xpath 
XPath在进行更改时被破坏
xpathseleniumselenium-webdriverautomated-tests 
Xpath 基于父母的多个标准'；兄弟姐妹
xpath 
XPATH-如何在平面结构中从html获取数据？
xpath 
表中Xpath select单元格位于固定列位置的最后一行
xpath 
使用XPath抓取网页
xpathweb-scrapingscrapy 
是否可以使用XPath 1.0获取文本节点中最后出现的换行符？
xpath 
Xpath 如何从camel主体中检索特定内容以传递给camel路由中的bean方法？
xpathapache-camel 
XPath:处理contains（）函数的无效第二个参数
xpath 
如何为动态变化的属性创建XPATH
xpathselenium-webdriver 
Xpath 从div中提取文本
xpathscrapy 
如何编写xpath
xpathautomated-testsrobotframework 
如何使用xpath获得类似的属性？

xpathscrapy 
如何解决动态xpath（在exceute后更改id）
xpath 
多元素上的条件XPath
xpath 
Xpath 比较XSLT代码中的日期时获取无效日期问题
xpath 
原子值排序XPath查询的语法是什么？
xpath 
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Web
Deep Learning
Autohotkey
Apache2
Linq To Sql
Redirect
Drupal 6
Phpstorm
Curl
Apache Flink
Qt4
Smalltalk
Gitlab
Docker Compose
Sdk
Computer Science
Firefox Addon
Marklogic
Xamarin.ios
Jestjs
Groovy
Google Chrome
Kendo Ui
Content Management System
Cypress
Xna
Wxpython
Formatting
Debian
Filesystems
Cakephp
Zsh
Webrtc
Netbeans
Highcharts
Coding Style
Hazelcast
Unity3d
Sequelize.js
C
Oracle
Video Streaming
Xamarin.android
Phantomjs
Windows 8
Sql Server
Spring Cloud
Ecmascript 6
Ant
Corda
Plone
Functional Programming
Odoo
Autodesk Forge
Version Control
Electron
Jasper Reports
Google Cloud Platform
Com
Grid
Joomla
Optimization
Leaflet
Azure Devops
Sql
Wolfram Mathematica
Inheritance
Spring
Azure Sql Database
Azure Functions
Maven 2
Opencv
Hbase
Generics
Artifactory
Fortran
Xslt
Ionic Framework
Computer Vision
Lotus Notes
Gulp
Udp
File
Azure Service Fabric
Firebase
Outlook
Memory Leaks
Login
Dotnetnuke
Cassandra
Youtube
Google Visualization
Flask
Chef Infra
Antlr
Tsql
Continuous Integration
Sublimetext2
Jpa
Deployment
Coq
Influxdb
Stored Procedures
Liferay
Protocol Buffers
Scroll
Google App Maker
Android
Node.js
Big O
Django Rest Framework
Open Source
Tridion
Fonts
Time Complexity
Laravel 5
Rxjs
Cron
Airflow
Amazon Redshift
Debugging
Error Handling
Xpages
Google Chrome Devtools
Types
Salesforce
Asp Classic
Asp.net Mvc 3
Laravel 4
Activemq
Python 3.x
Hyperledger Fabric
Amazon Web Services
Prometheus
Ssis
Responsive Design
Sugarcrm
Gmail
Jetty
Twitter Bootstrap 3
Apache Pig
Eclipse
Here Api
Weblogic
Module
Symfony
Stanford Nlp
Mapping
Floating Point
Ms Access
Flutter
Blockchain
Triggers
Nhibernate
Usb
Api
Reference
Neural Network
Snmp
Parallel Processing
Rss
Polymer
Algorithm
Xmpp
Drupal
Sphinx
Ubuntu
Single Sign On
Multithreading
Monitoring
Serial Port
Apache Nifi
Gdb
Frameworks
Speech Recognition
Arrays
Couchbase
Orchardcms
Alfresco
Templates
Iframe
Parsing
Encoding
Sprite Kit
Django Models
Animation
Office Js
Dom
Quickbooks
Google Chrome Extension
Libgdx
Hadoop
Lisp
Dictionary
Google Cloud Firestore
Email
Ipad
Itext
Spring Mvc
Discord
Active Directory


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网