Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/url/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
从XML包保存htmlParse对象_R_Html Parsing - Fatal编程技术网

从XML包保存htmlParse对象

从XML包保存htmlParse对象,r,html-parsing,R,Html Parsing,我想保存作为htmlpasse命令结果的对象。下面是一些代码来说明我的问题。简单地说,我希望能够将解析HTML页面保存到一个对象中,并将其加载到未来的会话中 library(XML) PATH = "/colleges/Bentley-University" URL <- paste("http://www.cappex.com", PATH, sep="") doc <- htmlParse(URL) mylist <- list(doc) mylist[[1]] save(

我想保存作为htmlpasse命令结果的对象。下面是一些代码来说明我的问题。简单地说,我希望能够将解析HTML页面保存到一个对象中,并将其加载到未来的会话中

library(XML)
PATH = "/colleges/Bentley-University"
URL <- paste("http://www.cappex.com", PATH, sep="")
doc <- htmlParse(URL)
mylist <- list(doc)
mylist[[1]]
save(mylist, file="mylist.Rdata")
rm(list=ls())
load("mylist.Rdata")

doc
无法保存,因为它是指向“C级节点”的指针。把它放在一个列表中并不能改变这个事实。您可以先将XML树的表示形式写入字符串,然后保存它。之后可以恢复文本

library(XML)
PATH = "/colleges/Bentley-University"
URL <- paste("http://www.cappex.com", PATH, sep="")
doc <- htmlParse(URL)
saveXML(doc, file="ex.txt")
rm(list=ls())

# recover
doc<-htmlParse('ex.txt')
库(XML)
PATH=“/colleges/Bentley University”

向可能复制此内容的人员发出URL警告。Btibert3还没有构建一个最小的示例。mylist[[1]]的输出有很多页长。如果这是他想要的,他应该保存mylist[[1]],因为:在mylist上执行
str
会得到:
1$的列表:class'HTMLInternalDocument','XMLInternalDocument'
,但如何保存列表而不仅仅是一个HTML解析文件?
library(XML)
PATH = "/colleges/Bentley-University"
URL <- paste("http://www.cappex.com", PATH, sep="")
doc <- htmlParse(URL)
saveXML(doc, file="ex.txt")
rm(list=ls())

# recover
doc<-htmlParse('ex.txt')