DirSource导入文件问题

DirSource导入文件问题,r,tm,R,Tm,我一直在尝试导入该文件 reuters <- Corpus(DirSource(directory = "E:\\R Programs\\Test\\Reuteurs\\reut2-000.xml", encoding = "UTF-8"), readerControl = list(reader = readReut21578XMLasPlain)) 我还检查了stackoverflow中提供的其他解决方案,但它对我不起作用。我遗漏了什么吗 reuters <- Corp

我一直在尝试导入该文件

reuters <- Corpus(DirSource(directory = "E:\\R Programs\\Test\\Reuteurs\\reut2-000.xml", encoding = "UTF-8"), 
   readerControl = list(reader = readReut21578XMLasPlain))
我还检查了stackoverflow中提供的其他解决方案,但它对我不起作用。我遗漏了什么吗

reuters <- Corpus(URISource("file://E:\\R Programs\\Test\\Reuteurs\\reut2-000.xml",encoding="UTF-8"), 
   readerControl = list(reader = readReut21578XMLasPlain))

但下面的代码是有效的:为什么DirSource方法不适合我?我遗漏了什么吗

reuters <- Corpus(URISource("file://E:\\R Programs\\Test\\Reuteurs\\reut2-000.xml",encoding="UTF-8"), 
   readerControl = list(reader = readReut21578XMLasPlain))

reuters
reut2-000.xml
可能是一个文件,而不是一个目录


将文件作为目录打开将导致错误。

reut2-000.xml
可能是一个文件,而不是目录


将文件作为目录打开会导致错误。

我建议您使用R package
tm.Corpus.Reuters21578
中预处理的路透社语料库(正如我在这里已经建议的那样:)


这些数据与原始Reuters xml文件中的数据相同,但是没有编码、缺少xml声明等问题。

我建议您使用R package
tm.Corpus.Reuters21578
中预处理的Reuters语料库(正如我在这里已经建议的那样:)


这些数据与原始Reuters xml文件中的数据相同,但是没有编码、缺少xml声明等问题。

最后我找到了解决此错误的方法:


words我终于找到了解决这个错误的方法:


Words您是否尝试首先使用
setwd()
在右侧文件夹中定位,然后仅使用文件名?是的,我已经这样做了。
DirSource
不查找特定文件,而是查找目录。查看
?DirSource
并尝试
DirSource(directory=“E:\\R Programs\\Test\\Reuteurs”,…
您是否尝试首先使用
setwd()在正确的文件夹中定位
然后只使用文件名?是的,我已经这样做了。
DirSource
不查找特定的文件,而是查找目录。查看
?DirSource
并尝试
DirSource(directory=“E:\\R Programs\\Test\\Reuteurs”,…
install.packages("tm.corpus.Reuters21578", repos = "http://datacube.wu.ac.at")
library(tm.corpus.Reuters21578)
data(Reuters21578)