R尝试访问本地数据时出错

R尝试访问本地数据时出错,r,R,我刚刚尝试了这个关于构建文本挖掘机器的非常有趣的Youtube-R教程: 目前,我已经走了这么远,我所有的代码都是 # Tutorial: http://www.youtube.com/watch?v=j1V2McKbkLo # init libs <- c("tm", "plyr", "class") lapply(libs, require, character.only = TRUE) # set options options(stringsAsFactors = FALSE

我刚刚尝试了这个关于构建文本挖掘机器的非常有趣的Youtube-R教程:

目前,我已经走了这么远,我所有的代码都是

# Tutorial: http://www.youtube.com/watch?v=j1V2McKbkLo

# init

libs <- c("tm", "plyr", "class")
lapply(libs, require, character.only = TRUE)

# set options
options(stringsAsFactors = FALSE)

# set parameters
candidates <- c("Obama", "Romney")
pathname <- "C:/Users/***"      # here I pointed out the name for reasons of anonymity

# clean text
cleanCorpus <- function(corpus){
    corpus.tmp <- tm_map(corpus, removePunctuation)
    corpus.tmp <- tm_map(corpus.tmp, stripWhitespace)
    corpus.tmp <- tm_map(corpus.tmp, tolower)
    corpus.tmp <- tm_map(corpus.tmp, removeWords, stopwords("english"))
    return(corpus.tmp)
}

# build TDM
generateTDM <- function(cand, path){
    s.dir <- sprintf("%s/%s", path, cand)
    s.cor <- Corpus(DirSource(directory = s.dir, encoding = "ANSI"))
    s.cor.cl <- cleanCorpus(s.cor)
    s.tdm(TermDocumentMatrix(s.cor.cl))
    s.tdm <- removeSparseTerms(s.tdm, 0.7)
    result <- list(name = cand, tdm = s.tdm)
}

tdm = lapply(candidates, generateTDM, path = pathname)
我就是不知道错误在哪里。我尝试了几种编写目录路径的版本,但都不起作用。我不确定错误是在RStudio无法访问本地保存的数据中,还是在整个代码中,如果有人能帮助我或给出任何提示,我将非常高兴


谢谢大家!

在Windows上,您需要通过
\
(而不是
/
)分隔路径组件,并在R字符串中键入
“\\\”
以获得单个
\
。因此,您可以(希望)通过如下定义
路径名来解决问题:

pathname <- "C:\\Users\\***"

pathname请将
print(s.dir)
添加到
generateTDM
并重新运行代码。您确定这显示了正确的完整路径吗?感谢您的提示-现在它确实显示了路径,但仍然告诉我目录将为空:/我认为主要错误在于无法将RStudio连接到本地保存的文件。我们现在尝试使用Filezilla将文件放到主目录,我希望它能工作…谢谢你!我在代码中加入了这一点,但仍然得到了相同的错误:
>tdm=lappy(候选者,generateTDM,path=pathname)[1]“C:\\Users\\\***\\Obama”在DirSource(directory=s.dir,encoding=“ANSI”):空目录中显示回溯重新运行,并带有调试错误(DirSource=s.dir,encoding=“ANSI”):空目录
,即使该目录中肯定有文件。我真的很乐意得到更多的提示
pathname <- "C:\\Users\\***"