为什么R将我的CSV文件中的所有行合并为一个完整的文档?
我正在使用为什么R将我的CSV文件中的所有行合并为一个完整的文档?,r,tm,R,Tm,我正在使用R进行情绪分析。我的源文件包含了客人大约50条评论,它是在Excel中创建的(每一条评论都记录在一行和一列中)。因此,所有评论都在A列中,没有标题。该文件随后被保存为csv文件并存储在文件夹中 我的R代码如下: library (tm) docs<-Corpus(DirSource('E:/Sentiment Analysis')) #checking a particular review in the document writeLines(as.character(docs
R
进行情绪分析。我的源文件包含了客人大约50条评论,它是在Excel
中创建的(每一条评论都记录在一行和一列中)。因此,所有评论都在A列中,没有标题。该文件随后被保存为csv
文件并存储在文件夹中
我的R
代码如下:
library (tm)
docs<-Corpus(DirSource('E:/Sentiment Analysis'))
#checking a particular review in the document
writeLines(as.character(docs[[20]]))
library(tm)
docs与DirSource()
一起使用的tm::Corpus()
函数将每个文件视为单独的文档,而不是将一个文件中的每一行视为单独的文档
要将文本文件的每一行作为单独的文档读取,可以使用语料库(VectorSource())
语法
例如,我们将创建一个文本文件,从目录中读取它,以说明Corpus()
如何使用DirSource()
,而不是如何使用VectorSource()读取它
其次,我们将打印第二次读取的两行,说明它们被视为单独的文档
> aCorpus <- Corpus(VectorSource(aDataFrame$V1))
> aCorpus[1]$content
[1] "This is line one of text."
> aCorpus[2]$content
[1] "This is line two of text. This is a second sentence in line two. "
>
>aCorpus aCorpus[1]$content
[1] “这是文本的第一行。”
>aCorpus[2]$content
[1] “这是正文的第二行。这是第二行的第二句话。”
>
> length(aCorpus) # shows only one item in list, entire file
[1] 1
> aCorpus <- Corpus(VectorSource(aDataFrame$V1))
> aCorpus[1]$content
[1] "This is line one of text."
> aCorpus[2]$content
[1] "This is line two of text. This is a second sentence in line two. "
>