RTextTools空文档

RTextTools空文档,r,text,R,Text,在使用包“RTextTools”中的create_matrix()函数创建矩阵后,我收到以下错误: train.matrix = create_matrix(cbind(train.corpus,train.pp.title), language="english", weighting=weightTfIdf) 警告信息: In weighting(x) : empty document(s): 我认为这可能是由于权重tfidf权重要求语料库中填写的所有行 如何避免出现此警告消息?一个

在使用包“
RTextTools
”中的
create_matrix()
函数创建矩阵后,我收到以下错误:

train.matrix = create_matrix(cbind(train.corpus,train.pp.title), language="english",
weighting=weightTfIdf)
警告信息:

In weighting(x) :
  empty document(s):
我认为这可能是由于
权重tfidf
权重要求语料库中填写的所有行


如何避免出现此警告消息?

一个简单的解决方法是首先保存矩阵
cbind(train.corpus,train.pp.title)
并检查零行是否正确。这听起来很合乎逻辑。我试试看。。。除了现在,我将留下空白行。如果我是gsub,这是否也会替换其他行中的空格?我会这样做
mat[rowSums(apply(mat,2,nchar))!=0,]
,其中
mat
是您的矩阵。。对于gsub,这取决于你如何使用它…+1谢谢,霍尔兹伯恩。你的建议使我找到了一个可能的解决办法。