在R中:我如何解决;“内存不足”;POS标记错误?

在R中:我如何解决;“内存不足”;POS标记错误?,r,twitter,opennlp,pos-tagger,semantic-analysis,R,Twitter,Opennlp,Pos Tagger,Semantic Analysis,在R中,我有一个数据,样本有30条记录,主数据有20000条记录。记录就是推特。 我从任何tweet中提取bigrams,并从postagger中使用。对于示例数据,它向我显示了错误 .jnew(“opennlp.tools.postag.postmodel”, .jcast(.jnew(“java.io.FileInputStream”),: java.lang.OutOfMemoryError:java堆空间 或 .jnew(“opennlp.tools.tokenize.Tokenizer

在R中,我有一个数据,样本有30条记录,主数据有20000条记录。记录就是推特。 我从任何tweet中提取bigrams,并从postagger中使用。对于示例数据,它向我显示了错误

.jnew(“opennlp.tools.postag.postmodel”, .jcast(.jnew(“java.io.FileInputStream”),:
java.lang.OutOfMemoryError:java堆空间

.jnew(“opennlp.tools.tokenize.TokenizerModel”, .jcast(.jnew(“java.io.FileInputStream”),:
java.lang.OutOfMemoryError:超出GC开销限制

我如何解决这个问题

    for(i in 1:nrow(data1))
{
 .
 .
 .

 for(k in 1:length(bigrams))
 {
   s = as.String(bigrams[k])
   sent_token_annotator =openNLP:: Maxent_Sent_Token_Annotator()
   word_token_annotator = openNLP::Maxent_Word_Token_Annotator()
   a2 = annotate(s, list(sent_token_annotator, word_token_annotator))
   pos_tag_annotator = openNLP::Maxent_POS_Tag_Annotator()
   a3 = annotate(s, pos_tag_annotator, a2)
   a3w = subset(a3, type == "word")
   tags = sapply(a3w$features, `[[`, "POS")
   if(tags[1]=="JJ") 
    {
      if(tags[2]=="NN"||tags[2]=="NNS")
      {
        bigram_final[j]=bigrams[k]
        j=j+1;
      }
  .
  .
  .
  }
}
我的代码是: 我如何解决这个问题

    for(i in 1:nrow(data1))
{
 .
 .
 .

 for(k in 1:length(bigrams))
 {
   s = as.String(bigrams[k])
   sent_token_annotator =openNLP:: Maxent_Sent_Token_Annotator()
   word_token_annotator = openNLP::Maxent_Word_Token_Annotator()
   a2 = annotate(s, list(sent_token_annotator, word_token_annotator))
   pos_tag_annotator = openNLP::Maxent_POS_Tag_Annotator()
   a3 = annotate(s, pos_tag_annotator, a2)
   a3w = subset(a3, type == "word")
   tags = sapply(a3w$features, `[[`, "POS")
   if(tags[1]=="JJ") 
    {
      if(tags[2]=="NN"||tags[2]=="NNS")
      {
        bigram_final[j]=bigrams[k]
        j=j+1;
      }
  .
  .
  .
  }
}

这个问题通常发生在脚本在R中使用rJava时,在我的例子中,我在加载库
options(java.parameters=“-Xmx1024m”)
gc()之前添加了以下行,从而更改了JVM的内存大小,使其更能处理我的脚本在包函数之后立即释放内存。请查看更多信息。

此问题通常发生在脚本在R中使用rJava时,在我的情况下,我更改了JVM的内存大小,以便更能够处理我的脚本,方法是在加载库之前添加以下行
选项(java.parameters=“-Xmx1024m”)
我还在package函数之后添加了
gc()
以释放内存。请查看更多信息。

我使用from选项(java.parameters=“-Xmx1024m”),但此错误没有改变。感谢您回答我使用from选项(java.parameters=“-Xmx1024m”)的问题但是这个错误没有改变。谢谢你回答这个问题