Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/65.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中的TreeTagger_R_Pos Tagger_Treetagger - Fatal编程技术网

R中的TreeTagger

R中的TreeTagger,r,pos-tagger,treetagger,R,Pos Tagger,Treetagger,我已经下载了适用于Windows的TreeTaggerv3.2,并根据install.txt对其进行了配置。我正试图在R和koRpus包中使用它。我已将kRp.env设置为- set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tag-english.bat", lang="en", preset="en", treetagger="manual", format="file", TT.tknz=TRUE, encoding="UTF-8" )

我已经下载了适用于Windows的TreeTaggerv3.2,并根据install.txt对其进行了配置。我正试图在R和koRpus包中使用它。我已将kRp.env设置为-

set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tag-english.bat", lang="en", 
   preset="en", treetagger="manual", format="file", 
    TT.tknz=TRUE, encoding="UTF-8" )
.My要标记的数据位于一个文件中,并试图将其用作treetag(“myfile.txt”),但它抛出了错误-

矩阵中的错误(未列出(strsplit(taged.text,“\t”)),ncol=3,byrow=TRUE,: “数据”必须是向量类型,为“NULL”

此外:警告信息: 正在运行命令“C:\windows\system32\cmd.exe/C:\TreeTagger\bin\tag-english.bat”

C:\Users\vivsingh\Desktop\NLP\tree\u tag\u ex.txt“状态为255”


独立的TreeTagger由windows操作。知道它是如何工作的吗?

我发布这个答案是为了记录。我也面临同样的问题,因为64位处理器和windows 8.1上的
jri.dll
的位置规格不正确。如果我们调用
set.kRp.env(TT.cmd=“manual”,lang=“en”,TT.options=list(path=“/path/to/tree-tagger-windows-x.x/TreeTagger”,preset=“en”)
并且我们遵循以下两个步骤之一,我们可以解决此错误:

  • 在安装R时,如果只安装64位版本的R 为这些变量指定正确的路径

    LD\u LIBRARY\u PATH=/PATH/to/rJava/jri

    JAVA_HOME=/path/to/jdk1.x.x

    java.library.path=/path/to/rJava/jri/jri.dll

    CLASSPATH=/path/to/rJava/jri

  • 如果我们已经在您的计算机上安装了两个版本,即32位和64位的R,那么只需将
    jri.dll
    /path/to/rJava/jri/x64/jri.dll
    复制到
    path/to/rJava/jri/jri.dll
    。此外,我们需要设置上述四个变量的路径

  • 我发现了这个问题(我想很类似),并将查询发布到GitHub。 对于这个案例,我目前的工作解决方案比我预期的要简单,只是降级了
    koRpus
    包。这可能会随着时间的推移而改变,但这个版本应该保持适当

    library("devtools")
    install_github("unDocUMeantIt/koRpus", ref="0.06-5")
    

    他们说,这个软件包与Java无关。

    在使用windows 7和R 3.4.1(x64)对R word vector进行柠檬化时,我遇到了完全相同的错误和警告。这个问题也在使用textstem软件包时出现,但TreeTagger在cmd窗口中正常运行

    我混合了在这篇文章中找到的几个答案,下面是我的步骤和正确运行的代码:

    进入R win_库(
    ~\Documents\R\win library\3.4\rJava\jri\x64\jri.dll
    )并复制
    jri.dll
    (谢谢kravi!)以将其替换为父文件夹

    关闭并重新启动R

    library(koRpus)
    
    set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tag-english.bat", lang="en", preset="en", treetagger="manual", format="file", TT.tknz=TRUE, encoding="UTF-8")
    lemma_tagged <- treetag(lemma_unique$word_clean, treetagger="manual", format="obj", TT.tknz=FALSE , lang="en", TT.options=list(path="c:/TreeTagger", preset="en"))
    lemma_tagged_tbl <- tbl_df(lemma_tagged@TT.res)
    
    库(koRpus)
    set.kRp.env(TT.cmd=“C:\\TreeTagger\\bin\\tag english.bat”,lang=“en”,preset=“en”,TreeTagger=“manual”,format=“file”,TT.tknz=TRUE,encoding=“UTF-8”)
    
    lemma_taged在设置korpus环境并从treetagger获取结果时,您可能会遇到相同的错误。例如,当您使用:

    tagged.text <- treetag(
      "C:/temp/sample_text.txt",
      treetagger = "manual",
      lang = "en",
      TT.options = list(
        path = "c:/Treetagger",
        preset = "en"
      ),
      doc_id = "sample"
    )
    

    但是,在此之前,请记住将kRp.env设置为


    一旦你这样做了,你就会得到想要的结果。

    如果你在
    treetag
    中设置路径,例如
    treetag(file=“myfile.txt”,treetagger=“C:/treetagger/bin/tag english.bat”,TT.options=C(path=“C:/treetagger/”)
    ?我试着用treetag(file=“C:\\Users\\singh\\Desktop\\NLP\\tree\u tag\u ex.txt”,treetagger=“C:/TreeTagger/bin/tag english.bat”,TT.options=list(path=“C:/TreeTagger/”),lang=“en”)。警告已消失,但错误仍然存在-矩阵中的错误(unlist(strsplit(taged.text)”),ncol=3,byrow=TRUE,:“data”必须是向量类型,不可复制。Mabye更新您的包?提供数据?投票关闭:(R版本是3.2.2,koRpus软件包版本是0.05-6,我想这是最新的。操作系统是windows 7 64位。文件中的数据只是一个纯文本,例如sql Server。我有完全相同的设置。和
    writeLines(text=‘所有人生而自由,在尊严和权利上一律平等。他们被赋予理性和良知,应该本着兄弟情谊的精神彼此行动。’,con=“myfile.txt”);treetag(“myfile.txt”)
    效果很好。
    treetagger = "manual"
    
    treetagger = "kRp.env"
    
    set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tag-english.bat", lang="en", preset="en", treetagger="manual", format="file", TT.tknz=TRUE, encoding="UTF-8")