Stanford nlp Stanford NER tagger生成';未找到文件';提供的模型除外

Stanford nlp Stanford NER tagger生成';未找到文件';提供的模型除外,stanford-nlp,named-entity-recognition,Stanford Nlp,Named Entity Recognition,我下载并解压缩了它,并尝试使用默认(提供的)培训模型在本地文件上运行命名实体识别。我明白了: `java.io.FileNotFoundException: /u/nlp/data/pos_tags_are_useless/egw4-reut.512.clusters (No such file or directory) at edu.stanford.nlp.io.IOUtils.inputStreamFromFile(IOUtils.java:481)` 出了什么问题以及如何修复?事实

我下载并解压缩了它,并尝试使用默认(提供的)培训模型在本地文件上运行命名实体识别。我明白了:

 `java.io.FileNotFoundException: /u/nlp/data/pos_tags_are_useless/egw4-reut.512.clusters (No such file or directory) at edu.stanford.nlp.io.IOUtils.inputStreamFromFile(IOUtils.java:481)`

出了什么问题以及如何修复?

事实证明,提供的模型使用了“分布相似性特征”,需要在压缩模型文件中指定的位置使用
.clusters
文件(很难更改)。如果你在斯坦福网络上,可能需要的文件就在那里。如果没有,我发现了两个选择:

  • 下载(性能略有下降,但运行速度更快)。免责声明:我还没有真正尝试过这个,但它应该可以工作
  • 从stanford下载distsim文件(),并创建指向该文件的sym链接,使其看起来位于正确的位置。在Mac电脑上,我做到了:
    • 我在某个地方创建了一个文件夹继承权
      u/nlp/data/pos\u标签\u无用/
    • 复制了下载的
      egw4 reut.512.clusters
      文件
    • 然后
      cd/;sudo ln-s/u

  • 事实证明,所提供的模型使用了“分布相似性特征”,需要在压缩模型文件中指定的位置使用
    .clusters
    文件(很难更改)。如果你在斯坦福网络上,可能需要的文件就在那里。如果没有,我发现了两个选择:

  • 下载(性能略有下降,但运行速度更快)。免责声明:我还没有真正尝试过这个,但它应该可以工作
  • 从stanford下载distsim文件(),并创建指向该文件的sym链接,使其看起来位于正确的位置。在Mac电脑上,我做到了:
    • 我在某个地方创建了一个文件夹继承权
      u/nlp/data/pos\u标签\u无用/
    • 复制了下载的
      egw4 reut.512.clusters
      文件
    • 然后
      cd/;sudo ln-s/u

  • 这是v3.4.1代码初始版本附带的模型文件中的一个错误,已经修复。重新下载后,一切都会正常运行,无需symlink解决方案。

    这是v3.4.1代码初始版本附带的模型文件中的一个错误,已修复。重新下载后,一切都会正常运行,无需symlink解决方案。

    这是3.4.1版发布的分类器模型中的一个错误。当您的解决方案工作时,分布相似性集群应该在序列化模型中(并且在以前的版本中)。我将在一天左右的时间内重新发布固定型号的产品,一旦我重新制作了这些型号……从2015年10月25日起,德国和西班牙的型号似乎存在相同或类似的问题?至少当我尝试使用版本3.4库加载时?我建议对@ChristopherManning的答案发表评论,这样他就会听到(:这是版本3.4.1发布的分类器模型中的一个错误。当您的解决方法起作用时,分布相似性集群应该在序列化模型中(并且在以前的版本中).一旦我重新制作了模型,我将在一天左右的时间内重新发布带有固定模型的内容…从2015年10月25日起,德国和西班牙的模型似乎存在相同或类似的问题?至少当我尝试使用3.4版库加载时?我建议对@ChristopherManning的答案发表评论,这样h我会听到的