Nlp 斯坦福塔格的拱门选项?

Nlp 斯坦福塔格的拱门选项?,nlp,stanford-nlp,Nlp,Stanford Nlp,除了像left3words,left5words,bi5words,bi5words这样的标准拱形选项外,其余选项的含义是什么?他们需要什么论据 我好像到处都找不到文档 恐怕arch选项目前只在源代码中有文档记录:-( 请参阅提取器框架和提取器框架类 首先要做的是查看分布式标记器中使用的arch选项。您可以在models子目录中的*.props文件中找到它们 简言之: “通用”给你一个像样的基础 单词和标记功能集 (当前、上一个和下一个单词) 功能、上一个标记和上一个标记 两个标记和 上一个标

除了像
left3words
left5words
bi5words
bi5words
这样的标准拱形选项外,其余选项的含义是什么?他们需要什么论据


我好像到处都找不到文档

恐怕arch选项目前只在源代码中有文档记录:-(

请参阅提取器框架和提取器框架类

首先要做的是查看分布式标记器中使用的arch选项。您可以在models子目录中的*.props文件中找到它们

简言之:

  • “通用”给你一个像样的基础 单词和标记功能集 (当前、上一个和下一个单词) 功能、上一个标记和上一个标记 两个标记和 上一个标记和当前单词以及 当前和以前的单词)。这是一个 开始的好地方
  • 有各种各样的选项可以打开一大堆提取器,为英语和汉语提供已知的良好配置(双向、sighan2005、naacl2003unknowns)
  • 其他选项(通常带有参数)以合理的方式打开可混合在一起的功能集。您可以在分布式中文和阿拉伯文标记器的定义中看到这一点。例如,后缀(6)包括长度不超过6的所有单词结尾子串作为功能