自然语言处理工具的比较(UIMA、LingPipe、Lucene、Gate、Stanford)

自然语言处理工具的比较(UIMA、LingPipe、Lucene、Gate、Stanford),lucene,stanford-nlp,gate,uima,Lucene,Stanford Nlp,Gate,Uima,我想选择一个自然语言处理工具来完成常见任务,如标记化、句子检测、各种标记(名称实体识别、词性标记等)。我的问题分为两部分: 选择自然语言处理的标准是什么 工具 在(UIMA、LingPipe、Lucene、Gate、Stanford)中,哪一个满足 这些标准更好吗 你有什么建议?一些一般标准: 我可以使用提供的模型执行多少任务(例如,该工具是否包含用于我的任务的模型,如西班牙语标记化或蛋白质标记) 添加缺少的工具对我来说有多容易 顺便说一句,我会添加到您的列表中,以及它的 关于你的任务,你能说得

我想选择一个自然语言处理工具来完成常见任务,如标记化、句子检测、各种标记(名称实体识别、词性标记等)。我的问题分为两部分:

  • 选择自然语言处理的标准是什么 工具
  • 在(UIMA、LingPipe、Lucene、Gate、Stanford)中,哪一个满足 这些标准更好吗

  • 你有什么建议?

    一些一般标准:

  • 我可以使用提供的模型执行多少任务(例如,该工具是否包含用于我的任务的模型,如西班牙语标记化或蛋白质标记)
  • 添加缺少的工具对我来说有多容易

  • 顺便说一句,我会添加到您的列表中,以及它的

    关于你的任务,你能说得更具体些吗?比较实际上取决于您想要实现的具体任务。Languageware资源工作台将完成您提到的任务,并输出到UIMA字典。然而,我的回答可能是有偏见和不完整的,所以我不会把它作为一个答案。UIMA不是一个NLP工具。它是一个互操作性和可伸缩性框架,允许将这些工具集成到一个通用框架中。有几种风格的UIMA组件集合可以满足您的需要(例如DKPro Core、ClearTK、U-Compare等),其中一些集成工具(例如LingPipe、Stanford等)介于两者之间。如果您使用Java,我可能会建议您使用ApacheOpenNLP(ASL)或StanfordCorenLP(GPL)的一些初步步骤,具体取决于您喜欢哪种许可证。-请注意,这是一个意见问题,不太适合Stackoverflow。这里有一个很好的概述: