Nlp 在大数据中使用stanford temporal tagger好吗?

Nlp 在大数据中使用stanford temporal tagger好吗?,nlp,stanford-nlp,information-extraction,named-entity-recognition,Nlp,Stanford Nlp,Information Extraction,Named Entity Recognition,我正在为我的项目探索斯坦福时间标记器,以便从文本中提取日期实体。来自的演示似乎很有希望。我想知道这个图书馆是否成熟。还有人帮助我了解这个库如何处理大数据。如果您能指导我了解其他基于java的时态标记器库,特别是针对大数据需求的时态标记器库,这也会很有帮助。是否有任何apache项目可以进行时态标记 我发现有些图书馆像 是的,SUTime库是成熟且相当准确的,已经运行了数千万字的文本。(只需确保您没有调用Stanford CoreNLP中更昂贵、速度更慢的部分—解析和dcoref—这是时态标记所

我正在为我的项目探索斯坦福时间标记器,以便从文本中提取日期实体。来自的演示似乎很有希望。我想知道这个图书馆是否成熟。还有人帮助我了解这个库如何处理大数据。如果您能指导我了解其他基于java的时态标记器库,特别是针对大数据需求的时态标记器库,这也会很有帮助。是否有任何apache项目可以进行时态标记

我发现有些图书馆像


是的,SUTime库是成熟且相当准确的,已经运行了数千万字的文本。(只需确保您没有调用Stanford CoreNLP中更昂贵、速度更慢的部分—解析和dcoref—这是时态标记所不需要的。)


Heideltime是另一个非常好的用于时态标记的Java库。它的优点是支持多种语言,而SUTime目前只支持英语。它的缺点是配置为使用TreeTagger作为其词性标记器,这意味着您要么需要处理使用这个非开源、非Java组件的问题,要么需要编写一些东西来将其配置为使用其他POS标记器。我不熟悉stemptag;我认为这方面没有任何apache项目。

是的,SUTime库是成熟且相当准确的,已经运行了数千万字的文本。(只需确保您没有调用Stanford CoreNLP中更昂贵、速度更慢的部分—解析和dcoref—这是时态标记所不需要的。)

Heideltime是另一个非常好的用于时态标记的Java库。它的优点是支持多种语言,而SUTime目前只支持英语。它的缺点是配置为使用TreeTagger作为其词性标记器,这意味着您要么需要处理使用这个非开源、非Java组件的问题,要么需要编写一些东西来将其配置为使用其他POS标记器。我不熟悉stemptag;我不认为有任何apache项目用于此