Stanford nlp Stanford NerreatureFactory描述_Stanford Nlp

Stanford nlp Stanford NerreatureFactory描述

stanford-nlp

Stanford nlp Stanford NerreatureFactory描述,stanford-nlp,Stanford Nlp,你知道我在哪里可以找到更多关于斯坦福NERFeatureFactory描述的细节吗我在以下网站上读到：但我不完全理解（有些没有描述）例如：useprov，使用单词对，连体图形， useSum。。。或（pw，c）（t，c）有一个没有更好描述的前。我想知道从那时起是否有新的东西出现谢谢你的帮助如果您查看NERFeatureFactory的源代码，您可以看到正在发生的事情源代码可在此处提供：例如，useWordPairs为考虑中的单词和上一个/下一个单词创建功能。您可以在第10

你知道我在哪里可以找到更多关于斯坦福NERFeatureFactory描述的细节吗

我在以下网站上读到：但我不完全理解（有些没有描述）

例如：useprov，使用单词对，连体图形， useSum。。。或（pw，c）（t，c）

有一个没有更好描述的前。我想知道从那时起是否有新的东西出现

谢谢你的帮助

如果您查看NERFeatureFactory的源代码，您可以看到正在发生的事情

源代码可在此处提供：

例如，

useWordPairs

为考虑中的单词和上一个/下一个单词创建功能。您可以在第1062行开始的代码中看到这一点

作为一个例子，考虑Word <代码>新< /代码>中的文本<代码>……来自纽约…<代码>……有用字对的特征产生了代码< No.FROM W-PW 和<代码> N-W-NW

许多特性在该文件中也有描述

查看代码并查看生成的内容是很有帮助的。例如，

conjoinShapeNGrams

功能正在生成附加单词整体形状和单词子字符串的功能。通过查看代码，您可以完全了解正在发生的事情

作为<代码>连接窗体图< /代码>，考虑名称>代码>华兹华斯<代码>，它将获得诸如“代码>值XXXXXXXXX CNCG CS < /代码>、<代码> Word XXXXXXXXXX CNCG CS < /代码>等…

此功能同时捕获特定子字符串和单词形状的存在

（pw，c）指的是“上一个单词”和“当前单词”，它们与useprov标志相链接

（t，c）指的是“词性标签”和“当前单词”，它们链接到useTags标志

它看起来不再像

useSum

做任何事情了…

非常感谢您的回答！通过使用属性“printFeatures=True”保存功能，我可以看到使用了哪些功能，这也很有帮助。在代码中，我可以在哪里看到使用这些特性的模型？我还想了解如何处理单个单词的多个特性。谢谢