Stanford nlp Stanford NerreatureFactory描述

Stanford nlp Stanford NerreatureFactory描述,stanford-nlp,Stanford Nlp,你知道我在哪里可以找到更多关于斯坦福NERFeatureFactory描述的细节吗 我在以下网站上读到: 但我不完全理解(有些没有描述) 例如:useprov, 使用单词对, 连体图形, useSum。。。 或 (pw,c)(t,c) 有一个没有更好描述的前。我想知道从那时起是否有新的东西出现 谢谢你的帮助 如果您查看NERFeatureFactory的源代码,您可以看到正在发生的事情 源代码可在此处提供: 例如,useWordPairs为考虑中的单词和上一个/下一个单词创建功能。您可以在第10

你知道我在哪里可以找到更多关于斯坦福NERFeatureFactory描述的细节吗

我在以下网站上读到: 但我不完全理解(有些没有描述)

例如:useprov, 使用单词对, 连体图形, useSum。。。 或 (pw,c)(t,c)

有一个没有更好描述的前。我想知道从那时起是否有新的东西出现


谢谢你的帮助

如果您查看NERFeatureFactory的源代码,您可以看到正在发生的事情

源代码可在此处提供:

例如,
useWordPairs
为考虑中的单词和上一个/下一个单词创建功能。您可以在第1062行开始的代码中看到这一点

作为一个例子,考虑Word <代码>新< /代码>中的文本<代码>……来自纽约…<代码>……有用字对的特征产生了代码< No.FROM W-PW 和<代码> N-W-NW

许多特性在该文件中也有描述

查看代码并查看生成的内容是很有帮助的。例如,
conjoinShapeNGrams
功能正在生成附加单词整体形状和单词子字符串的功能。通过查看代码,您可以完全了解正在发生的事情

作为<代码>连接窗体图< /代码>,考虑名称>代码>华兹华斯<代码>,它将获得诸如“代码>值XXXXXXXXX CNCG CS < /代码>、<代码> Word XXXXXXXXXX CNCG CS < /代码>等…

此功能同时捕获特定子字符串和单词形状的存在

(pw,c)指的是“上一个单词”和“当前单词”,它们与useprov标志相链接

(t,c)指的是“词性标签”和“当前单词”,它们链接到useTags标志


它看起来不再像
useSum
做任何事情了…

非常感谢您的回答!通过使用属性“printFeatures=True”保存功能,我可以看到使用了哪些功能,这也很有帮助。在代码中,我可以在哪里看到使用这些特性的模型?我还想了解如何处理单个单词的多个特性。谢谢