Nlp 如何嵌入外部插件,如;BWP地名录“;带闸门
我想使用Nlp 如何嵌入外部插件,如;BWP地名录“;带闸门,nlp,gate,Nlp,Gate,我想使用BWP地名录而不是GATE的默认地名录。为此,我将其作为资源添加到creole.xml中,并将其JAR也包含在工作区中 Creole.xml <RESOURCE> <NAME>BWPGazetteer</NAME> <JAR>BWPGazetteer.jar</JAR> <CLASS>bwp.gate.gazetteer.BWPGazetteer</CLASS> <COMMENT>A BW
BWP地名录
而不是GATE的默认地名录。为此,我将其作为资源添加到creole.xml
中,并将其JAR也包含在工作区中
Creole.xml
<RESOURCE>
<NAME>BWPGazetteer</NAME>
<JAR>BWPGazetteer.jar</JAR>
<CLASS>bwp.gate.gazetteer.BWPGazetteer</CLASS>
<COMMENT>A BWPGazetteer.</COMMENT>
<PARAMETER NAME="document" RUNTIME="true"
COMMENT="The document to be processed"> gate.Document</PARAMETER>
<PARAMETER NAME="annotationSetName" RUNTIME="true"
COMMENT="The annotation set to be used for the generated annotations"
OPTIONAL="true">java.lang.String</PARAMETER>
<PARAMETER NAME="listsURL"
DEFAULT="resources/gazetteer/lists.def"
COMMENT="The URL to the file with list of lists" SUFFIXES="def">
java.net.URL</PARAMETER>
<PARAMETER DEFAULT="UTF-8"
COMMENT="The encoding used for reading the definitions" NAME="encoding">
java.lang.String</PARAMETER>
<PARAMETER DEFAULT="true"
COMMENT="Should this gazetteer diferentiate on case"
NAME="caseSensitive">java.lang.Boolean</PARAMETER>
<PARAMETER DEFAULT="true"
COMMENT="Should this gazetteer only match whole words"
NAME="wholeWordsOnly">java.lang.Boolean</PARAMETER>
<PARAMETER NAME="normalizedDistanceThreshold"
COMMENT="Maximum normalized distance(0.0-1.0) for a match"
DEFAULT="0.1">
java.lang.Double
</PARAMETER>
<PARAMETER DEFAULT="true"
COMMENT="Should this gazetter avoid overlapping annotations"
NAME= "avoidOverlapingAnnotations">
java.lang.Boolean
</PARAMETER>
bwpgazetter
bwpgazetter.jar
bwp.gate.gazetter.bwpggazetter
bwpgazetter。
登机门文件
java.lang.String
java.net.URL
java.lang.String
java.lang.Boolean
java.lang.Boolean
java.lang.Double
java.lang.Boolean
有人能告诉我我的JAVA代码或配置文件需要做哪些进一步的更改才能使用它吗?您不需要修改任何creole.xml文件,只需下载并解压BwpGazetter发行版,将
BwpGazetter
目录作为creole插件加载,创建地名录的实例,并将其插入管道中的适当位置。到目前为止,最简单的方法是使用GateDeveloper构建管道(包括位于正确位置的相关地名录实例),然后右键单击并“导出用于GATECloud.net”。这将生成一个zip文件,其中包含保存的应用程序状态(application.xgapp)以及应用程序使用的所有插件和资源文件
将此zip文件解压缩到项目中的某个位置,然后您只需使用
PersistenceManager.loadObjectFromFile
(或loadObjectFromUrl
)即可加载保存的应用程序及其所需的所有插件。很抱歉,我是个新手,不清楚该方法。通过将BWPGazetter目录作为克里奥尔插件加载,你的意思是将它(仅BWPGazetter.JAR)复制到plugins文件夹中吗?在我的Java项目中,层次结构就像:GATE->Plugins->ANNIE(ANNIE->resources,build.xml,creole.xml)@DivyaMotivala下载插件zip文件,解压缩它,然后在GATE Developer中打开插件管理器,单击左上角的+
按钮,单击文件夹按钮,然后选择刚刚解包的bwpgazetter
目录。这将把插件添加到下面的列表中,然后你可以勾选相关的“立即加载”框来加载插件。感谢所有的帮助:)它成功了。你能告诉我《BWP地名录》的性能含义吗?因为我在使用后会注意到严重的性能问题。这需要很多时间来处理。任何关于这方面的见解都是值得赞赏的:)@DivyaMotiwala恐怕我对BWP地名录插件一无所知,除了它自己的网站上的内容。我对这个问题的回答只是简单地将任何第三方插件加载到GATE中的一般方法。@DivyaMotiwalabwpgazetter
本质上是缓慢的。它使用Levenshtein的距离进行近似字符串匹配
,这比普通地名索引匹配需要更多的时间。尽量减少标准化距离应以加快速度,但恐怕不会有帮助。我认为bwpgazetter
仅适用于小型地名索引列表。