Nlp 如何嵌入外部插件,如;BWP地名录“;带闸门

Nlp 如何嵌入外部插件,如;BWP地名录“;带闸门,nlp,gate,Nlp,Gate,我想使用BWP地名录而不是GATE的默认地名录。为此,我将其作为资源添加到creole.xml中,并将其JAR也包含在工作区中 Creole.xml <RESOURCE> <NAME>BWPGazetteer</NAME> <JAR>BWPGazetteer.jar</JAR> <CLASS>bwp.gate.gazetteer.BWPGazetteer</CLASS> <COMMENT>A BW

我想使用
BWP地名录
而不是GATE的默认地名录。为此,我将其作为资源添加到
creole.xml
中,并将其JAR也包含在工作区中

Creole.xml

  <RESOURCE>
<NAME>BWPGazetteer</NAME>
<JAR>BWPGazetteer.jar</JAR>
<CLASS>bwp.gate.gazetteer.BWPGazetteer</CLASS>
<COMMENT>A BWPGazetteer.</COMMENT>
  <PARAMETER NAME="document" RUNTIME="true"
    COMMENT="The document to be processed"> gate.Document</PARAMETER>
  <PARAMETER NAME="annotationSetName" RUNTIME="true"
    COMMENT="The annotation set to be used for the generated annotations"
    OPTIONAL="true">java.lang.String</PARAMETER>
  <PARAMETER NAME="listsURL"
    DEFAULT="resources/gazetteer/lists.def"
    COMMENT="The URL to the file with list of lists" SUFFIXES="def">
    java.net.URL</PARAMETER>
  <PARAMETER DEFAULT="UTF-8"
    COMMENT="The encoding used for reading the definitions" NAME="encoding">
    java.lang.String</PARAMETER>
  <PARAMETER DEFAULT="true"
    COMMENT="Should this gazetteer diferentiate on case"
    NAME="caseSensitive">java.lang.Boolean</PARAMETER>
  <PARAMETER DEFAULT="true"
    COMMENT="Should this gazetteer only match whole words"
    NAME="wholeWordsOnly">java.lang.Boolean</PARAMETER>
    <PARAMETER NAME="normalizedDistanceThreshold"
            COMMENT="Maximum normalized distance(0.0-1.0) for a match"
            DEFAULT="0.1">
            java.lang.Double
        </PARAMETER>
<PARAMETER DEFAULT="true"
    COMMENT="Should this gazetter avoid overlapping annotations"
    NAME= "avoidOverlapingAnnotations">
    java.lang.Boolean
</PARAMETER>

bwpgazetter
bwpgazetter.jar
bwp.gate.gazetter.bwpggazetter
bwpgazetter。
登机门文件
java.lang.String
java.net.URL
java.lang.String
java.lang.Boolean
java.lang.Boolean
java.lang.Double
java.lang.Boolean


有人能告诉我我的JAVA代码或配置文件需要做哪些进一步的更改才能使用它吗?

您不需要修改任何creole.xml文件,只需下载并解压BwpGazetter发行版,将
BwpGazetter
目录作为creole插件加载,创建地名录的实例,并将其插入管道中的适当位置。到目前为止,最简单的方法是使用GateDeveloper构建管道(包括位于正确位置的相关地名录实例),然后右键单击并“导出用于GATECloud.net”。这将生成一个zip文件,其中包含保存的应用程序状态(application.xgapp)以及应用程序使用的所有插件和资源文件


将此zip文件解压缩到项目中的某个位置,然后您只需使用
PersistenceManager.loadObjectFromFile
(或
loadObjectFromUrl
)即可加载保存的应用程序及其所需的所有插件。

很抱歉,我是个新手,不清楚该方法。通过
将BWPGazetter目录作为克里奥尔插件加载
,你的意思是将它(仅BWPGazetter.JAR)复制到plugins文件夹中吗?在我的Java项目中,层次结构就像:GATE->Plugins->ANNIE(ANNIE->resources,build.xml,creole.xml)@DivyaMotivala下载插件zip文件,解压缩它,然后在GATE Developer中打开插件管理器,单击左上角的
+
按钮,单击文件夹按钮,然后选择刚刚解包的
bwpgazetter
目录。这将把插件添加到下面的列表中,然后你可以勾选相关的“立即加载”框来加载插件。感谢所有的帮助:)它成功了。你能告诉我《BWP地名录》的性能含义吗?因为我在使用后会注意到严重的性能问题。这需要很多时间来处理。任何关于这方面的见解都是值得赞赏的:)@DivyaMotiwala恐怕我对BWP地名录插件一无所知,除了它自己的网站上的内容。我对这个问题的回答只是简单地将任何第三方插件加载到GATE中的一般方法。@DivyaMotiwala
bwpgazetter
本质上是缓慢的。它使用
Levenshtein的距离进行近似字符串匹配
,这比普通地名索引匹配需要更多的时间。尽量减少
标准化距离应
以加快速度,但恐怕不会有帮助。我认为
bwpgazetter
仅适用于小型地名索引列表。