Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/jquery-ui/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Stanford nlp 如何在python中实现基于令牌的实体提取_Stanford Nlp_Ner - Fatal编程技术网

Stanford nlp 如何在python中实现基于令牌的实体提取

Stanford nlp 如何在python中实现基于令牌的实体提取,stanford-nlp,ner,Stanford Nlp,Ner,我想使用Stanford的tokensregex特性进行基本的实体提取。但是我不知道如何通过python中的包装类使用它,也不知道在哪里可以使用我自己的正则表达式规则 我得到的大部分代码和实现都是用java编写的。你能推荐一些好的教程或者简单地解释一下吗?到目前为止,我一直在使用CRF模型进行实体提取 推荐的方法是编写规则文件,运行Java服务器,并使用Python包装器访问服务器 有关规则文件的信息: 有关使用Python访问服务器的信息: 很快,我们将发布一个新的Python包,所以我将

我想使用Stanford的tokensregex特性进行基本的实体提取。但是我不知道如何通过python中的包装类使用它,也不知道在哪里可以使用我自己的正则表达式规则


我得到的大部分代码和实现都是用java编写的。你能推荐一些好的教程或者简单地解释一下吗?到目前为止,我一直在使用CRF模型进行实体提取

推荐的方法是编写规则文件,运行Java服务器,并使用Python包装器访问服务器

有关规则文件的信息:

有关使用Python访问服务器的信息:


很快,我们将发布一个新的Python包,所以我将在发布后更新此信息。

我使用了中提到的上述代码,但在使用corenlp.CoreNLPClient时出错(annotators=“tokenize ssplit pos lemma ner depparse”.split())作为客户:我已安装了上述stanford corenlp pip install stanford corenlp,并在bashrc文件中将环境变量设置为export corenlp_HOME=“/HOME/stanford/stanford-corenlp-full-2018-02-27”。我正在使用anaconda python 2.7访问斯坦福大学corenlp的最新版本。回溯(最后一次调用):文件“corenlp1.py”,第4行,在ann=client.annotate(文本)文件“/home/saurabh/anaconda2/lib/python2.7/site packages/corenlp/client.py”,第225行,在annotate。。。。。raise ReadTimeout(e,request=request)requests.exceptions.ReadTimeout:HTTPConnectionPool(host='localhost',port=9000):读取超时。(读取超时=30)