Python pycorenlp:“;CoreNLP请求超时。您的文档可能太长”;

Python pycorenlp:“;CoreNLP请求超时。您的文档可能太长”;,python,timeout,nlp,stanford-nlp,Python,Timeout,Nlp,Stanford Nlp,我试图在长文本上运行,并得到一个CoreNLP请求超时。您的文档可能太长错误消息。如何修复它?有没有办法增加服务器超时 我不想把课文分成更小的课文 以下是我使用的代码: ''' From https://github.com/smilli/py-corenlp/blob/master/example.py ''' from pycorenlp import StanfordCoreNLP import pprint if __name__ == '__main__': nlp = St

我试图在长文本上运行,并得到一个
CoreNLP请求超时。您的文档可能太长
错误消息。如何修复它?有没有办法增加服务器超时

我不想把课文分成更小的课文

以下是我使用的代码:

'''
From https://github.com/smilli/py-corenlp/blob/master/example.py
'''
from pycorenlp import StanfordCoreNLP
import pprint

if __name__ == '__main__':
    nlp = StanfordCoreNLP('http://localhost:9000')
    fp = open("long_text.txt")
    text = fp.read()
    output = nlp.annotate(text, properties={
        'annotators': 'tokenize,ssplit,pos,depparse,parse',
        'outputFormat': 'json'
    })
    pp = pprint.PrettyPrinter(indent=4)
    pp.pprint(output)
Stanford Core NLP服务器是通过以下方式启动的:

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer 9000

您可以在
属性
字典中添加
'timeout':'50000'
(单位为ms):

output = nlp.annotate(text, properties={
    'timeout': '50000',
    'annotators': 'tokenize,ssplit,pos,depparse,parse',
    'outputFormat': 'json'
})
否则,您可以启动Stanford Core NLP服务器,并指定超时:

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 50000

(没有提到
timeout
参数,可能他们忘记添加它了,它至少出现在最新的公开发行版中)

现在似乎是这样,但似乎没有无限超时,也没有在文档中指定最大值。@displayname一次一步:/Yeah,不幸的是,可能与超时问题或类似问题有关。