Nlp 使用nltk进行词性标注需要时间

Nlp 使用nltk进行词性标注需要时间,nlp,nltk,Nlp,Nltk,我正在尝试使用nltk获取POS标签,我认为处理小文本所需的时间应该少于或大约1秒。但是2-3句话需要20-25秒 import nltk,re, time def findPos( text): start_time = time.time() try: tokens = nltk.word_tokenize(text) pos_tags = nltk.pos_tag(tokens) print [ x[0] for x in p

我正在尝试使用nltk获取POS标签,我认为处理小文本所需的时间应该少于或大约1秒。但是2-3句话需要20-25秒

import nltk,re, time
def findPos( text):
    start_time = time.time()
    try:
        tokens = nltk.word_tokenize(text)
        pos_tags = nltk.pos_tag(tokens)
        print [ x[0] for x in pos_tags if x[1] == "NN" or "NNP"]
    except Exception:
        import traceback
        traceback.format_exc()
    print("--- %s seconds ---" % (time.time() - start_time))

findPos(raw_input())

有没有关于如何缩短时间的建议?

对我来说,这不到一秒钟。nltk.pos_tagnltk.word_tokenize现在,对于完全不同的东西,即使我将tokenize结果乘以10,欢迎使用stackoverflow,如果您提供这些信息,我们可以更好地帮助您。你能发布你输入的文本吗?您的机器的CPU速度和RAM规格是多少?您是否连接到云,以及如何对功能计时?@alvas:是的,它在amazon t2微实例上。输入5-10句,可能重复