Python上下文无关语法和PCFG生成基准?

Python上下文无关语法和PCFG生成基准?,python,nlp,nltk,context-free-grammar,text-analysis,Python,Nlp,Nltk,Context Free Grammar,Text Analysis,我知道在Python中有各种函数可用于通用CFGs和PCFGs;然而,它们的速度似乎都不同 例如:NLTK、PyParsing 最近有没有比较与速度和内存使用相关的各种属性的基准测试?如果您正在查看NLP工具(如其他计算软件)的官方基准测试,您可能会非常沮丧。可悲的是,NLP的研究人员正试图将准确度系统推到实时性之上。(可以肯定地说,我的得分比最先进的高出X%,而不是我在研究中训练我的模型节省了Y小时/天) 通常,他们在研究论文中会有一句话来说明训练他们的系统需要多长时间。例如,平均而言,在维基

我知道在Python中有各种函数可用于通用CFGs和PCFGs;然而,它们的速度似乎都不同

例如:NLTK、PyParsing


最近有没有比较与速度和内存使用相关的各种属性的基准测试?如果您正在查看NLP工具(如其他计算软件)的官方基准测试,您可能会非常沮丧。可悲的是,NLP的研究人员正试图将准确度系统推到实时性之上。(可以肯定地说,
我的得分比最先进的
高出X%,而不是
我在研究中训练我的模型
节省了Y小时/天)

通常,他们在研究论文中会有一句话来说明训练他们的系统需要多长时间。例如,平均而言,在维基百科转储上运行的采样程序消耗了20G内存,而每一轮在一个AMD双核1000MHZ处理器上运行大约一周。

不管怎样,因为你需要一些基准测试,所以这里有一些家庭作业,你可以用谷歌来做()‎. 但您再次意识到,他们是在测试准确性,而不是速度=)