Python:如何加载并使用经过训练和酸洗的NLTK标记器来进行GAE?

Python:如何加载并使用经过训练和酸洗的NLTK标记器来进行GAE?,python,google-app-engine,pickle,nltk,Python,Google App Engine,Pickle,Nltk,我有一个训练有素的NLTK标记器(Brill的基于规则的转换标记器)。 我想在GAE上使用它。最好的方法是什么?如果您的NLTK标记代码和数据大小有限,请将其与GAE代码一起携带 如果您必须根据它重新训练集合,则可以选择将文件内容作为BLOB存储在数据存储中,以便获取、分析、重新训练和放置。但由于GAE硬限制,这会将数据项的大小限制为小于1MB。如果NLTK标记器代码和数据的大小有限,然后将其与您的GAE代码一起携带 如果您必须对其进行操作以重新训练集合,则可以选择将文件内容作为BLOB存储在数

我有一个训练有素的NLTK标记器(Brill的基于规则的转换标记器)。
我想在GAE上使用它。最好的方法是什么?

如果您的NLTK标记代码和数据大小有限,请将其与GAE代码一起携带


如果您必须根据它重新训练集合,则可以选择将文件内容作为
BLOB存储在数据存储中,以便获取、分析、重新训练和放置。但由于GAE硬限制,这会将数据项的大小限制为小于1MB。

如果NLTK标记器代码和数据的大小有限,然后将其与您的GAE代码一起携带


如果您必须对其进行操作以重新训练集合,则可以选择将文件内容作为
BLOB存储在数据存储中,以便获取、分析、,重新训练并放入。但由于GAE硬限制,这将限制dataitem的大小小于1MB。

也可以使用到的文件接口写入大于1MB的新数据。而不是在静态目录中!静态目录直接提供给用户,代码无法访问。相反,将其包含在应用程序中,不要将其标记为静态。@尼克-我认为静态目录可以通过代码只读访问(如果我们直接通过url指向该位置会怎么样)。但无论如何,正如你所说的,我意识到CDN将为它们提供服务,将它们存储在静态目录中是个坏主意。非静态目录是代码无法显式访问的。所有未标记为静态的文件都可以访问;静态是指应该由前端直接提供服务的文件。现在我们有了用于GAE的云存储api。还可以使用到的文件接口来写入大于1MB的新数据。而不是在静态目录中!静态目录直接提供给用户,代码无法访问。相反,将其包含在应用程序中,不要将其标记为静态。@尼克-我认为静态目录可以通过代码只读访问(如果我们直接通过url指向该位置会怎么样)。但无论如何,正如你所说的,我意识到CDN将为它们提供服务,将它们存储在静态目录中是个坏主意。非静态目录是代码无法显式访问的。所有未标记为静态的文件都可以访问;静态是指应该由前端直接提供服务的文件。现在我们有了用于GAE的云存储api。