Stanford nlp 斯坦福corenlp Android java sdk

Stanford nlp 斯坦福corenlp Android java sdk,stanford-nlp,Stanford Nlp,我希望在Android应用程序中使用JavaSDK进行文本处理,并将其归入某个类别。 但我看到corenlp java sdk的大小是371MB(3.7.0版),这在Android应用程序中是不可行的,因为它的大小比这个小得多,无法承受更多的应用程序大小。 是否可能只有nlp的子集可用?您能描述一下您想用Stanford CoreNLP做什么吗?你需要把东西缩小到什么尺寸?您可以删除一些代码和资源,但删除得越多,功能就会丢失得越多 更新:需要记住的是,代码和依赖项约为10 MB。350+MB中的

我希望在Android应用程序中使用JavaSDK进行文本处理,并将其归入某个类别。 但我看到corenlp java sdk的大小是371MB(3.7.0版),这在Android应用程序中是不可行的,因为它的大小比这个小得多,无法承受更多的应用程序大小。
是否可能只有nlp的子集可用?

您能描述一下您想用Stanford CoreNLP做什么吗?你需要把东西缩小到什么尺寸?您可以删除一些代码和资源,但删除得越多,功能就会丢失得越多

更新:需要记住的是,代码和依赖项约为10 MB。350+MB中的大部分是仅在运行时需要的资源。如果只使用一个子集,您肯定可以减少10MB

您不能将资源放在最多允许4 GB的扩展文件中吗。您仍然可以删除一些不必要的资源


尽管另一个严重的问题是Android应用程序的内存限制似乎很小。内存使用量低于30 MB可能是一个挑战。

我们主要希望处理用户在下输入的文本,并尝试将整个文本分类为一个类别,因此这里可能会使用一些文本挖掘算法。因此,对于这个特定的任务,有没有一种方法可以从371MB中获得代码和资源的子集,并且最终的sdk(jar或aar)大小大约为30-40MB或更小?在这里,我想将sdk集成到android应用程序中,所以不确定如何使用扩展文件。我想你可能会遇到很多麻烦,无法达到这个大小。但是是的,您可以只选择几个类和必要的资源,只使用它们,而不是全部371MB。您必须编译所需类所需的代码子集,并从各种JAR中提取必要的资源。源代码可在GitHub上获得: