Indexing 流形cf是谷歌硬盘索引的好选择吗?

Indexing 流形cf是谷歌硬盘索引的好选择吗?,indexing,solr,google-drive-api,manifoldcf,Indexing,Solr,Google Drive Api,Manifoldcf,我正在使用ApacheManifoldcf开源项目将Google Drive中的文档索引到我的solr中。我经常看到它在索引数据时非常不一致。在solr中反映即使是少量文档也需要时间。您真的认为使用它为Google Drive编制索引是一个不错的选择吗?由于响应时间和Google Drive本身的限制,它目前有点慢。但如果你从谷歌购买额外的带宽,这个限制可能会得到缓解。使用当前的设置,如果您希望在google drive中为一大组文档编制索引,它可能不会像您预期的那样快,而且对于在文件系统中爬行

我正在使用ApacheManifoldcf开源项目将Google Drive中的文档索引到我的solr中。我经常看到它在索引数据时非常不一致。在solr中反映即使是少量文档也需要时间。您真的认为使用它为Google Drive编制索引是一个不错的选择吗?

由于响应时间和Google Drive本身的限制,它目前有点慢。但如果你从谷歌购买额外的带宽,这个限制可能会得到缓解。使用当前的设置,如果您希望在google drive中为一大组文档编制索引,它可能不会像您预期的那样快,而且对于在文件系统中爬行来说,它是很好的。如果您对web爬行感兴趣,可以选择ApacheNutch

是的,ManifoldCF需要花费大量时间来反映少量文档。它的文档也很少。尽管如此,您可以加入邮件列表,在那里您可以向首席开发人员“Karl”提问。他很乐于助人,通常会在几个小时内回答


注:我已经在一个项目中使用ManifoldCF工作了10个月。

thanx,kbird你能告诉我一些其他方法,我可以从google drive索引文档,这不是依赖ManifoldCF???@codechat如果你要使用api,约束仍然存在。我不确定除了使用api之外还有什么其他方法