Python 对存储在Discodex中的数据运行Disco map reduce作业

Python 对存储在Discodex中的数据运行Disco map reduce作业,python,mapreduce,disco,Python,Mapreduce,Disco,我有大量静态数据,需要提供随机访问。因为,我使用Disco来消化它,所以我在Disco分布式文件系统之上使用了外观非常令人印象深刻的Discodex(key,value)存储。然而,迪斯科的文档非常稀少,所以我不知道如何使用我的迪斯科索引作为迪斯科作业的输入 这可能吗?如果是,我该怎么做 或者,我想得不对?将这些数据作为文本文件存储在DDFS上会更好吗?没关系,看来我所做的并不是真的要做的。这可能是可能的,但最好只使用语义DDFS标记来引用数据块 Discodex的正确使用案例是存储由Disco

我有大量静态数据,需要提供随机访问。因为,我使用Disco来消化它,所以我在Disco分布式文件系统之上使用了外观非常令人印象深刻的Discodex(key,value)存储。然而,迪斯科的文档非常稀少,所以我不知道如何使用我的迪斯科索引作为迪斯科作业的输入

这可能吗?如果是,我该怎么做


或者,我想得不对?将这些数据作为文本文件存储在DDFS上会更好吗?

没关系,看来我所做的并不是真的要做的。这可能是可能的,但最好只使用语义DDFS标记来引用数据块


Discodex的正确使用案例是存储由Disco map reduce程序构建的索引,该索引不需要作为另一个map reduce程序的输入。

您也可以使用DiscoDB存储一个作业的输出,然后将其用作另一个作业的输入。DiscoDB教程有一个很好的例子