Google cloud storage 谷歌云存储API-将数据合并到现有

Google cloud storage 谷歌云存储API-将数据合并到现有,google-cloud-storage,Google Cloud Storage,我在谷歌云存储中有一些数据集。我可以找到如何将更多数据附加到此数据集。但是如果我想合并数据集(Insert else update),我该怎么做呢 我有一个选择使用配置单元-插入覆盖。还有其他更好的选择吗 谷歌云存储API本身有什么选择吗 GCS将对象(文件)视为blob,对象中的文本没有内置GCS操作。不过,有一种更简单的方法可以像你现在这样做 提供用于地面军事系统的内置适配器。您可以在中找到示例代码。这可能会有所帮助: 谢谢你,阿什。你能帮我理解吗?你是说,我可以写一个Mapreduce程序

我在谷歌云存储中有一些数据集。我可以找到如何将更多数据附加到此数据集。但是如果我想合并数据集(Insert else update),我该怎么做呢

我有一个选择使用配置单元-插入覆盖。还有其他更好的选择吗

谷歌云存储API本身有什么选择吗

GCS将对象(文件)视为blob,对象中的文本没有内置GCS操作。不过,有一种更简单的方法可以像你现在这样做


提供用于地面军事系统的内置适配器。您可以在中找到示例代码。

这可能会有所帮助:


谢谢你,阿什。你能帮我理解吗?你是说,我可以写一个Mapreduce程序来合并数据集?mapreduce程序可以指向地面军事系统的位置。我是否正确理解了它?在哪里可以使用sqoop?我可以使用sqoop合并Google集群中的两个数据集并将结果数据输出到Google集群吗?不像sqoop那样。appengine将为您运行一个Web服务器,它可以接受带有参数的请求,并且您可以在其中相应地运行作业。您可以在这里找到一个代码示例:我有一组分隔文件。不完全是逗号分隔的。但是^个独立的文件。请注意,它不能连接超过32个对象,并且在服务器上连接。这意味着您必须递归地在32个对象上合成批,这在google对象中是一件痛苦的事情
Objects: compose

Concatenates a list of existing objects into a new object in the same bucket.