Hadoop 如何在Sqoop+;开源同步排序

Hadoop 如何在Sqoop+;开源同步排序,hadoop,sqoop,mainframe,vsam,syncsort-dmx-h,Hadoop,Sqoop,Mainframe,Vsam,Syncsort Dmx H,我正在尝试将一些VSAM文件从大型机导入配置单元 我发现Sqoop1.4.6将Syncsort作为一种开源contrib包含在内。我浏览了文档,不清楚是否可以在这个版本中包含COBOL文案 是否有人尝试过这样做或知道其他替代方法?从您的链接中可以看出,sqoop支持PDS中的顺序“文本”文件。所以忘了VSAM的Sqoop,好吗?我根本不知道你在第二段中想问什么。我相信,无论你的意思是什么,如果文档中没有包含,它不太可能神奇地工作。请记住,“告诉我一些将VSAM嵌入Hadoop的工具”是一个离题

我正在尝试将一些VSAM文件从大型机导入配置单元

我发现Sqoop1.4.6将Syncsort作为一种开源contrib包含在内。我浏览了文档,不清楚是否可以在这个版本中包含COBOL文案


是否有人尝试过这样做或知道其他替代方法?

从您的链接中可以看出,sqoop支持PDS中的顺序“文本”文件。所以忘了VSAM的Sqoop,好吗?我根本不知道你在第二段中想问什么。我相信,无论你的意思是什么,如果文档中没有包含,它不太可能神奇地工作。请记住,“告诉我一些将VSAM嵌入Hadoop的工具”是一个离题的问题。你必须找到一个工具,有问题,然后问。Sqoop+syncsort商业版包括接收VSAM的功能,该VSAM指定了它的副本(根据他们的销售讲话)。开源版本也是如此。但是当我阅读文档时,我找不到描述这些特性的特定部分。这就是为什么我感到困惑并问这个问题。你提供的链接没有提供这方面的证据。VSAM数据集不能存在于PDS(或PDSE)中。链接只讨论PDS。这本身就有点奇怪,因为通常在PDS中不会有多个和e“文件”。无论如何,从术语上讲,他们应该是“成员”。沿着数据集名称的“层次结构”往下看,会“看起来有点像”PDS中的文件。也许文档的作者缺少一两条线索。你用的是商业版吗?根据您的支持合同提出请求。另外,可能还有更直接的地方发布这个问题。我真的不确定文档是否知道它在说什么。忽略对PDS的引用,并不一定排除VSAM数据集(但似乎仍有“文本”限制)。如果消费者是Syncsort的东西,那么这将是一个提问的地方。如果Cobol可用,我会感到惊讶(这就是为什么Syncsort会收取巨额费用的原因)。即使有cobol选项,大多数cobol文件都是二进制文件,因此cobol选项对您没有多大好处,您仍然需要大型机程序员将文件转换为文本。