Apache flink Flink跨多个主机读取CSV

Apache flink Flink跨多个主机读取CSV,apache-flink,flink-sql,Apache Flink,Flink Sql,我有一个类似的集群,其中我有多个CSV,对应于每个主机的一个碎片。 我想使用TableAPI计算跨多个主机的CSV列的总和。 每个工人都应该能够计算他拥有的CSV的总和,并将结果返回到主服务器上。 有可能吗?如果我能正确理解您的问题,请阅读CSV文件并总结一些字段。这是一个相当简单的查询,对Flink来说不是问题 使用最新的Flink版本(1.4.2),您可以将CsvTableSource注册为一个表,并从您的表中运行类似SELECT sum(a),sum(b)的查询 请注意,CSV文件应存储在

我有一个类似的集群,其中我有多个CSV,对应于每个主机的一个碎片。 我想使用TableAPI计算跨多个主机的CSV列的总和。 每个工人都应该能够计算他拥有的CSV的总和,并将结果返回到主服务器上。
有可能吗?如果我能正确理解您的问题,请阅读CSV文件并总结一些字段。这是一个相当简单的查询,对Flink来说不是问题

使用最新的Flink版本(1.4.2),您可以将
CsvTableSource
注册为一个表,并从您的表中运行类似
SELECT sum(a),sum(b)的查询

请注意,CSV文件应存储在可从所有计算机(分布式文件系统、NFS等)访问的文件系统中