Protocol buffers 在apache beam中读取协议缓冲区文件

Protocol buffers 在apache beam中读取协议缓冲区文件,protocol-buffers,google-cloud-dataflow,apache-beam,apache-beam-io,Protocol Buffers,Google Cloud Dataflow,Apache Beam,Apache Beam Io,我在GCS中有一堆protobuff文件,我想通过dataflow(javasdk)来处理它们,但我不知道如何做到这一点 apachebeam提供了AvroIO来读取avro文件 Schema schema = new Schema.Parser().parse(new File("schema.avsc")); PCollection<GenericRecord> records = p.apply(AvroIO.readGenericRecords(schema)

我在GCS中有一堆protobuff文件,我想通过dataflow(javasdk)来处理它们,但我不知道如何做到这一点

apachebeam提供了AvroIO来读取avro文件

 Schema schema = new Schema.Parser().parse(new File("schema.avsc"));
 PCollection<GenericRecord> records =
     p.apply(AvroIO.readGenericRecords(schema)
                .from("gs://my_bucket/path/to/records-*.avro"));
Schema Schema=newschema.Parser().parse(新文件(“Schema.avsc”);
收集记录=
p、 应用(AvroIO.readGenericRecords(模式)
.from(“gs://my_bucket/path/to/records-*.avro”);
读取protobuff文件有类似的方法吗


提前谢谢

这可能是您要找的吗?它似乎包含一个示例代码片段。是的,我需要protocoder,但它不能与Text.IO一起使用,也不能与任何其他可用的IO一起使用。您可以使用您尝试的与上面链接中描述的protocoder类相关的内容更新问题。当你说它不起作用时,是什么错误?