Google cloud dataflow 是否可以将非文本文件读入google数据流管道?

Google cloud dataflow 是否可以将非文本文件读入google数据流管道?,google-cloud-dataflow,apache-beam,Google Cloud Dataflow,Apache Beam,我想把pdf文件读入管道。但是,除了纯文本或xml之外,我还没有找到任何关于文件格式的apache beam示例。数据流或apache beam库中没有现成的PDF阅读器。但是,您可以使用这个TensorFlow记录阅读器的示例作为模型,使用您选择的PDF解析库编写自己的文档 谢谢链接Andrea。你知道Python中有这样一个例子吗?谢谢,艾拉兰

我想把pdf文件读入管道。但是,除了纯文本或xml之外,我还没有找到任何关于文件格式的apache beam示例。

数据流或apache beam库中没有现成的PDF阅读器。但是,您可以使用这个TensorFlow记录阅读器的示例作为模型,使用您选择的PDF解析库编写自己的文档


谢谢链接Andrea。你知道Python中有这样一个例子吗?谢谢,艾拉兰