Google cloud platform 数据流管道从GCS读取csv并通过调用Vision和NL API写入BigBuery
我想写一个数据流程序(Java和maven实现)。以下是我要执行的步骤:Google cloud platform 数据流管道从GCS读取csv并通过调用Vision和NL API写入BigBuery,google-cloud-platform,google-cloud-dataflow,google-cloud-vision,google-cloud-nl,Google Cloud Platform,Google Cloud Dataflow,Google Cloud Vision,Google Cloud Nl,我想写一个数据流程序(Java和maven实现)。以下是我要执行的步骤: 数据流应该从google云存储中读取csv文件。csv文件的格式如下: 产品名称、图像URL、类别、说明1、说明2 樱花30062 6件套Pigma微米墨水笔,艺术,包括1支尺寸:#005(0.20mm) CCBERTER迷你热熔胶枪,带25支胶棒高温熔胶枪套件灵活触发器,适用于DIY小型工艺项目和密封及快速维修(20瓦,蓝色),安全舒适的电源开关,带LED灯模式。采用可拆卸、灵活的支撑,保持枪的稳定和直立,采用优质隔热喷
我是Dataflow的新手,因此非常感谢您提供的任何帮助、代码片段或整个源代码或参考资料您应该先阅读其中一个,然后看看其中的一些 根据您的描述,高级大纲可能是:
TextIO.read
从地面军事系统读取内容。请注意,它不支持忽略标题,因此您可能需要自己检测并删除它DoFn
,在文件每一行的URL上使用vision API。您甚至可以将其分成多个DoFn
s——一个用于将行转换为URL,然后一个用于使用vision API的DoFn,然后一个用于提取前两个标记的DoFnDoFn
或一系列DoFn
sDoFn
或一系列DoFn
s,生成具有所需输出格式的行,如TableRow
sBigQueryIO.write
transform将它们写入BigQuery李>
你应该先读一本,然后看看其中的一些 根据您的描述,高级大纲可能是:
TextIO.read
从地面军事系统读取内容。请注意,它不支持忽略标题,因此您可能需要自己检测并删除它DoFn
,在文件每一行的URL上使用vision API。您甚至可以将其分成多个DoFn
s——一个用于将行转换为URL,然后一个用于使用vision API的DoFn,然后一个用于提取前两个标记的DoFnDoFn
或一系列DoFn
sDoFn
或一系列DoFn
s,生成具有所需输出格式的行,如TableRow
sBigQueryIO.write
transform将它们写入BigQuery李>