Google cloud dataflow 启动工作人员后,数据流作业未完成/失败

Google cloud dataflow 启动工作人员后,数据流作业未完成/失败,google-cloud-dataflow,apache-beam,dataflow,Google Cloud Dataflow,Apache Beam,Dataflow,我创建了一个数据流管道,它从存储桶中读取一个文件,然后对数据进行简单的转换(例如:修剪空格) 当我执行数据流作业时,作业已启动,并且日志显示工人已在区域中启动,但在此之后什么也没有发生。作业从未完成或失败。我不得不手动停止这项工作 数据流作业已由具有Dataflow.worker角色、Dataflow.developer角色和Dataflow.objectAdmin角色的服务帐户执行 请有人提出为什么数据流作业没有完成,或者为什么工作人员启动后作业没有执行 2021-02-09 11:01:29

我创建了一个数据流管道,它从存储桶中读取一个文件,然后对数据进行简单的转换(例如:修剪空格)

当我执行数据流作业时,作业已启动,并且日志显示工人已在区域中启动,但在此之后什么也没有发生。作业从未完成或失败。我不得不手动停止这项工作

数据流作业已由具有Dataflow.worker角色、Dataflow.developer角色和Dataflow.objectAdmin角色的服务帐户执行

请有人提出为什么数据流作业没有完成,或者为什么工作人员启动后作业没有执行

2021-02-09 11:01:29.753 GMTWorker configuration: n1-standard-1 in europe-west2-b.
Warning
2021-02-09 11:01:30.015 GMTThe network sdas-global-dev doesn't have rules that open TCP ports 12345-12346 for internal connection with other VMs. Only rules with a target tag 'dataflow' or empty target tags set apply. If you don't specify such a rule, any pipeline with more than one worker that shuffles data will hang. Causes: No firewall rules associated with your network.
Info
2021-02-09 11:01:31.067 GMTExecuting operation Read files/Read+ManageData/ParDo(ManageData)
Info
2021-02-09 11:01:31.115 GMTStarting 1 workers in europe-west2-b...
Warning
2021-02-09 11:07:33.341 GMTThe network sdas-global-dev doesn't have rules that open TCP ports 12345-12346 for internal connection with other VMs. Only rules with a target tag 'dataflow' or empty target tags set apply. If you don't specify such a rule, any pipeline with more than one worker that shuffles data will hang. Causes: No firewall rules associated with your network.

我发现了问题。我是在一个地区运行的,因为VPC在不同的地区。因此,工人无法旋转。将该区域设置为VPC的相同区域,然后一切顺利。

工作人员和诊断日志显示了什么?在“计算引擎”面板中,是否正在启动工作节点?每个实例的Stackdriver中有什么有趣的东西吗?需要更多详细信息来帮助您。@JohnHanley没有工作日志或诊断日志。作业日志仅显示工人已启动。在右侧作业信息面板中,资源度量将所有值显示为零;像当前的CPU 0、当前内存0b等,我已经用作业日志详细信息更新了问题。谢谢。当您转到Compute Engine时,运行VM(不是数据流部分)“Compute Engine”->“VM实例”会显示什么?这些VM实例的Stackdriver中还有什么内容吗?@JohnHanley我刚刚发布了解决方案。我是在一个地区运行的,因为VPC在不同的地区。因此,工人无法旋转。把这个区域和VPC的一样,然后一切都很顺利。你能补充更多细节吗?1) 关于如何诊断此问题的提示。2) 有关冲突VPC的详细信息,以及Dataflow如何在错误的VPC中启动Worker。3) 此问题的错误消息存储在哪里?@JohnHanley 1。首先在日志中标识,其中显示您的网络存在无防火墙规则。(我编辑了我的问题,把日志放回原处)。2.要求我的网络团队允许我的网络。他们做到了。但问题仍然是一样的。那个工人还没有开始工作。3.然后,网络团队的人让我使用我的网络所属的同一地区。因为之前我使用的是不同的区域。我的意思是在你的答案中添加更多的细节。我非常了解数据流,但我不太清楚您是如何创建此问题以及如何诊断解决方案的。我很想了解细节。