Google cloud dataflow Google数据流中的保留CPU时间

Google cloud dataflow Google数据流中的保留CPU时间,google-cloud-dataflow,Google Cloud Dataflow,我有一个关于Google Dataflow中保留的CPU时间字段的问题。我不明白为什么根据我跑步的配置变化如此之大。我怀疑我没有解释保留的CPU时间到底是什么。据我所知,完成我提交的作业所需的CPU时间,但根据以下证据,似乎我错了。是不是分配给你的工作的时间,不管它是否实际使用资源?如果是这样的话,我如何得到我工作的实际CPU时间 首先,我用不同规模的员工(最多24名员工)执行我的工作 相应的统计数据如下: 然后,我使用固定数量的工作人员(10)运行脚本: 统计数据将更改为: 他们从15天

我有一个关于Google Dataflow中保留的CPU时间字段的问题。我不明白为什么根据我跑步的配置变化如此之大。我怀疑我没有解释保留的CPU时间到底是什么。据我所知,完成我提交的作业所需的CPU时间,但根据以下证据,似乎我错了。是不是分配给你的工作的时间,不管它是否实际使用资源?如果是这样的话,我如何得到我工作的实际CPU时间

首先,我用不同规模的员工(最多24名员工)执行我的工作

相应的统计数据如下:

然后,我使用固定数量的工作人员(10)运行脚本:

统计数据将更改为:

他们从15天到7小时?这怎么可能


谢谢

如果您将鼠标悬停在“保留CPU时间”旁边的“?”上,将显示一条弹出消息,内容为:“GCE实例上的数据流在每个CPU上的活动总时间”。这表明它不是VM使用的CPU时间。此时,数据流不会聚合每台机器的CPU使用统计数据;但是,您可以自己使用提取这些度量。

在上面提到的第一个作业的日志中,我看到自动缩放已启用“[sic]在1到1000个工作人员之间…”。你介意把工作ID发给我们吗?这样我们可以进一步调查。谢谢!我读了这条信息,徘徊在“?”上,但我不明白其中的含义。。。谢谢你的澄清。