Google cloud platform 谷歌数据流“;“工作流失败”;无缘无故

Google cloud platform 谷歌数据流“;“工作流失败”;无缘无故,google-cloud-platform,google-cloud-dataflow,Google Cloud Platform,Google Cloud Dataflow,我在谷歌云平台上运行数据流作业,我得到的一个新错误是“工作流失败”,没有任何解释。 我得到的日志如下: 2017-08-25 (00:06:01) Executing operation ReadNewXXXFromStorage/Read+JsonStringsToXXX+RemoveLanguagesFromXXX... 2017-08-25 (00:06:01) Executing operation ReadOldXYZ_ABC_1234_123_ns_123123123123123

我在谷歌云平台上运行数据流作业,我得到的一个新错误是“工作流失败”,没有任何解释。 我得到的日志如下:

 2017-08-25 (00:06:01) Executing operation ReadNewXXXFromStorage/Read+JsonStringsToXXX+RemoveLanguagesFromXXX...
 2017-08-25 (00:06:01) Executing operation ReadOldXYZ_ABC_1234_123_ns_123123123123123/GroupByKey/Create
 2017-08-25 (00:06:01) Starting 1 workers in europe-west1-b...
 2017-08-25 (00:06:01) Executing operation ReadOldXYZ_ABC_1234_123_ns_123123123123123/ParDo(SplitQuery)+ReadOldXYZ...
 2017-08-25 (00:06:48) Workflow failed.
 2017-08-25 (00:06:48) Stopping worker pool...
 2017-08-25 (00:06:58) Worker pool stopped.
我怎么才能知道出了什么问题?对象上的权限不应该有问题,因为类似的作业会成功运行。 当我尝试从Google云控制台重新运行模板时,我收到以下消息:

找不到此模板的元数据文件

但是我能够启动模板,现在它成功运行了。这可能与超额配额有关吗?我们刚刚增加了数据流的CPU和IP配额,我将并行运行作业从5个增加到15个,以便能够使用配额。当我在没有运行任何其他作业的情况下重新运行模板时,一切似乎都正常

非常感谢您的任何意见。谢谢

编辑:看起来作业失败是因为超出了CPU配额,但通常我们会得到一个错误描述,其中说“无法生成足够的工作人员”。尽管如此,在我降低了每项工作的最大工人数量后,一切都很顺利,这样就不能超过我们的配额

我认为“找不到此模板的元数据文件”应该被视为警告,而不是错误。模板可以有一个与之关联的“元数据”文件,该文件允许验证参数。如果不存在这样的文件,则不会验证参数,但其他一切都正常工作——消息只是这种情况的指示器

听起来问题在于工作由于其他原因无法完成。根据您的描述和编辑,这听起来像是因为缺少运行作业的配额