Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/sorting/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google cloud dataflow 由于数据流作业工作人员在启动时卡住,TFX管道停止工作_Google Cloud Dataflow_Apache Beam_Tfx_Google Cloud Ai Platform Pipelines - Fatal编程技术网

Google cloud dataflow 由于数据流作业工作人员在启动时卡住,TFX管道停止工作

Google cloud dataflow 由于数据流作业工作人员在启动时卡住,TFX管道停止工作,google-cloud-dataflow,apache-beam,tfx,google-cloud-ai-platform-pipelines,Google Cloud Dataflow,Apache Beam,Tfx,Google Cloud Ai Platform Pipelines,我有一个TFX管道在GCP AI平台管道中运行(托管Kubeflow)。它正常运行了一段时间,但在BigQuery ExampleGen步骤中突然停止正常工作 BQ ExampleGen利用数据流从BQ读取数据并保存到TreRecords。数据流作业启动但没有执行任何操作-它在启动/准备工作人员期间被卡住 工作日志显示python依赖项是使用pip安装的。问题是,pip不断下载同一软件包的不同版本以解决依赖冲突,但它没有显示冲突是什么。 我已经在worker VM启动时连接到它,但它没有显示pi

我有一个TFX管道在GCP AI平台管道中运行(托管Kubeflow)。它正常运行了一段时间,但在BigQuery ExampleGen步骤中突然停止正常工作

BQ ExampleGen利用数据流从BQ读取数据并保存到TreRecords。数据流作业启动但没有执行任何操作-它在启动/准备工作人员期间被卡住

工作日志显示python依赖项是使用pip安装的。问题是,pip不断下载同一软件包的不同版本以解决依赖冲突,但它没有显示冲突是什么。 我已经在worker VM启动时连接到它,但它没有显示pip一直在运行并消耗100%的CPU—它没有完成,我等待了一个多小时才停止作业

TFX版本:0.26.3(与0.26.4并列,结果相同) Apache Beam SDL:2.28(使用2.29进行了尝试,结果相同)

我甚至尝试过在ApacheBeam docker映像(与Dataflow workers使用的映像相同)中进行TFX 0.26.3的pip安装,但在尝试安装时也遇到了问题

我曾尝试在Apache Beam docker映像中安装TFX 0.30.0,安装得很好,但我无法在AI平台管道中使用TFX 0.30,因为似乎只支持TFX 0.26


其他人是否也遇到过同样的问题并可能解决了该问题?

我通过将TFX容器版本设置为0.26.1,而不是默认情况下从TFX模板设置为0.26.3,最终解决了该问题