Azure机器学习管道中的错误操作
我有一个定期运行的已发布和计划的管道。有时,管道可能会失败(例如,如果数据存储因维护而脱机)。如果管道因任何原因失败,是否有方法指定计划管道以执行特定操作?操作可能是向我发送电子邮件,几小时后再次尝试运行,或调用webhook。现在,我必须定期手动检查生产线的状态,这显然是次优的。当然,我可以指示管道中的每个脚本在由于任何原因失败时执行某些操作,但是在管道计划(或管道本身)中全局指定它会更干净、更容易 可能的次优解决方案可以是:Azure机器学习管道中的错误操作,azure,azure-machine-learning-studio,azure-machine-learning-service,Azure,Azure Machine Learning Studio,Azure Machine Learning Service,我有一个定期运行的已发布和计划的管道。有时,管道可能会失败(例如,如果数据存储因维护而脱机)。如果管道因任何原因失败,是否有方法指定计划管道以执行特定操作?操作可能是向我发送电子邮件,几小时后再次尝试运行,或调用webhook。现在,我必须定期手动检查生产线的状态,这显然是次优的。当然,我可以指示管道中的每个脚本在由于任何原因失败时执行某些操作,但是在管道计划(或管道本身)中全局指定它会更干净、更容易 可能的次优解决方案可以是: 设置Azure逻辑应用程序以调用管道 设置cron作业或Azur
- 设置Azure逻辑应用程序以调用管道
- 设置cron作业或Azure计划程序
- 按照触发管道、监视输出并在遇到错误时执行相关操作的计划设置第二个Azure机器学习管道
以上所有的解决方案都很复杂,而且不是很干净-肯定存在一个简单、干净的解决方案来解决这个问题吗?这个解决方案从您的管道日志中读取,让您在Logic App功能范围内做些事情,当计划管道失败时,我用它向团队发送电子邮件 步骤:
- 订阅“运行状态已更改”事件,以便在管道失败时获取日志
- 使用“高级过滤器”部分指定要监视的管道(将“处理UAT”更改为特定的ml实验),如下所示:
可以使用逻辑应用程序-有关详细指南,请参阅