Azure data factory azure数据工厂依赖项
我的azure数据工厂中有两个活动 活动A1=sql数据库上的存储过程。输入=无,输出=DB(输出1)。存储的进程以输出数据集为目标 活动A2=一个azure复制活动(“类型”:“复制”),它将blob复制到同一个sql db。输入=blob,输出=DB(输出2) 我需要在A2之前运行活动A1,我无法让世界知道它们之间应该有什么依赖关系 我试图将A2标记为有两个输入—blob+DB(output1)。如果我这样做,复制活动不会抛出错误,但它不会将blob复制到db(我认为它会默默地使用db作为复制源,而不是blob作为复制源,并且不知何故什么也不做) 如果我删除A2上的DB输入(output1),它可以成功地将blob复制到DB,但我不再拥有A1需要在A2之前运行的依赖链Azure data factory azure数据工厂依赖项,azure-data-factory,Azure Data Factory,我的azure数据工厂中有两个活动 活动A1=sql数据库上的存储过程。输入=无,输出=DB(输出1)。存储的进程以输出数据集为目标 活动A2=一个azure复制活动(“类型”:“复制”),它将blob复制到同一个sql db。输入=blob,输出=DB(输出2) 我需要在A2之前运行活动A1,我无法让世界知道它们之间应该有什么依赖关系 我试图将A2标记为有两个输入—blob+DB(output1)。如果我这样做,复制活动不会抛出错误,但它不会将blob复制到db(我认为它会默默地使用db作为复
谢谢 我发现了这一点——我能够在A2上保留两个依赖项,但只需要确保两个输入的顺序。奇怪的看起来复制活动只作用于第一个输入-因此,当我将blob作为第一个输入移动时,它工作了!:)(早些时候,我将DB output1作为第一个输入,但它没有做任何事情)
是的,在ADFv1中,MSoft就是这样告诉我们的。好发现!
"activities": [
{
"type": "Copy",
"typeProperties": {
"source": {
"type": "BlobSource"
},
"sink": {
"type": "SqlSink",
"writeBatchSize": 0,
"writeBatchTimeout": "00:00:00"
}
},
"inputs": [
{
"name": "MyBlobInput"
},
{
"name": "MyDBOutput1"
}
],
"outputs": [
{
"name": "MyDBOutput2"
}
],
"policy": {
"timeout": "01:00:00",
"concurrency": 3,
"retry": 3
},
"scheduler": {
"frequency": "Day",
"interval": 1
},
"name": "AzureBlobtoSQL",
"description": "Copy Activity"
}
],