如何在visual studio代码中设置本地环境以运行U-SQL,而不连接到Azure DataLake?
这是我的代码,用于消除空单元格和重复的函数行,同时保持产品列与函数列正确对齐。我只想保留第一次出现的函数并删除所有重复的函数。它编译得很好,但找不到输出。有人建议我只需点击输出的jobURL,但这对我来说并不合适。下面是一个示例文件,它是整个电子表格的一小部分,只包含2个相关列中的数据。完整的电子表格在所有列中都有数据 以下是我想要的结果: 如果要在本地运行/调试脚本,请查看此文档如何在visual studio代码中设置本地环境以运行U-SQL,而不连接到Azure DataLake?,azure,visual-studio-code,u-sql,Azure,Visual Studio Code,U Sql,这是我的代码,用于消除空单元格和重复的函数行,同时保持产品列与函数列正确对齐。我只想保留第一次出现的函数并删除所有重复的函数。它编译得很好,但找不到输出。有人建议我只需点击输出的jobURL,但这对我来说并不合适。下面是一个示例文件,它是整个电子表格的一小部分,只包含2个相关列中的数据。完整的电子表格在所有列中都有数据 以下是我想要的结果: 如果要在本地运行/调试脚本,请查看此文档 @input = EXTRACT CompanyID str
@input =
EXTRACT
CompanyID string,
division string,
store_location string,
International_Id string,
Function string,
office_location string,
address string,
Product string,
Revenue string,
sales_goal string,
Manager string,
Country string
FROM "/input/input142.csv"
USING Extractors.Csv(skipFirstNRows : 1 );
// Remove empty columns
@working =
SELECT *
FROM @input
WHERE Function.Length > 0;
// Rank the columns by Function and keep only the first one
@working =
SELECT CompanyID,
division,
store_location,
International_Id,
Function,
office_location,
address,
Product,
Revenue,
sales_goal,
Manager,
Country
FROM
(
SELECT *,
ROW_NUMBER() OVER(PARTITION BY Function ORDER BY Product)
AS rn
FROM @working
) AS x
WHERE rn == 1;
@output = SELECT * FROM @working;
OUTPUT @output TO "/output/output.csv"
USING Outputters.Csv(quoting:false);