Scala 在DataRicks上使用df.bulkCopyToSqlDB时，1000万条记录的sql大容量插入永远不会完成_Scala_Apache Spark_Apache Spark Sql_Bulkinsert_Azure Databricks

Scala 在DataRicks上使用df.bulkCopyToSqlDB时，1000万条记录的sql大容量插入永远不会完成

scala apache-spark

Scala 在DataRicks上使用df.bulkCopyToSqlDB时，1000万条记录的sql大容量插入永远不会完成,scala,apache-spark,apache-spark-sql,bulkinsert,azure-databricks,Scala,Apache Spark,Apache Spark Sql,Bulkinsert,Azure Databricks,我正在读取1GB的CSV文件（记录数：1000万，列数：13），并试图将其转储到SQL server中。以下为下文的详细信息： CSV文件位置：azure blob存储代码：Spark+Scala 集群：数据块尺寸：用于读取文件并将其转储的代码： val df=spark.read.format（fileparser_-config（“fileFormat”）.as[String]）.option（header），fileparser_-config（“IsFirstRowHeader

我正在读取1GB的CSV文件（记录数：1000万，列数：13），并试图将其转储到SQL server中。以下为下文的详细信息：

CSV文件位置：azure blob存储
代码：Spark+Scala
集群：数据块尺寸：
用于读取文件并将其转储的代码：
val df=spark.read.format（fileparser_-config（“fileFormat”）.as[String]）.option（header），fileparser_-config（“IsFirstRowHeader”）.toString.load（fileparser_-config（“FileName”）.as[String]）。带列（“\u-ID”，单调递增\u-ID）
val bulkCopyConfig=Config（映射( “url”->connconconfig（“数据源”）。作为[字符串]， “databaseName”->connconConfig（“dbName”）.as[String]， “用户”->connConfig（“用户名”）.as[String]， “password”->connconconfig（“password”）.as[String]， “dbTable”->表名， “bulkCopyBatchSize”->“500000”， “bulkCopyTableLock”->“true”， “bulkCopyTimeout”->“600”））
println（s“${LocalDateTime.now（）}*************sql大容量插入开始*************”）
df.bulkCopyToSqlDB（bulkCopyConfig）
println（s“${LocalDateTime.now（）}*************sql大容量插入结束***********”）
问题:

集群陷入了困境，我的工作永远无法完成。有一次，当它运行的时间足够长时，它抛出了一个错误：

org.apache.spark.SparkException: Job aborted due to stage failure: Task 13 in stage 38.0 failed 4 times, most recent failure: Lost task 13.3 in stage 38.0 (TID 1532, 10.0.6.6, executor 4): com.microsoft.sqlserver.jdbc.SQLServerException: The connection is closed.\n\tat com.microsoft.sqlserver.jdbc.SQLServerException.makeFromDriverError(SQLServerException.java:227)\n\tat com.microsoft.sqlserver.jdbc.SQLServerConnection.checkClosed(SQLServerConnection.java:796)\n\tat com.microsoft.sqlserver.jdbc.SQLServ

群集事件日志：

其他意见：
虽然作业运行很长时间，但集群并不是完全没有响应。我尝试在同一窗口中提交更多的作业。作业运行了，但花费的时间比平时多（约为10倍）
我尝试增加工作节点和节点类型（甚至选择了128 GB节点），但结果仍然是一样的
作业运行时，我尝试使用nolock查询检查SQL表行数。当作业运行时，我在3-4分钟后运行了它，它在表中给了我大约200万条记录。但当我在10分钟后再次运行它时，查询一直在运行，并且从未返回任何记录
我尝试过调整bulkCopyBatchSize属性，但没有多大帮助
我尝试删除sqlinsertion代码，并对从1GB文件创建的数据帧使用聚合操作，整个过程只需40-50秒，因此问题只存在于sql驱动程序/sql server

Azure SQL Server

HDInsight

数据大小

“bulkCopyBatchSize”

“bulkCopyTableLock”

Azure SQL Server

HDInsight

数据大小

“bulkCopyBatchSize”

“bulkCopyTableLock”