Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Database 生成TPCH-SF300和SF1000数据_Database_Apache Spark_Databricks_Data Generation_Tpc - Fatal编程技术网

Database 生成TPCH-SF300和SF1000数据

Database 生成TPCH-SF300和SF1000数据,database,apache-spark,databricks,data-generation,tpc,Database,Apache Spark,Databricks,Data Generation,Tpc,我试图在Databrick上生成SF300和SF1000 TPCH数据。然而,我的脚本已经运行了超过24小时了,我猜我做错了什么 我按照以下说明操作:。然后我使用他们存储库中的笔记本(tpcds_datagen.scala)生成数据。当然,我修改了参数,将TPC-DS更改为TPC-H。但是速度非常慢 有人能建议一个更快的方法来帮我吗?提前谢谢

我试图在Databrick上生成SF300和SF1000 TPCH数据。然而,我的脚本已经运行了超过24小时了,我猜我做错了什么

我按照以下说明操作:。然后我使用他们存储库中的笔记本(tpcds_datagen.scala)生成数据。当然,我修改了参数,将TPC-DS更改为TPC-H。但是速度非常慢

有人能建议一个更快的方法来帮我吗?提前谢谢