Apache spark 如何掌握sparksql

Apache spark 如何掌握sparksql,apache-spark,apache-spark-sql,Apache Spark,Apache Spark Sql,我是一个激发sql的新手。我发现用复杂的逻辑编写spark查询程序可能非常棘手。例如,我知道spark sql库中的运算符非常有限,所以有时我们需要实现UDF。但是,您如何知道库操作员是否可以执行某些操作?我如何知道是否有必要实施UDF?我发现很多开发人员都能想出漂亮的Spark程序。你是如何掌握火花的?如何使用Spark SQL提高编程能力。我应该先掌握MYSQL吗?我是一个有软件开发背景的学生。我错过了什么?@Young。如果您要求特定于spark sql,那么我建议您改进sql。尝试复杂S

我是一个激发sql的新手。我发现用复杂的逻辑编写spark查询程序可能非常棘手。例如,我知道spark sql库中的运算符非常有限,所以有时我们需要实现UDF。但是,您如何知道库操作员是否可以执行某些操作?我如何知道是否有必要实施UDF?我发现很多开发人员都能想出漂亮的Spark程序。你是如何掌握火花的?如何使用Spark SQL提高编程能力。我应该先掌握MYSQL吗?我是一个有软件开发背景的学生。我错过了什么?

@Young。如果您要求特定于spark sql,那么我建议您改进sql。尝试复杂SQL,主题包括:分组依据、所有联接、窗口函数等。本教程很短

并介绍了SQL。我不认为MySql会很重要,因为它会很庞大,并且有自己的实现和不同的逻辑。对您来说,重要的是学习ANSI SQL。你们可以在线在虚拟环境中练习小提琴。 这里有一个:

然后,您需要练习不同的sql问题,对于这些问题,Hackerrank的sql练习已经足够了

之后,您应该转向Spark SQL并探索所有可用的函数


@Young。如果您要求特定于spark sql,那么我建议您改进sql。尝试复杂SQL,主题包括:分组依据、所有联接、窗口函数等。本教程很短

并介绍了SQL。我不认为MySql会很重要,因为它会很庞大,并且有自己的实现和不同的逻辑。对您来说,重要的是学习ANSI SQL。你们可以在线在虚拟环境中练习小提琴。 这里有一个:

然后,您需要练习不同的sql问题,对于这些问题,Hackerrank的sql练习已经足够了

之后,您应该转向Spark SQL并探索所有可用的函数


当我们说“浏览所有可用函数”时,这意味着我们需要浏览库中的所有API?您不必逐一练习。但最好的选择是,大多数答案都将使用这些API解决。因此,当我们说“探索所有可用函数”时,您至少应该阅读它们,这意味着我们需要浏览库中的所有API?您不必练习每一个API。但最好的选择是,大多数答案都将使用这些API解决。所以你至少应该读一读