Spark sql查询与数据帧函数_Sql_Performance_Apache Spark_Dataframe_Apache Spark Sql

Spark sql查询与数据帧函数

sql performance apache-spark dataframe

Spark sql查询与数据帧函数,sql,performance,apache-spark,dataframe,apache-spark-sql,Sql,Performance,Apache Spark,Dataframe,Apache Spark Sql,使用Spark执行良好的性能。我想知道通过SQLContext使用sql查询是否好，或者通过数据帧函数（如df.select（））进行查询是否更好有什么想法吗？：）没有任何性能差异。这两种方法使用完全相同的执行引擎和内部数据结构。归根结底，一切都归结为个人喜好可以说，DataFrame查询更容易以编程方式构造，并提供最小的类型安全性普通SQL查询可以更简洁、更容易理解。它们也是可移植的，并且可以在没有任何修改的情况下使用每种支持的语言。使用HiveContext，这些还可用于公开某些功

使用Spark执行良好的性能。我想知道通过

SQLContext

使用sql查询是否好，或者通过数据帧函数（如

df.select（）

）进行查询是否更好

有什么想法吗？：）

没有任何性能差异。这两种方法使用完全相同的执行引擎和内部数据结构。归根结底，一切都归结为个人喜好

可以说，
```
DataFrame
```
查询更容易以编程方式构造，并提供最小的类型安全性
普通SQL查询可以更简洁、更容易理解。它们也是可移植的，并且可以在没有任何修改的情况下使用每种支持的语言。使用
```
HiveContext
```
，这些还可用于公开某些功能，这些功能可能以其他方式无法访问（例如，没有Spark包装器的UDF）

可以说，
```
DataFrame
```
查询更容易以编程方式构造，并提供最小的类型安全性
普通SQL查询可以更简洁、更容易理解。它们也是可移植的，并且可以在没有任何修改的情况下使用每种支持的语言。使用
```
HiveContext
```
，这些还可用于公开某些功能，这些功能可能以其他方式无法访问（例如，没有Spark包装器的UDF）