Apache spark pySpark.sql如何使用WHERE关键字？_Apache Spark_Pyspark_Pyspark Sql

Apache spark pySpark.sql如何使用WHERE关键字？

apache-spark pyspark

Apache spark pySpark.sql如何使用WHERE关键字？,apache-spark,pyspark,pyspark-sql,Apache Spark,Pyspark,Pyspark Sql,如何使用WHERE关键字获得在泰坦尼克号灾难中幸存下来的性别及其百分比我的代码： spark.sql 选择存活性别=1，countSex\ 作为性别统计，countsex*100/sumcountsex超过\ 按性别划分的泰坦尼克号餐桌组的百分比显示错误：语法异常：输入不匹配，第1行，位置28 ==SQL== 选择存活性别=1，countSex 作为性别统计，countsex*100/sumcountsex超过按性别划分的泰坦尼克号餐桌组的百分比 --------------^^^

如何使用WHERE关键字获得在泰坦尼克号灾难中幸存下来的性别及其百分比

我的代码：

spark.sql 选择存活性别=1，countSex\ 作为性别统计，countsex*100/sumcountsex超过\ 按性别划分的泰坦尼克号餐桌组的百分比显示错误：

语法异常：输入不匹配，第1行，位置28 ==SQL== 选择存活性别=1，countSex 作为性别统计，countsex*100/sumcountsex超过按性别划分的泰坦尼克号餐桌组的百分比 --------------^^^ 你应该把它放在小组的后面和前面

您的代码应该是：

spark.sqlSELECT Sex，countSex作为gender\u count\ 100*countsex/sumcountsex超过百分比\ 从泰坦尼克号的桌子上\ 其中生存=1\ 按性别分组

您的语法不正确。不能像那样在SELECT表达式中使用WHERE。它必须在来自的消息之后出现。在这种情况下，您似乎还需要使用GROUP BY。我可以知道语法是什么样的吗？通常需要选择表单，您的问题包括一个小的、独立的、具有所需输出的表单。