Apache spark pySpark.sql如何使用WHERE关键字?

Apache spark pySpark.sql如何使用WHERE关键字?,apache-spark,pyspark,pyspark-sql,Apache Spark,Pyspark,Pyspark Sql,如何使用WHERE关键字获得在泰坦尼克号灾难中幸存下来的性别及其百分比 我的代码: spark.sql 选择存活性别=1,countSex\ 作为性别统计,countsex*100/sumcountsex超过\ 按性别划分的泰坦尼克号餐桌组的百分比 显示 错误: 语法异常: 输入不匹配,第1行,位置28 ==SQL== 选择存活性别=1,countSex 作为性别统计,countsex*100/sumcountsex超过 按性别划分的泰坦尼克号餐桌组的百分比 --------------^^^

如何使用WHERE关键字获得在泰坦尼克号灾难中幸存下来的性别及其百分比

我的代码:

spark.sql 选择存活性别=1,countSex\ 作为性别统计,countsex*100/sumcountsex超过\ 按性别划分的泰坦尼克号餐桌组的百分比 显示 错误:

语法异常: 输入不匹配,第1行,位置28 ==SQL== 选择存活性别=1,countSex 作为性别统计,countsex*100/sumcountsex超过 按性别划分的泰坦尼克号餐桌组的百分比 --------------^^^ 你应该把它放在小组的后面和前面

您的代码应该是:

spark.sqlSELECT Sex,countSex作为gender\u count\ 100*countsex/sumcountsex超过百分比\ 从泰坦尼克号的桌子上\ 其中生存=1\ 按性别分组
您的语法不正确。不能像那样在SELECT表达式中使用WHERE。它必须在来自的消息之后出现。在这种情况下,您似乎还需要使用GROUP BY。我可以知道语法是什么样的吗?通常需要选择表单,您的问题包括一个小的、独立的、具有所需输出的表单。