Scala Spark SQL筛选多个字段_Scala_Apache Spark_Apache Spark Sql - Fatal编程技术网

Scala Spark SQL筛选多个字段

scala apache-spark

Scala Spark SQL筛选多个字段,scala,apache-spark,apache-spark-sql,Scala,Apache Spark,Apache Spark Sql,Scala API中过滤多列的正确语法是什么？如果我想做这样的事情： dataFrame.filter($"col01" === "something" && $"col02" === "something else") 或编辑：这就是我的原始代码的样子。一切都是一串串的 df.select($"userID" as "user", $"itemID" as "item", $"quantity" cast("int"), $"price" cast("float"), $

Scala API中过滤多列的正确语法是什么？如果我想做这样的事情：

dataFrame.filter($"col01" === "something" && $"col02" === "something else")

或

编辑：

这就是我的原始代码的样子。一切都是一串串的

df.select($"userID" as "user", $"itemID" as "item", $"quantity" cast("int"), $"price" cast("float"), $"discount" cast ("float"), sqlf.substring($"datetime", 0, 10) as "date", $"group")
  .filter($"item" !== "" && $"group" !== "-1")

我想我明白问题所在了。由于某些原因，spark不允许两个！='在同一个过滤器中的。需要了解Spark源代码中如何定义过滤器
现在，为了让代码正常工作，您可以使用它来进行筛选

df.filter(col("item").notEqual("") && col("group").notEqual("-1"))
或者在同一语句中使用两个筛选器

df.filter($"item" !== "").filter($"group" !== "-1").select(....)

此链接有助于使用不同的spark方法。
看起来不错。您是否遇到任何问题？如果它不起作用，您可能只是缺少导入sqlContext.implicits.\u，其中
sqlContext
是
sqlContext
或
HiveContext
的一个实例。我得到的是“value&&不是字符串的成员”。解决方法是将每条语句都用括号括起来。@gstvolvr以上两个过滤器都适用于我。为了进一步调试，如果您可以发布一些以前的代码或示例数据，这将有所帮助。@dheee我发布了一个编辑。如果有帮助，请告诉我。嗨@dheee？你知道这两个选项的性能是否相同吗？@servatj我没有看到我这方面的性能有任何差异。！==类内列已弃用，并且！==不具有与==相同的优先级。所以我建议使用=！=相反，@user3252097您可以在这里发布您的查询吗。
df.filter($"item" !== "").filter($"group" !== "-1").select(....)

[apache spark]相关文章推荐

Apache spark 开发spark流应用程序 apache-spark

Apache spark 在Spark中禁用拼花地板元数据摘要 apache-spark

Apache spark 在关闭合并模式的情况下，dataframe如何拾取拼花地板的模式？如何确定应该从哪个文件夹模式中选择？ apache-spark

Apache spark pyspark createDataFrame没有一致的输出，强制无效类型的值变为无 apache-spark pyspark

Apache spark Spark-按键对数据流进行排序，并限制为5个值 apache-spark pyspark

Apache spark 加载拼花地板时不支持Spark异常复杂类型 apache-spark

Apache spark 如何在启用检查点的情况下连接dstream和JDBCRDD？ apache-spark

Apache spark Spark-为映射中的灵活键指定架构 apache-spark pyspark

Apache spark 如何在SparkSQL中模拟ZEROIFNULL的功能 apache-spark pyspark

Apache spark SparkSQL-在join和groupBy之后获得了重复的行 apache-spark

Apache spark 火花交叉口的实现 apache-spark pyspark

Apache spark 连接到beeline的SparkSQL Thriftserver上具有聚合函数的Where子句 apache-spark hive

Apache spark 如何向PySpark数据帧添加标题？ apache-spark pyspark

Apache spark 如何在Mac上使用自制软件安装apache spark 2.3.3 apache-spark

Apache spark 齐柏林飞艇：spark.app.name中的#{user}变量未在纱线簇模式下工作 apache-spark

Apache spark 如何从spark中的字符串加载数据集 apache-spark

Apache spark SparkConf作为Kubernetes配置映射 apache-spark kubernetes

Apache spark RDD警告：内存中没有足够的空间缓存RDD apache-spark pyspark

Apache spark 如何将pyspark dataframe作为参数（多个映射参数）传递给自定义映射函数 apache-spark pyspark

Apache spark Dataframe联接返回pyspark的空结果 apache-spark pyspark

随机文章推荐

Sugarcrm Sugar CRM中的模块访问-soap和web之间的差异（非管理员）？ sugarcrm

SugarCRM，是否可以为用户提供某些字段的编辑选项 sugarcrm

Sugarcrm 在Sugar CRM中添加高级开放销售模块 sugarcrm

SugarCRM-正确显示Dashlet中的条目总数 sugarcrm

sugarCRM迁移潜在客户模块 sugarcrm

在SugarCRM社区版中上载图像 sugarcrm

[scala]相关推荐

Scala kafka Producer上的“ClassCastException:kafka.message.message无法强制转换为java.lang.String”
Scala Apache Kafka

Scala 这个类从哪个类扩展？
Scala

Scala 带有阻塞调用的默认executioncontext
Scala

Scala 在case类中使用json4s序列化Nones
Scala

Scala 在\/.fromTryCatch内抛出Throwable，并正确对齐方法类型
Scala

播放Scala-groupBy删除重复值
Scala Playframework

Scala极限函数参数可能的类型
Scala Types

Scala 单个ActorSystem内的ConfigFactor.load更改导致读取不同的application.config
Scala Dependencies Sbt Akka

Scala 规范正确的术语SimpleType[Type][Type]有什么用途？
Scala

scala计算树中的节点数
Scala Tree

Scala 如何将映射（元组->列表）转换为（元组，列表）
Scala Functional Programming

Scala，部分函数参数和隐式参数
Scala

Scala 如何在RDD的每一行上应用“Sum（vi*ln（vi）”“org.apache.spark.RDD.RDD[（Long，org.apache.spark.mllib.linalg.Vector）]”
Scala Apache Spark

Scala 斯卡拉的懒惰中的福德里特
Scala Functional Programming

无法在Play 2.5（Scala）中传输简单字符串
Scala Playframework Streaming Akka

在scala中按字节码名称查找方法
Scala Reflection

Scala 为什么ArrayBuilder基类不提供方法接口？
Scala

Scala 从akka http提取HttpServletRequest
Scala Servlets

Scala 使用Akka参与者进行流量切分
Scala Akka

Scala 构造函数中的隐式参数与方法签名
Scala

在Scala中添加不可变集合时，幕后会发生什么？
Scala

Scala 为KafkaProducer执行spark提交时发生NoClassDefFoundError
Scala

Scala 如何使用“flatMap”实现延迟计算的成本估算？
Scala

Scala 如何在映射中查找重复值
Scala Dictionary

Scala Spark jdbc读取性能调优，无主键列
Scala Apache Spark

Scala spark，输入数据帧，返回所有值都等于1的列
Scala Dataframe Apache Spark Filter

在Scala中将Spark SQL函数名作为参数传递
Scala Apache Spark

Scala 如何将泛型方法转换为泛型函数问题
Scala Generics

scala使用重载方法扩展类
Scala

在特定示例中，在scala中如何使用return？
Scala

Tags

Windows 10 For Loop Charts Random Asynchronous .net Core Maven 2 Dataframe Hazelcast Sublimetext3 Web Applications Macros Sugarcrm Cobol Binary Logic Zend Framework2 Clojure Influxdb Compiler Construction Robotframework Google Plus Sas Uml Linq Opencart Windows Numpy Firefox Addon Postman Npm Drupal Intellij Idea Aws Lambda Google Bigquery Ide Cloud Foundry Transactions Youtube Api Machine Learning Sap Tsql Next.js Function Matlab Dll Sql Server 2012 Ldap Playframework Magento Iis Forms Common Lisp Vba Postgresql Report Floating Point Responsive Design Sails.js Image Processing Quickbooks Asp.net Core Sqlalchemy Object Drop Down Menu Primefaces Bazel Com Sip Linker Zend Framework Cypress Cuda Windows Mobile Exception Handling Outlook Wix Twitter Bootstrap Command Line Stanford Nlp Xampp Permissions Vue.js Rdf Oauth 2.0 Less Coldfusion Windows Store Apps Air Python 2.7 Express Telegram Excel Cron Bison Discord.js Bots Scroll Javafx 2 Hibernate Entity Framework 4 Dns Python Protocol Buffers Sass Keras Sdk Web Silverlight 4.0 Audio Automated Tests .htaccess Iis 7 Xsd Swing Objective C Sharepoint String Google Apps Script Push Notification Time Dependencies Gmail Sharepoint 2007 Graphviz Ms Word Plsql Rest Ios Visual Studio 2017 Ethereum Spring Batch Bootstrap 4 Curl Google Colaboratory Extjs4 Twilio Programming Languages Azure Service Fabric Kendo Ui Kdb Asterisk Netbeans Go Sitecore Url Http Python Sphinx Mapreduce Video Chart.js Ansible Statistics Cluster Computing Here Api Arangodb Webstorm Ssl Terminal Combobox Ios5 Sbt Facebook Graph Api Osgi Django Models C# 4.0 Material Ui Model View Controller Apache Storm Autohotkey Documentation Netlogo Identityserver4 Gps Download Codeigniter Jqgrid Google Analytics Model Stored Procedures Soap Asp Classic Pdf Jersey Xna Smalltalk Algorithm Ip Coq Editor Encryption Tableau Api Computer Science Polymer Character Encoding Linux Kernel Printing Error Handling Xamarin.ios Optimization Bash

Copyright © 2024. All Rights Reserved by - Fatal编程技术网