scala中数据帧连接中字符串函数的使用_Scala_Apache Spark_Apache Spark Sql - Fatal编程技术网

scala中数据帧连接中字符串函数的使用

scala apache-spark

scala中数据帧连接中字符串函数的使用,scala,apache-spark,apache-spark-sql,Scala,Apache Spark,Apache Spark Sql,我正在尝试连接两个数据帧，条件类似于“Hello World”中的“Wo”，即（dataframe1 col包含dataframe2 col1值）在HQL中，我们可以使用instr（t1.col1，t2.col1）>0 如何在Scala的Dataframe中实现相同的条件？我试过了 df1.join(df2,df1("col1").indexOfSlice(df2("col1")) > 0) 但它给了我下面的错误错误：值indexOfSlice不是的成员 org.apache.spa

我正在尝试连接两个

数据帧

，条件类似于“Hello World”中的“Wo”，即（dataframe1 col包含dataframe2 col1值）

在HQL中，我们可以使用

instr（t1.col1，t2.col1）>0

如何在Scala的Dataframe中实现相同的条件？我试过了

df1.join(df2,df1("col1").indexOfSlice(df2("col1")) > 0)

但它给了我下面的错误

错误：值indexOfSlice不是的成员 org.apache.spark.sql.Column

我只想使用DataFrames实现下面的hql查询

select t1.*,t2.col1 from t1,t2 where instr(t1.col1,t2.col1)>0

使用spark 2.2测试以下溶液。您需要定义一个

UDF

，并且您可以指定一个连接条件作为

的一部分，其中过滤器：
val indexOfSlice_ = (c1: String, c2: String) => c1.indexOfSlice(c2)
val islice = udf(indexOfSlice_)

val df10: DataFrame = Seq(("Hello World", 2), ("Foo", 3)).toDF("c1", "c2")
val df20: DataFrame = Seq(("Wo", 2), ("Bar", 3)).toDF("c3", "c4")

df10.crossJoin(df20).where(islice(df10.col("c1"), df20.col("c3")) > 0).show
// +-----------+---+---+---+
// |         c1| c2| c3| c4|
// +-----------+---+---+---+
// |Hello World|  2| Wo|  2|
// +-----------+---+---+---+

PS:当心！使用交叉联接是一个昂贵的操作，因为它会产生笛卡尔联接
 <强>编辑：当您想使用此解决方案时考虑阅读。
首先，这是一个特定于SARK的问题，它应该被标记为。其次，你在做什么还不是很清楚。您是否确实在尝试使用条件执行交叉联接？你不介意展示一个MVCE，这样我们就可以试着帮助你了吗？错误是显而易见的thought@eliasah是的，我正在尝试交叉连接。我将在问题中添加sql示例。。。




[apache spark]相关文章推荐



                                                        
Apache spark 如何控制使用的线程/核心数？
apache-spark 
Apache spark Spark SQL RDD在pyspark中加载，但不在Spark submit中加载："；JDBCRDD：闭合连接“；
apache-sparkjdbcpyspark 
Apache spark 我想测量Spark'；数据帧聚合的性能。计数还是收集行动？
apache-spark 
Apache spark 如何将sql_context.registerDataFrameAsTable从spark 1.x迁移到spark 2.x
apache-sparkpyspark 
Apache spark 如何在启用X-Pack的情况下设置Elasticsearch结构化流媒体？
apache-spark 
Apache spark 升级hive metastore后，Apache spark 2.2.0无法连接到metastore
apache-sparkhive 
Apache spark Rdd持久性如何支持容错
apache-sparkpyspark 
Apache spark 使用两个作业spark在同一个repositor内的HDFS中同时写入
apache-spark 
Apache spark PySpark SQL:用作表达式的子查询返回多行：
apache-sparkpyspark 
Apache spark 在pyspark上运行python库的速度快吗
apache-sparkdataframepyspark 
Apache spark 从Spark看savastable
apache-sparkhivepyspark 
Apache spark 在侧视图上连接分解Spark1与Spark2
apache-sparkhadoop 
Apache spark 初始作业未接受AWS EMR中的任何资源
apache-spark 
Apache spark 如何使用Spark Streaming更新拼花地板文件？
apache-spark 
Apache spark 聚合后如何包含非聚合列？
apache-spark 
Apache spark 将spark数据帧写入Azure Sql Server会导致间歇性重复记录
apache-sparkpyspark 
Apache spark 如何通过apache spark java代码从kafka消费者获取消息？
apache-spark 
Apache spark 从pyspark将预测保存到HDFS在纱线（群集或客户端）上非常慢
apache-sparkpyspark 
Apache spark SODAAPI的错误消息中缺少什么？
apache-sparkpyspark 
Apache spark 为什么flume无法使用启动脚本运行？
apache-spark 
                                       





随机文章推荐



                                                        
Objective c 在发送发布消息之前检查是否为非零是否是良好做法？
objective-c 
Objective c 将NSInteger变量传递给NSMutableDictionary或NSMutableArray
objective-ciphone 
Objective c 目标C：HighScoreManager，为什么'；这不管用吗？
objective-c 
Objective c 选项卡栏应用程序问题
objective-cios 
Objective c 显示和取消模式视图控制器时出现问题
objective-copengl-es 
Objective-C新手问题：全球实例
objective-ccocoa 
Objective c 如何为同一表格中的不同单元格集设置不同的UITableViewCellStyle？
objective-ciosuitableview 
Objective c 目标-utf-8中的C、NSC字典编码
objective-cencodingutf-8 
Objective c ObjC中最快的：IsEqualToString:@"&引用；或长度>；0?
objective-cios 
Objective c 如何使用coredata导入视频？
objective-ciosxcode 
Objective c KVC-过滤器集
objective-ccore-data 
Objective-C解析问题扩展标识符
objective-c 
Objective c 将NSString转换为NSData是否强制使用尾随字节？
objective-ccocoa 
Objective c 用于删除块级标记之前出现的XHTML换行符的正则表达式
objective-cregex 
Objective c 我想使图像的某些区域透明。图像设置为UIButton的背景
objective-cios6 
Objective c 在两个字符串中查找匹配的单词序列
objective-cstringcocos2d-iphone 
Objective c iOS中带有自定义单元格的可扩展和可折叠的tableview
objective-cuitableviewios7 
Objective c 在UILabel中设置自定义单词边界
objective-c 
Objective c 隐藏控制youtube API it'；这很难
objective-cvideoyoutubeyoutube-api 
Objective c 如何在sqlite中重命名列名在objective c中不起作用
objective-csqlite


                                        

                                        
                                        


                                                
                                                        [scala]相关推荐
                                                        
Scala 从sbt以开发模式运行lift webapp时，我需要在哪个文件中为jetty端口添加覆盖？
									Scala
							 
简单scala宏
									Scala
							 
Scala 未调用apply方法
									Scala
							 
Scala 对于Play框架中的循环，如何获取对象的名称
									Scala
							 									Playframework
							 
Scala 省略抽象方法中的返回类型，但不在抽象字段中
									Scala
							 
如何基于用户输入创建scala类？
									Scala
							 
Scala 模式匹配类型不匹配错误
									Scala
							 
Scala 如何使用reduce或fold加密字符串令牌列表？
									Scala
							 
处理未来理解Scala
									Scala
							 									Akka
							 
Scala Typesafe激活器在运行类时指定参数
									Scala
							 									Akka
							 
Scala 如何将元素附加到HList
									Scala
							 
Scala 如何从HCatalog中的顶点和边表创建顶点和边RDD以在GraphX中使用
									Scala
							 									Apache Spark
							 
Scala 如何使用Play 2和Akka登录标准输出和文件
									Scala
							 									Logging
							 									Intellij Idea
							 									Playframework
							 									Akka
							 
用Mockito模拟Scala-void函数
									Scala
							 
Scala Apache Spark SQL标识符应为异常
									Scala
							 									Sqlite
							 									Apache Spark
							 
Scala 使用Writer monad验证XML元素序列
									Scala
							 									Validation
							 
Scala Spark SQL：如何将新行追加到dataframe表（来自另一个表）
									Scala
							 									Apache Spark
							 
Scala：筛选列表中的多个元素
									Scala
							 									Filter
							 									Functional Programming
							 
在scala中读取和处理文件
									Scala
							 
Scala gatlingsbt执行特定的模拟
									Scala
							 
Scala 如何将数据帧的所有列（具有嵌套的StructTypes）强制转换为Spark中的字符串
									Scala
							 									Apache Spark
							 
Scala 在Sangria、GraphQL实现中将多个延迟值合并到一个新的延迟类型中
									Scala
							 									Graphql
							 
scala json解析并获取嵌套的键和值
									Scala
							 
避免两次指定模式（Spark/scala）
									Scala
							 									Apache Spark
							 
Scala 如何禁用打印外部代码输出的日志消息？
									Scala
							 									Logging
							 
Scala 无法制作简单的无标记最终示例
									Scala
							 									Functional Programming
							 
Scala 更新元组列表
									Scala
							 									Lambda
							 									Collections
							 									Functional Programming
							 
Scala 具有错误累积的异步处理的函数签名
									Scala
							 									Concurrency
							 
Scala 具有Akka类型参与者和群集分片的优先级邮箱
									Scala
							 									Akka
							 
Scala 如何在JVM关闭时允许/等待Akka流完成？
									Scala
							 									Akka
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Flask
Azure Sql Database
Jpa
Drools
For Loop
Sockets
Notepad++
Telerik
Matrix
Imagemagick
Iphone
Laravel 5
Geolocation
Docker Compose
Blazor
Eclipse Rcp
System Verilog
Discord.js
Clojure
Opencart
Docusignapi
Alfresco
Iframe
Terminal
Webview
Parse Platform
Gridview
Rx Java
Django Models
Content Management System
Coldfusion
E Commerce
Android Fragments
Netsuite
Hive
Rss
Jsf
Python 2.7
Io
Internet Explorer 8
Marklogic
Vb6
Xampp
C
Hibernate
Axapta
Pagination
Playframework 2.0
Grails
Ruby On Rails 3.2
Google Plus
Sharepoint
Passwords
Loops
Mobile
Cmd
Objective C
Exception
Mule
Smalltalk
Mono
Tags
Embedded
Ios5
Asp.net
Fortran
Eclipse
Webpack
Timer
Google Cloud Platform
Apache Zookeeper
Xml
Ember.js
Windows 7
Macos
Dart
C++11
Yocto
Julia
Oracle11g
Influxdb
Netlogo
Model View Controller
Pandas
Azure Cosmosdb
Random
Verilog
Ssh
Filter
Nhibernate
Firefox
Amazon S3
Windows Installer
Ms Access
Sublimetext2
Vim
Z3
Ubuntu
Excel
Jms
Cassandra
Memory Management
Loopbackjs
Jdbc
Google Colaboratory
Nest
Autocomplete
Ag Grid
Couchdb
Intellij Idea
Windows Store Apps
Core Data
3d
Concurrency
Mysql
Redis
Isabelle
Wxpython
Rspec
Here Api
Artifactory
Swift3
Sed
Windows Phone
Colors
Configuration
Protractor
Wso2
Yaml
Gcc
Character Encoding
Internationalization
Pytorch
Sprite Kit
Ffmpeg
Search
Twitter Bootstrap 3
Silverlight
Linq
Scheme
Maven
Amazon Redshift
Twig
Sml
Safari
Netbeans
Wordpress
Requirejs
Javascript
Url
Select
Sql Server
Tinymce
Odoo
Linkedin
Talend
Ms Office
Sqlalchemy
Svn
Ios6
X86
Sdk
Spring Cloud
Outlook
Google Api
Air
.net 4.0
Qt4
Visual Studio 2015
Apache2
Telegram
Openid
Post
Ms Word
Python 3.x
Gwt
Llvm
Path
Ruby On Rails 4
Snmp
Variables
Jsp
Actionscript 3
Xpath
Sequelize.js
Error Handling
Pascal
Webstorm
Bluetooth
Xmpp
Apache Camel
Google Apps Script
Adobe
Arm
Visual Studio 2012
Inheritance
Moodle
Pdf
Scripting
Actions On Google
Nestjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网