Regex 数据帧中带有子字符串和字符的Scala Spark筛选器行_Regex_Scala_Apache Spark_Dataframe_Filter - Fatal编程技术网

Regex 数据帧中带有子字符串和字符的Scala Spark筛选器行

regex scala apache-spark dataframe filter

Regex 数据帧中带有子字符串和字符的Scala Spark筛选器行,regex,scala,apache-spark,dataframe,filter,Regex,Scala,Apache Spark,Dataframe,Filter,我想过滤DF中的一些行，保留列以开头的行，并且不包含字符“#” 我可以用两个过滤器做我想做的事： .filter( _!= col("theCol").contains("#")) .filter( col("theCol").startsWith("startSubString")) 但我想知道是否不能在一个过滤器中实现更好的性能：比如： .filter（col（“theCol”）.rlike（“^（startSubString）。*^[^@]”）尽管此不起作用。我遗漏了什么？我一直在使

我想过滤
DF
中的一些行，保留列以开头的行，并且不包含字符“#” 我可以用两个过滤器做我想做的事： .filter( _!= col("theCol").contains("#")) .filter( col("theCol").startsWith("startSubString")) 但我想知道是否不能在一个过滤器中实现更好的性能：比如： .filter（col（“theCol”）.rlike（“^（startSubString）。*^[^@]”）尽管此不起作用。我遗漏了什么？我一直在使用substr（），但我不明白为什么starsWith（）也不起作用，但下面是我所做的 .filter( (!(col("theCol").contains("#"))) && (col("theCol").substr(1,4) === ("http"))) 您可以使用startsWith（） .filter( !col("theCol").contains("#") && col("theCol").startsWith("startSubString") ) 你可以随时使用| |.filter（！=col（“theCol”）.contains（#”）| | col（“theCol”）.startsWith（“http”）不起作用吗？我会保持原样，我认为它比一个巨大的逻辑表达式更可读。Spark的优化器将组合过滤器，所以我认为您不会获得性能

[scala]相关文章推荐

Scala中的方法何时需要返回类型？ scala methods

Scala 附加列表[数据库] scala

Scala电梯布线给了我什么？ scala

一切都是scala中的函数、表达式或对象吗？ scala

Scala 是否可以在收集期间打印值而不修改返回类型？ scala

Scala 在slick中使用自动递增模型ID的选项？ scala

Scala 在决定是否使用ApacheSpark时，应该考虑哪些因素？ scala apache-spark

如何使Scala依赖关系更小？ scala dependencies

Scala 可以用json4s将JSON数组解析成元组吗？ scala

Scala 使用其中一个来分析失败和成功 scala

Scala 如何在Spark中对GroupedData执行自定义操作？ scala apache-spark

Scala Spark:GenericMutableRow不能强制转换为java.lang.Byte和<；无>；这不是一个术语 scala apache-spark

Scala 我可以在这里测试哪些属性？ scala

Scala sum MADlib UDF Spark SQL scala apache-spark

理解scala中的闭包 scala

Scala 跳过生成'&书信电报；排除/>'；对于com.google#*。依赖项排除应同时具有'；组织'；和'；模块'；遵守Maven POM&x27；s scala sbt

Scala Spark：写信给master'；工人的日志 scala apache-spark

通过在Scala中将小数位数作为参数传递来格式化数字 scala formatting

用于将structtype转换为case类的scala宏 scala generics macros

Scala 在未成形的产品上扩展选项[u3;] scala generics

随机文章推荐

Maps 如何使用经纬度在世界地图上查找城市的像素坐标？ maps

Maps Windows Phone-连续跟踪和反转eCodeQuery maps windows-phone-8 windows-phone

Maps Openlayers：缩放时标记消失 maps openlayers

Maps 在那里我可以找到数据来测试我的CSP贴图着色解算器 maps artificial-intelligence

Maps 如何通过html url打开诺基亚地图应用程序 maps here-api

Maps 谷歌地图需要显示地址列表-设置输出速度慢和超过查询限制问题 maps

Maps 如何在windows phone 8.1地图控件中显示控件按钮 maps windows-phone-8.1

Maps 从地址获取地理坐标 maps leaflet

Maps 如何添加包含文本和图像的信息窗口？ maps

[regex]相关推荐

Regex Groovy正则匹配引号之间的所有内容
Regex Groovy

Regex XQuery正则表达式
Regex Rdf Sparql

Regex 当它不是'；不支持
Regex

Regex 用于JavaScript源代码的正则表达式
Regex

Regex 在bash中提取一段字符串？
Regex Bash

Regex 在Perl中从LaTeX代码中提取数字
Regex Perl

Regex 如何在Elisp自定义声明中消除字符串和正则表达式的歧义？
Regex Types

Regex Perl正则表达式来匹配文件中的字符串和数字
Regex Perl

Regex 我如何编写250或更多的正则表达式？
Regex

Regex 子域显示域访问的文件
Regex Apache .htaccess Mod Rewrite Redirect

Regex Perl单词取消元音：删除除第一个和最后一个元音以外的所有元音
Regex Perl

Regex 塞德·奥克·格雷普？查找准确的行号
Regex Bash Awk Sed Grep

Regex 我想删除'\'；在jmeter中使用正则表达式提取器从jmy URL中提取字符
Regex Url Jmeter

Regex 如何检索不遵循特定格式的所有表达式
Regex Visual Studio 2013

Regex 使用bash正则表达式在两个组之间选择字符串
Regex Bash

Regex 正则表达式查找第一个逗号后的文本
Regex

Regex 如何删除单行换行符？
Regex Notepad++

Regex 如果在字段中找到匹配项，awk将删除行
Regex Awk

Regex R中特殊字符的匹配
Regex R

Regex 如果分隔符中包含特定单词，则正则表达式匹配字符串
Regex

Regex SublimiteText在特定字符串之后替换文本文件中的重复字符串
Regex

Regex 选择MD代码块中的所有代码？
Regex

使用regexshell命令交换文件所有行中的字符串和数字顺序
Regex Shell Perl

Regex 用于捕获python中所有数学运算符的正则表达式，如>；=<；=及==
Regex Python 3.x

如何在Nifi Regexpr上提取组？
Regex Apache Nifi

Regex将部分文件名与多个扩展名相匹配
Regex

Regex 在两个html标记之间查找正则表达式选择干细胞治疗科Shair RestorationFace&；身体美学阴道复壮你的名字电话电子邮件请将此字段留空。
Regex

（regex，sed）如何在删除单词后附加已删除的单词
Regex Sed Replace

Regex 用于替换的正则表达式分组规则
Regex

Regex 正则表达式在一行中恰好两次匹配包含字符的单词问题
Regex

Tags

Image Processing Elm Excel Formula Keras Highcharts Mapping Ios4 Markdown Cordova Wcf Iphone Hybris Django Google Api Keycloak Codenameone Sass Ruby On Rails Performance Reactjs Openlayers Teradata Delphi Replace Combobox Ruby On Rails 3.1 Compiler Errors Amazon Redshift Java 8 Geolocation Automated Tests Aurelia Active Directory Adobe Android Emulator Amazon Ec2 Shiny Rest Pentaho Notepad++ Tabs Workflow Flutter Selenium Opencart Keyboard Sip Matrix Liferay Artifactory Node.js Vector Image Jquery Symfony1 Single Sign On Dojo Xsd Mvvm Xpages Java Makefile Asp.net Web Api Serial Port Postman Django Models Python 2.7 Opengl Excel Terraform Browser Virtualbox Ios Monitoring Plone String Erlang Cucumber Eclipse Plugin Dependency Injection Merge Aws Lambda Cmake Robotframework Ada Xcode4 Azure Ad B2c Dynamics Crm Activemq Fiware Devexpress Spring Batch EmptyTag Sbt Rxjs Drools Spring Cloud Video Streaming Asp.net Mvc Tcp Xna Apache Nifi Iis 7 Layout Geometry Facebook Apache Spark Import Cocos2d X Websocket Powershell Pip Cocoa Recursion Memory Leaks Date Winapi Uml Filter Neural Network Opencv Timer Webstorm Microsoft Graph Api Instagram Types Karate Validation Io Hyperledger Fabric Oracle10g Jboss Junit Octave Ansible Interface Tags Azure Sql Database Selenium Webdriver Math Tfs Sqlalchemy Oracle Vb.net Laravel 4 Racket Object Caching Mediawiki Rust Python 3.x Azure Cosmosdb Embedded Jquery Plugins Sublimetext2 Phantomjs Yii Typescript Time Streaming Jupyter Notebook Google App Maker Windows 7 Pycharm Vbscript Twitter Bootstrap Cobol Testng Express Mercurial Networking Vhdl Sms Ember.js Iis Orientdb Jdbc Odata Filesystems Unicode Redux Ssh Sap Sed Batch File Blackberry Canvas Utf 8 Deep Learning Tableau Api Mod Rewrite C++11 Doxygen Silverlight Jquery Mobile Ionic Framework Windows Installer Variables Input Coldfusion Windows

Copyright © 2024. All Rights Reserved by - Fatal编程技术网