Apache spark 筛选pyspark数据帧时出现问题，如果包含&燃气轮机&引用；或<&引用；_Apache Spark_Pyspark_Apache Spark Sql_Pyspark Dataframes - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 筛选pyspark数据帧时出现问题，如果包含&燃气轮机&引用；或<&引用；_Apache Spark_Pyspark_Apache Spark Sql_Pyspark Dataframes - Fatal编程技术网

Apache spark 筛选pyspark数据帧时出现问题，如果包含&燃气轮机&引用；或<&引用；

apache-spark pyspark

Apache spark 筛选pyspark数据帧时出现问题，如果包含&燃气轮机&引用；或<&引用；,apache-spark,pyspark,apache-spark-sql,pyspark-dataframes,Apache Spark,Pyspark,Apache Spark Sql,Pyspark Dataframes,我的数据框有value列，其中包含或这肯定是由value列中的空值造成的 df.count（）。但是当您在筛选器中使用contains时，将跳过空值示例： data = [("value1_>", ), ("value2_>", ), ("value3_<",), ("value4",), (None,)] df = spark.createDataFrame(data, ['value']) df1 = df.filter((col("value").contains(

我的数据框有

value

列，其中包含

或

这肯定是由value
列中的空值造成的
df.count（）。但是当您在筛选器中使用contains
时，将跳过空值
示例：
data = [("value1_>", ), ("value2_>", ), ("value3_<",), ("value4",), (None,)]
df = spark.createDataFrame(data, ['value']) 

df1 = df.filter((col("value").contains('>') | col("value").contains('<')))
df2 = df.filter(~(col("value").contains('>') | col("value").contains('<')))
print(df.count())
print(df1.count())
print(df2.count())

#5
#3
#1

数据=[（“值1>，），（“值2>，），（“值3_
3900000
202
3600000

df.count() = df1.count() + df2.count()

data = [("value1_>", ), ("value2_>", ), ("value3_<",), ("value4",), (None,)]
df = spark.createDataFrame(data, ['value']) 

df1 = df.filter((col("value").contains('>') | col("value").contains('<')))
df2 = df.filter(~(col("value").contains('>') | col("value").contains('<')))
print(df.count())
print(df1.count())
print(df2.count())

#5
#3
#1




[pyspark]相关文章推荐



                                                        
如何从PySpark中的spark.ml中提取模型超参数？
pyspark 
Pyspark # |2    |[2, 3]            |
# +-----+------------------+
pyspark 
pyspark-如何交叉验证多个ML算法
pyspark 
Pyspark中的AggregateByKey未提供预期输出
pyspark 
pyspark将数据流传输到卡夫卡主题
pysparkapache-kafka 
如何从不同列的PySpark数据帧中提取数组元素？
pyspark 
pyspark:将列转换为小写后出现withcolumn分析错误
pyspark 
Pyspark Pypark填充缺失/分组平均值错误
pyspark 
Pyspark 如何将数据帧的每一行写入/写入到不同的增量表中
pyspark 
Pyspark删除具有10个空值的列
pyspark 
如何透视pyspark流数据帧
pyspark 
异常（“storageLevel必须是pyspark.storageLevel”类型）
pyspark 
Pyspark google colab中的Py4JJavaError
Py4JJavaError回溯（最近一次调用）
在（）
1.
---->2 df=spark.read.parquet（“gs://tata_2/activityObf.parquet”）
3帧
/获
pysparkgoogle-colaboratory 
通过PySpark的查询执行错误-GC错误
pyspark 
基于条件映射pyspark数据帧列中字典中的值
pyspark 
如何使用pyspark将字符串格式的日期转换为日期
pyspark 
Pyspark-在读取Pyspark数据帧时，如何根据文件名中的regex模式过滤掉.gz文件
pyspark 
Pyspark mllib中梯度增强树中的类型错误
pyspark 
Pyspark 如何将Tableau/BI工具连接到Delta Lake？（不带数据块）
pysparkhivetableau-api 
将pyspark tfidf向量转换为数据帧
pysparknlp 
                                       





随机文章推荐



                                                        
Class “如何在对象Pascal中生成”；“接口类”；（或“接口的接口”类型
classinterfacedelphi 
Class 基于另一个类名添加具有异常的类
class 
Class OCaml中具有类似字段的记录
classtypesocaml 
Class 如何在MapReduce中使用sqoop生成的类？
classimportmapreduce 
Class Clojure：为现有java类实现Seqable
classinterfaceclojure 
Class 使用供应商类的Laravel4
classlaravellaravel-4 
Class PDO包装类，动态绑定？
classdynamic 
Class 为什么我的网站不能识别课程？
classhtmlfonts 
Class scala：如何定义具有显式类类型的对象
classscalaobject 
Class 什么是子类和超类？
class 
Class Gatling 2：如何更改scala类的目录位置
classscalacompilation 
Class Xcode 6-私有成员没有可见接口
class 
Class 尝试通过scikit learn中的示例权重平衡我的数据集
classscikit-learn 
Class 如何在两次之间创建_的作用域，并在实例上使用所述作用域？
classruby-on-rails-4methods 
Class 如何将一个类从main调用为一个类？并保留输出值？
class 
Class 创建typescript'；从另一个*.ts文件删除对象
classobjecttypescript 
Class 如何通过单独的类访问数字？
classactionscript-3 
Class 复数双精度实例
classhaskelltypes 
Class 如何将队列中的用户移动到另一个队列中，而不丢失Moodle中的信息？
classcontent-management-systemmoodle 
Class 科特林–；为什么必须在子类中传递参数值？
classkotlin


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Biztalk
Microservices
Jestjs
Jboss
Fluent Nhibernate
Ibm Mq
Requirejs
Charts
Stream
Silverlight 4.0
Apache Kafka
Ruby
Netsuite
Date
Redis
Protocol Buffers
Pascal
Cryptography
Java 8
Vector
Map
Keyboard
Macos
Stanford Nlp
Ftp
Stm32
Gcc
Lucene
Eclipse Plugin
Actions On Google
Polymer
Cmake
Reference
Socket.io
Blockchain
Yii2
Cassandra
Drupal
String
Ios4
Stripe Payments
Scikit Learn
Junit
Service
Opengl
Vbscript
Xcode
Certificate
Jquery Mobile
Windbg
Hash
If Statement
Apache Flex
Hyperlink
Silverstripe
Facebook Graph Api
Jasper Reports
Project Management
Firefox Addon
Spring Boot
Datatables
Sharepoint 2013
Floating Point
Automation
Sapui5
Couchdb
Ldap
Joomla
Sharepoint 2010
Webview
Encoding
Codeigniter
Ckeditor
Loops
Configuration
Activemq
Redirect
Twilio
For Loop
Collections
Google Plus
Discord.py
Sonarqube
Julia
Menu
Shell
Algorithm
Python Sphinx
Automated Tests
Big O
Knockout.js
Transactions
Iis
Regex
Entity Framework 4
Random
Python 2.7
Jpa
Browser
Path
Ipad
Clearcase
Breeze
Design Patterns
Highcharts
Windows Phone 8.1
Leaflet
Common Lisp
Zurb Foundation
Push Notification
Scheme
Actionscript
Tinymce
Swing
Calendar
Puppet
Flash
Kubernetes
Sip
Azure Service Fabric
Arduino
Multithreading
Grafana
Django
Ravendb
Racket
Wso2
Layout
Arm
Ant
Wicket
Nunit
Domain Driven Design
Asterisk
Delphi
Compression
Oop
Zend Framework2
Coding Style
Asp.net Web Api
Tsql
Jquery Plugins
Groovy
Editor
Azure
Interface
Uml
Com
Select
Javafx
Web Applications
Syntax
Identityserver4
Directx
Asp.net Mvc
Apache Storm
Appium
Angular Material
Bazel
Oracle10g
Ms Word
Applescript
Jenkins
Php
Material Ui
Iframe
Networking
Nosql
Terminal
Npm
Api
Llvm
Rust
Jwt
Sencha Touch 2
Apache Flink
Vim
Documentation
Airflow
Cocoa
Markdown
Instagram
Dynamic
Rx Java
Omnet++
Asp Classic
Outlook
Asp.net Core
Ansible
Mule
Twitter Bootstrap 3
Selenium Webdriver
Qml
Amazon Web Services
Meteor
Smtp
Microsoft Graph Api
Tree
Itext
Safari
Visual Studio 2012


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网