Python Pyspark：字符串列上的多个筛选器_Python_Pandas_Pyspark_Apache Spark Sql_Pyspark Sql - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/307.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Pyspark：字符串列上的多个筛选器_Python_Pandas_Pyspark_Apache Spark Sql_Pyspark Sql - Fatal编程技术网

Python Pyspark：字符串列上的多个筛选器

python pandas pyspark

Python Pyspark：字符串列上的多个筛选器,python,pandas,pyspark,apache-spark-sql,pyspark-sql,Python,Pandas,Pyspark,Apache Spark Sql,Pyspark Sql,假设下表是pyspark dataframe，我想对多个值的列ind应用过滤器。如何在pyspark中执行此操作 ind group people value John 1 5 100 Ram 1 2 2 John 1 10 80 Tom 2 20 40 Tom 1 7 10 Anil 2 23 30 我试着跟随，但没有成功 filter = ['John'

假设下表是pyspark dataframe，我想对多个值的列ind应用过滤器。如何在pyspark中执行此操作

ind group people value 
John  1    5    100   
Ram   1    2    2       
John  1    10   80    
Tom   2    20   40    
Tom   1    7    10    
Anil  2    23   30

我试着跟随，但没有成功

filter = ['John', 'Ram']
filtered_df = df.filter("ind == filter ")
filtered_df.show()

如何在spark中实现这一点？

您可以使用：

filter = ['John', 'Ram']
filtered_df = df.filter("ind in ('John', 'Ram') ")
filtered_df.show()

或

如果您想在列表中包含过滤器。还请注意，我们使用单等号

而不是双等号

来测试pyspark中的相等性（如SQL中）

这与您想要的正好相反：-因此您知道需要在函数/运算符中使用

。此处：可能重复
filter = ['John', 'Ram']
processed_for_pyspark = ', '.join(['\'' + s + '\'' for s in filter])
filtered_df = df.filter("ind in ({}) ".format(processed_for_puspark))
filtered_df.show()




[pandas]相关文章推荐



                                                        
Pandas 重采样后缺少第一行
pandas 
Pandas 无法调用新列上的值\u计数
pandasdataframe 
Pandas 使用列值作为计数生成Seaborn Countplot
pandas 
Pandas 熊猫计数值列表的唯一值
pandasdataframe 
Pandas 如何将一个csv文件的两个字段与另一个csv文件的一个字段合并？
pandas 
Pandas 作为熊猫第一个多重索引的持续数字
pandasindexing 
Pandas 如何将对应的行值合并成熊猫中的列名？
pandas 
Pandas 连接有多行分配给表键的数据集-如何防止数量重复？
pandasjoin 
Pandas 加载CSV文件后，DataFrame有一些错误的列
pandas 
Pandas 如何通过更快地滚动统计数据来使用分组？
pandas 
Pandas 我想将第0行的内容写为列名。我该怎么办？（问题）
pandas 
Pandas 如何替换dtype=K.floatx（）？
pandasnumpymachine-learningkeras 
在使用pandas读取csv文件时，如何根据特定条件在数字前面添加零
pandasdataframe 
Pandas 为列表列表中的每个列表创建df
pandaslistdataframefor-loop 
Pandas 熊猫数据帧过滤器'；和'；和'；或'；条款
pandasdataframesearchfilter 
以功能为键的pandas groupby
pandasdataframe 
Pandas 在多重处理后连接结果
pandasmultithreadingdataframe 
Pandas 模块'；熊猫'；没有属性'；面板'；
pandas 
Pandas 熊猫CSV文件可视化| Tweet帖子频率
pandascsvmatplotlibtwitter 
Pandas 如果列的范围从F_1到F_532，那么如何使用jupyter笔记本在python中删除多个列
pandas 
                                       





随机文章推荐



                                                        
Salesforce 如何根据用户权限查询记录？
salesforce 
Salesforce 如何从另一个Vf页面中的按钮调用带有参数的Vf页面
salesforce 
Salesforce 如何在Visualforce页面上仅显示自定义验证中提取的错误消息？
salesforce 
Salesforce 创建子视觉力页面
salesforce 
使用OAuth 2.0的访问令牌拒绝连接Salesforce的用户代理身份验证
salesforceoauth-2.0 
如何在Salesforce中进行lead history报告？
salesforce 
Salesforce 系统管理员的Site.com错误
salesforce 
Salesforce将一个对象拆分为两个（父子关系）
salesforce 
Salesforce Visualforce页面中日期和ID值的呈现不一致
salesforce 
Salesforce 
salesforce 
Salesforce API描述对象权限
salesforce 
Salesforce 要显示文本，请单击vf页面中的复选框
salesforce 
Salesforce 从SAP Hana向SFDC获取数据
salesforcesap 
Salesforce SOQL在该领域的应用
salesforce 
Salesforce 如何在SFDC的视觉力中获得强制标志？
salesforce 
如何在Salesforce Lightning应用程序中打开/关闭模式？
salesforce 
Nodejs-从Amazon Alexa skill中的salesforce oauth响应中获取实例url，或使用API获取实例url
salesforce 
Salesforce Google reCaptcha:无法及时验证
salesforce 
Salesforce 在电子邮件模板中写入picklist键，而不是显示值
salesforce 
Salesforce Lightning Web组件：从构造函数内部无法获取recordId
salesforce


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Frameworks
Iis
Computer Vision
Acumatica
Kubernetes
Botframework
Ruby On Rails 3.1
Asp.net
Ant
Workflow
Graph
Angular
Ocaml
Compression
Cmake
Pip
Codenameone
Dojo
Ftp
Twig
Big O
Vagrant
Ember.js
Parallel Processing
Hadoop
Templates
Android
Snowflake Cloud Data Platform
Google Chrome
Logic
Mqtt
Heroku
Tcp
Reporting Services
Powerbi
Primefaces
Office Js
Mediawiki
Google Cloud Storage
Installation
Office365
Inno Setup
Mips
Windows 7
Umbraco
Amazon Cloudformation
Zend Framework
Ibm Midrange
Memory
Aframe
Command Line
Azure Functions
Html5 Canvas
Sed
Here Api
Network Programming
Mapping
Caching
Neural Network
Playframework
Windows 8
Printing
Selenium Webdriver
Apache2
Visual Studio 2010
Winforms
Amazon Redshift
Actionscript
Google Cloud Platform
Log4j
Configuration
Doxygen
Instagram
Proxy
Process
Vuejs2
Sharepoint
Imagemagick
Linux
Soap
Combobox
Osgi
Oracle11g
Google Apps Script
Certificate
Cocoa Touch
Scripting
Apache Kafka
Firebase
Image Processing
Jqgrid
Ibm Mq
Orchardcms
Memory Management
Google Maps Api 3
Fiware
Appium
Sml
Kdb
Cloud
Google Cloud Dataflow
Salesforce
Menu
Hybris
Reflection
Drupal 7
Dns
Jms
Vhdl
Tableau Api
Google Api
Internationalization
Ios
Solr
.htaccess
Facebook
Sql Server 2012
Ssl
Automated Tests
Ms Office
Windows Phone 7
Sql Server
Quickbooks
Xamarin
Character Encoding
Streaming
Checkbox
Arm
Gradle
Com
Codeigniter
Nlp
Youtube
Google Plus
Asynchronous
Directory
Testng
Asp.net Web Api
C# 3.0
Iis 7
Geometry
Sdk
Terminal
Interface
Gps
Abap
Antlr4
Swagger
Rally
Swing
System Verilog
Apache Flink
Entity Framework Core
Merge
Sonarqube
Emacs
Java Me
Netlogo
Asp.net Core Mvc
Drools
Crystal Reports
Rss
Python 2.7
Vue.js
Wpf
Node.js
Open Source
Matplotlib
Signalr
Subsonic
Google Colaboratory
Filesystems
Gwt
Redirect
Java
Discord.js
Azure Active Directory
Zend Framework2
Silverlight
Jquery
Deployment
Ruby On Rails 3.2
Asp Classic
Stored Procedures
Selenium
Safari
Visual Studio 2008
Post
Android Ndk
Chef Infra
Web
Dart
Openlayers 3
Leaflet
Video Streaming
Listview
Material Ui
Google Calendar Api
Docusignapi
Single Sign On
Lucene


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网