转换和重命名1000+；有Pyspark的专栏？_Pyspark_Transform_Rename - Fatal编程技术网

转换和重命名1000+；有Pyspark的专栏？

pyspark

转换和重命名1000+；有Pyspark的专栏？,pyspark,transform,rename,Pyspark,Transform,Rename,我正在寻找最有效的方法来转换原始数据帧中可能存在或不存在的大量变量（100+）。列值为1字节。如果该值不为NULL，请使用值1重新编码。如果为NUll，则使用值0重新编码。然后重命名该列，以“U_”开头我的代码可以工作，但效率非常低。我是Pyspark的新手，可以使用一些指针 update_vars_list = [ 'Col_1','Col_2','Col_3',...'Col_n] for var in update_vars_list : i

我正在寻找最有效的方法来转换原始数据帧中可能存在或不存在的大量变量（100+）。列值为1字节。如果该值不为NULL，请使用值1重新编码。如果为NUll，则使用值0重新编码。然后重命名该列，以“U_”开头

我的代码可以工作，但效率非常低。我是Pyspark的新手，可以使用一些指针

update_vars_list = [ 'Col_1','Col_2','Col_3',...'Col_n]                   
for var in update_vars_list :
    if var in original_df.columns:
        original_df= original_df.withColumn(('U_'+var),f.when(f.col(var).isNotNull(),1).otherwise(0)).drop(var)

例如：

如注释中所述，尝试使用带有select的表达式：

expr = [ f.when(f.col(var).isNotNull(),1).otherwise(0).alias('U_'+var) for var in update_vars_list if var in original_df.columns]
df = original_df.select(*expr)

使用列多次调用

，速度非常慢。而是使用选择
执行所有转换，只需使用别名
重命名列即可。退房谢谢！这正是我所需要的。不客气，如果答案有帮助，请投票！




[model view controller]相关文章推荐



                                                        
Model view controller 视图中的跨组件通信（MVC）
model-view-controllerdesign-patterns 
Model view controller MS单元测试访问私有方法和基类成员
model-view-controllerunit-testing 
Model view controller 打开Zend MVC错误上的Flash图表
model-view-controller 
Model view controller 在MVC2C中防止图像缓存#
model-view-controllerasp.net-mvc-2imagecaching 
Model view controller 通过MVC-Joomla传递表单数据
model-view-controllerjoomla 
Model view controller CakePHP根据域加载不同的布局/数据？
model-view-controllercakephpdns 
Model view controller MVC2应用程序将在MVC3主机服务器上运行吗？
model-view-controllerasp.net-mvc-2asp.net-mvc-3 
Model view controller MVC Sencha Touch赢得'；无法正确显示选项卡面板
model-view-controllersencha-touch 
Model view controller 只是没有得到MVC（比如backbone.js）
model-view-controllerframeworksbackbone.js 
Model view controller 如何将另一个参数从jQueryAjax传递到mvc控制器，以及form.serialize（）
model-view-controllerjquery 
Model view controller 如何忽略ModelState中特定类的所有属性的验证错误
model-view-controller 
Model view controller @Scripts.Render在将webfleep.dll升级到1.6.0版本，然后部署到azure web角色后导致错误
model-view-controller 
Model view controller 自动计算剑道网格列
model-view-controllerkendo-ui 
Model view controller MVC formcollection未显示所有控件
model-view-controllerdrop-down-menu 
Model view controller NeedDataSource和ItemDataBinding仅触发一次
model-view-controllertelerik 
Model view controller selectedlistitem选定属性
model-view-controller 
Model view controller DAL、DTO和DAO在三层架构风格（包括MVC）中有什么区别
model-view-controllerorm 
Model view controller Typo3验证器返回对成员函数addError（）的调用，该函数为null
model-view-controllertypo3 
Model view controller Sitecore以编程方式更新NameValueList
model-view-controllersitecore 
Model view controller 如何将数据从ELMAH NuGet记录到MySQL数据库？
model-view-controller 
                                       





随机文章推荐



                                                        
Macos 如何构建dmg Mac OS X文件（在非Mac平台上）？
macosinstallation 
Macos 如何以编程方式获取OSX网络服务的连接状态？
macos 
Macos Alias使emacs在新缓冲区（不是帧）中打开文件并被激活/放在前面？
macosemacsapplescript 
Macos OSX导出的环境变量未在子进程中继承
macosbashvariables 
Macos 是否可以对DTrace隐藏OS X应用程序？
macos 
Macos 我的程序是root，但只有用sudo启动时才能运行
macos 
Macos Excel Mac 2011-X轴位置
macosexcel 
Macos Mac OSX提示git分支感知
macosgitbash 
Macos 如何在超级视图中移动子视图
macoscocoa 
Macos 在AppleScript中移动和合并文件夹
macosvbaapplescript 
Macos 将NSScroll视图居中'；s的文档视图是否与Preview.app类似？
macoscocoa 
Macos 如何限制Mac OSx应用程序仅针对少数OSx版本启动
macos 
Macos 通过Open运行OSX包
macosqtcmake 
Macos 预期行结束，但找到“&引用”；。出现在apple脚本编辑器上
macosapplescripteditor 
Macos opencv是否可以混合编译用于OSX应用程序开发的Objective C？
我想使用OSX默认的GUI，比如NSimaGeVIEW来显示一个OSX图像，它是一个OS X应用程序（不是iOS），所以我需要使用C++的Objic C，这对于苹果LLVM编译器来说不是什么大不了的事。但是，对于OpenCV，即使只是将opencv2/OpenCV.hpp导入到“.mm”文件中，也会使构建崩溃
macosopencv 
Macos 如何修复错误并顺利安装xmgrace？
macosbashshell 
Macos Concat将X类型的文件夹/子文件夹文件的内容设置为变量
macosbash 
Macos 如何在Swift、Mac OSX和Cocoa中触发leftMouseDown上的按钮操作
macosswiftcocoa 
Macos 如何使用系统权限为plist编写词典？
macosswift 
Macos hdiutil在使用自制桶安装DMG文件时没有响应
macos


                                        

                                        
                                        


                                                
                                                        [pyspark]相关推荐
                                                        
在Pyspark中添加python外部库
									Pyspark
							 
如何在pyspark中使用reduceByKey a行
									Pyspark
							 
Pyspark Pypark和Stata，丢失变量观测值
									Pyspark
							 									Stata
							 
Pyspark 基于现有列值替换Null
									Pyspark
							 
我们如何使用jdbc执行连接查询，而不是使用pyspark获取多个表
									Pyspark
							 
Pyspark 数据帧减少
									Pyspark
							 
PySpark-如何连接字符串前缀0'；根据条件，将s转换为另一个字符串列
									Pyspark
							 
Pyspark 使用Spark数据帧进行文本文件比较
									Pyspark
							 
Pyspark 多个spark核密度估计的并行计算与推理
									Pyspark
							 
pyspark从星期四开始获取月的周数
									Pyspark
							 
如何使用pyspark连接到独立的cassandra？
									Pyspark
							 									Cassandra
							 									Jupyter Notebook
							 
创建包含架构详细信息的dataframe时Dataproc上出现Pyspark错误
									Pyspark
							 									Anaconda
							 
Pyspark Dataproc主节点和工作节点之间的Python版本不同
									Pyspark
							 
检查电子邮件列是否包含@和。使用pyspark
									Pyspark
							 
Pyspark Pypark类型错误
									Pyspark
							 
pyspark流无法使用广播变量从检查点恢复
									Pyspark
							 
如何在Pyspark数据帧中创建查找列中值的函数
									Pyspark
							 
Pyspark筛选器，其中值位于另一个数据帧中
									Pyspark
							 
Pyspark Spark提交作业：FileNotFoundError:[Errno 2]没有这样的文件或目录
									Pyspark
							 									Airflow
							 
使用Pyspark将格式为MMM d yyyy hh:mm AM/PM的字符串转换为日期
									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Arm
Ignite
Clearcase
Pagination
Reflection
Vhdl
Vaadin
Tridion
Jmeter
Ember.js
Drupal
Memory
Big O
Kendo Ui
Abap
Dictionary
Gis
Build
C++ Cli
Openlayers 3
Bots
Apache Flink
Sugarcrm
Batch File
Openerp
Nosql
React Native
Redis
Mapreduce
Routes
Apache Flex
Subsonic
Javafx 2
Alfresco
Visual Studio 2017
Opencart
Syntax
Zend Framework
Django
Windbg
Telerik
Winapi
Google Analytics
Ide
Unix
Pascal
Sencha Touch
Jenkins
Isabelle
Vector
Nativescript
Discord.py
Merge
Sublimetext2
Visual Studio 2010
Web Crawler
Terraform
Compiler Construction
Makefile
Dll
Regex
Visual Studio Code
Powerbi
Macros
Camera
Adobe
Vim
Authentication
EmptyTag
Pip
Matlab
Jvm
Ms Word
Identityserver4
Mediawiki
Apache Storm
Telegram
Zurb Foundation
Sql Server
Shiny
Dialogflow Es
Marklogic
Jsp
Oracle
Google Api
Teradata
Maven
Salesforce
Xampp
Memory Leaks
Docker Compose
Tableau Api
Swift3
Protractor
Heroku
Wix
Permissions
Apache Nifi
Android Fragments
Log4j
Python
Swift2
Cloud Foundry
Oauth 2.0
Openssl
Selenium
Security
Clang
Nunit
Filter
Nest
Google Maps
Apache Zookeeper
Osgi
Laravel 4
Outlook
Scrapy
.net 4.0
Matplotlib
Php
Actionscript
Gmail
Linkedin
Synchronization
Tensorflow
Import
Usb
Haskell
Google Cloud Platform
For Loop
Dynamic
Sharepoint
Windows Phone 7
Weblogic
Jquery Plugins
Google Maps Api 3
Debian
Ckeditor
Asp.net Mvc
Octave
Jquery
Stripe Payments
Mdx
Azure Data Factory
Jetty
Silverlight 4.0
Opengl Es
Arduino
Join
Polymer
Spring Batch
Flutter
Nestjs
Mono
Visual Studio 2008
Hash
Common Lisp
Opencv
Matrix
Fortran
Ios6
Less
Parse Platform
Db2
Qml
Mongoose
File
Struts2
Pytorch
Doctrine
Ffmpeg
Content Management System
Sql Server 2008
Tree
Arangodb
Angular
Cors
Formatting
Android Ndk
Ionic Framework
Playframework 2.0
Vuejs2
Wpf
Ios8
Sharepoint 2007
Hbase
Windows Mobile
Coffeescript
Floating Point
Google App Maker
Python 3.x
Directx
Webstorm
Ios4
Core Data
Erlang
Install4j
Internationalization
Three.js
Struct
Next.js


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网