Python PySpark Dataframe删除多列的最佳实践？_Python_Dataframe_Apache Spark_Pyspark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/325.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python PySpark Dataframe删除多列的最佳实践？_Python_Dataframe_Apache Spark_Pyspark - Fatal编程技术网

Python PySpark Dataframe删除多列的最佳实践？

python dataframe apache-spark pyspark

Python PySpark Dataframe删除多列的最佳实践？,python,dataframe,apache-spark,pyspark,Python,Dataframe,Apache Spark,Pyspark,假设有人想从数据帧中删除一列。在不创建新的数据帧的情况下，可以实现这一点吗 df=df.drop（“标签”）似乎创建一个新的数据帧更安全、更正确，对吗？重复使用上述数据帧可能会遇到什么问题如果重复使用数据帧是一种不好的做法，那么假设您想要删除多个与模式匹配的列： for col in df.columns: if col.startswith("aux_"): df = df.drop(col) 在这种情况下，每次创建一个新的数据帧似乎不切实际。最佳做法是什么如果要删除多个

假设有人想从数据帧中删除一列。在不创建新的数据帧的情况下，可以实现这一点吗

df=df.drop（“标签”）

似乎创建一个新的数据帧更安全、更正确，对吗？重复使用上述数据帧可能会遇到什么问题

如果重复使用数据帧是一种不好的做法，那么假设您想要删除多个与模式匹配的列：

for col in df.columns:
  if col.startswith("aux_"):
    df = df.drop(col)

在这种情况下，每次创建一个新的数据帧似乎不切实际。

最佳做法是什么

如果要删除多个列，我认为第一步是识别列，将其保存在列表中，然后执行单个

。删除，类似于：
your_column_list = [col for col in df.columns if col.startswith("aux") ]
df.drop(*your_column_list)

这是根据我对spark dataframe的理解，您不必担心它每次都返回新的dataframe，您在那里所做的只是对dataframe进行转换。您可以对数据帧执行许多转换，只有当您对数据帧执行任何操作时，它才会生成新的数据帧
下面是有关转换与操作的更多信息，
我对标题进行了编辑，使其更加具体，请看一看。并非每次都会创建新的数据框。你的方式很好。




[dataframe]相关文章推荐



                                                        
Dataframe 循环内的DASK数据帧
dataframedask 
Dataframe Pyspark货币转换器
dataframepyspark 
Dataframe 条件下分区中的Pypark枚举
dataframepyspark 
Dataframe 使用Julia中的列表对数据帧进行子集设置
dataframejulia 
如何从Pyspark dataframe列中选择一些行并将其添加到新的dataframe？
dataframepyspark 
Dataframe 如何在将spark数据框中的数字数据写入csv时仅删除双引号
dataframeapache-spark 
Dataframe 在spark数据帧中生成哈希键（数据帧中的唯一标识符列）
dataframehashpyspark 
Dataframe 无法写入没有标头的Dynamicframe
dataframepyspark 
Dataframe 将URI查询字符串转换为PySpark中的结构键值数组
dataframeapache-sparkpyspark 
Dataframe 如何将pySpark中数据帧的所有列与其他单列相乘
dataframepyspark 
Dataframe Pyspark架构更新/更改数据帧
dataframepyspark 
Dataframe 如何在连接多个表后处理空值
dataframeapache-sparkpyspark 
Dataframe Query.jl-创建一个新列并立即使用它
dataframejulia 
Dataframe 如何将整数与数据帧相乘，并将结果放入新的数据帧
dataframe 
Dataframe 如何将列表添加为新列？
dataframeapache-sparkpyspark 
Dataframe 获取错误：FUN中的错误（X[[i]]，…）：仅在包含所有数值变量的数据帧上定义；而sapply（x，is.numeric）返回所有TRUE？
dataframe 
                                       





随机文章推荐



                                                        
如何在wicket中手动设置RadioGroup值？
wicket 
Wicket RadioGroup getValue未返回正确的选定值
wicket 
Wicket 如何使用buildr将html文件打包到jar/war中？
wicket 
Wicket表单：禁用提交按钮
wicketforms 
Wicket 防止页面过期
wicket


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
View
Tcp
Azure Data Factory
Visual Studio 2017
Terminal
Protocol Buffers
Influxdb
Nosql
Ocaml
Apache Zookeeper
Rx Java
Forms
Laravel
Google Maps
Netty
Ssh
Gps
Android Ndk
Button
Zend Framework
Gis
Raspberry Pi
Java 8
Amazon Dynamodb
Search
Nsis
Kotlin
Php
Ms Office
Elm
Jhipster
Linux Kernel
Responsive Design
Command Line
Netsuite
Django Rest Framework
Visual Studio 2008
Documentation
Random
Spotify
Db2
Jms
Geolocation
Openlayers 3
Asp.net Web Api
Visual C++
Loopbackjs
Virtualbox
Spring Batch
Outlook
Hive
Cordova
F#
Asp.net
Heroku
Java Me
Alfresco
Gitlab
Artificial Intelligence
Login
Linkedin
Material Ui
Ruby On Rails 3.1
Jqgrid
Continuous Integration
Parse Platform
Jira
Corda
Drupal 7
Types
Ibm Mq
File
Rally
Coding Style
Angularjs
Xpath
Marklogic
Mdx
Autocomplete
Twitter
Web
Magento
Security
Cron
Joomla
Post
Graphql
Ibm Cloud
Time
Cygwin
Postman
Ssrs 2008
Email
Odata
Windows Mobile
Video
.net Core
Stm32
Jasper Reports
Sapui5
Maven 2
Requirejs
Yocto
Karate
Spring Security
Floating Point
Centos
Multithreading
C++
Rxjs
Encryption
Gcc
Nunit
Ios8
Networking
Intellij Idea
Seo
Azure Functions
Properties
Robotframework
Project Management
Vba
Chef Infra
File Upload
Webstorm
Azure
Ionic Framework
Memory
Jar
Replace
Batch File
Arrays
Enums
Eclipse Plugin
Windows Phone 8
Google Drive Api
Xcode
Aem
Ldap
Twig
Sqlalchemy
Apache Flex
Kubernetes
Doxygen
Pointers
For Loop
Dynamic
Xampp
Functional Programming
Graph
Scripting
Artifactory
Tinymce
Mips
Isabelle
Jquery Ui
Air
Notepad++
Mqtt
Permissions
Assembly
Testng
Layout
Perl
Instagram
Rabbitmq
Phantomjs
Ruby
Animation
Webpack
Arangodb
Hybris
Omnet++
Node.js
Lua
Eclipse Rcp
Amp Html
Arduino
Lisp
Qml
Antlr4
Magento2
Parameters
Struct
Css
Laravel 5
Youtube
Syntax
Ios6
Ibm Midrange
Cocos2d Iphone
Zurb Foundation
Tags
Itext
Iphone
Dialogflow Es
Sencha Touch
Azure Devops
Calendar
Primefaces
Debian


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网