为什么我的列在我的pyspark数据框中被删除后仍然存在？_Pyspark_Databricks - Fatal编程技术网

为什么我的列在我的pyspark数据框中被删除后仍然存在？

pyspark

为什么我的列在我的pyspark数据框中被删除后仍然存在？,pyspark,databricks,Pyspark,Databricks,我使用的是pyspark 2.4.5版和Databricks runtime 6.5版，我遇到了意想不到的行为。我的代码如下： import pyspark.sql.functions as F df_A = spark.table(...) df_B = df_A.drop( F.col("colA") ) df_C = df_B.filter( F.col("colA") > 0 ) 当我通过对dfu B进行过滤来分配dfu C时，我希望会抛出一个错误，因为“col

我使用的是pyspark 2.4.5版和Databricks runtime 6.5版，我遇到了意想不到的行为。我的代码如下：

import pyspark.sql.functions as F

df_A = spark.table(...)
df_B = df_A.drop(
    F.col("colA")
)
df_C = df_B.filter(
    F.col("colA") > 0
)

当我通过对dfu B进行过滤来分配dfu C时，我希望会抛出一个错误，因为“colA”已被删除。但是当我运行它时，这段代码运行得很好。这是预期的还是我遗漏了什么？

Spark构建了一个有意义的解释计划，并在

过滤器之后应用下拉列表。你可以从解释计划中看出这一点
spark.createDataFrame([('foo','bar')]).drop(col('_2')).filter(col('_2') == 'bar').explain()

给出：
== Physical Plan ==
*(1) Project [_1#0]
+- *(1) Filter (isnotnull(_2#1) && (_2#1 = bar))
   +- Scan ExistingRDD[_1#0,_2#1]

在上面的解释计划中，删除列的投影发生在过滤器之后




[matrix]相关文章推荐



                                                        
Matrix OpenCV乘法标量和矩阵
matrixopencvmath 
Matrix 非常大的稀疏矩阵上的聚类？
matrix 
Matrix 坐标变换
matrix 
Matrix C+的稀疏矩阵库+；
matrix 
Matrix 使用apachehama实现大矩阵乘法
matrix 
Matrix J:输入矩阵的简便方法？
matrix 
Matrix “有什么问题吗？”；a2=a1-a1.平均值（）&引用；获取中心数据？
matrix 
Matrix 以所需的方式格式化文本文件数据
matrixtextformatting 
Matrix I'；我正在努力使用安卓磁强计和陀螺仪传感器
matrix 
Matrix OSRM距离矩阵
matrixrouting 
Matrix 基于其他矩阵的矩阵元预测
matrixmachine-learningartificial-intelligence 
Matrix HDR颜色空间变换会导致RGB值为负值（从Yxy到XYZ到sRGB）
matrix 
Matrix 神经网络中偏差单元的良好实现
matrixmachine-learningneural-network 
Matrix 金属着色语言中的矩阵乘法
matrix 
Matrix 在2d图像上旋转Z轴'；着色器中的s矩阵
matrixglslwebgl 
Matrix 八度：群上的矩阵乘法
matrixoctave 
Matrix 如何使用倍频程将一列1和0插入矩阵？
matrixoctave 
Matrix 创建3个变量的共现矩阵
matrix 
Matrix sympy中的符号矩阵，打印跟踪并生成C代码
matrix 
Matrix fortran语言中的乘法乘积
matrixfortran 
                                       





随机文章推荐



                                                        
jqGrid：列重新排序时是否有事件？
jqgrid 
jqGrid获取所有ID
jqgrid 
如何在jqGrid的顶部和底部获得导航器
jqgrid 
Jqgrid树视图邻接
jqgrid 
在jqGrid中显示自定义表单上的错误和消息
jqgrid 
IE8中的Jqgrid treegrid性能问题
jqgrid 
jqgrid中的“查看所有”选项将导致行号和总计的NAN
jqgrid 
功能jqGrid-它可以呈现的最大行数（分页关闭和虚拟滚动关闭）
jqgrid 
Jqgrid 排序图标在设置排序器时未更新
jqgrid 
jqgrid：如何在不同的列上排序
jqgrid 
jqgrid：如何在每次打开添加对话框时创建它
jqgrid 
jqGrid删除多行
jqgrid 
Jqgrid 找不到grid.jqueryui.js？
jqgrid 
Jqgrid 无法获取属性'；stype&x27；指未定义的或空的引用
jqgrid 
Jqgrid 客户端排序不工作
jqgrid 
ZQB网格数据报在ZURB基金会中的应用
我开始使用ZURB基金会，我需要一个类似DATAID的JQGRID，以表格格式显示数据，它具有分页和选择行的能力。
我搜索了ALDT，但只找到DATABABLSE.NET，这对于ZURB基金会并不是很有希望。
jqgridzurb-foundation 
条件可编辑取决于colModel jqGrid中的值
jqgrid 
网页包jqgrid错误
jqgridwebpack 
问题：jqgrid双标题问题
jqgrid 
JQGrid-如何基于另一个选择重新加载一个选择的dataurl
jqgrid


                                        

                                        
                                        


                                                
                                                        [pyspark]相关推荐
                                                        
Pyspark Spark SQL PypSpark将表中的值更新为表中的另一个值
									Pyspark
							 
Pyspark Livy在计算结束前返回
									Pyspark
							 
pyspark:连接两个数据帧时发生AnalysisException
									Pyspark
							 
如何使用Pyspark中的kmeans将原始观测值与预测的星团正确标记？
									Pyspark
							 
Bing地图-如何使用dataframe在pyspark中使用路由api
									Pyspark
							 
Pyspark 矢量汇编行为与密集数据聚合
									Pyspark
							 
Pyspark:添加新列的行和值超过255列
									Pyspark
							 
PySpark:Dataframe:Numeric+；Null列值导致Null而不是数值
									Pyspark
							 
Pyspark 使用迭代Spark数据帧创建的内存错误
									Pyspark
							 
Pyspark PypSpark多工况多工况多工况
									Pyspark
							 
Pyspark SparkSQL（Databricks）：将数据插入由不同角色创建的雪花表中
									Pyspark
							 									Snowflake Cloud Data Platform
							 
Pyspark中的DOB场
									Pyspark
							 
AWS SageMaker笔记本列表表使用boto3和PySpark
									Pyspark
							 									Amazon Dynamodb
							 
Pyspark模式-同时定义和推断
									Pyspark
							 
Pyspark Py4JJavaError:调用o27.sessionState时出错
									Pyspark
							 
删除pyspark中任何列中具有特定值的行
									Pyspark
							 
Pyspark 带时区的Pypark时间戳
									Pyspark
							 
在pyspark中读取tsv文件
									Pyspark
							 
如何使用pyspark在Amazon EMR中跟踪长期作业的进度？
									Pyspark
							 
当多列包含空值时pyspark中的加权平均计算
									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Canvas
Here Api
Logic
Actionscript
Doctrine
Algorithm
Forms
Identityserver4
Dart
Visual Studio Code
Dynamics Crm
Migration
Sugarcrm
Cocos2d Iphone
Swagger
Scroll
Shiny
Magento2
Sdk
Eclipse
Mdx
Visual Studio 2012
Talend
Logstash
String
Qt
Install4j
Node.js
Ruby On Rails 4
Zurb Foundation
Intellij Idea
Docker Compose
Snmp
Date
Internationalization
Spring Batch
Processing
Isabelle
Sorting
Stm32
Cassandra
Npm
Time Complexity
Yii2
Cloud
Couchbase
Extjs
File
Eclipse Rcp
Corda
Ruby On Rails 3
Laravel 4
Directx
Umbraco
Url Rewriting
Websphere
Windows 7
Responsive Design
E Commerce
Directory
Hyperledger Fabric
Amazon S3
Antlr
Windows
Loops
Asp.net Core Mvc
Visual C++
Version Control
Laravel
Path
Wolfram Mathematica
Akka
Jqgrid
Microservices
Spring Integration
Time
Dns
Hybris
Postgresql
Wcf
Computer Vision
Grails
Octave
Sharepoint 2007
Gridview
Tridion
Statistics
Protocol Buffers
Openlayers 3
Binding
Autohotkey
Scheme
Jvm
Breeze
Asp.net Mvc
Windows Phone
Leaflet
Qml
Openshift
Svg
Image Processing
Amazon Dynamodb
Azure Data Factory
Gremlin
Vue.js
Oracle Apex
Keycloak
Swift3
Ruby On Rails 3.2
Java
Sparql
Sbt
Sql Server 2008
Delphi
Spring Cloud
Calendar
Activerecord
Swift2
Windows Store Apps
Typescript
Programming Languages
Excel
Oracle10g
Lotus Notes
Pagination
Google Api
Electron
Camera
Dialogflow Es
Django
Twilio
Api
Sapui5
Selenium
Jakarta Ee
Dynamic
Phpmyadmin
Racket
Exception
Localization
Search
Unity3d
Facebook
Sed
Apache Kafka
Postman
Colors
Openstack
Sencha Touch
Cygwin
Plsql
Cuda
Parsing
Spring
Video Streaming
Hibernate
Database
Ide
D3.js
Model
Z3
Raspberry Pi
Android Fragments
Glsl
Visual Studio 2017
Flash
Jquery Plugins
File Io
Listview
Internet Explorer 8
Android Layout
Cakephp
Sass
Yocto
Web
Chart.js
Indexing
Vb6
Compilation
Xsd
Tags
Datetime
Axapta
Bots
Netsuite
Internet Explorer
Embedded
Sublimetext2
Actions On Google
Salesforce
Ldap
Enums
Telegram
Kubernetes
Uiview
Arm
Asterisk
Debian
Unit Testing
Jmeter
Haskell


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网