Python 检查Spark数据帧中的StructType中是否存在元素_Python_Apache Spark_Pyspark_Spark Dataframe - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/319.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 检查Spark数据帧中的StructType中是否存在元素_Python_Apache Spark_Pyspark_Spark Dataframe - Fatal编程技术网

Python 检查Spark数据帧中的StructType中是否存在元素

python apache-spark pyspark

Python 检查Spark数据帧中的StructType中是否存在元素,python,apache-spark,pyspark,spark-dataframe,Python,Apache Spark,Pyspark,Spark Dataframe,在python中，我有一个带有嵌套列的Spark数据框，我有路径a.b.c，我想检查c之后是否有一个名为d的嵌套列，因此如果a.b.c.d存在简单地检查df.columns['a']['b']['c']['d']或df.columns['a.b.c.d']似乎不起作用，所以我发现可以使用df.schema函数。因此，我只是重复了一遍，例如： y = df.schema['a'].dataType['b'].dataType['c'].dataType 然后应该正常检查d是否在y中我做这件

在python中，我有一个带有嵌套列的Spark数据框，我有路径

a.b.c

，我想检查c之后是否有一个名为d的嵌套列，因此如果

a.b.c.d

存在

简单地检查

df.columns['a']['b']['c']['d']

或

df.columns['a.b.c.d']

似乎不起作用，所以我发现可以使用

df.schema

函数。因此，我只是重复了一遍，例如：

y = df.schema['a'].dataType['b'].dataType['c'].dataType

然后应该正常检查d是否在y中

我做这件事的方法就是尝试

y['d']

，如果失败了，那么它就不存在了。但我不认为使用try是最好的方法

所以我试着检查y中的

if'd

，但显然这不起作用，尽管检索元素

y['d']

在它存在的情况下是有效的

y的类型是

StructType（列表（StructField（d，StringType，true），…其他列））

所以我真的不知道如何正确地检查d是否在y中。当我可以检索到

y['d']

时，为什么我不能直接检查

y中的'd'

？有人能帮忙吗？我也是python新手，但我找不到或想不出其他解决方案。

我认为在中使用

不起作用，因为schema
的数据类型是StructType
，根据文档，它包含一个StructField
列表。因此，您试图检查字符串“d”是否在StructField
的列表中。可能是重复的，我想是的，但我仍然不明白检索y['d']
的工作原理。那么，除了使用try
，是否没有简单的方法来检查这一点？引用的帖子没有多大帮助，因为在python中没有quickTry
作为选项函数（据我所知，这就是我试图避免的全部内容），并且没有嵌套列的解决方案。




[apache spark]相关文章推荐



                                                        
Apache spark 为什么在Spark UI for RDD中只显示转换而不显示操作的作业条目
apache-spark 
Apache spark Spark 1.3.1在Java中将数据映射到键值[]对
apache-sparkmapping 
Apache spark spark scala RDD[双]IIR滤波（顺序反馈滤波操作）
apache-spark 
Apache spark 浮点参数必须是Pyspark中的字符串或参数
apache-sparkpyspark 
Apache spark 我可以为ApacheSpark独立集群设置多少内核？
apache-spark 
Apache spark 火花洗牌读取时间
apache-sparkpyspark 
Apache spark 不使用root访问启动apachespark
apache-sparkssh 
Apache spark 火花驱动程序在集群模式下运行在何处，可以控制它？
apache-spark 
Apache spark 在纱线上运行Spark应用程序时出现的问题
apache-sparkpyspark 
Apache spark 使用字典列表提取Pyspark Dataframe的列值
apache-sparkpysparkamazon-dynamodb 
Apache spark 基于pyspark中的整列计算统计信息
apache-sparkstatisticspyspark 
Apache spark 如何在RDD中列出每个键的最大值？
apache-sparkpyspark 
Apache spark Spark程序引发异常
apache-sparkexception 
Apache spark PySpark：创建RDD->；DF->；具有1000'；字段的个数，但列数可变的行数
apache-sparkhadooppyspark 
Apache spark 从RDD元组中提取嵌套值
apache-spark 
Apache spark 如何在DataBricks中创建带有GUID/Autogenerate键的表
apache-spark 
Apache spark 在pyspark中查找行字符串中日期之间的平均和总时间？
apache-sparkpyspark 
Apache spark Pyspark-如何在强制转换后将列传递给函数？
apache-sparkpyspark 
Apache spark Pyspark:由于窗口函数上的OutOfMemory而失败
apache-sparkpyspark 
Apache spark 将Spark结构化流与融合模式注册表集成
apache-sparkapache-kafka 
                                       





随机文章推荐



                                                        
highcharts-使用yaxis.stacklables.formatter为每个条指定自定义文本
highcharts 
Highcharts 如何使用高位图表从柱状图向下展开到堆叠柱状图
highcharts 
Highcharts Firefox&&IE类型错误：Window.getComputedStyle的参数1未实现接口元素
highcharts 
Highcharts highstock：不工作；“上色”；
highcharts 
当鼠标悬停在Internet Explorer中时，Highcharts热图单元格颜色消失
highcharts 
highcharts仅在某些点上具有数据标签
highcharts 
Highcharts Highchart-如何在半圆饼图中创建附加的图像量表
highcharts 
Highcharts：如何从图例中隐藏文本
highcharts 
Highcharts 我如何才能使高图表库的饼图不可旋转？
highcharts 
Highcharts 在x轴标题中应用HTML样式的正确方法
highcharts 
当x轴刻度数较大时，Highcharts仅显示特定的刻度
highcharts 
Highcharts蜘蛛网在第一个位置显示错误的类别
highcharts 
Highcharts类别标签的自定义格式/颜色
highcharts


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Alfresco
Struts2
Ruby
Autohotkey
Glsl
Tcp
E Commerce
Exchange Server
Localization
Express
Ios8
C# 4.0
Sockets
Grails
Wxpython
Vue.js
Sencha Touch
Selenium
Vbscript
Configuration
Xquery
Netty
Graphics
Map
Wordpress
Keras
Ant
Azure Data Factory
Google Maps Api 3
Synchronization
Nest
Forms
Download
Dll
Ruby On Rails 3
Mapbox
Neural Network
Gremlin
Smtp
Cmake
Embedded
Jaxb
Kubernetes
Oauth
Reference
Url
Dynamics Crm
Big O
Elm
Fiware
Groovy
Com
Visual Studio Code
Cloud Foundry
Grid
C++
Octave
Leaflet
Mediawiki
Jasmine
Azure Service Fabric
Object
Applescript
View
Swift
Svn
Amazon Cloudformation
Maven 2
Tfs
Drupal 7
Python 2.7
Visual Studio 2015
Mod Rewrite
Optimization
Windows Installer
Stripe Payments
For Loop
Sql Server 2008
Amazon Dynamodb
Jestjs
Gatsby
Cmd
Svg
Ansible
Login
Exception
Scheme
Llvm
Graph
Url Rewriting
Inno Setup
Raspberry Pi
Linker
Compiler Construction
Internet Explorer 8
Npm
Jekyll
Nestjs
Signalr
Safari
Mysql
Stanford Nlp
Acumatica
Tensorflow
Listview
Rest
Grep
Flask
Fullcalendar
Design Patterns
Ide
Ajax
Single Sign On
Anaconda
Kotlin
Html5 Canvas
Memory Leaks
Functional Programming
Unix
Visual Studio 2013
Facebook
Amp Html
Material Ui
Streaming
Logic
Xcode
Azure Cosmosdb
Uitableview
Sql Server 2012
Drools
Nosql
Phpmyadmin
Sharepoint
Python Sphinx
Aframe
Colors
Selenium Webdriver
Openlayers
Mvvm
Sharepoint 2013
Image
Computer Vision
Sdk
Sql Server 2008 R2
Azure Active Directory
Rx Java
Ldap
Gridview
Three.js
Ibm Mq
Lisp
Clojure
Kentico
Redis
Dojo
Frameworks
Google Maps
Linq To Sql
Network Programming
Android Emulator
Gcc
Amazon Redshift
Windows 8
Docker Compose
Intellij Idea
Properties
Woocommerce
.htaccess
Servlets
Linq
Biztalk
Lua
Lucene
System Verilog
Machine Learning
Datatables
Smalltalk
Swift2
Angular6
Arrays
Pine Script
Blockchain
Language Agnostic
Quickbooks
Ibm Mobilefirst
Firefox
Sql
Sonarqube
Openshift
Compiler Errors
Db2
Text
Eclipse Rcp
Jquery Plugins
Maps
Sharepoint 2007
Input
Linkedin
Kdb
Plone
Eclipse Plugin


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网