动态修剪dataframe scala spark的所有字符串类型列_Scala_Apache Spark - Fatal编程技术网

动态修剪dataframe scala spark的所有字符串类型列

scala apache-spark

动态修剪dataframe scala spark的所有字符串类型列,scala,apache-spark,Scala,Apache Spark,嗨，我只想修剪DF的字符串类型列，因为修剪所有列会将非字符串列的数据类型更改为字符串类型。目前我有两种方法，但我正在寻找一些好的和有效的方法第一种方法 val trimmedDF = Countrydf.columns.foldLeft(Countrydf) { (memoDF, colName) => memoDF.withColumn(colName, trim(col(colName))) } val exprs = Countrydf.schema.fields.map

嗨，我只想修剪DF的字符串类型列，因为修剪所有列会将非字符串列的数据类型更改为字符串类型。目前我有两种方法，但我正在寻找一些好的和有效的方法

第一种方法

val trimmedDF = Countrydf.columns.foldLeft(Countrydf) { (memoDF, colName) =>
  memoDF.withColumn(colName, trim(col(colName)))
}

val exprs = Countrydf.schema.fields.map { f => 
  if (trimmedDF.schema.fields.contains(f)) col(f.name)
  else lit(null).cast(f.dataType).alias(f.name) 
}
trimmedDF.select(exprs: _*).printSchema

var Countrydf=Seq（（“Virat”，18，“RCB ali shah”），（“Rohit”，45，“MI”），（“DK”，67，“KKR”）。toDF（“队长”，“球衣号码”，“球队”）
乡村秀
对于（name性能方面，我找到的最佳解决方案是
var Countrydf = Seq(("Virat               ",18,"RCB ali shah"),("             Rohit ",45,"MI "),(" DK",67,"KKR ")).toDF("captains","jersey_number","teams")

Countrydf.show

for( name <- Countrydf.schema) {
   if(name.dataType.toString=="StringType")
   Countrydf= Countrydf.withColumn(name.name, trim(col(name.name)))
 } 


var Countrydf=Seq（（“Virat”，18，“RCB ali shah”），（“Rohit”，45，“MI”），（“DK”，67，“KKR”）。toDF（“队长”，“球衣号码”，“球队”）
乡村秀
（姓名）




[apache spark]相关文章推荐



                                                        
Apache spark 如何在SparkSQL中获取星期几？
apache-spark 
Apache spark 使文件可用于工作节点
apache-sparkgoogle-cloud-storagegoogle-compute-engine 
Apache spark Spark作业服务器是否必须部署在与Spark Master相同的主机上？
apache-sparkdocker 
Apache spark Spark独立模式在群集中不工作
apache-spark 
Apache spark Spark状态计算：在mappingFunction中创建RDD
apache-sparkstreaming 
Apache spark 如何使用ApacheSpark构建实时推荐系统？
apache-spark 
Apache spark 新的SQLContext:Spark 1.6与Spark 2.1的向后兼容性
apache-sparkpyspark 
Apache spark Spark数据帧已成功创建，但无法写入本地磁盘
apache-sparkintellij-idea 
Apache spark Spark Kafka的SBT文件
apache-sparkapache-kafka 
Apache spark 将Spark ML管道保存到数据库
apache-sparkcassandra 
Apache spark 如何在Spark中将编辑从一个数据帧合并到另一个数据帧？
apache-sparkdataframe 
Apache spark 在Spark Standalone中，如果Spark.worker.cleanup.appDataTtl过期，则会删除驱动程序workdir及其jar文件。这是预期的吗？
apache-spark 
Apache spark 火花读avro
apache-spark 
Apache spark 关于Spark cluster向HBase提出的问题；java.lang.IllegalStateException:未读块数据“；例外
apache-sparkhbase 
Apache spark 有没有更好的方法在Spark中加载一个巨大的tar文件，同时避免OutOfMemoryError？
apache-spark 
Apache spark 如何将Palantir Foundry与Amazon S3或HDFS集成
apache-sparkamazon-s3 
Apache spark Hadoop CLI命令以获取使用的总内存，如8088上的Hadoop Web UI所示
apache-sparkhadoop 
Apache spark 通过databricks向配置单元外部表添加新分区
apache-sparkamazon-s3hive 
Apache spark HDP&x2B；安巴里+；纱线节点标签和HDF
apache-sparkhadoop 
Apache spark Spark无法合并拼花地板文件（整数->；小数）
apache-sparkpyspark 
                                       





随机文章推荐



                                                        
Hyperlink UI jQuery选项卡-在同一页面的选项卡中创建多个指向选项卡的链接
hyperlink 
Hyperlink 指向网络上其他工作簿的绝对链接
hyperlinkexcel 
Hyperlink 从链接中嵌入flash文件的最佳方式是什么？
hyperlinkflash 
Hyperlink 将链接和下划线之间的间距调整到最小值以下
hyperlink 
Hyperlink 将两个字段合并为一个超链接
hyperlink 
Hyperlink 如何从外部链接链接到模态对话框？
hyperlink 
Hyperlink 如何在招摇过市的文档中链接和引用自我？
hyperlinkswagger 
Hyperlink react admin的仪表板中的链接不起作用
hyperlink


                                        

                                        
                                        


                                                
                                                        [scala]相关推荐
                                                        
Scala 选项[Map[String，String]]可以奇怪地获得一个值
									Scala
							 
如何在Scala中创建对象列表（即单例）？
									Scala
							 									Types
							 
Scala通用宏
									Scala
							 									Generics
							 									Macros
							 
Scala 如何将sbt.InputTask[T]转换为sbt.Task[T]？
									Scala
							 									Sbt
							 
在Scala中启动特定的外部进程
									Scala
							 									Command Line
							 									Process
							 
Scala 如何设置Akka演员只在特定时间段运行？
									Scala
							 									Akka
							 
捕获Specs2（Scala）测试的屏幕截图
									Scala
							 									Automation
							 
scala发电机驱动试验
									Scala
							 									Testing
							 									Functional Programming
							 
Scala 类扩展特征迭代器中的重写方法map和flatMap
									Scala
							 									Inheritance
							 									Collections
							 
Scala 如何在Slick中“按选择创建临时表”？
									Scala
							 
Scala 使用除疣器运行sbt
									Scala
							 									Plugins
							 									Sbt
							 
Scala Spark leftOuterJoin问题-leftOuterJoin不是org.apache.Spark.rdd.rdd[（String，String）]的成员
									Scala
							 									Apache Spark
							 
Scala 在数组之后使用“*”表示什么？
									Scala
							 
Scala 基于Spark Dataframe中的条件跨行的单列总和
									Scala
							 									Apache Spark
							 
Scala-模式匹配-是否可以检测值是否为case类？
									Scala
							 
Scala 如何在相同/不同年份的两周编号之间生成所有周？
									Scala
							 
Scala Meta：对版本感到困惑
									Scala
							 
将分钟转换为小时scala
									Scala
							 
Scala 询问模式覆盖消息是否收到
									Scala
							 									Akka
							 
If-else在单个语句中：scala
									Scala
							 
Scala 在插入的字符串中使用转义引号和大括号
									Scala
							 
如何使用Scala的异常处理从JDBC连接类返回连接？
									Scala
							 									Jdbc
							 
Scala 在slick 3.0中更新多对多联接表
									Scala
							 									Playframework
							 
Java`Class`类的Scala等价物？
									Scala
							 
Spark scala数据帧获取每行的值并分配给变量
									Scala
							 
Scala 使用无形状的通用默认实例为案例类构建，并使用定义公共createValue方法的参数
									Scala
							 
Scala 如何在抽象效果类型上配置Cats计时器
									Scala
							 									Functional Programming
							 
如何避免在Scala中使用类型投影
									Scala
							 
Scala fastparse.P[Any]=>fastparse.P[Unit]中没有隐式视图可用
									Scala
							 
Scala存在型怪异行为
									Scala
							 									Class
							 									Inheritance
							 									Types
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Cloud Foundry
Visual Studio 2010
Pagination
.net 4.0
Gstreamer
Scala
.htaccess
Uiview
Gremlin
Playframework
Networking
Nativescript
Reference
Smalltalk
Kubernetes
Asynchronous
Facebook Graph Api
Sharepoint 2010
Tfs
Composer Php
Snmp
Installation
Gridview
Google Apps Script
Curl
Javascript
Calendar
Sails.js
Jvm
Llvm
Apache2
Visual C++
Deep Learning
Hibernate
Smtp
Jwt
Url
Process
Java 8
Ibm Cloud
Google Cloud Dataflow
Azure Devops
Mediawiki
Office365
Jsp
Asp.net Core
Grid
Spring Mvc
Bison
User Interface
Vim
Datetime
Keyboard
Android Ndk
Antlr4
Phantomjs
Usb
Data Binding
Log4net
Paypal
X86
Ecmascript 6
Appium
Outlook
Jqgrid
Openlayers 3
Image Processing
Import
Dart
Mapbox
Tableau Api
Liferay
Mdx
If Statement
Gps
Sqlite
Mysql
Dynamic
Maven 2
Applescript
Terraform
Razor
Swiftui
Binding
Julia
Itext
Windows 7
Apache Camel
Microsoft Graph Api
Exchange Server
Operating System
Azure Active Directory
Scroll
Swing
Windows Phone 8.1
Discord
Windows 8
Opencl
Sencha Touch 2
Oauth 2.0
Continuous Integration
Lambda
Internationalization
Google Cloud Platform
Web
Kentico
Wpf
Cloud
Phpstorm
Ember.js
Linq
Vb6
Passwords
Jenkins
Sublimetext3
Ssrs 2008
Localization
Cordova
Windows Phone
Gatsby
Module
Visual Studio 2012
Gruntjs
Angular Material
Ruby On Rails 3.1
Jquery Mobile
Github
Navigation
Lisp
Cors
Debian
Wolfram Mathematica
Actionscript
Xcode4
Scrapy
Sql Server
Sip
Timer
Mvvm
Iphone
Ignite
Facebook
Colors
Drools
Database Design
Opencv
Amazon Redshift
Redux
Gulp
Ruby
Opengl
Url Rewriting
Notifications
Debugging
Object
Express
Odata
Push Notification
Twitter
Shiny
Protractor
Arm
Shopify
Linker
Keras
Monitoring
Crystal Reports
Ibm Mq
Ftp
Svn
Azure Functions
Clojure
Aframe
Robotframework
Automated Tests
Docusignapi
Hadoop
Api
Plsql
Fluent Nhibernate
Graphql
Internet Explorer 8
Vector
Telegram
Typescript
Dynamics Crm
Speech Recognition
Winapi
Neo4j
Wcf
Tinymce
Laravel 4
Optimization
Antlr
Bootstrap 4
System Verilog
Sql Server 2008 R2
Spring Security
Seo
Emacs
Parsing


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网