Spark Java编辑列中的数据_Java_Apache Spark_Apache Spark Sql_Apache Spark Dataset - Fatal编程技术网

Spark Java编辑列中的数据

java apache-spark

Spark Java编辑列中的数据,java,apache-spark,apache-spark-sql,apache-spark-dataset,Java,Apache Spark,Apache Spark Sql,Apache Spark Dataset,我希望遍历sparkDataFrame中列的内容，并在单元格中更正满足特定条件的数据 +-------------+ |column_title | +-------------+ +-----+ |null | +-----+ +-----+ |0 | +-----+ +-----+ |1 | +-----+ 假设我想在列的值为null时显示其他内容，我尝试了 Column.when（） DataSet.withColumn（）但是我找不到正确的方法，我认为没有必要转换为RDD

我希望遍历spark

DataFrame

中列的内容，并在单元格中更正满足特定条件的数据

+-------------+
|column_title |
+-------------+
+-----+
|null |
+-----+
+-----+
|0    |
+-----+
+-----+
|1    |
+-----+

假设我想在列的值为null时显示其他内容，我尝试了

Column.when（）

DataSet.withColumn（）

但是我找不到正确的方法，我认为没有必要转换为RDD并对其进行迭代。

当和

等于

时，可以使用

，当

和

为空时，可以使用
Dataset<Row> df1 = df.withColumn("value", when(col("value").equalTo("bbb"), "ccc").otherwise(col("value")));

Dataset<Row> df2 = df.withColumn("value", when(col("value").isNull(), "ccc").otherwise(col("value")));

Dataset<Row> df3 = df.na().fill("ccc");

另一种方法是使用UDF
创建一个UDF
    private static UDF1 myUdf = new UDF1<String, String>() {
    public String call(final String str) throws Exception {
        // any condition or custom function can be used
        return StringUtils.rightPad(str, 25, 'A');
      }
    };

在数据集上应用自定义项
   Dataset<Row> dataset = dataset.withColumn("city", functions.callUDF("myudf", col("city")));

Dataset-Dataset=Dataset.withColumn（“city”，functions.callUDF（“myudf”，col（“city”）；

希望有帮助
   Dataset<Row> dataset = dataset.withColumn("city", functions.callUDF("myudf", col("city")));




[apache spark]相关文章推荐



                                                        
Apache spark 如何测量Spark独立集群中节点之间的通信？
apache-spark 
Apache spark DSE 4.7和spark sql驱动程序
apache-spark 
Apache spark pySpark-groupByKey不工作
apache-sparkpyspark 
Apache spark 带有Spark Magic的Jypyter中出现Livy Pypark Python会话错误-错误repl.PythonInterpreter:进程已因1而终止
apache-sparkpyspark 
Apache spark 需要帮助根据Apache Spark的一组规则筛选记录吗
apache-spark 
Apache spark 为什么在spark shell中导入SparkSession失败；object SparkSession不是包org.apache.spark.sql的成员；？
apache-spark 
Apache spark Pypark近似分位数投掷误差
apache-sparkpyspark 
Apache spark “怎么做？”；“阶段”；在Spark SQL中生成与Spark Core'；s阶段？
apache-spark 
Apache spark Spark数据帧：合并两个连续行
apache-sparkdataframe 
Apache spark Spark json数据帧文件不存在错误
df=spark.read.format（“json”）.option（“header”，“true”）.load（“test.json”）
apache-sparkpyspark 
Apache spark 从PySpark查询日期之间的Vertica
apache-sparkpyspark 
Apache spark 当spark通过jdbc连接到kylin时，sql order by不起作用
apache-sparkjdbc 
Apache spark Spark master中的Spark提交本地模式
apache-spark 
Apache spark Spark-EMR-GlueCatalog:DataFrameWriter.bucketBy（）失败，出现UnknownHostException
apache-sparkhive 
Apache spark 如何在Spark中实现迭代优化问题
apache-sparkpyspark 
Apache spark 如何使用Java/Scala将kafka使用者输出附加到HDFS中的文件（拼花地板）？
apache-sparkapache-kafka 
Apache spark 错误消息：'；Java.net.URISyntaxExcaption:索引3处应为特定于方案的部分：s3
apache-spark 
Apache spark 如何一次查询delta lake表中的所有版本以跟踪对特定ID所做的更改
apache-spark 
Apache spark Spark性能：本地和HDFS相同
apache-spark 
Apache spark Spark 2.4.5 toDF函数未编译
apache-spark 
                                       





随机文章推荐



                                                        
Gradle 解压缩时删除目录
gradle 
gradle-自定义build.gradle和settings.gradle
gradle 
如何将本地android库添加到gradle构建中？
gradleandroid-studio 
Gradle Spring Boot项目在Tomcat中不起作用
gradlespring-boot 
使用gradle Scala插件运行Scala测试
gradle 
Gradle 解析渐变生成脚本依赖项
gradle 
如何访问Gradle正在使用的“java.home”？
gradle 
Gradle 在springboot中找不到Thymeleaf视图
gradlespring-boot 
sl4j版本在gradle中与Storm 1.0.1和elasticsearch 5.2冲突
gradleapache-storm 
如何使gradle任务执行两次而不是显示最新状态？
gradle 
如何在Gradle中将Launch4J与模糊jar一起使用
gradle 
Intellij IDEA没有'；t突出显示并解析build.gradle文件“；“勇气”；恰当地
gradleintellij-idea 
Kotlin Gradle DSL-buildSrc中的预编译脚本不工作
gradle 
在readme.md文件中显示gradle属性
gradlemarkdown 
Gradle 多项目渐变配置
gradle 
从本地文件应用Gradle插件
gradle 
Gradle 如何将图像添加到REST docs api文档
gradle 
Gradle Grails-IntelliJ can'；t解析符号和对象
gradleintellij-ideagrails 
Gradle IntelliJ IDEA（2020.2）：渐变：锁文件：存储库/缓存/journal-1/journal-1.Lock
gradleintellij-idea 
Gradle 在主类上找不到参数[directory'；build/classes/main/'；]的方法setFrom（）
gradleazure-devops


                                        

                                        
                                        


                                                
                                                        [java]相关推荐
                                                        
Java 我无法在android应用程序中正确加载包含TabHost的xml
									Java
							 									Android
							 									Xml
							 									Tabs
							 
Java 为什么自定义饼图不显示？
									Java
							 									Swing
							 
Java 在类路径中指定log4j
									Java
							 									Jar
							 
Java线程在run（）时调用其他方法{while（true）{executing here}}
									Java
							 									Multithreading
							 
Java Eclipse SVN提交在从Ubuntu 10.04 LTS升级到12.04 LTS后“失败”
									Java
							 									Eclipse
							 									Svn
							 									Ubuntu
							 									Configuration
							 
Java Spring抛出NoClassDefFoundError:MethodInterceptor，尽管类在类路径中存在
									Java
							 									Spring
							 									Glassfish
							 
如何在JavaCodeAndroid中设置xml名称空间值
									Java
							 									Xml
							 									Android Studio
							 
Java Spring Cron验证
									Java
							 									Spring
							 									Cron
							 
使用对象的linkedlist出现Java toString打印错误
									Java
							 									Io
							 									Reference
							 
在JavaSpring中使用ActiveMq为多个项目创建公共代理
									Java
							 									Spring
							 									Activemq
							 
Java：使用强制转换从对象静态类公开受保护的值
									Java
							 
Java 由于字符串存储在字符串常量池中（当我们使用=）基于内容，而不是在这种情况下为什么s1==s3为false
									Java
							 									String
							 
Java 如何在我的TestSuite接口中有junit@Beforeclass&&@Afterclass？
									Java
							 									Junit
							 									Interface
							 
Java Spring Activiti在完成任务之前验证受让人或候选组
									Java
							 									Spring
							 
Java 用于查找和替换特定子字符串的正则表达式
									Java
							 									Regex
							 
Java 如何对特定区域内的非GUI对象实现MouseListener？
									Java
							 									Swing
							 
Java 将Keylistener和actionlistener调用到main时，它们不工作。
									Java
							 									Swing
							 
Java Spring mvc-从PostMapping URL返回JSON（Froala编辑器）
									Java
							 									Spring Mvc
							 
Java 我想从特定位置删除文件，但不是从该位置删除文件
									Java
							 
Java 8比较器不工作
									Java
							 									List
							 									Lambda
							 
java将两个列表合并为HashMap
									Java
							 									List
							 
Java Arduino自动调光器
									Java
							 									Arduino
							 
Java 如何仅在前一个对象完成时从Firebase获取对象？
									Java
							 									Android
							 									Firebase
							 
Java 如何在使用哈希函数时检查记录是否已经存在？
									Java
							 									Hash
							 
Java 对数组列表排序
									Java
							 
Java 回收器视图占据整个屏幕。不在其上方显示我的UI元素
									Java
							 									Android
							 									Xml
							 
Java 在servlet中为我的web应用使用池？
									Java
							 									Google App Engine
							 									Servlets
							 
Java akka不返回值的蒙特卡罗Pi计算
									Java
							 									Akka
							 
Java 将“从foo foo中选择foo，Bar Bar where…”形式的HQL查询转换为条件查询
									Java
							 									Hibernate
							 									Select
							 
Java 部分运行循环
									Java
							 									Loops
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Seo
Build
Css
Curl
Google Cloud Dataflow
Numpy
Npm
Liferay
Webgl
Enums
Discord.py
Service
Vmware
Cocoa
Ipad
Ignite
Assembly
Computer Science
Next.js
Tfs
Hash
Arrays
Scala
Angular Material
C#
Pagination
Maps
Codeigniter
Nginx
Mapbox
Webview
Parallel Processing
Spring Mvc
Apache Nifi
Inno Setup
Breeze
X86
Orm
Xcode
Continuous Integration
Razor
Command Line
Joomla
Less
Mediawiki
Generics
Google Drive Api
Triggers
Google Analytics
Axapta
Maven 2
Clearcase
Sqlalchemy
Rally
Csv
Nest
Functional Programming
Windows 8
Javafx 2
Mdx
Nunit
Linux
Lotus Notes
Notifications
Phpmyadmin
Compiler Construction
Concurrency
D3.js
Yocto
Hazelcast
Chart.js
Struct
Typescript
Opengl Es
Sap
Vim
Autohotkey
Memory Leaks
Asp.net Web Api
Macros
Web Applications
Windows
Orchardcms
Log4j
Mapreduce
Jdbc
Grid
Autodesk Forge
Https
3d
C
Activerecord
Isabelle
Flutter
Fiware
Vhdl
Selenium
Karate
Quickbooks
Loops
Couchbase
Streaming
Sapui5
Xamarin
Xslt
Glsl
Cygwin
Directx
Vba
Blackberry
Prestashop
Blazor
Visual Studio 2013
Python Sphinx
Struts2
Meteor
Alfresco
Dataframe
Junit
Uitableview
Utf 8
Amazon Cloudformation
.net 4.0
Internet Explorer
Ethereum
Gatsby
Xaml
Zsh
Stripe Payments
Web Services
Gremlin
Syntax
Io
Cassandra
Sails.js
Tabs
Tinymce
Timer
Compression
Docker Compose
Pdf
Sockets
Embedded
Angular
File Io
Url Rewriting
Maven
Express
Scikit Learn
Blockchain
Sql Server
Sed
Codenameone
Apache Storm
Visual Studio 2017
Jenkins
Ruby On Rails 3.1
Deep Learning
Ibm Mobilefirst
Prometheus
Antlr
Antlr4
Flash
Llvm
Winforms
Java 8
Applescript
Math
Google Chrome Devtools
Jquery
Oracle Apex
Jupyter Notebook
Jms
Debugging
Sip
Proxy
Knockout.js
Internet Explorer 8
Jar
Spring
Magento
Synchronization
Google Bigquery
Visual Studio Code
Geolocation
Composer Php
Moodle
Transactions
Protractor
Debian
Function
Corda
Artificial Intelligence
Kotlin
Data Structures
Jira
Mobile
Stanford Nlp
Twilio
Firefox
Xsd


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网