从Dataframe列中提取表情符号,并将其添加到同一Dataframe Scala Spark的不同列中

从Dataframe列中提取表情符号,并将其添加到同一Dataframe Scala Spark的不同列中,scala,dataframe,apache-spark,apache-spark-sql,emoji,Scala,Dataframe,Apache Spark,Apache Spark Sql,Emoji,我有以下数据帧 +----------------- |______价值观______________________| |我要上学了你可以用空字符串替换非表情符号字符。请注意正则表达式模式开头的“^”,它与非指定字符的字符相匹配 val df2=df.filter regexp_extract$value,原始\p{block=Emoticons},1=!= .withColumn 表情符号, regexp\u替换 colvalue, 原始[^\p{block=Emoticons}\p{blo

我有以下数据帧

+----------------- |______价值观______________________|
|我要上学了你可以用空字符串替换非表情符号字符。请注意正则表达式模式开头的“^”,它与非指定字符的字符相匹配

val df2=df.filter regexp_extract$value,原始\p{block=Emoticons},1=!= .withColumn 表情符号, regexp\u替换 colvalue, 原始[^\p{block=Emoticons}\p{block=杂项符号和象形文字}\uD83E\uDD00-\uD83E\uDDFF], df2.showfalse +----------------+---+ |值|表情符号| +----------------+---+
|我要去学校和给定的正则表达式,甚至,字符也被确定为正则表达式。我可以从表情符号数组中去掉吗?@user3279893是的,实际上正则表达式模式中不需要逗号。请参阅编辑后的答案。是否有可能在每个数组中获得不同的值?没有数组。你是什么意思?我已经编辑了给定的代码以获得表情符号数组。但是我缺少数组元素之间的逗号。我已编辑了我的问题