Dataframe 删除配置单元列的前导字符和尾随字符
我有一个配置单元列,列中有未知数量的前导和尾随双引号。该列的数据内部也有双引号 例如,该列如下所示 我想输出如下 我已经写了一个pyspark代码,我可以在其中剥离,它可以工作,但我想在hql中找到一个解决方案。 我也尝试过类似的regexp\u替换Dataframe 删除配置单元列的前导字符和尾随字符,dataframe,hive,apache-spark-sql,hql,Dataframe,Hive,Apache Spark Sql,Hql,我有一个配置单元列,列中有未知数量的前导和尾随双引号。该列的数据内部也有双引号 例如,该列如下所示 我想输出如下 我已经写了一个pyspark代码,我可以在其中剥离,它可以工作,但我想在hql中找到一个解决方案。 我也尝试过类似的regexp\u替换 regexp_replace(test,'^"|^""|""$|"$', "") 但这是一种硬编码。 有人能提供一个通用的解决方案吗?试试这个- val df=spa
regexp_replace(test,'^"|^""|""$|"$', "")
但这是一种硬编码。
有人能提供一个通用的解决方案吗?试试这个-
val df=spark.sqlselect'\\\56\7\'作为测试
df.showfalse
/**
* +----+
*|试验|
* +----+
* |567|
* +----+
*/
df.createOrReplaceTempViewtable
spark.sqlselect test,regexp\u replacetest,“^\+\124;\+$”,作为表中的新测试
.showfalse
/**
* +----+----+
*|测试|测试|新|
* +----+----+
* |567|567 |
* +----+----+
*/
@Nils,你能检查一下这个解决方案吗?谢谢Someshwar Kale给你的答案。我没有注意到,因为我得到了答案。