Dataframe 删除配置单元列的前导字符和尾随字符_Dataframe_Hive_Apache Spark Sql_Hql

Dataframe 删除配置单元列的前导字符和尾随字符

dataframe hive

Dataframe 删除配置单元列的前导字符和尾随字符,dataframe,hive,apache-spark-sql,hql,Dataframe,Hive,Apache Spark Sql,Hql,我有一个配置单元列，列中有未知数量的前导和尾随双引号。该列的数据内部也有双引号例如，该列如下所示我想输出如下我已经写了一个pyspark代码，我可以在其中剥离，它可以工作，但我想在hql中找到一个解决方案。我也尝试过类似的regexp\u替换 regexp_replace(test,'^"|^""|""$|"$', "") 但这是一种硬编码。有人能提供一个通用的解决方案吗？试试这个- val df=spa

我有一个配置单元列，列中有未知数量的前导和尾随双引号。该列的数据内部也有双引号

例如，该列如下所示

我想输出如下

我已经写了一个pyspark代码，我可以在其中剥离，它可以工作，但我想在hql中找到一个解决方案。我也尝试过类似的regexp\u替换

regexp_replace(test,'^"|^""|""$|"$', "")

但这是一种硬编码。有人能提供一个通用的解决方案吗？

试试这个-

val df=spark.sqlselect'\\\56\7\'作为测试 df.showfalse /** * +----+ *|试验| * +----+ * |567| * +----+ */ df.createOrReplaceTempViewtable spark.sqlselect test，regexp\u replacetest，“^\+\124;\+$”，作为表中的新测试 .showfalse /** * +----+----+ *|测试|测试|新| * +----+----+ * |567|567 | * +----+----+ */

@Nils，你能检查一下这个解决方案吗？谢谢Someshwar Kale给你的答案。我没有注意到，因为我得到了答案。