Regex 在引号中提取值的有效方法;在具有特殊字符列的配置单元中

Regex 在引号中提取值的有效方法;在具有特殊字符列的配置单元中,regex,hive,special-characters,hiveql,Regex,Hive,Special Characters,Hiveql,下面的问题。我在HDFS中有一个表,它包含一个特定列(字符串数组)的表,在它的记录中有一些特殊的字符。 我在配置单元中使用regex来提取第一个引号中的值(我使用case语句来检测是否存在“-I regex,否则我按原样返回列值)。但是,最可能的原因是由于特殊字符,结果中存在跳过和异常。我想问一下解决此问题的最有效方法是什么,以及如何解决?在第一阶段清理列(由regex as在保留QOUTING标记的同时)然后再使用我的正则表达式。或者,有一种方法可以在一个正则表达式中同时使用它们?Avi,请添

下面的问题。我在HDFS中有一个表,它包含一个特定列(字符串数组)的表,在它的记录中有一些特殊的字符。
我在配置单元中使用regex来提取第一个引号中的值(我使用
case
语句来检测是否存在“-I regex,否则我按原样返回列值)。但是,最可能的原因是由于特殊字符,结果中存在跳过和异常。我想问一下解决此问题的最有效方法是什么,以及如何解决?在第一阶段清理列(由regex as在保留QOUTING标记的同时)然后再使用我的正则表达式。或者,有一种方法可以在一个正则表达式中同时使用它们?

Avi,请添加一个数据样本,包括请求的结果。问题是,这是大数据…绝大多数行看起来像普通行。我可以添加一个小示例:dasdsa