Regex 替换图案之间的空格<&燃气轮机;
我需要解析XML标记。但有些标签显示为空白,如下所示 因此,基本上我想使用正则表达式删除XML标记中的空白字符Regex 替换图案之间的空格<&燃气轮机;,regex,hive,Regex,Hive,我需要解析XML标记。但有些标签显示为空白,如下所示 因此,基本上我想使用正则表达式删除XML标记中的空白字符 <Employee >< Name>ABC</Name><Age>21</Age ></Employee> ABC21 在员工的标签中,姓名和年龄空格出现在标签的前面或后面,但在之间 所以基本上我想得到这样的输出 <Employee><Name>ABC</Name>&l
<Employee >< Name>ABC</Name><Age>21</Age ></Employee>
ABC21
在员工的标签中,姓名和年龄空格出现在标签的前面或后面,但在
之间
所以基本上我想得到这样的输出
<Employee><Name>ABC</Name><Age>21</Age></Employee>
ABC21
注意:
之间的空格可以是多次出现,而不是一次出现
请在这个问题上帮助我,提供正则表达式来完成此操作
谢谢。一个可能捕获我们不想要的空间的表达式可能类似于:
<\s*(\/)?\s*(\S+?)\s*>
我们可以用:
替换
编辑:
我们的代码可能如下所示:
regexp_replace(str,'<\\s*(\\/)?\\s*(\\S+?)\\s*(\\/)?>','<$1$2$3>')
regexp\u替换(str,,“”)
忠告
建议:
对于配置单元,使用双反斜杠可以正常工作:
regexp_replace(str,'<\\s*(\\/)?\\s*(\\S+?)\\s*>','<$1$2>')
regexp\u替换(str,,“”)
对于配置单元,使用双反斜杠,效果很好:
regexp\u replace(str,,“”)
Hi@leftjoin,感谢您的更新。这个很好用。但是当我得到像绳子一样的东西时。这是一个空标签,后面有空格。我也想把它去掉。你能不能也提供正则表达式code
regexp\u replace(““”,”),这应该返回。谢谢你在这方面的帮助。Thanks@ungalVicky这是艾玛的答案。你为什么不问问她?我当然可以帮忙。为斜杠和前后可能的空格在regexp中再添加一个组。像这样:选择regexp_replace(str,,'')@Emma你更快:)
regexp_replace(str,'<\\s*(\\/)?\\s*(\\S+?)\\s*>','<$1$2>')