在配置单元中使用Regex从路径提取主目录
我正在使用配置单元中的regex函数查找主文件夹 我想从这个文件路径解析出“main”:在配置单元中使用Regex从路径提取主目录,regex,hive,hiveql,Regex,Hive,Hiveql,我正在使用配置单元中的regex函数查找主文件夹 我想从这个文件路径解析出“main”: /main/one/path/to/hdfs 这是我使用的正则表达式: regexp_extract(filepath,'(^/[^/]+)',0) 您必须用“\”来转义“/” (^\/[^\/]+)我猜我们希望得到斜杠后的第一个目录,我们可能希望从以下简单表达式开始: \/(.+?)\/.+ 在这里,我们将在第一个捕获组中捕获我们的main输出: (.+?) 我们可以使用group1简单地将其称为
/main/one/path/to/hdfs
这是我使用的正则表达式:
regexp_extract(filepath,'(^/[^/]+)',0)
您必须用“\”来转义“/”
(^\/[^\/]+)
我猜我们希望得到斜杠后的第一个目录,我们可能希望从以下简单表达式开始:
\/(.+?)\/.+
在这里,我们将在第一个捕获组中捕获我们的main
输出:
(.+?)
我们可以使用group1
简单地将其称为,我们的代码可能如下所示:
regexp_extract(filepath,'\/(.+?)\/.+', 1)