Sql 如何使用REGEXP\u SUBSTR解析数据?

Sql 如何使用REGEXP\u SUBSTR解析数据?,sql,regex,oracle,oracle11g,regex-greedy,Sql,Regex,Oracle,Oracle11g,Regex Greedy,我有一个这样的数据集(见下文),我尝试提取形式为{variable_number_of_digits}{hyphen}{only_one_digits}的数字: with mcte as ( select 'ILLD/ELKJS/00000000/ELKJS/FHSH' as addr from dual union all select 'ILLD/EFECTE/0116988-7-002/ADFA/ADFG' as addr from dual union all select 'IIOD

我有一个这样的数据集(见下文),我尝试提取形式为{variable_number_of_digits}{hyphen}{only_one_digits}的数字:

with mcte as (
select 'ILLD/ELKJS/00000000/ELKJS/FHSH' as addr from dual
union all 
select 'ILLD/EFECTE/0116988-7-002/ADFA/ADFG' as addr from dual
union all
select 'IIODK/1573230-0/2216755-7/' as addr  from dual
union all
select 'IIODK/1573230-0/2216755-700/WRITE' as addr from dual
)
select  addr, 
        REGEXP_SUBSTR(addr,'(\/)([0-9-]+)',1,1,NULL,2) AS num1,
        REGEXP_SUBSTR(addr,'(\/)([^\/]+\/)([0-9\-]+)',1,1,NULL,3) num2
from mcte
;
我没有得到一个正确的结果集,应该是

+-------------------------------------+-----------+-----------+
|                ADDR                 |   NUM1    |   NUM2    |
+-------------------------------------+-----------+-----------+
| ILLD/ELKJS/00000000/ELKJS/FHSH      | NULL      | NULL      |
| ILLD/EFECTE/0116988-7-002/ADFA/ADFG | NULL      | NULL      |
| IIODK/1573230-0/2216755-7/          | 1573230-0 | 2216755-7 |
| IIODK/1573230-0/2216755-700/WRITE   | 1573230-0 | NULL      |
+-------------------------------------+-----------+-----------+
如何做到这一点

我尝试提取形式为{variable_number_of_digits}{hyphen}{only_one_digits}的数字

要匹配此格式中的数字,您应该执行以下操作

正则表达式:
\/\d+-\d

我尝试提取形式为{variable_number_of_digits}{hyphen}{only_one_digits}的数字

要匹配此格式中的数字,您应该执行以下操作

正则表达式:
\/\d+-\d


如果要从第二个和第三个
/
分隔组中获取结果,则:

with mcte ( addr ) as (
  select 'ILLD/ELKJS/00000000/ELKJS/FHSH'      from dual union all 
  select 'ILLD/EFECTE/0116988-7-002/ADFA/ADFG' from dual union all
  select 'IIODK/1573230-0/2216755-7/'          from dual union all
  select 'IIODK/1573230-0/2216755-700/WRITE'   from dual union all
  select 'IIODK/TEST/1573230-0/2216755-700/WRITE'   from dual
)
select  addr, 
        REGEXP_SUBSTR(addr,'^[^/]*/(\d+-\d)/',1,1,NULL,1) AS num1,
        REGEXP_SUBSTR(addr,'^[^/]*/[^/]*/(\d+-\d)/',1,1,NULL,1) num2
from mcte;
输出

ADDR                                   NUM1                NUM2
-------------------------------------- ------------------- -------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE                     1573230-0
ADDR                                   NUM1                NUM2

-------------------------------------- ------------------- ------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE 1573230-0           
1234567-8                              1234567-8
1234567-8/9876543-2                    1234567-8           9876543-2
1234567-8/TEST/9876543-2               1234567-8           9876543-2
更新

ADDR                                   NUM1                NUM2
-------------------------------------- ------------------- -------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE                     1573230-0
ADDR                                   NUM1                NUM2

-------------------------------------- ------------------- ------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE 1573230-0           
1234567-8                              1234567-8
1234567-8/9876543-2                    1234567-8           9876543-2
1234567-8/TEST/9876543-2               1234567-8           9876543-2
如果您只需要匹配的第一个和第二个模式,而不关心它们在字符串中的位置,那么:

with mcte ( addr ) as (
  select 'ILLD/ELKJS/00000000/ELKJS/FHSH'         from dual union all 
  select 'ILLD/EFECTE/0116988-7-002/ADFA/ADFG'    from dual union all
  select 'IIODK/1573230-0/2216755-7/'             from dual union all
  select 'IIODK/1573230-0/2216755-700/WRITE'      from dual union all
  select 'IIODK/TEST/1573230-0/2216755-700/WRITE' from dual union all
  select '1234567-8'                              from dual union all
  select '1234567-8/9876543-2'                    from dual union all
  select '1234567-8/TEST/9876543-2'               from dual
)
select  addr, 
        REGEXP_SUBSTR(addr,'(^|/)(\d+-\d)(/|$)',1,1,NULL,2) AS num1,
        REGEXP_SUBSTR(addr,'(^|/)\d+-\d(/.+?)?/(\d+-\d)(/|$)',1,1,NULL,3) num2
from mcte;
输出

ADDR                                   NUM1                NUM2
-------------------------------------- ------------------- -------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE                     1573230-0
ADDR                                   NUM1                NUM2

-------------------------------------- ------------------- ------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE 1573230-0           
1234567-8                              1234567-8
1234567-8/9876543-2                    1234567-8           9876543-2
1234567-8/TEST/9876543-2               1234567-8           9876543-2

如果要从第二个和第三个
/
分隔组获取结果,请执行以下操作:

with mcte ( addr ) as (
  select 'ILLD/ELKJS/00000000/ELKJS/FHSH'      from dual union all 
  select 'ILLD/EFECTE/0116988-7-002/ADFA/ADFG' from dual union all
  select 'IIODK/1573230-0/2216755-7/'          from dual union all
  select 'IIODK/1573230-0/2216755-700/WRITE'   from dual union all
  select 'IIODK/TEST/1573230-0/2216755-700/WRITE'   from dual
)
select  addr, 
        REGEXP_SUBSTR(addr,'^[^/]*/(\d+-\d)/',1,1,NULL,1) AS num1,
        REGEXP_SUBSTR(addr,'^[^/]*/[^/]*/(\d+-\d)/',1,1,NULL,1) num2
from mcte;
输出

ADDR                                   NUM1                NUM2
-------------------------------------- ------------------- -------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE                     1573230-0
ADDR                                   NUM1                NUM2

-------------------------------------- ------------------- ------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE 1573230-0           
1234567-8                              1234567-8
1234567-8/9876543-2                    1234567-8           9876543-2
1234567-8/TEST/9876543-2               1234567-8           9876543-2
更新

ADDR                                   NUM1                NUM2
-------------------------------------- ------------------- -------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE                     1573230-0
ADDR                                   NUM1                NUM2

-------------------------------------- ------------------- ------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE 1573230-0           
1234567-8                              1234567-8
1234567-8/9876543-2                    1234567-8           9876543-2
1234567-8/TEST/9876543-2               1234567-8           9876543-2
如果您只需要匹配的第一个和第二个模式,而不关心它们在字符串中的位置,那么:

with mcte ( addr ) as (
  select 'ILLD/ELKJS/00000000/ELKJS/FHSH'         from dual union all 
  select 'ILLD/EFECTE/0116988-7-002/ADFA/ADFG'    from dual union all
  select 'IIODK/1573230-0/2216755-7/'             from dual union all
  select 'IIODK/1573230-0/2216755-700/WRITE'      from dual union all
  select 'IIODK/TEST/1573230-0/2216755-700/WRITE' from dual union all
  select '1234567-8'                              from dual union all
  select '1234567-8/9876543-2'                    from dual union all
  select '1234567-8/TEST/9876543-2'               from dual
)
select  addr, 
        REGEXP_SUBSTR(addr,'(^|/)(\d+-\d)(/|$)',1,1,NULL,2) AS num1,
        REGEXP_SUBSTR(addr,'(^|/)\d+-\d(/.+?)?/(\d+-\d)(/|$)',1,1,NULL,3) num2
from mcte;
输出

ADDR                                   NUM1                NUM2
-------------------------------------- ------------------- -------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE                     1573230-0
ADDR                                   NUM1                NUM2

-------------------------------------- ------------------- ------------------
ILLD/ELKJS/00000000/ELKJS/FHSH
ILLD/EFECTE/0116988-7-002/ADFA/ADFG
IIODK/1573230-0/2216755-7/             1573230-0           2216755-7
IIODK/1573230-0/2216755-700/WRITE      1573230-0
IIODK/TEST/1573230-0/2216755-700/WRITE 1573230-0           
1234567-8                              1234567-8
1234567-8/9876543-2                    1234567-8           9876543-2
1234567-8/TEST/9876543-2               1234567-8           9876543-2
将与类似于的REGEXP_组合,并对结果进行透视,可以使此查询处理多达6个数字。您需要更新
cols
子查询和
pivot
列表,以便能够处理每条记录的更多数字。(不幸的是,这不能在静态SQL中通用完成)

将与类似于的REGEXP_组合,并对结果进行透视,可以使此查询处理多达6个数字。您需要更新
cols
子查询和
pivot
列表,以便能够处理每条记录的更多数字。(不幸的是,这不能在静态SQL中通用完成)



所以num1的位置并不重要,它只是格式正确的第一个数字,即使在数据中的另一个位置?是的,字符串中的位置并不重要,它只是“/”之间的第一个匹配项。是否有类似于…/34400-0-3009/…-如果是这样的话,是否应该把它捡起来?(我假设不是;您希望一位数正好在/)之前。更重要的是,关于…/34400-2003-5/…-你想把它捡起来吗?或者只是2003-5年?还是不是全部?@JoachimIsaksson很抱歉我误解了你的问题,数字的顺序很重要,因此,如果num1不是所需的格式,但num2是,num1应该为空,num2是第二个数字中的数字。@jrara你可能想用一个例子来说明。您的意思是,在示例中,
IIODK/TEST/1573230-0/2216755-700/WRITE
I(将1573230-0作为num1作为第一个匹配项)和MT0(将其放在第2列中,因为它位于第二个斜杠之后)都是错误的?那么预期的结果是什么呢?所以num1的位置并不重要,它只是格式正确的第一个数字,即使在数据中的另一个位置也是如此?是的,字符串中的位置并不重要,它只是“/”之间的第一个匹配项。会不会有类似于…/34400-0-3009/…-如果是这样的话,是否应该把它捡起来?(我假设不是;您希望一位数正好在/)之前。更重要的是,关于…/34400-2003-5/…-你想把它捡起来吗?或者只是2003-5年?还是不是全部?@JoachimIsaksson很抱歉我误解了你的问题,数字的顺序很重要,因此,如果num1不是所需的格式,但num2是,num1应该为空,num2是第二个数字中的数字。@jrara你可能想用一个例子来说明。您的意思是,在示例中,
IIODK/TEST/1573230-0/2216755-700/WRITE
I(将1573230-0作为num1作为第一个匹配项)和MT0(将其放在第2列中,因为它位于第二个斜杠之后)都是错误的?那么预期的结果是什么?谢谢,我试过了,但没有给出正确的结果。请尝试使用
[0-9]
而不是
\d
。你得到了什么输出?有错误吗?谢谢,我试过了,但没有给出正确的结果。请尝试使用
[0-9]
而不是
\d
。你得到了什么输出?有错误吗?这不应该起作用:如果num1不是所需的格式,但num2是,那么num2将显示为num1(因为。*将吃掉/和所有num1,并在as num1部分下拾取num2)。@mathguy谢谢,fixedGood!我发布了我的解决方案,但由于它现在与您的完全相同,我将其删除。干杯,Mahtguy这似乎没有给出正确的结果。对于最后一个ADDR,数字在错误的列中(以NUM2表示),它应该在NUM1中。@jrara您在评论中说,它应该是,
NUM1
在最后一行将是
TEST
,并且格式不正确,因此它应该是空的,
NUM2
(1573230-0)应该显示?这不应该起作用:如果num1不是所需格式,但num2是,则num2将显示为num1(因为。*将吃掉/和所有num1,并在as num1部分下拾取num2)。@mathguy谢谢,fixedGood!我发布了我的解决方案,但由于它现在与您的完全相同,我将其删除。干杯,Mahtguy这似乎没有给出正确的结果。对于最后一个地址,数字在错误的列中(以NUM2表示),它应该是NUM1。@您在评论中说应该是,
NUM1
在最后一行是
TEST
,格式不正确,所以它应该是空的,并且应该显示
NUM2
(1573230-0)?