Python 正则表达式:为hadoop流作业构造URL

Python 正则表达式:为hadoop流作业构造URL,python,regex,Python,Regex,我试图构造一个url,作为hadoop流作业的输入提交。 我想提供小时范围08-11的所有数据作为输入。 例如: 在04-08赛季,我做到了 s3://some bucket/some folder/month=2015-05-01/hour=0[4-8]成功了 有没有办法在8-11范围内执行相同的操作 08~11不是数字而是字符串 您可能只想匹配数值为8,9,10,11 所以 0[8-9]| 1[0-2] 是您可能需要的表达式。我试过了,因为输入必须作为命令行参数传递,*nix将|误认为管道符

我试图构造一个url,作为hadoop流作业的输入提交。 我想提供小时
范围08-11的所有数据作为输入。
例如:

在04-08赛季,我做到了
s3://some bucket/some folder/month=2015-05-01/hour=0[4-8]
成功了


有没有办法在
8-11范围内执行相同的操作

08~11不是数字而是字符串

您可能只想匹配数值为
8
9
10
11

所以

0[8-9]| 1[0-2]


是您可能需要的表达式。

我试过了,因为输入必须作为命令行参数传递,*nix将|误认为管道符号类似于/usr/lib/hadoop/bin/hadoop-jar/usr/lib/hadoop/hadoop-streaming.jar-input s3n://some bucket/some folder/date=2015-05-10/hour=1[6-9]/-output s3n://some bucket/some other folder/data_2015_05_10_16_to_19/-mapper DoSomethingMapper.py-file DoSomethingMapper.py-reducer DoSomethingReducer.py-file DoSomethingReducer.py您所做的实际上并不是关于regex,而是[shell globbing][1]的一个例子。我认为这并不支持您正在尝试的扩展。[1]:
s3://some-bucket/some-folder/month=2015-05-01/hour=[08-11]