如何在python中解决这个正则表达式问题_Python_Regex_Python 3.x_Verilog

如何在python中解决这个正则表达式问题

python regex python-3.x verilog

如何在python中解决这个正则表达式问题,python,regex,python-3.x,verilog,Python,Regex,Python 3.x,Verilog,我正在尝试生成一个python脚本，它应该逐行读取verilog代码，当它遇到“Inputsome_name；”时它应该匹配行和返回名称，这样我就可以计算我在verilog代码中定义的所有输入端口（verilog代码非常大）。所以verilog代码是这样的 module(a,b,c,d, vbg `ifdef USE_GOOD_PIN , vb, vc, vd, vg ..... some more input and outputs `endif ); input [7:0]

我正在尝试生成一个python脚本，它应该逐行读取verilog代码，当它遇到“Inputsome_name；”时它应该匹配行和返回名称，这样我就可以计算我在verilog代码中定义的所有输入端口（verilog代码非常大）。所以verilog代码是这样的

module(a,b,c,d, vbg
`ifdef USE_GOOD_PIN     
, vb, vc, vd, vg ..... some more input and outputs
`endif
 );

input  [7:0] t_d;
input srd;
output comb;
output src;
inout  [1:0] Iout;
output a_in;
output b_in;
input ff_parity;

我试图匹配的代码（'input[7:0]t_d；'input srd；'等）是

同样，在“input”和“[]”以及“name”之间可以有一个或多个空格，因此如何使用python正则表达式精确地获得“t_d”或“srd”之类的名称

使用我输入的代码，我无法满足要求。

您可以将变量空格与

\s*

（零个或多个空格）或

\s+

（一个或多个空格）匹配，并且可以使用

（…）

括号“捕获”文本

查看，您可以看到您将查找

input

，后跟一个可选范围，后跟一个或多个标识符，这些标识符是。以下模式将从此类语句中捕获标识符列表：

r'^input\s+(?:\[[^\]]*\]\s+)?(.+);'

（？：\[[^\]]*\]\s+

部分将匹配可选范围语法（a

，后跟非

字符上的任何数字，后跟

），而不捕获它。有关在线演示，请参阅

由于标识符总是以空格分隔，因此可以使用

str.split（）

将捕获的值转换为Python列表

您不需要将文件读入内存或使用

range

。直接在文件上循环。在处理单个行时，不需要使用

re.M

。我也会删除

re.I

，因为Verilog是区分大小写的<代码>输入与

输入

不同：

with open(r'D:/pyfile/verilog.v') as file:
    for line in file:
        match = re.search(r'^input\s+(?:\[[^\]]*\]\s+)?(.+);', line)
        if match:
            identifiers = match.group(1).split()
            print(*identifiers)

使用您的示例演示：

>>> import re
>>> from io import StringIO
>>> sample = '''\
... module(a,b,c,d, vbg
... `ifdef USE_GOOD_PIN
... , vb, vc, vd, vg ..... some more input and outputs
... `endif
...  );
...
... input  [7:0] t_d;
... input srd;
... output comb;
... output src;
... inout  [1:0] Iout;
... output a_in;
... output b_in;
... input ff_parity;
... '''
>>> with StringIO(sample) as file:
...     for line in file:
...         match = re.search(r'^input\s+(?:\[[^\]]*\]\s+)?(.+);', line)
...         if match:
...             identifiers = match.group(1).split()
...             print(*identifiers)
...
t_d
srd
ff_parity

您可以将变量空白与

\s*