Python 如何通过正则表达式解析gcc输出以获得默认包含路径?

Python 如何通过正则表达式解析gcc输出以获得默认包含路径?,python,linux,gcc,Python,Linux,Gcc,我知道 gcc-xc-E-v- 打印末端的默认包含路径 [patryk@patryk-asus-manjaro ~]$ gcc -xc -E -v - Using built-in specs. COLLECT_GCC=gcc Target: x86_64-pc-linux-gnu Configured with: /build/gcc/src/gcc/configure --prefix=/usr --libdir=/usr/lib --libexecdir=/usr/lib --mand

我知道
gcc-xc-E-v-
打印末端的默认包含路径

[patryk@patryk-asus-manjaro ~]$ gcc -xc -E -v -  
Using built-in specs.
COLLECT_GCC=gcc
Target: x86_64-pc-linux-gnu
Configured with: /build/gcc/src/gcc/configure --prefix=/usr --libdir=/usr/lib --libexecdir=/usr/lib --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=https://bugs.archlinux.org/ --enable-languages=c,c++,ada,fortran,go,lto,objc,obj-c++ --enable-shared --enable-threads=posix --enable-libmpx --with-system-zlib --with-isl --enable-__cxa_atexit --disable-libunwind-exceptions --enable-clocale=gnu --disable-libstdcxx-pch --disable-libssp --enable-gnu-unique-object --enable-linker-build-id --enable-lto --enable-plugin --enable-install-libiberty --with-linker-hash-style=gnu --enable-gnu-indirect-function --enable-multilib --disable-werror --enable-checking=release --enable-default-pie --enable-default-ssp --enable-cet=auto
Thread model: posix
gcc version 8.2.1 20181127 (GCC) 
COLLECT_GCC_OPTIONS='-E' '-v' '-mtune=generic' '-march=x86-64'
 /usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/cc1 -E -quiet -v - -mtune=generic -march=x86-64
ignoring nonexistent directory "/usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/../../../../x86_64-pc-linux-gnu/include"
#include "..." search starts here:
#include <...> search starts here:
 /usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/include
 /usr/local/include
 /usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/include-fixed
 /usr/include
End of search list.
^C
[patryk@patryk-asus-manjaro ~]$
[patryk@patryk-华硕manjaro~]$gcc-xc-E-v-
使用内置规格。
收集\u GCC=GCC
目标:x86_64-pc-linux-gnu
配置为:/build/gcc/src/gcc/configure--prefix=/usr--libdir=/usr/lib--libexecdir=/usr/lib--mandir=/usr/share/man--infodir=/usr/share/info--with bugurl=https://bugs.archlinux.org/ ——启用语言= C、C++、艾达、FORTRAN、GO、LTO、Objc,obj-c++--enable shared--enable threads=posix--enable libmpx--system zlib--isl--enable--uuuuuuuucxa_atexit--disable libunwind exceptions--enable clocale=gnu--disable libstdcxx pch--disable libssp--enable gnu unique object enable linker build id--enable lto--enable plugin enable install libiberty--with linker hash style=gnu--启用gnu间接函数--enable multilib--disable werror--enable checking=release--enable default pie--enable default ssp--enable cet=auto
线程模型:posix
gcc版本8.2.1 20181127(gcc)
COLLECT\u GCC\u OPTIONS='-E'-v'-mtune=generic'-march=x86-64'
/usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/cc1-E-quiet-v--mtune=generic-march=x86-64
忽略不存在的目录“/usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/../../../../../../x86_64-pc-linux-gnu/include”
#包括“…”搜索从这里开始:
#包括搜索从这里开始:
/usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/include
/usr/本地/包括
/usr/lib/gcc/x86_64-pc-linux-gnu/8.2.1/include-fixed
/usr/包括
搜索列表结束。
^C
[patryk@patryk-华硕曼哈罗~]$
我创建了正则表达式

#include <\.\.\.> search starts here:$
(^.+$)*
^End of search list\.$
#包含搜索从这里开始:$
(^.+$)*
^搜索列表结束\$
但它不能正常工作。
另一个问题是,该参数的gcc并没有终止。我必须在Linux上调用SIGINT Ctrl+C。我正在使用Python3和
子流程。运行

我已经编写了一些spagheti

def find_re_it_in_list(pattern, input, start=0, stop=-1, flags=0):
    length = len(input)

    if length == 0:
        return None

    end_it = max(0, length - 1)

    if start >= end_it:
        return None

    if stop<0:
        stop = length

    if stop <= start:
        return None

    for it in range(max(0, start), min(stop, length)):
        elem = input[it]
        match = re.match(pattern, elem, flags)
        if match:
            return it

def get_includes(self):
    args = [self.conf['gcc_path'], '-xc', '-E', '-v', os.devnull]
    args.extend(self.env.get('flags', []))

    incl_start_regex = r' *#include <\.\.\.> search starts here: *'
    incl_end_regex = r' *End of search list\. *'

    proc = subprocess.run(args, stdout=subprocess.PIPE, stderr=subprocess.STDOUT , text=True)
    lines = proc.stdout.splitlines()

    start_it = find_re_it_in_list(incl_start_regex, lines)
    if start_it == None:
        return []

    end_it = find_re_it_in_list(incl_end_regex, lines, start_it)
    if end_it == None:
        return []

    # theres no paths between them
    if (end_it - start_it) == 1:
        return []

    return lines[start_it+1 : end_it]
def find_re_it_in_list(模式、输入、开始=0、停止=-1、标志=0):
长度=长度(输入)
如果长度==0:
一无所获
end_it=最大值(0,长度-1)
如果开始>=结束它:
一无所获

如果停止仅使用外壳的溶液:

gcc -x c -E -v /dev/null 2>&1 | sed -n '/include.*search starts here/,/End of search list/{s/^ //p}'
如果相关,请务必处理以下情况:

  • 该目录包含以下符号链接
  • 有重复的目录
  • 该目录不存在
  • 可能安装了多个gcc二进制文件(不同的版本、不同的arch等),每个都有不同的路径
  • 即使对于单个gcc二进制文件,编译器标志(例如
    -m32
    )也会影响包含路径

gcc不会终止,因为您告诉它从
stdin
读取,所以它会坐在那里等待输入。如果您不想这样做,请不要告诉它解析
stdin
@melpomene,因此我必须将/dev/zero传递给gcc?仅当您想解析无限多个NUL字节流时。