python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值_Python_Regex_String_Pattern Matching

python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值

python regex string

python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值,python,regex,string,pattern-matching,Python,Regex,String,Pattern Matching,我几乎没有数据线 ReadPosRankSum=SNPEFF\u氨基酸变化=p.Pro3Pro/c.9T>c SNPEFF\u密码子变化=ccT/ccC ReadPosRankSum=SNPEFF\u氨基酸变化=p.Trp7Ser/c.20G>c SNPEFF\u密码子变化=tGg/tCg ReadPosRankSum=SNPEFF\u氨基酸变化=p.Lys17Arg/c.50A>G SNPEFF\u密码子变化=aAa/aGa 等等我想能够只提取SNPEFF\u氨基酸\u变化键的值，即p.P

我几乎没有数据线

ReadPosRankSum=SNPEFF\u氨基酸变化=p.Pro3Pro/c.9T>c SNPEFF\u密码子变化=ccT/ccC

ReadPosRankSum=SNPEFF\u氨基酸变化=p.Trp7Ser/c.20G>c SNPEFF\u密码子变化=tGg/tCg

ReadPosRankSum=SNPEFF\u氨基酸变化=p.Lys17Arg/c.50A>G SNPEFF\u密码子变化=aAa/aGa

等等

我想能够只提取SNPEFF\u氨基酸\u变化键的值，即p.Pro3Pro/c.9T>c、p.Trp7Ser/c.20G>c和p.Lys17Arg/c.50A>G。关于如何创建这种模式，有什么想法吗？

通常在提出类似问题时需要付出一些努力。因此，请考虑说明确切的问题，至少在下一次尝试时付出一些努力

要开始，可以尝试以下正则表达式：

>>> re.findall(r'SNPEFF_AMINO_ACID_CHANGE=(\S+)', text)

这将从模式中提取值并将其存储在列表中

说明：

到目前为止你有什么？re.findall[SNPEFF_-AMINI_-ACID=]{1，}谢谢你，我会在下一步发布我的成果。我正在尝试re.findall[SNPEFF_-AMINI_-ACID=]{1，}，它把它旁边的所有文本作为单个字母而不是一个单词。

SNPEFF_AMINO_ACID_CHANGE=   # match 'SNPEFF_AMINO_ACID_CHANGE='
(                           # group and capture to \1:
  \S+                       #   non-whitespace (1 or more times)
)                           # end of \1