python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值
我几乎没有数据线 ReadPosRankSum=SNPEFF\u氨基酸变化=p.Pro3Pro/c.9T>c SNPEFF\u密码子变化=ccT/ccC ReadPosRankSum=SNPEFF\u氨基酸变化=p.Trp7Ser/c.20G>c SNPEFF\u密码子变化=tGg/tCg ReadPosRankSum=SNPEFF\u氨基酸变化=p.Lys17Arg/c.50A>G SNPEFF\u密码子变化=aAa/aGa 等等python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值,python,regex,string,pattern-matching,Python,Regex,String,Pattern Matching,我几乎没有数据线 ReadPosRankSum=SNPEFF\u氨基酸变化=p.Pro3Pro/c.9T>c SNPEFF\u密码子变化=ccT/ccC ReadPosRankSum=SNPEFF\u氨基酸变化=p.Trp7Ser/c.20G>c SNPEFF\u密码子变化=tGg/tCg ReadPosRankSum=SNPEFF\u氨基酸变化=p.Lys17Arg/c.50A>G SNPEFF\u密码子变化=aAa/aGa 等等 我想能够只提取SNPEFF\u氨基酸\u变化键的值,即p.P
我想能够只提取SNPEFF\u氨基酸\u变化键的值,即p.Pro3Pro/c.9T>c、p.Trp7Ser/c.20G>c和p.Lys17Arg/c.50A>G。关于如何创建这种模式,有什么想法吗?通常在提出类似问题时需要付出一些努力。因此,请考虑说明确切的问题,至少在下一次尝试时付出一些努力 要开始,可以尝试以下正则表达式:
>>> re.findall(r'SNPEFF_AMINO_ACID_CHANGE=(\S+)', text)
这将从模式中提取值并将其存储在列表中
说明:
到目前为止你有什么?re.findall[SNPEFF_-AMINI_-ACID=]{1,}谢谢你,我会在下一步发布我的成果。我正在尝试re.findall[SNPEFF_-AMINI_-ACID=]{1,},它把它旁边的所有文本作为单个字母而不是一个单词。
SNPEFF_AMINO_ACID_CHANGE= # match 'SNPEFF_AMINO_ACID_CHANGE='
( # group and capture to \1:
\S+ # non-whitespace (1 or more times)
) # end of \1