Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/354.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/20.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值_Python_Regex_String_Pattern Matching - Fatal编程技术网

python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值

python正则表达式“SNPEFF\u aminomy\u ACID\u CHANGE=p.Pro3Pro/c.9T>c”提取键的值,python,regex,string,pattern-matching,Python,Regex,String,Pattern Matching,我几乎没有数据线 ReadPosRankSum=SNPEFF\u氨基酸变化=p.Pro3Pro/c.9T>c SNPEFF\u密码子变化=ccT/ccC ReadPosRankSum=SNPEFF\u氨基酸变化=p.Trp7Ser/c.20G>c SNPEFF\u密码子变化=tGg/tCg ReadPosRankSum=SNPEFF\u氨基酸变化=p.Lys17Arg/c.50A>G SNPEFF\u密码子变化=aAa/aGa 等等 我想能够只提取SNPEFF\u氨基酸\u变化键的值,即p.P

我几乎没有数据线

ReadPosRankSum=SNPEFF\u氨基酸变化=p.Pro3Pro/c.9T>c SNPEFF\u密码子变化=ccT/ccC

ReadPosRankSum=SNPEFF\u氨基酸变化=p.Trp7Ser/c.20G>c SNPEFF\u密码子变化=tGg/tCg

ReadPosRankSum=SNPEFF\u氨基酸变化=p.Lys17Arg/c.50A>G SNPEFF\u密码子变化=aAa/aGa

等等
我想能够只提取SNPEFF\u氨基酸\u变化键的值,即p.Pro3Pro/c.9T>c、p.Trp7Ser/c.20G>c和p.Lys17Arg/c.50A>G。关于如何创建这种模式,有什么想法吗?

通常在提出类似问题时需要付出一些努力。因此,请考虑说明确切的问题,至少在下一次尝试时付出一些努力

要开始,可以尝试以下正则表达式:

>>> re.findall(r'SNPEFF_AMINO_ACID_CHANGE=(\S+)', text)
这将从模式中提取值并将其存储在列表中

说明:


到目前为止你有什么?re.findall[SNPEFF_-AMINI_-ACID=]{1,}谢谢你,我会在下一步发布我的成果。我正在尝试re.findall[SNPEFF_-AMINI_-ACID=]{1,},它把它旁边的所有文本作为单个字母而不是一个单词。
SNPEFF_AMINO_ACID_CHANGE=   # match 'SNPEFF_AMINO_ACID_CHANGE='
(                           # group and capture to \1:
  \S+                       #   non-whitespace (1 or more times)
)                           # end of \1