Regex 正则表达式只找到一个匹配项
我有以下案文:Regex 正则表达式只找到一个匹配项,regex,Regex,我有以下案文: TRANSCRIPT WS000006.1 (802 nt) PARENT_CONTIG WS000006 FEATURES Location/Qualifiers source 1..802 /organism="Winter skate" CDS complement(3..443) /protein_
TRANSCRIPT WS000006.1 (802 nt)
PARENT_CONTIG WS000006
FEATURES Location/Qualifiers
source 1..802
/organism="Winter skate"
CDS complement(3..443)
/protein_id="WS000006.1_orf1"
/orf_type="5prime_partial"
/blastp_hit_swissprot="MALD2_HUMAN"
/blastp_hit_uniprot="Q8N4S9"
/blastp_hit_name="MARVEL domain-containing protein 2"
/blastp_hit_identity="61.29%"
/blastp_hit_evalue="5e-47"
/pfam_hit_accession="PF07303.8"
/pfam_hit_id="Occludin_ELL"
/pfam_hit_name="Occludin homology domain"
/pfam_hit_evalue="7.3e-28"
/translation="AKSFPSRCNGAGTLNKSIPAGFIPKPLIVPDYVTKYPKIETAEE
RERYKGVFNDQYAEYRELHTEIYVANRKFGELKTLIERLPHYVETSEEHR
RIMKILEDYKEKKNDPTFVEKKQRCTYLKNKLSYIKLRIQEYDLDCDSSS
SY*"
/go_cellular_component="plasma membrane|0005886"
/go_cellular_component="tight junction|0005923"
/go_biological_process="cell-cell junction organization|0045216"
/go_biological_process="sensory perception of sound|0007605"
ORIGIN
1 CTGCCAAGAG CTTCCCGTCG CGGTGCAACG GTGCGGGCAC GCTCAACAAG TCCATTCCCG
61 CAGGATTCAT CCCGAAGCCT CTCATCGTTC CCGATTACGT CACAAAGTAC CCGAAGATTG
121 AGACTGCAGA GGAGAGAGAA CGGTACAAGG GTGTGTTCAA TGACCAGTAC GCGGAATATC
181 GGGAGCTACA CACTGAGATC TATGTGGCCA ACAGGAAGTT TGGGGAACTG AAGACTCTGA
241 TCGAGAGACT GCCCCACTAC GTCGAGACAT CAGAGGAGCA CAGACGTATA ATGAAGATCC
301 TCGAAGATTA CAAGGAGAAA AAGAATGACC CAACATTTGT GGAGAAGAAG CAACGATGCA
361 CTTACCTGAA GAACAAACTC TCGTACATCA AGCTGCGAAT CCAGGAGTAT GATCTAGACT
421 GTGACTCCTC CAGCAGTTAC TGAACAAAAT CTCACATCAT TCATCATTAA TATTTTCATT
481 ATTTTTCTTC TAGTGCAGAT AGGATTCATT TGGGCCGTGG AGTGTGTATG TATGTGTGTG
541 TGTGTATGTA TGTGTGCGTG TGTACGTATA TGTGTGTGTG TACACCGTGT TGTGTGTACC
601 TGTGTGTACG TGTATGTATG TGTGTGTACG TGTGTGTGTG CGCATGATTA TATGTGTGTG
661 TGAATATGAG TGCGGGTGTG TGCATATGTG TGTGTGTGAA ATAATATAGT ATTTCGTAGT
721 TCAGAGCTTA TTTGTTAAGT TTAATAGCGT GATGGCTGTC AGGAAGAAGC TGTTCCTCAA
781 TGTAGATGTT ACAGTTTTCA GT
//
我想得到以/go开头的行_
因此,我构造了以下正则表达式:\/go.+?=“+?”
在我看来,应该是/go_uu位,然后是=字符前面的行的其余部分,然后是=字符后面的最后一部分,在引号内
然而,在一个在线regex测试仪()上,我只得到了第一行/go_uu作为匹配。我怎样才能匹配所有的线条
谢谢。图案可以是:
\s*\/go_.*
但是,您需要传递g
(全局)to标志以捕获所有匹配项:
. 根据您的编程语言和上下文,您可能还希望传递m
(多行)选项,并将模式更改为^\s*\/go
(请注意^
表示传递m
时的行首)
顺便说一句。请注意如何提问。您应该a)创建尽可能短的示例,而不是仅仅粘贴大量文本;b)解释您到底在做什么,使用哪种编程语言以及到目前为止您尝试了什么(!)。在特定的正则表达式引擎中,使用第二个文本输入框(在/)中的g参数将使其查找所有事件。这是因为该引擎不是逐行搜索字符串,而是作为要搜索的单个单一文本块。因此,它找到第一个匹配项并退出。g开关告诉它查找所有匹配项 这样做的结果是,您需要了解如何扫描多行字符串以查找所使用目标语言中的所有匹配项。这里有一些Ruby可以完成这项工作:
s=<input string above>
s.scan(/\/go_.+?=".+?"/).each do |match|
puts match
end
您正在使用哪种编程语言?在该站点,您需要。实际上,在您正在尝试的regex tester中,您必须在regex输入之后的输入中指定标志“g”。“g”表示全局搜索,获取所有事件。。。。
/go_cellular_component="plasma membrane|0005886"
/go_cellular_component="tight junction|0005923"
/go_biological_process="cell-cell junction organization|0045216"
/go_biological_process="sensory perception of sound|0007605"