Regex Reg ex-查找字符串的一部分

Regex Reg ex-查找字符串的一部分,regex,Regex,我得到了这种类型的数据(重复了很多次): 使用regexp,我试图选择包含特定字符串的所有行cagcgctgcccattg。 我是一个regex新手,所以我尝试过:\w{3,}(cagcgctgcccattg)\w{3,} 非常感谢您的帮助 干杯 Simon据我所知,您希望收集包含单个子序列的所有序列。我不知道您使用的是什么环境,但这应该以一种非常简单的方式返回您要查找的任何序列 ([ACGT]{3,}CAGCCGCTGCCCATTTG[ACGT]{3,}) 括号是一个字符类,这意味着它匹配其

我得到了这种类型的数据(重复了很多次):

使用regexp,我试图选择包含特定字符串的所有行
cagcgctgcccattg
。 我是一个regex新手,所以我尝试过:
\w{3,}(cagcgctgcccattg)\w{3,}

非常感谢您的帮助

干杯
Simon

据我所知,您希望收集包含单个子序列的所有序列。我不知道您使用的是什么环境,但这应该以一种非常简单的方式返回您要查找的任何序列

([ACGT]{3,}CAGCCGCTGCCCATTTG[ACGT]{3,})

括号是一个字符类,这意味着它匹配其中的任何单个字符。您不想匹配\w,您只想匹配您要查找的4个字符之一的字符。此外,您还可以使用parens覆盖整个正则表达式以获取整个匹配项。

正则表达式中
\w{3,}
的目的是什么?我知道这意味着什么,我只是不明白你为什么需要它来解决你的问题。这是DNA测序吗?腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)和胞嘧啶(c)?只是想知道。无论如何,在JavaScript/(cagcgctgcccattg)/.test('string')中,对于字符串片段,可以很好地工作。你在哪个编辑器/环境中工作?所以基本上我只希望有一行,例如accacagcgcgcccattgcataa accacagcgcctgcccattgcataa accacagcgcctccattgcataa accacagcgcctccattgcataa等。我已经使用了\w{3,}来表示匹配的表达式前面有至少3个字符,并且后面有至少3个字符。哇,你已经解决了!非常感谢,这真的很有帮助。很酷,很高兴我能帮上忙!请务必单击“我的答案”旁边的复选标记以接受它,因为稍后人们可能不想回答不接受答案的人提出的问题。另外,在告诉你想要得到什么作为输出的时候,一定要非常明确,我认为一开始对其他一些人来说,这是令人困惑的。欢迎来到SO!谢谢你,下次我会做得更好。
([ACGT]{3,}CAGCCGCTGCCCATTTG[ACGT]{3,})