Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/361.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 创建具有相似自由度的所有可能组合_Python_Regex_Combinations_Bioinformatics_Itertools - Fatal编程技术网

Python 创建具有相似自由度的所有可能组合

Python 创建具有相似自由度的所有可能组合,python,regex,combinations,bioinformatics,itertools,Python,Regex,Combinations,Bioinformatics,Itertools,我正在尝试用python编写一个代码,在给定字母表中给定一个正则表达式的情况下,它将给出所有可能的替代方案,具有相似的自由度。 例如,如果我的字母表是ACTG(DNA核苷酸),我的正则表达式是[AG]CG(一个覆盖ACG或GCG的正则表达式),我想输出[AC]CG(一个覆盖ACG或CCG的正则表达式),[AT]CG(一个覆盖ACG或TCG的正则表达式),[AG]CC,等等 问题是,我对python或编程非常陌生,还没有找到一种方法来实现这一点。 最终的目标是通过观察所有其他类似的去核序列的平均出

我正在尝试用python编写一个代码,在给定字母表中给定一个正则表达式的情况下,它将给出所有可能的替代方案,具有相似的自由度。 例如,如果我的字母表是ACTG(DNA核苷酸),我的正则表达式是[AG]CG(一个覆盖ACG或GCG的正则表达式),我想输出[AC]CG(一个覆盖ACG或CCG的正则表达式),[AT]CG(一个覆盖ACG或TCG的正则表达式),[AG]CC,等等

问题是,我对python或编程非常陌生,还没有找到一种方法来实现这一点。 最终的目标是通过观察所有其他类似的去核序列的平均出现次数是否确实小于特定的去核序列的出现次数,来发现给定字符串(DNA转录本)中是否存在对退化序列(正则表达式)的某种偏向

谢谢你的帮助或提示


Eyal

感谢您的评论,我使用以下代码(对于RegEx[AGT][AG]AC[ACT])暂时为特定的正则表达式手动执行此操作(直到我提高了python技能):

这将返回与我的类似的所有可能正则表达式的列表,如:

gf = ['[ACT][GT]CC[ACT]', '[GCT][CT]TT[GCT]', '[GCT][CT]TT[AGC]', '[GCT][CT]TT[AGT]', '[GCT][CT]TT[ACT]', '[GCT][CT]TA[GCT]', '[GCT][CT]TA[AGC]', '[GCT][CT]TA[AGT]', '[GCT][CT]TA[ACT]', '[GCT][CT]TG[GCT]', '[GCT][CT]TG[AGC]', '[GCT][CT]TG[AGT]'....]

请看这个问题:
[AG]*CG
?您打算如何处理具有无限可能匹配项的正则表达式?使用发电机?
gf = ['[ACT][GT]CC[ACT]', '[GCT][CT]TT[GCT]', '[GCT][CT]TT[AGC]', '[GCT][CT]TT[AGT]', '[GCT][CT]TT[ACT]', '[GCT][CT]TA[GCT]', '[GCT][CT]TA[AGC]', '[GCT][CT]TA[AGT]', '[GCT][CT]TA[ACT]', '[GCT][CT]TG[GCT]', '[GCT][CT]TG[AGC]', '[GCT][CT]TG[AGT]'....]