Python 如何找到不完美的子字符串？_Python_Regex_Python 2.7

Python 如何找到不完美的子字符串？

python regex python-2.7

Python 如何找到不完美的子字符串？,python,regex,python-2.7,Python,Regex,Python 2.7,我有一个等长的子字符串列表，对于所有这些子字符串，我想在一个大字符串中找到一个位置。然而，棘手的是，我还应该找到不匹配数量有限的子字符串（也给出了不匹配的数量）。我想我可以用正则表达式来实现这一点，但我找不到方法。UPD：我正在使用Python 2.7 例如：输入字符串：s='atgtcgatcgatgctagctataaaa'，输入子字符串为s0='ATG'，允许的不匹配数为n=1。我想要的是返回一个iterable，比如一个位置列表：[0,7,19,23,6]，它对应于“ATG”（两次）、

我有一个等长的子字符串列表，对于所有这些子字符串，我想在一个大字符串中找到一个位置。然而，棘手的是，我还应该找到不匹配数量有限的子字符串（也给出了不匹配的数量）。我想我可以用正则表达式来实现这一点，但我找不到方法。UPD：我正在使用Python 2.7

例如：

输入字符串：

s='atgtcgatcgatgctagctataaaa'

，输入子字符串为

s0='ATG'

，允许的不匹配数为n=1。我想要的是返回一个iterable，比如一个位置列表：

[0,7,19,23,6]

，它对应于“ATG”（两次）、“ATA”（两次）、“ATC”对应的位置，因为字符串中没有出现其他不匹配的3-mer。

您考虑过使用Levenshtein距离算法寻求帮助吗？它用于确定两个字符串之间的相似程度

下面是一个简单的实现：

对于i=0至len（干草堆）－len（针头）

让势匹配=干草堆[i，i+len]

查看潜在匹配和针头之间的Levenshtein距离

如果距离为0，则为完美匹配

如果距离小于阈值，则存在不完美但足够接近的匹配

否则，继续下一步

您是否考虑过使用Levenshtein距离算法寻求帮助？它用于确定两个字符串之间的相似程度